Текст
                    Н.Г.Ван Кампен
СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ В ФИЗИКЕ И ХИМИИ
Книга является введением в теорию флуктуации и стохастические методы. В
ней изложены вопросы теории вероятностей, случайных событий и
стохастических процессов. Рассмотрены Марковские процессы и основное
кинетическое уравнение, уравнения Фоккера —Планка, Ланжевена, а также
приложения приближенных методов к флуктуациям в нелинейных, неустойчивых
и пространственно-распределенных системах. Приведено много задач и
упражнений.
Для студентов и аспирантов инженерно-физических и математических
специальностей вузов.
ОГЛАВЛЕНИЕ
Предисловие редактора	5
Предисловие автора	8
Глава 1. Стохастические переменные	11
1.1.	Определения	11
1.2.	Средние	14
1.3.	Распределения для многих переменных	19
1.4.	Сложение стохастических переменных	23
1.5.	Преобразование переменных	26
1.6.	Распределение Гаусса	30
1.7.	Центральная предельная теорема	33
Глава 2. Случайные события	37
2.1.Определения	38
2.2	Распределение Пуассона	41
2.3.	Еще один способ описания случайных событий	43
2.4.	Формула обращения	47
2.5.	Корреляционная функция	51
2.6.	Время ожидания	54
Глава 3. Стохастические процессы	57
3	1. Определения	57
3.2.	Стохастические процессы в физике	60
3.3.	Преобразование Фурье стационарных процессов	64
3.4.	Иерархия функций распределения	67
3.5.	Колебания струны и случайные поля	71
3.6.	Ветвящиеся процессы	75
Глава 4. Марковские процессы	78
4.1.	Свойство марковости	78
4.2.	Уравнение Чепмена — Колмогорова	84
4.3.	Стационарные марковские процессы	87
4.4.	Выделение подансамбля	92
4.5.	Марковские цепи	95
4.6.	Процессы распада	98

Глава 5. Основное кинетическое уравнение 100 5.1. Вывод основного кинетического уравнения 100 5.2. Класс W-матриц 104 5.3. Предел больших времен 108 5.4. Замкнутые изолированные физические системы 112 5.5. Возрастание энтропии 115 5.6. Доказательство соотношения детального равновесия 119 5.7. Разложение по собственным функциям 122 5.8. Макроскопическое уравнение 126 5.9. Сопряженное уравнение 131 Глава 6. Одношаговые процессы 134 6.1. Определения; процесс Пуассона 134 6.2. Случайное блуждание с непрерывным временем 136 6.3. Общие свойства одношаговых процессов 139 6.4. Примеры линейных одношаговых процессов 143 6.5. Естественные граничные условия 147 6.6. Линейный одношаговый процесс с естественными граничными 149 условиями 6.7. Искусственные граничные условия 153 6.8. Искусственные граничные условия и нормальные моды 157 6.9. Нелинейные одношаговые процессы 161 6.10. Проблема первого прохождения 164 Глава 7. Химические реакции 169 7.1. Кинематика химических реакций 170 7.2. Динамика химических реакций 174 7.3. Стационарное решение 176 7.4. Открытые системы 179 7.5. Одномолекулярные реакции 181 7.6. Коллективные системы 186 7.7. Составные марковские процессы 190 Глава 8. Уравнения Фоккера — Планка и Ланжевена 195 8.1. Введение 195 8.2. Вывод уравнения Фоккера — Планка 199 8.3. Броуновское движение 202 8.4. Рэлеевская частица 205 8.5. Приложение к одношаговым процессам 208 8.6. Линейное уравнение Фоккера—Планка в случае многих 212 переменных 8.7. Уравнение Крамерса 215 8.8. Метод Ланжевена' 219 8.9. Как применять метод Ланжевена 228 Глава 9. Разложение основного кинетического уравнения 233 9.1. Вводные рассуждения 233
9.2. Общая формулировка метода разложения 237 9.3. Природа макроскопического закона 242 9.4. Приближение линейного шума 245 9.5. Разложение основного кинетического уравнения в случае многих переменных 250 9.6. Высшие порядки 254 Глава 10. Процессы диффузионного типа 259 10.1. Основное кинетическое уравнение диффузионного типа 259 10.2. Диффузия во внешнем поле 262 10.3. Диффузия в неоднородной среде 265 10.4. Уравнение диффузии в случае многих переменных 268 10.5. Предел нулевых флуктуации 272 Глава 11. Неустойчивые системы 276 11.1. Бистабильные системы 276 11.2. Время перехода 283 11.3. Вероятность расщепления 287 11.4. Проблема Мальтуса — Ферхюльста 290 11.5. Критические флуктуации 293 11.6. Диффузия в потенциале с двумя ямами 296 11.7. Параболическое приближение 300 11.8. Предельные циклы и флуктуации 304 11.9. Лазер как диффузионная система 307 Глава 12. Флуктуации в непрерывных системах 312 12.1. Введение 312 12.2. Диффузионный шум 315 12.3. Метод составных моментов 317 12.4. Флуктуации плотности в фазовом пространстве 321 12.5. Флуктуации и уравнение Больцмана 324 Г лава 13. Статистика скачкообразных событий 331 13.1. Основные формулы и простой пример 331 13.2. Скачкообразные события в нелинейных системах 334 13.3. Фотоэффект: флуктуации числа падающих фотонов 336 13.4. Фотоэффект (продолжение) 339 Глава 14. Стохастические дифференциальные уравнения 343 14.1. Определения 344 14.2. Эвристический анализ мультипликативных уравнений 347 14.3. Разложение по кумулянтам 350 14.4. Три критических замечания 356 14.5. Нелинейные стохастические дифференциальные уравнения 36! 14.6. Большие времена корреляции 365 14.7. Неоднородное линейное уравнение 371
ПРЕДИСЛОВИЕ РЕДАКТОРА Имя автора этой книги хорошо известно в научном мире, в ча- стности специалистам в области физики плазмы и гидродинамики. Именно Ван Кампен [П1], исходя из физических соображений, рас- ширил класс волновых решений в плазме, включив в него обоб- щенные функции, не удовлетворяющие классическим условиям интегрируемости. Среди новых волновых решений оказались и те, для которых нет однозначной связи между частотой и волновым вектором. В дальнейшем именно такой метод позволил эффективно исследовать эховые явления в плазме, проблему просветления вол- новых барьеров и др. Этот подход автора книги, связанный с ра- ботой на «стыке» физики и математики, оказывается очень полезным при исследовании случайных процессов, где без ясного физического понимания трудно рассчитывать на обнаружение интересных физи- ческих эффектов; но, с другой стороны, здесь же возможны различ- ные математические ловушки, как, например, при использовании «белого шума»—«беспамятного» процесса, являющегося предельным случаем короткокоррелированного процесса. В последние два-три десятилетия интерес к шуму резко возрос в силу большого числа новых явлений физики и химии, которые связаны с ролью флуктуаций, как внутренних, так и особенно внешних (последние часто называют флуктуациями среды). Посколь- ку автор предисловия является физиком, то это и предопределяет приводимые примеры, иллюстрирующие нарастающую важность случайных процессов. Так, Ф. Андерсоном еще в [П2] были вы- сказаны аргументы и найдены условия, при которых за счет рас- сеяния на случайном потенциале примесей каждый электрон ока- зывается локализованным в определенной области проводника. Иначе говоря, проводимость металла (теперь уже «бывшего» металла) обращается в нуль. Разумеется, «андерсоновская локализация» не может быть выделенным примером в природе. Необходим направ- ленный поиск связанных состояний (а также обратных явлений — понижения потенциального барьера), обязанных эффективному вли- янию случайных сил на движение системы. Приложения подобного 5
круга явлений в случае успеха трудно переоценить: новые типы химических реакций, влияние на термоядерные реакции и сверх- проводимость, связанные состояния в классической физике и др. Другой круг связан с проблемой динамического хаоса, т. е. с возникновением стохастичности в детерминированных системах (см., например, [ПЗ]). Здесь желательно подчеркнуть два момента. В отсутствие начального шума в системе действительно возможно возникновение хаотического состояния, но этот хабе достаточно сложен: он, вообще говоря, неоднороден и неизотропен. Вторая особенность, на которую хотелось бы обратить внимание,— роль малого шума. Конечно, получить шум без шума элегантно и по существу важно. Но дело в том, что в системе всегда имеется ма- лый шум и пренебрежение им фактически основывается на предпо- ложении о его «неагрессивном» поведении. Однако в [П4, П5] об- наружен новый тип хаотического состояния — флуктуационный хаос с экспоненциально быстро или даже взрывным образом на- растающей дисперсией, инициированный малыми флуктуациями среды в условиях, когда динамический хаос еще невозможен. Не- обходимо также обратить внимание на такие интересные физиче- ские явления, как обращение знака флуктуирующих коэффициентов переноса [П6], а также ускоренное развитие неустойчивостей под влиянием турбулентности или шума (см., например, [П5]). Из отмеченного видно, насколько повысился накал исследований шума за последние годы. Поэтому книга Ван Кампена с нужной математикой и приложениями очень своевременна. Книга хорошо написана и может служить введением в предмет. Автору удалось остаться на физическом уровне строгости изложения, и поэтому изложение не загромождено деталями, многие из которых сформу- лированы в виде упражнений. В тексте книги имеется много при- мечаний, разъяснений, предостережений и прочих отступлений от основного текста, проясняющих отдельные моменты. Особо следует сказать о многочисленных упражнениях, которые столь необходимы для глубокого овладения предметом. Некоторые из них не содер- жат вопроса, а сформулированы в виде утверждений. Такие упраж- нения надо понимать как дополнения к основному тексту. Книга Ван Кампена впервые была опубликована в 1981 г. и с тех пор переиздавалась еще несколько раз без изменений. За это время были опубликованы и переведены на русский язык еще не- которые монографии, посвященные близким вопросам (см., напри- мер, [П7—П9]). Однако книга Ван Кампена является учебным по- собием, а не обзором. Вероятно, поэтому список цитированной в ней литературы не полон и зачастую не дает всего представления о развитии данной области науки, но по поводу некоторых вопро- сов и приложений, лишь намеченных в книге, автор переадресует читателя к упомянутым работам. До настоящего времени на рус- ском языке отсутствовала литература учебного характера, дающая
элементарное введение в стохастические методы. Книга Ван Кам- пена заполняет этот пробел, она адресована прежде всего студен- там старших курсов и аспирантам, но может заинтересовать также физиков, химиков и математиков. Проф. С. С. Моисеев Литература к предисловию редактора ЛI. \' a n Kampen N. G. Physica, 21, 949 (1955). П2. Андерсон Ф., 127, № 1, 19, 1979. ПЗ. Заславский Г. М. Стохастичность динамических систем. М., 1984. П4. Барц Б. И., Моисеев С. С. В кн.: Нелинейные волны. Динамика и эволюция. М., 1989. С. 153—159. П5. Буц В. А., Колыхалов П. И., Моисеев С. С., Лунгин В. Г. Доклад на XIV Генеральной ассамблее Европейского геофизического общества. Барселона, 1989. П6. Моффат Г. Возбуждение магнитного поля в проводящей среде. М., 1980. П7. Лихтенберг А., Либерман М. Регулярная и стохастическая ди- намика. М., 1984. П8. Хорстхемке, -Лефевр Р. Индуцированные шумом переходы. М., 1987. П9. Заславский Г. М., СагдееевР. X. Введение в нелинейную физи- ку. От маятника до нелинейности и хаоса. М., 1988.
Памяти Ф. ЦЕРНИКЕ, чье влияние на эту работу простирается даже глубже, чем я это осознаю ПРЕДИСЛОВИЕ АВТОРА К чему набивать полное брюхо мясом, если это мясо не перева- ривается? если оно не превраща- ется в другие элементы? и если оно не придает нам сил? Монтень В последние десятилетия интерес к случайным флуктуациям и описывающим их стохастическим методам чрезвычайно возрос. Число статей, рассеянных по литературе из разных областей знания, ис- числяется, должно быть, тысячами. Этим проблемам посвящены специальные журналы. И тем не менее физик или химик, желаю- щий познакомиться с этой темой, должен немало потрудиться, что- бы отыскать подходящую вводную литературу. Он прочтет статьи Ванга, Уленбека и Чандрасекара — предтечи современной теории, которым уже почти по сорок лет; какие-то полезные сведения он извлечет из книг Феллера, Барухи-Рейда, Стратоновича и немно- гих других авторов. Помимо этих книг он столкнется с устраша- ющей массой математических работ, большая часть которых имеет мало отношения к его потребностям. Предлагаемая книга — попытка заполнить этот пробел в литературе. Первая часть содержит основные положения теории. Ее задача — предоставить физику и химику логически последовательное и до- статочно полное изложение основ теории на понятном им языке. При этом глубокое интуитивное понимание материала считается бо- лее важным инструментом исследования, чем математическая стро- гость и общность. Физические системы в лучшем случае лишь при- ближенно удовлетворяют математическим условиям, на которых основаны строгие доказательства, и физик должен постоянно созна- вать приближенность своих выкладок. (К примеру, колмогоровский вывод уравнения Фоккера — Планка ничего не говорит о том, к каким реальным системам приложимо это уравнение.) Физику также не нужны самые общие формулировки, но глубокое понимание ча- стных случаев позволит ему, когда в этом возникнет необходимость, распространить теорию на новые примеры. В соответствии с таким мнением теория в этой книге развивается в тесной связи с много- численными приложениями и примерами. 8
Вторая часть, начинающаяся с гл. 9, посвящена случайным флуктуациям в нелинейных системах. Этот предмет связан с рядом концептуальных трудностей, впервые указанных Д. К. К. Мак-До- нальдом. Эти трудности имеют скорее физическую, чем математи- ческую, природу. Много затруднений вызывает все еще преоблада- ющее мнение, что нелинейные флуктуации можно исследовать с тех же физических позиций, что и линейные, используя лишь более сложные математические методы. В действительности же нужно иметь более прочное физическое основание и знать свойства физи- ческих систем более детально, чем это было нужно при изучении линейного шума. Этому и посвящена вторая часть, характер кото- рой ближе к монографическому и которая неизбежно основана на моих собственных работах. Преобладающая часть книги написана на уровне, понятном для старшекурсника. Разделы, где излагаются более трудные темы, пе- речислены ниже. Упражнения меняются по трудности от почти тривиальных до довольно сложных. Во многих из них приведены приложения теории, а другие содержат дополнения к основному тексту; некоторые дополнения используются позже. Я надеюсь, что упражнения не вызовут затруднений у читателя, а помогут ему активно вжиться в материал. Особую трудность составляют литературные ссылки. Они не претендуют даже на приближение к полноте. Отбирая ссылки, я хотел лишь помочь читателю. Чтобы подчеркнуть это, ссылки даны в постраничных сносках, где читатель без труда найдет их, не роясь в других местах книги. Моя цель будет достигнута, если приве- денных ссылок окажется достаточно для дальнейших поисков не- обходимой литературы. Ряд важных работ не упоминается явно, их результаты изложены без прямых ссылок. Этого нельзя было избежать, и я приношу свои извинения авторам этих работ и прошу их помнить, что это учебник, а не исследование по истории науки. Полезными могут оказаться следующие рекомендации по поль- зованию книгой. В нумерации параграфов первая цифра означает номер главы, к которой относится данный параграф. В нумерации формул первые две цифры — номер параграфа, в котором приведена данная формула, третья цифра — ее порядковый номер. При первом чтении книги некоторые ее части можно пропустить. Пропуск гл. 2 и § 3.2; 3.5; 4.5; 5.3; 5.6; 5.9; 6.6—6.9, а также гл. 7 не прервет общую нить рассуждений, а потребует лишь небольших дополни- тельных усилий. Эю касается также 8.9; 9.6; 12.5 и гл. 13, где использованы некоторые результаты гл. 2, в то время как гл. 14 посвящена важной, но стоящей особняком теме. Я благодарю Б. Р. А. Нейбоера, X. Фальк и Дж. Гринвельда за сделанные ими критические замечания, студентов, исправивших большое число опечаток в тексте, и Дж. М. Силкенс, неутомимо печатавшую и перепечатывавшую рукопись. Н. Г. Ван Кампен 9
Приведенный ниже список книг несколько отличается от осталь- ного потока литературы. Все это работы более общего плана- Ссылки на них приводятся в тексте в виде цифры (соответствую- щей номеру книги в списке) в квадратных скобках. 1. W. Feller, An Introduction to Probability Theory and its Applications, Vol. 1 (2nd Ed., Wiley, New York, 1957); Феллер В. Введение в теорию вероятностей и ее приложения. М.: Наука 1984,—Т. 1. 2. W. Feller: idem, Vol. 2 (Wiley, New York, 1966); Феллер В. Там же.— Т. 2. 3. А. Т. Bharucha-Reid, Elements of the Teory of Markov Processes and their Applications (McGraw-Hill, New York, 1960); Баруча—Рид A. T. Элементы теории марковских процессов и их прило- жения. М.: Наука, 1969. 4. D. R. Сох and Н. D. Miller, The Theory of Stochastic Processes (Methuen, London, 1965; Chapman and Hall, London, 1972), 5. Selected Papers on Noise and Stochastic Processes (N. Wax ed., Dover Pub!., New York, 1954). 6. R. L. Stratonovich, Topics in the Theory of Random Noise, Vol, 1 (R. A. Sil- verman transl., Gordon and Breach, New York, 1963). 7. S. R. de Groot and P. Mazur, Non-equilibrium Thermodynamics (North- Holland, Amsterdam, 1962); Де Гроот С. P., Мазур П. Неравновесная термодинамика. М.: Мир, 1964. 8. N. G. van Kampen in: Advances in Chemical Physics 34 (I. Prigogine and S. A. Rice eds., Willey, New York, 1976).
ГЛАВА 1 СТОХАСТИЧЕСКИЕ ПЕРЕМЕННЫЕ Эта глава задумана как обзор теории вероятностей, или, скорее, как сводка фактов и концепций, которые понадобятся нам в даль- нейшем. Многие читатели в целях экономии времени могут опустить эту главу и обращаться к ней только от случая к случаю, когда ссылки на нее встретятся в последующем тексте. 1.1. ОПРЕДЕЛЕНИЯ Определить стохастическую переменную X— это значит задать: а) множество ее возможных значений (называемых «областью значений», «множеством состояний», «пространством выборочных значений» или «фазовым пространством»); б) распределение вероятностей на этом множестве. Добавление к а. Множество возможных значений может быть дискретным, например: орлы или решки; число электронов в зоне проводимости полупроводника; число молекул определенной ком- поненты в реагирующей смеси. Множество возможных значений мо- жет быть непрерывным—состоять из значений, непрерывно запол- няющих некоторый интервал, например: одна компонента скорости броуновской частицы (интервал —оо, +°о), кинетическая энергия этой частицы (0, оо), разность потенциалов между концами элект- рического сопротивления (— оо, 4- оо). Множество может быть ча- стично дискретным, частично непрерывным, например энергия электрона в присутствии связывающих центров. Помимо того, мно- жество состояний может быть многомерным. В этом случае X удобно записывать как вектор X. Например, X может обозначать: три компоненты скорости броуновской частицы, совокупность чисел молекул различных компонент в реагирующей смеси, количество электронов, захваченных примесями разных видов в полупроводнике. Для простоты мы будем часто использовать обозначения лишь для множества дискретных состояний и непрерывных одномерных областей, предоставляя читателю возможность выбирать удобные обозначения для других случаев. Добавление к б. В случае непрерывной одномерной области распределение вероятностей дается неотрицательной функцией Р(х)>0, (1.1.1) 11
с условием нормировки ^P(x)dx=l, (1.1.2) где интегрирование распространяется на всю область. Вероятность того, что X принимает значение между х и x + dx, есть Р (х) dx. Примечание. Физики любят изображать распределение вероятностей с по мощью ансамбля. Вместо того чтобы представлять себе одну величину с рас- пределением вероятностей, они вводят воображаемый набор произвольно боль- шого числа N величин, имеющих значения в заданной области. Причем число величин, имеющих значение между х и x-)-dx, равно NP(x)dx. Тогда распре- деление вероятностей заменяется плотностью распределения большого числа «выборок». Это никоим образом не влияет на результат, а является удобным языком для рассуждения о вероятностях, и мы иногда будем им пользоваться. Добавим к этому, что физическая система на самом деле может состоять из большого числа одинаковых объектов, которые в определенной мере и состав- ляют физическую реализацию ансамбля. Например, молекулы идеального газа могут служить ансамблем, представляющим максвелловскую функцию распре- деления вероятностей по скоростям. Другой пример — пучок электронов, рас- сеивающийся на мишени, представляет распределение вероятностей по углам отклонения. Однако использование понятия ансамбля не ограничивается та- кими случаями и не основано на них, а просто служит более наглядным пред- ставлением распределения вероятностей. Попытки ввести физическое взаимо- действие между элементами ансамбля или даже простое рассмотрение этого вопроса являются в принципе неправильными. В непрерывной области функция Р(х) может включать в себя дельта-функции: Р(х) = ^рпд(х-хп) + Р(х), (1.1.3) п где р—финитная или по крайней мере интегрируемая неотрица- тельная функция (рп > 0), и S /?„ -И Р (х) dx = 1. п Физически это можно представить как множество дискретных со- стояний х„ с вероятностью рп, как бы наложенных на непрерыв- ную область. Если Р (х) состоит из одних дельта-функций, т. е. Р(х) = 0, то такое распределение может рассматриваться как диск- ретное распределение рп на дискретном наборе состояний хп. Мате- матическая теорема утверждает, что практически любое распределение на —оо < х < оо может быть записано в виде (1.1.3). В общем виде выражение (1.1.3) содержит три члена, но не выписанный здесь третий член имеет достаточно странный вид и, как правило, не встречается в физических задачах*. Упражнение. Пусть X— число очков, полученных при подбрасывании играль- ной кости. Определите множество возможных значений и распределение вероятностей. Тот же вопрос — для подбрасывания двух игральных костей. * В [2, р. 143] первый член в выражении (1.1.3) назван «атомическим распределением». 12
Упражнение. Подбрасываем монету jV раз. Докажите, что вероятность выпа- дения «орла» точно п раз составляет ^ = 2-jV(n ) (п-0, 1, 2, . . Д') (1.1.4) («биномиальное распределение»). Если выпадение «орла» приводит к вы- игрышу одного пенни, а «решки» — к проигрышу одного пенни, найдите распределение вероятности суммарного выигрыша. Упражнение. Пусть X составлено нз трех компонент скорости молекулы газа. Найдите множество возможных значений и распределение вероятностей. Упражнение. Электрон свободно движется через кристалл объемом й или может быть захвачен одним из некоторого количества точечных центров. Каково распределение вероятностей его координат г? Упражнение. Два объема связаны друг с другом отверстием и содер- жат А невзаимодействующих молекул. Покажите, что вероятность найти п молекул в объеме V'j есть = (1.1.5) где у — V'i/V2 (обобщенное биномиальное распределение, или распределение Бернулли). Замечание. Много других упражнений можно найти в учебниках по эле- ментарной теории вероятностей, например в кн.: J. R. Gray, Probability (Oli- ver and Boyd, Edinburgh, 1967). Уточнение. В качестве альтернативного описания распределения вероят- ностей (в одномерном случае) вместо Р (х) часто используется функция Р (х), определенная как полная вероятность того, что X принимает любое значе- ние сх. Тогдй х + о Р(х)- $ P(x')dx', - 00 где верхний предел интегрирования показывает, что, если Р имеет дельта-пик в точке х, он должен быть включен в интеграл *. Математики называют Р функцией распределения вероятностей н предпочитают ее плотности вероят- ности Р, так как она не содержит дельта-пиков, имеет более простое поведе- ние при преобразовании х, а также в силу привычки. Физики называют Р кумулятивной функцией распределения, но предпочитают ей Р, потому что ее величина в точке х определена самим значением вероятности в х; кроме того, во многих приложениях Р оказывается более простой функцией; еще одна причина состоит в том, что такой подход более тесно связан с устоявшимся описанием вероятности на дискретных множествах состояний и немалое зна- чение имеют просто привычки. В частности, в многомерных распределениях, таких, как максвелловское распределение скоростей, Р довольно неудобна. Далее повсюду мы будем использовать плотность вероятности Р (х) и не бу- дем бояться называть ее распределением вероятности или просто вероятностью. Более общее и абстрактное рассмотрение дается аксиоматической теорией вероятностей **. Ось х заменяется множеством S, интервалы dx — подмноже- ствами 4cS, принадлежащими к соответственно определенному семейству * Это, конечно произвольное условие; можно было бы определить Р (х) как вероятность того, что X принимает значение меньшее, чем х. ** A. Kolmogoroff. Grundbergriffe der Wahrscheinlich heitsrechnung, Ergebn. Mathem. Grenzgeb. 2, no. 3 (Springer, Berlin, 193 ^-Foundations of the Theory of Probability/Chelsea Press, New York, 1950). Или любой учебник с большим математическим уклоном, например, [р. ПО] или М. Loere. Probability Theory I and II (Springer, New York, 1977/78). 13
подмножеств. Распределение вероятностей ставите соответствие неотрицатель- ное число Р(Л) каждому А семейства, причем Р(S) = 1, и если Л и В не пересекаются, то Р(Л + В) = Р(Л)~ Р(В). Такую функцию множества называют вероятностной мерой. Стохастическая переменная ставит в соответствие подмножествам А множество чисел f (Л). В соответствии с нашей программой мы не будем использовать этот подход, а будем пользоваться более конкретным языком. Упражнение. Покажите, что Р (х) должна быть монотонной неубывающей функцией с Р(—оо)=0 и Р(оо) = 1. Как это свойство переносится на функцию Р(Л) в последнем равенстве? Упражнение. В стране с несколькими политическими партиями проводится опрос общественного мнения. Какого объема нужно взять выборку, чтобы быть вполне уверенным, что партия, составляющая 5%, оказалась бы в ней с представительством между 4,5 и 5,5%? Упражнение. Томас Янг заметил, что если два разных языка содержат оди- наковые слова, обозначающие одно и то же понятие, то отсюда еще нельзя сделать вывода, что языки связаны, так как это может быть простым совпадением *. В связи с этим он решил следующую «задачу о случайной встрече», или «задачу о совпадениях»: какова вероятность того, что слу- чайная перестановка предметов не оставит ни одного предмета на месте? Естественно положить, что каждая перестановка имеет вероятность п!-1. Покажите, что искомая вероятность р как функция п подчиняется рекур- рентному соотношению пр(п) — (п — !) р(п— !) -- р (п—2). Найдите р (п) и покажите, что р (п) —> е-1 когда п —< оо. 1.2. СРЕДНИЕ Множество состояний и распределение вероятностей совместно полностью определяют стохастическую переменную, однако часто используют «некоторые дополнительные понятия». Среднее (или ожи- даемое) значение любой функции /(X), определенной на том же пространстве состояний, дается выражением </(%)> = f (х) Р (х) dx; в частности, <Х"’> = цот называют т-м моментом X, a рц—средним. Величину а2 = <(Х-<Х>)2> = р2-ц21 (1.2.1) называют дисперсией, она является квадратом стандартного откло- нения а. Не все распределения вероятностей имеют конечную дисперсию: контрпримером служит распределение Лоренца (или распределение Коши) Р(х) = — —J- (—оо<х<оо). (1-2.2) v ' л (х—а)2 + у2 ' ’ ’ * Phylos. Trans. Roy. Soc. (London, 1819), p 70; M. G. Kendall. Biomet- rika, 55, 249 (1968). 14
Упражнение. Найдите моменты «прямоугольного» распределения, определен- ного выражением Р (х) 0 при | х | > а; Р(х) = (2а)-1 при | х | < а. (1.2.3) Упражнение. Распределение Гаусса определено выражением (ср. § 1.6) -------~ X1 Р (х) =- (2л) 2е 2 (—оо < х < оо). (1-2.4) Покажите, что li,2 + 1 О и р2п- (2п—1)1! — (2n —1) (2л—3) (2л—5) ... 1. Упражнение. Постройте распределение, у которого вплоть до заданного порядка л, но не выше. Упражнение. Из (1.2.1) можно вывести неравенство очевидного факта <| Ао -j А^Х -j- А2Х2 |2> 5= 0 для неравенство существуют моменты ii„ Мг -'М^- Аналогично, из вс<'х Ао, А,], А2 докажите 1 Ml H2 М-1 р2 Мз М2 Мз Мд 0. Найдите аналогичные неравенства для высших моментов *. Упражнение. Убедитесь, что требование (1.1.1) можно заменить условием \ f (х) Р (х) dx 5г 0 для любой неотрицательной непрерывной функции /, которая равна нулю вне конечного интервала. Это условие относится так- же к случаю (1.1.3) и исключает появление производных от дельта-функ- ций в Р. Упражнение. Покажите, что для каждого л- 1, 2, 3 функция е ~х Р(х)=-п— 1п(х), представляющая плотность распределения вероятностей наО<х<оо, не имеет среднего (здесь через 1п обозначена модифицированная функция Бесселя). Характеристическая функция стохастической переменной X, у которой областью возможных значений является множество дей- ствительных чисел или его подмножество, определяется выражением G (k) = <eifex> = eikxP (х) dx. (1.2.5) Характеристическая функция определена для всех действительных k и обладает свойствами G(0) = l, |G(^)|C1. (1.2.6) Она также является производящей функцией моментов в том смысле, что коэффициенты ее разложения в ряд Тейлора по k являются моментами: (1-2.7) т—0 * J. A. Shohat and J. D. Tamarkin. The Problem of Moments (American Mathematical Society, New York, 1943). 15
Это предполагает, что производные от G (k) при k — Q существуют вплоть до тех значений т, что и сами моменты. Та же самая функ- ция служит производящей функцией кумулянтов кт, которые опре- делены выражением logG(fe)= X (1.2.8) т — 1 Они являются комбинациями моментов, т. е. Xi = Pi: х2 = ц2-ц1 = о2; x3 = fi,—3|x2pt-r 2н?; 1 ' х4 = р4 — 4p3pi — Зц2 + 12p2pi — 6р/. Упражнение. Вычислите характеристическую функцию прямоугольного распре- деления (1.2.3) и найдите таким путем его моменты. Упражнение. Покажите, что для распределения Гаусса (1.2.4) все кумулянты, кроме второго, равны нулю. Найдите наиболее общее распределение, обладающее таким свойством. Упражнение. Распределение Пуассона иа множестве натуральных чисел п—0, 1, 2, ... определено выражением р„ = ^-е-“. . (1.2.10) Найдите его кумулянты *. Упражнение. Перейдите в выражении (1.1.5) к пределу V2 — ♦ с», Л’+ оо, jV/|/2 = p-= const. В результате должно получиться выражение (1.2.10) с «—pl'j. Таким образом, число молекул в малом объеме, связанном с бесконечным резервуаром, распределено по Пуассону. Упражнение. Вычислите характеристическую функцию для распределения Лоренца (1.2.2). Как с ее помощью можно показать, что моменты этого распределения не существуют? Упражнение. Найдите распределение и его моменты, соответствующие харак- теристической функции G (k) - cos ak. Упражнение. Докажите, что характеристическая функция любого распределе- ния вероятностей равномерно непрерывна на действительной оси k. Упражнение. Нет причин, из-за которых характеристическая функция должна быть положительной для всех k. Почему это обстоятельство иг ограни- чивает справедливости определения кумулянтов (1.2.8)? Из уравнения (1.2.5) следует, что G (/г) является Фурье-образом от функции Р(х), которая совпадает с Р (х) внутри интервала / и равна нулю вне его. Тогда = G(fc)e-ife*dfe. - CD При нормальном обращении небольшая разница между Р и Р может не проявиться, но для прояснения ситуации сделаем следу- ющее примечание. * Выражение для моментов дано С. S. Kelly. Phys. Rev., В 20, 3221 (1979). 16
Предположим, что х принимает только целые значения п— ... —2, —1, 0, 1, 2, ... с вероятностями рп. Для того чтобы построить характеристическую функцию, нужно записать это диск- ретное распределение как распределение на всех действительных числах: Р(х) = 2^б(х-и). (1.2.11) п Тогда общее определение (1.2.5) дает G(fe) = Sp„e‘^; G (k) является периодической функцией k, а ее Фурье-образ вос- производит, конечно, выражение (1.2.11). Переменная k изменяется в интервале (—оо, оо). Добавим однако, что сама вероятность рп получается выполнением преобразования Фурье по одному периоду: 2л Рп ~ \ G(fe)e-^dfe. (1.2.12) о Любое распределение с множеством возможных значений, состоя- щим из точек па (а > 0; п = . . ., — 2, — 1, 0, 1, 2, . . .), (1.2.13) называют решеточным распределением. Для таких распределений | G(fe)| является периодической функцией с периодом 2л/а, и, сле- довательно, она принимает максимальное значение, равное единице, не только при k—Q. Этот факт характеризует решеточные распре- деления; для всех других распределений неравенство (1.2.6) может быть сделано строгим*: |G(Ze)|<l, /?=#0. (1.2.14) В более общем случае можно задать вопрос: как отражается на свойствах функции G тот факт, что значения величины х содер- жатся в подмножестве / множества действительных чисел? Если / представляет собой —а < х < а, то известно, что G (k) аналитична во всей комплексной /г-плоскости и относится к «экспоненциальному типу»**. Если / является полуосью функция G (k) анали- тична и ограничена в верхней полуплоскости. Однако полного от- вета на поставленный вопрос в общем виде не существует, и это обстоятельство оказывается важным в некоторых задачах. * Об этих и других свойствах характеристических функций см.: Е. Lukacs Characteristic Functions (Griffin, London, 1960); P. A. P. Moran, An Introduc- tion to prabability theory (Clarendon, Oxford, 1968). ** R. E. A. C. Paley and Wiener, Fourier Transforms in the Complex Do- main (American Mathematical Society, New York, 1934). 17
Примечание. В практических вычислениях множитель i в (1.2.7) и (1.2.8) неудобен. Этого можно избежать, если положить ik = s и использовать харак- теристическую функцию <е5У>; надо, однако, иметь в виду, что ее существо- вание гарантировано только для чисто мнимых s. Когда X принимает только положительные значения, использование функции <e_-sX>, существующей в правой полуплоскости комплексной s-плоскости, имеет некоторые преимущества. Если X принимает только целые значения, удобно использовать производящую функцию вероятности F (z) —<г-у>, которая однозначно определена для всех г на единичной окружности |г|=1 и будет использована в гл. 6. Когда X при- нимает только неотрицательные целые значения, F (г) также определена и ана- литична внутри этого круга. Упражнение. В действительности наиболее общее решеточное распределение определяется не множеством возможных значений (1.2.13), а множеством па-f-Ь. Пользуясь этим определением докажите, что (1.2.14) остается в силе тогда и только тогда, когда Р (х) не является решеточным распределением. Упражнение. Возьмите любые г действительных чисел kt, k2, ..., kr и рас- смотрите гхг-матрицу, у которой элементом с индексами t, / служит G (k, — kj). Докажите, что эта матрица нормально положительно опреде- лена, но может быть полуопределенной для некоторых специальных рас- пределений. Функции G, обладающие этим свойством для всех множеств {£}, называют положительно определенными или положительного типа. Упражнение. Когда X принимает значения только 0, 1, 2, ..., факториаль- ные моменты Фт можно определить следующим образом: Фо = 1 , , ] г> 1 г у Фда = <Л(Л-1)(Л-2)...(Л-т+1)>(щ^1). ' ' ’ Покажите, что все они также генерируются функцией F, а именно; К(1~х)= £ (1.2.16) т =0 Упражнение. Факториальные кумулянты определены выражением logF(l-x) = X (1.2.17) т = 1 Выразите несколько первых из них через моменты. Покажите, что у рас пределения Пуассона (1.2.10) все факториальные моменты, кроме 9t, равны нулю. Упражнение. Найдите факториальные моменты и кумулянты для распределе- ния (1.1.5). Упражнение. Гармонический осциллятор с уровнями nhv (п = 0, I, 2, ...) в термодинамическом равновесии имеет вероятность находиться на уровне п: Рп = (1—У)Уп, (1.2.18) где у = ехр[—hv/kT)]. Эту функцию называют геометрическим распреде- лением илн распределением Паскаля. Найдите факториальные моменты и кумулянты такого распределения и покажите, что его дисперсия больше, чем у распределения Пуассона с тем же самым средним. Упражнение. Hohlraum — это набор большого числа осцилляторов с различ- ными частотами. Предположим, что имеется Z осцилляторов в интервале частот Av, много меньшем, чем kT/h. Вероятность найтн п квантов в этой группе осцилляторов дается «отрицательным биномиальным распреде- лением» * (Г2.19) * См., например: D. der Haar, Elements of Statistical Mechanics (Holt, Kinehart, and Winston, New York, 1954), p. 74. 18
(для Z=1 это выражение сводится, конечно, к (1.2.18)). Выведите из (1.2.19) аналогичную формулу для равновесных флуктуаций в Бозе-газе. Упражнение. Обычные кумулянты удобно использовать, если приходится иметь дело с распределением Гаусса, а факториальные кумулянты — с распреде- лением Пуассона. Другие кумулянты можно определить таким образом, чтобы они были удобны в работе с другими распределениями. Например, определите пт следующим образом: 1 = 1 _ у (~хУп л F(l — х) 2- т\ т т — 1 — и покажите, что все ,т,„ для т > 1 равны нулю тогда и только тогда, когда распределение имеет вид (1.2.18). 1.3. РАСПРЕДЕЛЕНИЯ ДЛЯ МНОГИХ ПЕРЕМЕННЫХ Пусть X— случайная переменная, имеющая г компонент Хх, Х2, . .., Хг. Ее плотность вероятности Рг(х1( х2, . .., хг) называют также совместным распределением вероятности г переменных А’,, Х2, . . ., Хг. Возьмем подмножество s < г переменных А\, Х2, . . ., Xs. Вероятность того, что эти переменные имеют значения, лежащие между Xi, Xj-t-dxj, х2, x2 + dx2 и т. д., независимо от значений остальных переменных XJ41, . . ., Хг составляет РДХ1, .., xj= 5 Рг(х1, . .., xs, xj+1, . . ., xr)dx5+1.. .dxr. (1.3.1) Это так называемое частное распределение для подмножества. С другой стороны, переменным Х5+1, . .., Хг можно приписать фиксированные значения и рассматривать совместную вероятность распределения остальных переменных Х1т ..., Xs. Это называется условной вероятностью переменных Хъ ..., X, при условии, что остальные переменные Х5+1, Хг имеют заданные значения xs+1, ..., хг. Условную вероятность будем обозначать следующим образом *: Ps|r-s(Xi, ..., xjxi + 1, ..., xr). (1.3.2) Понятие условной вероятности можно пояснить на физическом языке следующим образом: из ансамбля, представляющего распределение в r-мерном пространстве, можно выделить подансамбль выборок, в которых Xi+i = xi+1, ..., Хг = х2, тогда распределение вероят- ности в таком подансамбле есть (1.3.2). Полное совместное распределение Рг равно частному распреде- лению вероятности того, что переменные Xi+i, ..., Хг принимают значения xi+1, ..., хг, умноженному на условную вероятность того, что это в самом деле так, когда остальные переменные принимают * Некоторые авторы используют обратное обозначение, записывая задан- ные переменные в первой части скобки. 19
значения хг, . . ., xs. РГ (,Х1< 1 хг) — Рг-s (-^s+l, • , xr) Pi | r-s (а, • • , \s 1 + • • • , xr)- Это так называемое правило Байеса. Его обычно записывают в виде Ps|r_s(x1( .... x,|xi+lt xr) = -р . (1.3.3) Предположим, что г переменных можно разбить на два множества (Хп . . Xs) и (Xi+l, • • Хг), так что Рг факторизуется: Pr(xi ^г) = РДх1, xs)Pr_s(xs^, xr). Тогда эти два множества называют статистически независимыми друг от друга. В этом случае множитель Ps является частной плотностью вероятности переменных Х2, Х2, . . ., Xs. В то же время он является условной плотностью вероятности Ли-Л*), . . xJx5+!, .... ХГ)-Р5(Х!, .... xj. Это означает, что задание величин Хъ . . ., X, не влияет на рас- пределение переменных Х5.н1, ..., Хг, и наоборот. Замечание. Нетрудно убедиться, что если знаменатель в выражении (1.3.3) обращается в нуль, числитель также обращается в нуль. Для таких значений Хз+1, хг левая часть равенства не определена. Таким образом, условная вероятность не определена, если условие не может быть выполнено. Упражнение. Докажите и поясните нормировку условной вероятности J?s|r_s(Xl, .... Xi|X5J.i, Xr) = Pf(Xi, *s)=l. (1.3.4) Упражнение. Какой вид имеет совместная плотность вероятности, если все переменные взаимно независимы? Упражнение. Максвелловский вывод распределения по скоростям в газе осно- ван на предположениях, что распределение может зависеть только от мо- дуля скорости 11> | и декартовы компоненты скорости статистически неза- висимы. Покажите, что эти предположения приводят к закону Максвелла. Упражнение. Вычислите частную и условную вероятности для двумерного кольцеобразного распределения: P2(Xi, х2) = л~1б(х1 + х2-~а2). Упражнение. Обобщите это распределение на случай г переменных, равно- мерно распределенных на гиперсфере в«г измерениях, т. е. мнкроканони- ческое распределение идеального газа. Найдите частное распределение для Xi- Покажите, что оно становится гауссовым в пределе г -► оо при условии, что радиус сферы возрастает пропорционально У г- Упражнение. При бросании двух игральных костей выпало 9 очков. Найдите распределение вероятности очков, выпавших на первой кости при задан ной сумме. Почему этот результат не противоречит очевидному факту не- зависимости игральных костей? Упражнение. Пусть Р (t) — распределение вероятности продолжительности жизни в популяции. Покажите, что условная вероятность дожить до возраста т для отдельного представителя популяции дается выражением СО P(/|T) = P(0/JPU')dr. (1.3.5) т 20
Отметим, что в случае Р (t) =ye~',t имеем Р (t | т) = Р (I—т): вероятность вы- живания не зависит от возраста. Покажите, что это единственный случай, когда это так. Моменты многомерного распределения имеют вид <Х7’ХТ!. . .Х7Г>=$ х'Г‘х?. . .x?rP(xlt х2, .... xr)dxjdx2.. .dxr (их можно было бы обозначать pWi, .... тг, но это обозначение ста- новится неудобным в случае многих переменных). Характеристиче- ская функция в этом случае зависит от г вспомогательных пере- менных: G(/ej, k.2, kr) — <ei(ftiXi+*’X2+ •• *krXr)y. Ее разложение в ряд Тейлора по переменным k генерирует моменты G(klt = . .Х?г>. (1.3.6) О 1- 2- г- Кумулянты теперь будем обозначать двойными угловыми скобками, определив их следующим образом: log G (k„ k2, . . ., kr) = У «Х^Х?2.. .X?'», (1.3.7) где штрих означает отсутствие члена со всеми т, одновременно равными нулю (обозначение с двойными скобками не является общепринятым, но удобно в случае нескольких переменных). Вторые моменты можно объединить в rxr-матрицу <Х,Х/>. Более важным понятием является матрица ковариаций «Х^-» = <(Х,—<Х;» (Ху - <Х7» = <Х,.Ху>-<Х,.> <Ху>. (1.3.8) Ее диагональные элементы являются дисперсиями, а недиагональ- ные элементы называют ковариацией или смешанными моментами второго порядка. Когда последние нормированы, их называют коэф- фициентами корреляции: ...- (ез 9) К«хЬ>«х?» К (<хЬ--<х«>2)(^>-<Ху>’-) Рассмотрим случай, когда г = 2; статистическая независимость выражается одним из следующих трех критериев: 1) все моменты факторизуются: <Х^’Х7'> = <Х7*> <Х'"’>; 2) характеристическая функция факторизуется: G(kr, kl) = Gi(k1)Gi(ktY (1.3.10) 21
3) кумулянты <^Х™>Х%Ч^> обращаются п нуль, когда обе вели- чины nii и т2 отличны от нуля. Переменные Xt, Х2 называют некоррелированными, когда извест- но, что их ковариация равна нулю. Это условие является более слабым, чем статистическая независимость. Причина, по которой такое свойство имеет специальное название, состоит в том, что пер- вый и второй моменты достаточно хорошо описывают многие конк- ретные случаи. Упражнение. Рассмотрите частное распределение некоторого подмножества всех переменных. Выразите его моменты через моменты полного распределения, а его характеристическую функцию—через полную характеристическую функцию. Упражнение. Докажите упомянутые выше три критерия статистической неза- висимости и обобщите их на случай г переменных. Упражнение. Докажите, что —l«Sp;y=£l. Докажите, что если р,у принимает значения 1 или —1, переменные Х-, X , связаны линейным соотношением. Упражнение. Покажите, что для любого множества Xj, ..., Хг можно найти г линейных комбинаций Y^^aifXf (i^\...........г) / = 1 таких, что новые переменные Y взаимно некоррелированы (процедура орто- гонализации И. Шмидта). Упражнение. Покажите, что каждый кумулянт <Х™ :Х™2... Х'”г> является «изобарической» комбинацией моментов, л. е. линейной комбинацией про- изведений моментов, такой, что сумма показателей в каждом произведении одна и та же, а именно /П1 + /П2+ • -\-тг. Упражнение. Докажите, что «независимость» подразумевает «некоррелирован- ность», и постройте пример, показывающий, что обратное утверждение неверно. Упражнение. Найдите моменты и кумулянты двумерного распределения Гаусса --i- <ах2 \ 2bxy -cy-) Р (х, у) — const е 2 (ас — Ь2 > 0, а > 0). Покажите, что для этого распределения «некоррелированность» и «неза- висимость» эквивалентны. Упражнение. Молекула может занимать различные уровни п1т п2, ... с веро- ятностями pi, р2, . Предположим, ' что имеется N таких молекул. Ве- роятность найти следующие одним за другим уровни, занятые Л\, молекулами, дается мультиноминальным распределением <L3 H) Упражнение. Коэффициенты корреляции для трех переменных удовлетворяют условию ( 1 + РI2) ( 1 + Р13) ( 1 + Раз) -jj- (1 + р!2 + Р13 + Ргз)2- Упражнение. Если распределение получено из серин наблюдений, оно часто имеет вид одного горба. Первый и второй кумулянты—это грубые показа- тели его положения и ширины. Дальнейшая информация о его форме со- держится в его «асимметрии», определенной соотношением у3 = х3/х^2 него 22
«эксцессом» Yi-х4/х2. Докажите*, что Y?<Y* + 2. Упражнение. Многомерные факториальные моменты, обозначенные фигурными скобками, определены очевидным обобщением выражения (1.2.16): ' / 7 / /П1 /П2 • • • 1 2 V 7 7 {т} 1 Многомерные факториальные кумулянты, обозначенные квадратными скоб- ками, определяются выражением (~г^'‘,(~,г2угг"' (1-3.13) ' {т} Выразите несколько низших из них через моменты, в частности |Х,-Х/1 = <Х,-Х/>-<Хг><Х/>. (1.3.14) Упражнение. Факториальный кумулянт суммы двух статистически независимых переменных является суммой их факториальных кумулянтов. Факториаль- ный кумулянт, включающий два взаимно независимых набора переменных, равен нулю. 1.4. СЛОЖЕНИЕ СТОХАСТИЧЕСКИХ ПЕРЕМЕННЫХ Пусть Хь Х2—две переменные с совместным распределением Рх(хх,х2). Вероятность того, что У = Хх + Х2 принимает значение между у и z/}Az/, составляет Ру(//)А//=- 5$ Рх (xlt х2) dx, dx2. у<х,+хг <у+Ьу Отсюда следует Ру (Р)= ~гх2—у)Рх (х„ x2)dxt dx2= $Px(Xj, z/—х,) dx,. (1.4.1) Если X,, X2 независимы, это соотношение превращается в следующее: Ру(р)- $ />х1(х1)Рх2(р—x1)dx1. (1-4.2) Таким образом, плотность вероятности суммы двух независимых переменных является сверткой их отдельных плотностей вероятности. Легко вывести следующие три правила, касающиеся моментов. Первое универсальное тождество <У> = <Хх> + <х2> утверждает: среднее суммы равно сумме средних, при этом не имеет значения, являются ли Хх, Х2 независимыми или нет. Второе правило состоит в том, что если X,, Х2 некоррелированы, то аУ = °х. + <тх!. (1.4.3а) * Другие неравенства такого типа данй А. А. Дубковым и А. Н. Малахо- вым: Radiophys., Quantum. Electron. (USA) 19, 833 (1977). 23
или в наших обозначениях <<(-^1+ (1.4.36) Для переменной Y характеристическая функция G у (/г) = бХ1х2 (/г, k). Если Xlf X, независимы, правая часть факторизуется в соответст- вии с (1.3.10), так что GY(k) = GXl(k)Gx2(k). (1.4.4) Это третье правило: для независимых переменных характеристи- ческая функция суммы является произведением их отдельных харак- теристических функций. Примечание. Можно было бы выдвинуть следующее логическое возраже- ние. В § 1.1 стохастические переменные были определены как объекты, сос- тоящие из множества возможных значений и распределения вероятностей. Алгебраические операции с такими объектами, следовательно, должны быть скорее определены, чем выведены. Значит, логичнее было бы сложение, об- суждаемое в этом параграфе, и преобразования, рассматриваемые в следующем разделе, рассматривать как определения, конечно, если будет показано, что свойства этих операций, очевидные для нас, действительно являются следст- виями определений. Усреднение является особым видом операции, поскольку оно связывает стохастическую переменную с нестохастическим, или «регулярным», числом. Оно может быть рассмотрено и как проецирование, осуществляемое следующим образом. Множество всех стохастических переменных содержит подмножество переменных, плотность вероятности которых есть дельта-пик. Это подмноже- ство изоморфно «регулярным» числам из множества возможных значений и может быть отождествлено с ними. Тогда операция усреднения является про- ецированием полного пространства стохастических переменных на это подмно- жество. Этот факт будет использован в (14.4.6). Упражнение. Докажите свойства (1.4.3) и покажите на примере, что условие некоррелированности переменных Х1( Х.г является необходимым. Упражнение. Обобщите эти утверждения на сложение более чем двух переменных. Упражнение. Сформулируйте правила для суммы двух или большего числа векторных переменных (дисперсию нужно заменить матрицей ковариаций). Упражнение. Для независимых переменных кумулянты суммы равны сум- ме кумулянтов. Соотношение (1.4.3) является частным случаем этого правила. Упражнение. Все три приведенные выше правила используют как само собой разумеющееся в кинетической теории газов. Приведите примеры. Упражнение. В пространстве стохастических переменных скалярное произ- ведение можно определить как <ХУ>. Докажите, используя это определе- ние, что проецирование на среднее является эрмитовым оператором. Упражнение. В пространстве действительных матриц X размером X х Л' функция X <Х> (Sp MX)/(Sp Л-1), где М — фиксированная матрица, является линейной проекцией X на дей- ствительные числа, эта функция отображает единичную матрицу на 1. Этих свойств достаточно для установления тождества <ех>---ехр [<Х>+ J-«X2»4-1«X3>>4 ... j. Старый, но все еще поучительный пример — это дискретные по времени случайные блуждания. Пьяница движется вдоль прямой, делая 24
каждый следующий шаг либо влево, либо вправо с одинаковой вероят- ностью. Его возможные положения представляют собой целые числа — оо<п<оо. Требуется найти вероятность рп(г) его нахождения в положении п после г шагов с точкой старта в п = 0. В § 4.5 мы будем трактовать этот пример как случайный процесс, здесь же рассмотрим его как задачу о сложении переменных. Каждому шагу соответствует стохастическая переменная X,- (/—1,2, .... г), принимающая значения 1 и —1 с вероятностью 1/2 каждое. Положение после г шагов дается выражением У X, Х2- . . . -уХг. Отсюда сразу находим <У> = 0, и так как шаги взаимно независимы, то (У2> = г <Х2> = г. (1.4.5) Тот факт, что средний квадрат смещения пропорционален числу шагов, является типичным для процессов диффузионного типа. Это предполагает для смещения за единичное время / ! Y \i \ 1 п п₽и г °°- Отсюда следует, что дисперсия средней скорости с увеличением времени стремится к нулю. Это отличает диффузионное рассасыва- ние от распространения посредством свободно разлетающихся частиц или в виде волн. Для того чтобы найти детальное распределение вероятности Y, используем характеристическую функцию G, (/г, г) --- (/?)У [1е^+уе-^]Л. (1.4.6) Вероятность того, что Y принимает значение п, есть коэффициент при = 2^^ (г—я)/2 ) • (1-4-7) Понятно, что биномиальные коэффициенты равны нулю, пока (г — п)/2 есть целое между 0 и г включительно. Распределение (1.4.7) параметрически зависит от числа шагов г. Его асимптотическая форма для больших г представляет особый интерес, потому что она имеет простой вид, который, как будет видно в гл. 7, в значительной мере нечувствителен к деталям мо- дели. В соответствии с (1.4.5) распределение становится очень широ- ким с ростом г и, следовательно, покрывает много отдельных положений п. Тогда имеет смысл заменить дискретное п непрерыв- ной переменной х и «размазать» рп. Формально плотность вероят- 25
ности Р (х, г) мы вводим, полагая Р(х, г)Дх = S Рп(г). х <пг- <хч Дх Масштаб подбирают таким образом, чтобы сделать ширину постоян- ной. В результате отдельные шаги перенормируются множителем г~1-2. Интервал Ах мал, но конечен, так что для больших г он содержит много положений, а именно г12 Ах. Используя формулу Стирлинга, находим Р(х, r)Ax~yr1/2 Дх^ехр | rlogr — Iog2nr —Ц-^Iog^^- Г — П 1. . . Г—И , r-]-n , r-'rn 1, , , , I -r-2----j logn(r-n)----§-|og^- + -2----ylogn(r+n)J . Коэффициент 1/2 введен, потому что каждая вторая рп равна нулю. Собирая члены требуемого порядка, получаем выражение lira Р (х, г) =-------е г-»х V 2 л (1.4.8) которое является распределением Гаусса (1.2.4). Упражнение. Дайте чисто комбинаторный вывод выражения (1.4.7) путем подсчета числа последовательностей из г шагов, оканчивающихся на п. Упражнение. Положив k — ur~1/2, получите из (1.4.6) асимптотическую формулу (1.4.8). Упражнение. При асимметричных случайных блужданиях на каждом шаге веро- ятность шага влево есть q и вероятность шага вправо 1—q. Найдите р„(г) для этого случая. Упражнение. Предположим, что на каждом шаге имеется вероятность qv сде- лать шаг длиной v единиц (v—±1, ±2, ...), а также вероятность qa ос- таться на месте. Найдите рп (г) для больших г. Упражнение. Пусть имеется бесконечное множество {X/} независимых стохас- тических переменных с одинаковыми распределениями Р (х) и характерис- тической функцией G (k). Пусть г есть случайное положительное целое число с распределением рг и производящей функцией вероятности f(z). Тогда Y =-%14-Хг+ • +ХГ есть случайная переменная. Покажите, что ее характеристическая функция есть (Распределение Y называют «сложным распределением», см. (1, гл. XII].) 1.5. ПРЕОБРАЗОВАНИЕ ПЕРЕМЕННЫХ Пусть непрерывная однокомпонентная переменная X отобража- ется на новую переменную Y с помощью соотношения Y = f(X). (1.5.1) Хорошо знакомыми примерами служат переход к логарифмической шкале (У = logX) и преобразование от частот к длинам волн (У=1/Х). Вообще говоря, области изменения Y и X могут отличаться друг от друга. Вероятность того, что Y принимает значения, лежащие 26
между у и у-^&у, дается выражением рг(у)&У = $ Px(x)dx. y<f(x)<g~ Ay Интеграл берется по всем интервалам области изменения X, в ко- торых выполняется неравенство. Это же соотношение можно запи- сать в следующем виде: PY(y)^6[f(x)-y]Px(x)dx. (1.5.2) Отсюда для характеристической функции переменной Y выводим: Gy (/<) = <(1.5.3) Эти выражения остаются справедливыми, если векторы X и Y имеют соответственно г и s компонент, причем s и г могут быть не равны. Типичный пример случая с r = 3, S--1—это преобразо- вание распределения Максвелла для X = (их, иу, иг) в распределение по энергиям Е = 1/2m(vx +VI +v2z): . , z , ту2 P (£) = ( 6 ( у mu2 —E j 3 ‘e -kT dux duy duz - = 2л-1/а (feT)-3 2Ei/2e kT («гамма-распределение», или «^-распределение»). В частном случае, когда только одно значение X соответствует каждому значению Y (и следовательно, r = s), можно обратить (1.5.1) и получить Х = £(У). В этом случае преобразование плотности вероятности сводится к Py(z/) = Px(x)J, где J — абсолютное значение определителя Якоби d(x)/d(y). Это соотношение можно запомнить в виде Py(y)d'-y = /’x (x)drx, при этом нужно позаботиться о выполнении условия единственности и иметь в виду, что может возникнуть необходимость изменить знак. Примечание. Рассмотрим, в частности, группу линейных преобразований У-=аХ^Ь, а 0 (1.5.4) Они преобразуют Рх в Ру, но разница столь незначительна, что они часто рассматриваются как одно и то же распределение и имеют одинаковое назва- ние. Это преобразование можно использовать для приведения распределения к стандартному виду, например к распределению с нулевым средним значением и единичной дисперсией. В случае решеточного распределения преобразова- ние (1.5.4) можно применять для того, чтобы совместить узлы решетки с целыми числами. Действительно, использование (1.5.4) для сведения распределения к простой форме столь тривиально, что оно часто делается неявно при поста- новке задачи или при выборе нуля и масштаба. 27
Упражнение. Выведите уравнения для сложения переменных как частный случай формул преобразования настоящего раздела. Упражнение. Семейство гамма-распределений определено при помощи соотно- шения av Р 'е > °- v > °- 0 < * < °°)- (1.5.5) Пусть Xlt Х2, .... Хг — независимые гауссовы переменные с нулевыми средними значениями и дисперсией о2. Докажите, что Y — Х% - Xl — ... ...Хгг является гамма-распределением. Упражнение. Предположим, что диаметры набора шаров распределены в соот- ветствии с (1.5.5). Предположим, что все они имеют одинаковую форму, так что их объем у = х3. Найдите распределение у. его среднее и диспер- сию и сравните их с соответствующими свойствами х. Упражнение. Пушка выстреливает ядро с начальной скоростью' v и углом к горизонту 0. Обе переменные и и 0 могут быть источником неопределен- ности, которая описывается гауссовым распределением для каждой пере- менной. Распределения центрированы соответственно в точках и 0о и столь остры, что нефизическими значениями, такими, как: отрицательные v или 0, можно пренебречь. Каково распределение вероятности дальности полета пушечного ядра? Упражнение. Как преобразование (1.5.4) влияет на кумулянты? Упражнение. Множеством возможных значений X является интервал (0, 2л), плотность вероятности постоянна в этой области. Найдите распределение V-sinX. Сделать то же самое, когда Р(х') = А 4-В sin х j причем | <Л = 1 \ — ~— I . 2Л ; Упражнение. Точка занимает t равной вероятностью любое место на окруж- ности. Каково распределение ее азимутального угла по отношению к'неко- торой точке, смещенной из центра окружности? Упражнение. Рассеивающий центр бомбардируется однородным пучком частиц. Налетающая частица с прицельным параметром отклоняется на угол 0 (Ь). Найдите дифференциальное сечение рассеяния. Уточнение. Вся теория вероятностей представляет собой не что иное, как преобразование переменных. Некоторые распределения вероятности должны быть априорно заданы на множестве элементарных событий; дальнейшая задача состоит в преобразовании их в распределения вероятностей для возможных исходов, каждый из которых соответствует набору элементарных событий. Когда бросают две игральные кости, имеется 36 элементарных событий, при этом предполагается, что они имеют равную вероятность. Задача состоит в нахождении вероятности различных возможных сумм очков путем подсчета числа элементарных событий, приводящих к набору каждой суммы. Математика может только вывести вероятности исходов из заданных a priori распределений. В приложении к реальному миру сначала нужно решить, какие заданные a priori распределения правильно описывают данную ситуацию. В задачах об азартных играх или о шарах в урнах правильный выбор (или по крайней мере правильный выбор, который имеет в виду автор) обычно столь ясен, что его обычно даже не упоминают. Это привело к ошибочной точке зрения, что чистая математика способна указать вероятности действительных событий, которые должны произойти, что, в свою очередь, привело к появле- нию большого количества литературы полуфилософского характера *. Одна из попыток избежать явного предположения об априорной вероят- ности представляет собой «принцип недостаточности причин», который утверж- * В качестве обзора: Lucas J. R. The Concept of Probability (Clarendon, Oxford, 1970). '28 .
дает, что два элементарных события имеют одну и ту же вероятность, если нет причин считать иначе. Это в лучшем случае рабочая гипотеза: никакой философский принцип не подскажет, как идет игра — честно или краплеными картами. Этот принцип определенно не может лежать в основе квантовой •статистики *. со случайной хор- дой Более того, этот принцип становится вообще неприменимым, когда область возможных состояний непрерывна (так называемая «геометрическая вероят- йо'йь»); Любое интуитивное представление, что равные вероятйбсти должны быть приписаны интервалам рав- ной длины или равным объемам, зависит от выбора переменных. Поэтому такая интуитивная гипотеза ли- шена смысла, пока не определен выбор переменных. Обычно это можно сделать несколькими способами и иног- да неясно, какой из них предпочтительнее. Равномерное распределение в пространстве скоростей—это не то же самое, что равномерное распределение по энергиям. Опасность интуитивных представлений о равных ве. роятностях была красиво продемонстрирована Бертра. ном**. Возьмем фиксированную окружность единич. ного радиуса и нарисуем «случайным образом» пря. мую линию, пересекающую ее (рис. 1). Какова веро. ясность того, что хорда имеет длину больше, чем У 3/ (Значение V 3 является длиной стороны равностороннего треугольника, вписанного в единичную окружность.) Первый ответ. Возьмем две случайные прямые, проведенные через произвольно выбранную фиксирован- ную точку Р, принадлежащую окружности. Все они, кроме касательной (вероятность равна нулю), пересекают окружность. Для того чтобы хорда была длиннее, чем р 3, она должна лежать внутри угла 60“, в то время как допустимы углы от 0 до 180', следовательно, вероятность этого равна 1/3. Второй ответ. Возьмем случайные прямые, перпендикулярные фикси- рованному диаметру. Длина хорды окажется больше J' 3, если точка пересече- ния Принадлежит средней половине диаметра; тогда вероятность составит 1/2. Третий ответ. Для того чтобы хорда была длиннее У 3, ее центр должен лежать на расстоянии, меньшем 1/2 от центра. Площадь круга радиуса 1/2 составляет четверть площади исходного круга, тогда вероятность равна 1/4. Читатель может легко заметить, что каждое решение основано на различных предположениях о равных априорных вероятностях. Неопределен- ное выражение «случайным образом» не определяет априорной вероятности б достаточной мере для того, чтобы сделать выбор между решениями. Использование метода’ наименьших квадратов для выделения информации из несовершенных наблюдений предполагает специфическое априорное распре- деление вероятности ошибок, а именно распределение Гаусса. То же самое предположение не может быть справедливым для всех переменных, которые могут быть использованы для измерения наблюдаемых величин (не более чем для одной переменной и тех переменных, которые связаны с ней линейными соотношениями). Метод наименьших квадратов, примененный к одним и тем же данным, записанным в частотной шкале и как функция длины волны, не дает одинаковых результатов; «Наилучшая оценка» яркости звезды зависит от того, применяется метод наименьших- квадратов к звездной величине или к ее светимости, выраженной в'энёргетических единицах. Спасительным обстоятель- ством служит то; что при малых ошибках любое разумное преобразование * Tohnati R. С. The Principles - of Statistical Mechanics (Clarendon, Oxford, 1938). ** Betntrahd J. Calctrl des' pTobabilites (Gauthiers-Villars, Paris, 1889). 29
является практически линейным в соответствующей области. Однако нет логи- ческого обоснования для применения этого метода к данным с широким р азбросом. Существует особый аспект вечной проблемы индукции: каким образом наука умудряется выводить общие законы из неизбежно ограниченного коли- чества наблюдений? Поскольку классическая логика не может ответить на этот вопрос, было предпринято много попыток обратиться к вероятностному рас- смотрению. Целью такого подхода является вычисление вероятности того, что гипотетический закон справедлив, если задан набор наблюдений. Предыдущее обсуждение показало, что этот вопрос не имеет ответа до тех пор, пока не будет задана или предположена априорная вероятность всех возможных гипотез. Если я вытащу шар из урны и он окажется черным, какова вероятность того, что все шары в этой урне черные? Вопрос не имеет ответа до тех пор, пока не будет известно, что урны выбраны из заданного ансамбля урн, содержащих черные и другие шары в заданной пропорции. Когда гипотеза является науч- ной теорией, выдвинутой для объяснения определенных наблюдаемых фактов, никакие априорные вероятности не даны и даже «множество всех возможных гипотез» является весьма туманным понятием *. Вероятность того, что теория верна, не может, следовательно, быть выра- жена объективно в виде процентов, а является субъективной величиной и может обсуждаться. И все же часто соглашение может быть достигнуто, когда число подтверждающих наблюдаемых фактов велико и вероятность a posteriori также велика, несмотря на то что выбранные априорные вероятности очень малы. Но эти вероятности невозможно разумным способом выразить числами. Упражнение. Вычислите распределение вероятности длины хорды в трех слу- чаях примера Бертрана. Упражнение. N урн содержат Ьк черных шаров и ак других (6=1,2, .... N). Я случайным образом выбираю одну урну (все урны равновероятны) и случайным образом вытаскиваю один шар. Если он черный, какова вероят- ность, что я выбрал k-ю урну? Найдите ответ для случая, когда я выби- раю урну с вероятностью, пропорциональной количеству шаров, содержа- щихся в ней. Упражнение. Покажите, что распределение Лоренца по частотам является также распределением Лоренца по длинам волн. Упражнение. Предположим, вы ожидаете, что х является функцией t в виде /(/; а), где а означает набор параметров, которые должны быть найдены из наблюдаемых величин X; в моменты Ц. Метод наименьших квадратов состоит в их определении из условия {х,— а)}2 = minimum. i Преобразуйте задачу к новой переменной у = Ф(х) и покажите, что мини- мизация этой переменной приводит к другому значению а. 1.6. РАСПРЕДЕЛЕНИЕ ГАУССА В общем виде это распределение для одной переменной запи- сывается следующим образом: Р (х) — Се 2 Вх (— оо < х < оо), (1.6.1) * К. R- Popper на с. 287 в: «Предположения и опровержения» (Harper and Row, New York, 1968) утверждает, что наименее вероятные теории наиболее ценны. Он имеет в виду, что на наиболее определенные предсказания, которые дает теория, менее всего можно положиться a priori, но тем больше их цен- ность, когда они оказываются правильными, т. е. когда их вероятность а posteriori после проверки и сравнения с действительностью оказывается близ- кой к единице. 30
где А — положительная константа, определяющая ширину распреде- ления, В определяет положение пика, а постоянная нормировки, С= (Z^-y/2e-B2<^). (1.6.2) \2л у' ' ' Часто бывает удобным выразить параметры А и В в терминах среднего рх = — В/А и дисперсии о2 =1/71: Р (х) == (2ло2)-1 2ехр • (1.6.3) Это распределение называют распределением Гаусса или нормальным распределением*. Для ссылок мы запишем его характеристическую Функцию G{k)=--^'k~~a'lk\ (1.6.4) Тля этого распределения особенно удобно использовать кумулянты х1 = р1, х2=о2, х3 = х4 = . . . = 0. Если Хи Х2, ..., Хг— взаимно независимые гауссовы перемен- ные, то их сумма Y = X, + Х2 д- . . . 4-Хг тоже является гауссовой, что сразу видно из формулы (1.4.4). Среднее значение и дисперсия Y являются суммами средних и дисперсий переменных X. Это пол- ностью определяет распределение Y. Упражнение. Найдите моменты распределения (1.6.3). Упражнение. Докажите, что (1.6.3) стремится к 6 (х—когда <52 стремится к нулю (умножьте на пробную функцию и проинтегрируйте). Упражнение. Свойство двух независимых гауссовых переменных образовывать в сумме снова гауссову переменную не является уникальным. Докажите, что распределения Лоренца и Пуассона обладают аналогичным свойством. Упражнение. Докажите, что свертка двух гамма-распределений (1.5.5) с одним и тем же а тоже является гамма-распределением. Многомерное распределение Гаусса имеет вид Р(х) С ехр (1.6.5) с положительно определенной симметричной матрицей А. Перепи- шем (1.6.5) в векторных обозначениях: Р(х) = Сехр j у х- Ах— Bxj . (1.6.6) Константу нормировки С находят с помощью (1.6.2) после преобра- зования к новым переменным, в которых А диагональна. В резуль- * Однако Гауссу (1809) предшествовали Лаплас (1780) и де Нуавр (1733). Вводящее в заблуждение прилагательное «нормальное» было введено К. Пир- соном, который позднее сожалел об этом: Biometrika, 13, 25 (1920). 31
тате получаем C^=(2n)-"2(DetА)’/2ехр l-BA^B] . (1.6.7) Соответствующая характеристическая функция имеет вид G (/г) = ехр | к- А'1 к — ik• А~1 В j . (1.6.8) Раскладывая в ряд по к, находим <^> = -2 (А"1),А; (1.6.9а) «ХДр^.^А-1),-/. (1.6.96) Отсюда следует, что матрица ковариаций, определенная в (1.3.8), для распределения Гаусса равна А-1. Следовательно, распределение Гаусса полностью определяется средними значениями переменных и их матрицей ковариаций. В частности, если переменные некоррели- рованы, матрица А'1 диагональна, но тогда и А также ди ато- нальна; следовательно, переменные независимы. Таким образом, если известно, что совместное распределение гауссово, «.некоррелиро- ванность» подразумевает «независимость» (ср. упражнение в § 1.3). Эта независимость всегда может быть получена с помощью линейного и даже ортогонального преобразования переменных. Моменты многомерного распределения Гаусса с нулевым средним обладают замечательным свойством. Рассмотрим распределение (1.6.6) с В = 0. Мы запишем его характеристическую функцию в терминах sy = ifey для того чтобы избавиться от нежелательного множителя i: G (— 1st, — is2, . •, — isr) = П exP у <.ХрХц> Sp$q ] p. q 1 J ==nb J-y<-XA>sA+---| •' (L61°) p. <7 * ’ Для того чтобы найти момент <X;XjXk. . . >, нужно сгруппировать члены, пропорциональные в,-3;5к... . Мы предполагаем, что число множителей четно и что индексы отличны друг от друга. Тогда члены, замененные многоточием в (1.6.10), не могут давать вклада. Следовательно, s,sysA. . . может войти в (1.6.10) единственным спо- собом в результате перемножения подходящих пар s^s^. С другой стороны, каждое произведение пар spsq, которое составляет s,szs^. • ., обязательно встречается. Результат следующий: = - • U-6.ii) Индексы р, q, и, и те же самые, что i, j, k, . . ., но разбитые по- парно. Суммирование распространяется на все возможные способы, которыми i, j, k, . . . могут быть разбиты на пары. Множитель 1/i в (1.6.10) сокращается, потому что произведение в (1.6.10) содер- жит каждую пару дважды. 32
Упражнение. Константу нормировки С находят из соотношения С-1—ехр |-------i-x-A x — B xj drx. Для того чтобы вычислить интеграл, нет необходимости использовать ор- тогональное преобразование х: можно использовать любое линейное пре- образование, которое приводит матрицу А к диагональному виду. Выве- дите таким способом (1.6.7) и (1.6.8). Упражнение. Выполните следующий вывод соотношения (1.6.9). Сначала сдвиньте начало координат так, чтобы \А;> = 0. Затем . X tX рУ А;к-=С XiXjAjb exp ApqX?Xq j drx — / = d^)eXp[ ldr*’ которое после интегрирования по частям дает желаемый результат *. Упражнение. Кумулянты первого и второго порядков многомерного распреде- ления Гаусса определены соотношениями (1.6.9). Докажите, что все куму- лянты более высокого порядка равны нулю. Упражнение. Если X — многомерная гауссова переменная е нулевым средним значением, a f (X) — многочлен, то <xkf (Х)> ---- У <хкхр ! Упражнение. Стандартный вид двумерного распределения Гаусса с нулевым средним, аналогичный (1.6.3), следующий: Р (X, у) —-------- exp ---2Р 7^---i—V! 1—“т!- (1-6.12> 2wxoy V J-р2 _ 2 I <4 о2 I 1-—Р2 J Какой вид должна иметь аналогичная запись для п переменных? Упражнение. Для случая <ух= оу=1, раскладывая (1.6.12), получаем Р(х,у}^-4-е~ ~<Х‘^2)У Не„ (х) Неп (у), (1.6.13) ал н. где Не„ -полиномы Эрмита, определенные в кн.: Magnus W., OPerhettinger F. and Soni R. P. Formulas and Theorems for the Special Functions of Ma- thematical Physics (3 rd Ed; Springer, Berlin, 1966), p. 250. 1.7. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА Пусть Xlt Х2, . .., Xr — множество г независимых стохастиче- ских переменных, каждая из которых имеет одинаковую гауссову плотность вероятности Рх (х) с нулевым средним значением и дис- персией о2. Их сумма Y имеет следующую плотность вероятности: (у) - [2лго2]-1/2 ехр | — j. Тогда <К2> = го2 возрастает линейно с ростом г. С другой стороны, распределение среднего арифметического переменных X становится * Onsager L. Phys. Rev. 38, 2265 (1931). 33
уже с увеличением г: fX1 + Xi+... о2 Поэтому полезно определить соответствующим образом нормирован- ную сумму Эта сумма имеет дисперсию о2 и, следовательно, Pz (?) = [2-то] -1/2 ехр | — . (1.7.1) Центральная предельная теорема утверждает, что если даже Рх(х) не гауссовы, а какие-либо другие распределения с нулевыми средними и конечными дисперсиями о2, уравнение (1.7.1) остается справедливым в пределе г —- оо. На этом замечательном факте ос- нована определяющая роль распределения Гаусса во всех областях статистики. Для того чтобы получить этот результат, запишем характери- стическую функцию произвольного распределения Рх: Gx(k} = §elixPx(x)dx = l — уо2^4-... . (1.7.2} Тогда для характеристической функции Z находим Gz(fe) = (1.7.3) что действительно соответствует распределению (1.7.1). Слагаемые в (1.7.2), обозначенные многоточием, приводят к появлению в Gx (й/Kr) членов порядка г~3/2 и поэтому в пределе г - - оо вкла- да не дают. Пример. Для прояснения полезно проследить явно, как распределение вероятности стремится к своему пределу*. Пусть X—стохастическая пере- менная, которая принимает значения 0 и 1 с вероятностью 1/2 каждое. Пусть Y—сумма г таких переменных. Тогда Y принимает значения 0, 1, 2, ..., г с вероятностью р„ = 2-г^). (1.7.4) Для нахождения предела необходимо сначала найти подходящую новую пе- ременную Z. Среднее значение и дисперсия следуют из (1.7.4) или могут быть найдены непосредственно: <К> = г <Х>==у г, о2 = rax = г, * Кас М. Amer. Mathem. Monthly, 54, 369 (1974). Domb C. and Offenba- cher E. L., A.mer. J. Phys., 46, 49 (1978). 34
соответственно полагаем r=4r+Tfl'2Z- Вероятность того, что Z лежит между г и гЧ-Дг, составляет Pz(z)Az = 2 Рп- (1.7.5) , , 1/2 _ . , I'2 , . , 1/2Г+1/2Г г < п < 1,2Г+ 1/2г (г + Дг) Когда г велико, это выражение определяет гладкую плотность вероятно- сти Рz< которую и нужно определить. Для больших г выражение (1.7.4) может быть написано в виде 'og.pn= - г log 24! г4-у j log г— 1оВп~- — — ! log(r — п) — у log(2.T) = = — rlog2-~ у log г —- I n+yj logfy-j-^-r-1'^ — — f r-n '-l ) log ^y-y r-i/2z j -y 10g2n= = log2 — у logr-^yr ^Ifl/Sz-y ) f'r~1'2z-~r-1z2^-... I-- - \ 4 r - '4 fI/2z+4 ) f — r~ 11гг—^г-Чг - ... 1 -'4 log 2л== log 2—4 iogf—4z2 ~ т!og2ix 0 ~1/2^ Подставим этот результат в (1.7.5): Pz (z) Д? = J г I 111 __- z2 :=-ту г1/2Дг exp log 2—у log r — -^-z2—-=-log2n =(2л)-1^ге 2 Дг. (1.7.6) i z 2. 2 I Важность для физики этого предельного выражения состоит в его при- менении: при больших г выражение (1.7.4) можно заменить его приближен- ным значением Py (у) (j лг- 1/2 ехр (1.7.7) Возникает вопрос: как дискретное распределение вероятности можно аппрок - симировать непрерывным? Ответ дает соотношение (1.7.5)—это описание, огрубленное по масштабам. Более точно (1.7.7) представляет собой вероят- ность найти Y в интервале у, y + dy, когда Ду > 1. В то же время очевидно, что оно некорректно описывает вероятность, когда Ду^/1. Другой парадокс состоит в том, что (1.7.7) простирается от —<х до -1-оо, несмотря на то что по построению Y не может принимать отрицательных зна- чений. Нельзя просто произвести обрезание (1.7.7) в нуле не нарушая нор- мировки. Разрешение парадокса состоит в том, что (1.7.7) является аппрок- симацией, которая при отрицательных у дает правильное нулевое значение лишь приближенно. Приближение является очень хорошим прн больших г: „ , пч / 1 \-‘/г Г 1 Ру (у < 0) < ( у лг< ехр -у г 35
Упражнение. Покажите, что результат (1.7.7) в действительности совпадает с полученным из центральной предельной теоремы. Упражнение. Примените центральную предельную теорему к случайным блуж- даниям в § 1.4, сравните с (1.4.8). Сравните результат с явным вычисле- нием, как было проделано выше. Упражнение. Покажите, что распределение Пуассона стремится к распределе- нию Гаусса при а —> ос. Упражнение. Верификацию, аналогичную проделанной выше, можно выпол- нить, когда X принимает значения 0, 1 с вероятностями а, Р, где а + р=1 (а не 1/2, 1/2) так что р задается (1.1.5) с у = а/Р (см., например: [1, рр. 169 ffj). Однако теперь мы перейдем к пределу N —>- оо и одновременно устремим а к нулю, a —a N, так что <У>=-а остается фиксированным. Покажите, что в этом пределе биномиальное распределение стремится к распределению Пуассона. Различные наборы строгих математических условий, при кото- рых справедлива центральная предельная теорема, можно найти в учебниках*. Однако тому, кто занимается физикой, важнее качест- венно понимать область ее применимости. С этой целью мы доба- вим несколько замечаний. Во-первых, не требуется гладкости р(х). Это ясно из приведен- ного выше примера, где р(х) '.2Ь(х) Ду6(Х—1). С другой стороны, необходимо минимальное условие гладкости ха- рактеристической функции G (k), а именно чтобы существовала вто- рая производная в начале координат. То, что такое условие нельзя игнорировать безнаказанно, было продемонстрировано с помощью распределения Лоренца. Если переменные X, независимы и имеют одно и то же распределение Лоренца, то их сумма Y тоже имеет распределение Лоренца. Следовательно, оно не стремится к распре- делению Гаусса. Во-вторых, понятно, что нет необходимости требовать, чтобы все переменные X имели одинаковое распределение. Допустим, имеется г, переменных с одним распределением и г2 переменных с другим. И пусть оба числа гг и г2 стремятся к бесконечности так, что их отношение остается фиксированным. Тогда обе суммы Y1 и Y 2 мо- гут быть аппроксимированы распределением Гаусса и общая сумма Y^=Y1-^Y2 опять гауссова. Ее характеристическая функция в обыч- ных обозначениях имеет вид С другой стороны, последовательность переменных Х}-, у которой среднее нарастает с / неограниченно, может привести к негауссовой полной сумме Y; соответствующий пример нетрудно построить. * Feller J. Ch. X; В. W. Gnedenko and A. N. Kolmogorov, Grenzverteilin- gen von Summen unathangiger Zufallsgrossen (Academie Verlag, Berlin, 1959); M. Hoeve, Probability Theory 1 (4 th Ed; Springer. New York, 1977) Ch. VI. 36
В-третьих, легко видеть, что имеет важное значение условие не- зависимости переменных X. Если в качестве всех г переменных взять одну и ту же величину X, результат будет не верен. С дру- гой стороны, достаточно слабая зависимость переменных друг от друга является допустимой. Это видно из вывода распределения Максвелла по скоростям из микроканонического ансамбля для иде- ального газа (см. упражнение в § 1.3). Микроканоническое распре- деление в фазовом пространстве является совместным распределе- нием, которое не факторизуется, но в пределе г -> оо распределе- ние скорости каждой молекулы гауссово. Эквивалентность различных ансамблей в статистической механике основана на этом факте. Упражнение. Проверьте с помощью явных вычислений, что доказательство центральной предельной теоремы для лоренцевых переменных не спра- ведливо, а ее результат не верен. Упражнение. В случайном блуждании шаги чередуются по длине: каждый второй шаг покрывает две единицы (влево или вправо). Найдите предель- ное распределение. Упражнение. Возьмите последовательность переменных Xj (j - 1, 2, 3, ..., г) с распределениями Р7 (х) = ((х — j) и фиксированным f. Покажите, что центральное предельное свойство неприменимо, но что переменные Z, оп- ределенные соотношением /=1 стремятся к гауссовости. Как это можно было заметить a priori? Упражнение. Примером переменных, которые не являются независимыми, слу- жат случайные блуждания с памятью. Предположим, что после шага впра- во вероятность того, что следующий шаг будет сделан вправо, есть а, а для шага влево--0. Аналогично, после шага влево вероятность движе- ния в гу же сторону есть айв противоположную — fl. Имеем <Ху> = 0; — <ХуХу + )>=. а— Р-—р. Находим *> = р*. Следовательно, <У>=-0 и ,T*'---V/.Xb + 2y V <X,-Xk> = -b-£r-O(r0). (1.7.8). J 1 — р /=1 /=2/,-=1 В § 4.5 будет показано, что в пределе переменная Y стремится стать га- уссовой. ГЛАВА 2 СЛУЧАЙНЫЕ СОБЫТИЯ В этой главе описан более сложный класс случайных перемен- ных, которые встречаются в некоторых областях физики и других наук. Эти случайные переменные можно рассматривать и как слу- чайные функции, поэтому нам кажется логичным поместить эту главу здесь. С другой стороны, из педагогических соображений было бы лучше отложить этот материал на более позднее время, 37
поскольку он достаточно сложен, а приведенные здесь результаты не будут использоваться вплоть до гл. 8. Читатели, которые не интересуются этим предметом как таковым, вполне могут отложить чтение настоящей главы на более позднее время, пока им не пона- добится этот материал. 2.1. ОПРЕДЕЛЕНИЯ Отсчеты счетчика Гейгера, попадание электронов на анод ваку- умной лампы или появление покупателей у прилавка — это все со- бытия, которые могут быть отмечены точками на оси времени. В ка- честве других примеров можно привести собственные значения случайной эрмитовой матрицы, принадлежащие действительной оси * и отмеченные точками на энергетической шкале значения энергии частиц в космических лучах. Случайный характер расположения этих точек приводит к изучению определенного класса стохастиче- ских переменных, называемых «случайным множеством точек» ** (или событий) [6, гл. 6] или «точечными процессами»***. а. Пространство выборок состоит из состояний, каждое из ко- торых, в свою очередь, состоит: 1) из неотрицательного целого 5 = 0, 1, 2, ...; 2) для каждого $—из множества s действительных чисел т0, удовлетворяющих неравенствам — оо < Tj < т2 < . . . < тл. < оо. (2.1.1) Читатель может заметить аналогию с большим каноническим ан- самблем в статистической механике и пространством Фока в теории поля. б. Распределение вероятности этих состояний дается последова- тельностью неотрицательных функций **** Q5(tx, т2, ..., т5), опре- деленной в области (2.1.1) и нормированной в соответствии с вы- ражением х <х ос Со-г $ dT1Q1(T1)4- $ d Т1 d t2Q2 (ть т2)+... = 1. (2.1.2) — X —30 Тх Для многих целей удобно исключить ограничение (2.1.1) с по- мощью следующего чисто алгебраического приема. Допустим, что каждое т0 изменяется от —оо до -(-оо, но договоримся, что все s! * Porter С. Е. Statistical Theories of Spectra (Acad. Press, New York, 1965); Mehta M. L., Random Martices (Acad, Press, New York, 1967); Elliott R. J., Krumhansl J. A. and Leath P. L. Rev. Mod. Phys. 46, 465 (1974). ** В данном контексте не следует смешивать эти точки с точками, обозна- чающими определенные значения t. См. также Ramakrishnan, in: Encyclope- dia in Physics 3/2 (S. Flugge ed., Springer, Berlin, 1959) Sec. 33. *** Snyder D. L. Random Point Processes (Wiley, New York, 1975). **♦* д|ы ИСпользуем букву Q для этого распределения вероятности, т. к. Р уже перегружено различными значениями. 38
наборов {тп т2, т5}, отличающиеся друг от друга только пе- рестановками, соответствуют одному и тому же состоянию. Кроме того, распространим определение Qs (тг, т2, . . ., xv) на все s-мерное пространство, поставив дополнительное условие, что Q, является симметричной функцией своих аргументов. Тогда условие норми- ровки (2.1.2) может быть записано в виде * 1 - dTidr2 .. . т2, ..., т4.) = 1. (2.1.3) ,s = 1 — х В этом интеграле две или несколько переменных т могут совпа- дать, тогда величина Q, в этих точках не определена. К счастью, множество таких точек имеет меру нуль в s-мерном пространстве, так что они не дают вклада в интеграл при условии, что Qs не содержит дельта-функций вида 6(tj — т2). Таким образом, мы огра- ничиваемся такими ситуациями, в которых отсутствует положитель- ная вероятность совпадения точек: прилавок, у которого появля- ются покупатели, не обслуживает супружеские пары. Средние определены для функций А на том же пространстве состояний; такие функции состоят из последовательности {Л„, ЛДт,), 42(Tj, т2), ..., ЛДТ), т2, .... т,.), . ..}. (2.1.4) В принципе каждое Л, необходимо определить только в области (2.1.1), но, имея в виду распространение на все s-пространство, мы опять дополняем определение функции A v требованием ее сим- метрии. Тогда * 1 р <Л> = Л0<20 + -jp \ ЛДт„ т2, . . ., ts)Q,(t„ т2, . . ., т,)бт, .. . dx5. s— 1 (2.1.5) Таким образом, угловые скобки, означающие усреднение, подразу- мевают суммирование по всем s и s-кратное интегрирование для каждого s. В качестве примера возьмем N точек в заданном интервале (ta, tb). Для того чтобы записать его в виде (2.1.4), мы определим индикатор* интервала х(0, полагая /(/)^1 для ta < t < tb и Х(0 = 0 Для всех Других значений t. Тогда физическая величина N представляется в виде последовательности А' -(0, хСМ, x(Ti) + x(T2), Х(ь) + Х(т2) + Х(т3), . • -}. ♦ Более общепринятое название характеристическая функция внесло бы путаницу в данном контексте. 39
Ее среднее значение записывается в виде <ЛГ> == ( 2 % (та)) = а= 1 • <1т5 Q (тх, . . ., Ts) V X (то) == (Т= 1 “ ! л “ = Х 3 X(Ti)dTi dx2 ... dx5 Qs (тг, tJ = S = 1 — CD — 'X 00 i e T> = V (T=Ij! J dT1 J dT2 • • db Qs (b, • • •, Ts). (2.1.6) s= 1 ta -» Как мы видим, результат получился весьма непростым и искомое среднее оказалось выраженным через сумму по всем Qs. В § 2.3 будет развит еще один подход к описанию случайных точек, кото- рый лучше приспособлен для вычисления таких средних. Упражнение. Переход от ограниченной области (2.1.1) к полной области с сим- метричной функцией Qs особенно удобен (если не обязателен) для обоб- щенного описания случайных точек на плоскости или в пространстве. Запишите явно функции Qs для большого канонического ансамбля молекул идеального газа в заданном объеме. Упражнение. Покажите, что средний квадрат числа точек N в интервале (/о, Zb) дается выражением * ‘ь * <N*y=-.<Ny~’-'\' . \ dti С <1т2 dT3. .dT,Q;;. (2.1.7) (-S—J J J s = 2 ta ta - х Упражнение. Случайное множество точек в интервале (0, оо) строится следую- щим образом: вероятность того, что первая точка лежит в интервале (Ti, Tj + dTi), есть ш(г1)от1, где w— заданная неотрицательная функция, удовлетворяющая условию А fu>(T)dT = l <•. 1. (2.1.8) о Плотность вероятности для второй точки есть w (т2— тх) и т. д. Вычис- лите Qs. Упражнение. Электроны попадают на катод случайным образом, причем этот процесс определяется заданными Qs. Попадание электрона в момент т вызывает отклик в выходной цепи, который в момент t имеет значение ф(—т). Полный отклик в момент времени t есть У (/) — ф (7— т.?)- Вы- разите <У (/)>, <У (г)2>, (гх) У (t2)> через эти данные. Упражнение. Обобщите этот подход на описание точек двух (или большего количества) сортов («меченые точки»). Упражнение. Предположим, что существует ненулевая вероятность совпадения пары точек. Этот случай можно описать с помощью введения точек двух сортов, а именно изолированных и двойных точек. Покажите, что соот- ветствующее двухсортовое распределение может быть перестроено в одно- 40
сортную последовательность Qs, которая в этом случае содержит дельта- функции. Упражнение. Объекты (2.1.4) образуют линейное векторное пространство. Ска- лярное произведение определено с весовой функцией 1/sl, так что выра- жение (2.1.5) является скалярным произведением (Л, Q). Запишите выра- жения (2.1.3) и (2.1.7) также в виде скалярных произведений. 2.2. РАСПРЕДЕЛЕНИЕ ПУАССОНА Случайные события называют независимыми, если каждое фак- торизуется: QJtj, т2, .... т5) = е- ^(Tj^fT,) . . . 7(т5); Q0 = e-v, (2.2.1) где q — некоторая неотрицательная интегрируемая функция. Кон- станта нормировки e~v определяется выражением v = q (т) dx. — 00 (2.2.2) В этом случае для среднего числа N в интервале (ta, tb) из выра- жения (2.1.6) легко находим Zb '.V/ -\ <7 (т) dr. (2.2.3) t а Из выражения (2.1.7) находим также средний квадрат: <№>-_= <дг>2 4-<дг>. (2.2.4) Распределение вероятности N можно вычислить явно. Его теристическая функция имеет вид: харак- (е-’*Л) = (ехр [ifeV Х(та)]) = е 0= 1 е‘*х (т)(7 (т) dr Г ? (ei«c(r>_ 1) <7 (т) dx = ехр (е‘*—1) \ <7(/)dr = ехр [(eiA=— 1) <Л(?] = е~<л'> £ ^eikN. (2.2.5) N =0 Сравнивая коэффициенты при eikN в левой и правой частях этого равенства, находим, что вероятность того, что N независимых случайных точек попадает в заданный интервал, есть P.v=^e-^>. (2.2.6) Именно таким путем распределение Пуассона (1.2.10) возникает в физических задачах. Это распределение определяет вероятность нахождения числа независимых событий в ограниченной области, 41
например вероятность попадания дождевых капель в заданную черепицу. Оно определяется единственным параметром — средним значением, которое, как видно из (2.2.4), также является диспер- сией. Распределение Пуассона для целых неотрицательных чисел столь же распространено, как распределение Гаусса для непрерыв- ной области (— оо, оо). Однако это распределение нельзя рассмат- ривать как универсальное, поскольку оно было выведено только для независимых событий. В § 7.3 мы увидим, что в химических реакциях это предположение не всегда справедливо. Кроме того, далеко не всегда дисперсия случайного числа частиц равна их сред- нему числу. Несмотря на это, в качестве полезного способа при- ближенной оценки часто можно полагать, что дисперсия имеет тот же порядок величины, что и среднее значение. В качестве дальнейшего уточнения предположим, что а (т) по- стоянно в интервале (—Т, Т) и равно нулю вне этого интервала. Постоянная v/(2T) =• р и представляет собой среднее число событий в единичное время. В пределах Т оо, v —- оо при фиксирован- ном р получаем приближение стационарного распределения точек, называемое дробовым шумом*. Тот факт, что стационарные распре- деления могут быть описаны только с помощью предельного пере- хода, является еще одним недостатком настоящего рассмотрения случайных точек. Этот недостаток мы устраним в следующем разделе. Упражнение. Убедитесь в том, что соотношение (2.2.2) — правильное условие нормировки, и покажите, что v представляет собой среднее значение коли- чества всех точек: v_-<s>. Упражнение. Обобщите формулы для случайных независимых точек в трехмер- ном пространстве. Покажите, что число точек N в произвольной области также подчиняется распределению (2.2.6). Упражнение. Обобщите формализм на случай, когда рассматриваются точки разных сортов, и покажите, что многомерный аналог распределения Пуас- сона— это просто произведение одномерных распределений (2.2.6). Упражнение. Если N1У2 —две статистически независимые переменные, каж- дая из которых подчиняется распределению Пуассона, то их сумма тоже распределена по Пуассону. Упражнение. Рассмотрите суперпозицию распределений Пуассона: ОС рп -= \ ф (a) ^-e_“da, (2.2.7) О где Ф° (а) в свою очередь является распределением вероятности. Выведите соотношения <'V> - <а>ф; <№>^-<У>р= <«2>ф. Таким образом, дисперсия такого распределения всегда больше дисперсии чисто пуассоновского распределения с тем же самым средним. Выразите также производящую функцию вероятности рп через характеристическую функцию распределения Ф (ос.) и выведите отсюда, что моменты переменной а равны факториальным моментам переменной п (ср. с. (1.2.15)). * Иногда это название применяют также к нестационарному набору неза- висимых событий. Точное определение «стационарности» дано в (2.3.13). 42
/ Ul, ^2, ' • • , tn) — У (s-п)! J n+1' -00 Упражнение. Любое распределение рп может быть представлено в виде (2.2.7), если отбросить условие, что Ф должна быть плотностью вероятности, а также допустить другие пути интегрирования *. 2.3. ЕЩЕ ОДИН СПОСОБ ОПИСАНИЯ СЛУЧАЙНЫХ СОБЫТИЙ Соотношения (2.1.6) и (2.1.7) для числа точек в заданном интер- вале наводят на мысль о том, что полезно определить последова- тельность функций t2, . .., tn) для n=l, 2, ..., положив 00 “ /1 (6) = у (-J,), J dx2... dxsQ, (/j, T2, . . ., x5), S— 1 - cc - j о /(Л, M = y (-_2)| } dx3. . dxJQs(/1, t2, x3, ..., xj, s= 2 - ec dT/M/n t2, tn, xn+1, ..., xs). (2.3.1) Тогда соотношения (2.1 6) и (2.1.7) можно записать в более про- стом виде: = J A(Md/i; (2.3.2) ta ‘b = <W> + J /2 (/1( /2) dG d/2. (2.3.3) ta Интуитивно значение функций fn можно уяснить из определяющих выражений (2.3.1): произведение t-i, • /„) d/xd/2 .. . d(r равно вероятности того, что каждый из интервалов (^, /j-J- d/J, (/2, /2 + d/2) и т. д. содержит точку независимо от того, сколько точек может быть вне этих интервалов. Вероятность того, что один из этих интервалов содержит две точки или более, пренебрежимо мала, так как в соответствии с нашей договоренностью Qs не содержит дель- та-функций. Это соглашение приводит еще и к тому, что fn также не содержит дельта-функций. В свою очередь, нет необходимости задавать значение величины fn, когда у нее совпадают два аргумента. Функция fn обладает следующими очевидными свойствами: 1) 2) fn является симметричной функцией своих аргументов /2, . . ., trt. * Gardiner С. N. and Chaturvedi S., J. Stat. Phys. 17. 429 (1977); 18, 501, (1978). 43
Функции fn не удовлетворяют условиям нормировки и поэтому сами не являются плотностями вероятности. Здесь может возникнуть небольшая путаница, поскольку раньше мы интерпретировали их как вероятности. Но их вероятностная интерпретация применима только к бесконечно малым интервалам или по крайней мере интер- валам настолько малым, что отсутствует заметная вероятность нахож- дения в них двух или большего числа точек. Что касается больших интервалов (?а, tb), то, как можно видеть из выражения (2.3.2), проинтегрированная функция Д является средним числом точек, а не полной вероятностью найти точку в этом интервале. Таким образом, она представляет собой среднюю плотность точек. Анало- гично, функции более высокого порядка /га представляют собой нечто вроде «средних совместных плотностей». Только для бесконечно малых интервалов они действительно сводятся к вероятностям. Стра- тонович [8, гл. 6] называет их функциями распределения, но, для того чтобы избежать неправильного толкования, мы будем их назы- вать функциями fn. Упражнение. Вычислите функции fn для независимых точек и покажите, что fnth, G, tn) = /i(G)/i(G) h(tn). (2.3.4) Упражнение. Предположим, что попадания фотонов в счетчик образуют слу- чайное множество с известными стохастическими свойствами. Вероятность срабатывания счетчика для каждого попадания есть а. Выразите функ- цию fn срабатывания счетчика через соответствующую функцию попадания фотонов в счетчик. Упражнение. При описании точек функция fn является более полезной, чем Qn- по следующей причине. Большинство величин А, средними от которых мы интересуемся, являются «суммарными функциями», т. е. они состоят из одночастичных функций а (та), просуммированных по всем частицам, или из двухчастичных функций а (та, та), просуммированных по всем парам частиц, и т. д. * В общем виде л= 2 а(тщ> %- М, Cfi, 02’ • • • • &П где а — функция лишь небольшого числа частиц. Примерами могут служить выражения (2.3.2) и (2.3.3). Покажите, что среднее значение А включает только f2, ..., fn и не содержит функций распределения более высо- кого порядка. При каком условии оно содержит только fn? Предположим, прибор реагирует на попадание фотонов или элек- тронов с некоторой чувствительностью, которая по внешним при- чинам зависит от времени. Пусть реакция на попадание в момент т есть ф(т). (Существенным обстоятельством является то, что ответ не зависит от попадания других частиц: отсутствуют «мертвые зоны» или время восстановления работоспособности прибора.) Если s по- паданий происходит в моменты времени тъ т2, .... г,, общая реак- * Важность этого факта для статистической механики была подчеркнута А. И. Хинчиным (Khinchin A. I. Mathematical, Foundations of Statistical Mechanics (G. Gamow transl., Dover Publ., New York. 1949, p. 63)). но он на- зывает А суммарными функциями только при га=1. 44
ция прибора имеет вид U = 2 Ч (b)- а= 1 Если попадания случайны, среднее значение общей реакции прибора в соответствии с (2.1.5) дается выражением (У, Ч (ь)) =-- У J dTi • • •dx А (Ь, • • •, Ь) Ч (Ti) = а— 1 s= 1 - <х оо = f4Ui)MMA- (2-3.5) — X Средний квадрат U имеет вид I2 ч (то) 2 ч (М) =-- (2 ч (та)2)+( 2 ч (та) ч (м)= 'а с' ’ ' о ' 'о=#и' ' Чч(М2 Ш) А + П Ч(Л)Ч(4)/2 (/п 4) A А- Можно продолжить это рассуждение, вычисляя высшие моменты, и таким путем вычислить полную характеристическую функцию V. Но тот же самый результат можно получить намного более простым способом, если сначала ввести производящий функционал для В гл. 1 было показано, как использование производящей функ- ции моментов упрощает обращение с моментами и кумулянтами Сейчас мы введем аналогичную технику для Однако вместо вспомогательной переменной k нам теперь понадобится вспомога- тельная функция, или «пробная функция» y(Z), а вместо произво- дящей функции у нас будет тогда функционал, т. е. величина, зависящая от всех v, взятых для — оо < t <. оо (их обозначают квадратными скобками). Производящий функционал для /„ имеет вид ММ) = ( Пп (2.3.6) (7 = 1 Раскрывая произведение, получаем ММ) = 1 + (2^(О) + ( 2 + • • . = ' а 1 ' ст < о' 1 = 1 + J V (Zx) Л (Z,) dZ, 4- у j и (Zj) V (Z2) f2 dZ, dZ2 -4- . . . = 00 = 1 + 21 4г С V (ZJ v (t2) ...V (tn) fn (Zj, Z2, . . ., Z„) dZI dZ2 • . . dZ„. (2.3.7) Получилось, что /п являются коэффициентами разложения функ- ционала L по степеням пробной функции и, так что знание функ- ционала L ([и]) для всех функций v однозначно определяет все 45
Для того чтобы найти следствие из этого результата, мы выра- зим v через другую функцию и с помощью равенства ц(/) = е'и(0 — 1, тогда тождество (2.3.7) дает /Jd/i. . ,d/„. (2.3.8) Упражнение. Покажите, что этот результат сразу приводит к выражению ха- рактеристической функции <е,Л£/> через fn, где U обозначает то же самое, что и выше. Упражнение. Проверьте (2.3.7) и (2.3.8) для независимых точек. Упражнение. Докажите (2.3.8) непосредственно, т. е. раскладывая левую часть в ряд Тейлора и выражая каждый член через сумму, включающую не- сколько fn. Упражнение. Пусть {гД — множество моментов времени, содержащее т точек. Тогда znxm-матрица /2Ию ^v) положительно определена или по крайней мере неотрицательна. Упражнение. Выведите следующее соотношение для характеристической функ- ции распределения числа точек Л7 в заданном интервале (/а, tj,): /е'>Л'> 1.. V j fn t2, .... tn) dn d/2... d/„. (2.3.9) n— 1 f a Как следует из него, вероятность того, что в интервале (ta, t^) не ока- жется ни одной точки, дается выражением сю /ь)= 14-У b’lLC )„(/,, t2........ 1. J '»=I ta (2.3.10) где х~индикатор (1а, !ъ). Упражнение. Возьмите v неперекрывающихся интервалов и выразите характе- ристическую функцию G (fej, k2........kr) совместного распределения веро- ятности их чисел заполнения Nt, .... Nv через fn. Упражнение. Докажите следующее тождество для функциональных производ- ных от L: Ъ'Ь (Qr) 05 —7 С (G) • •v (^л) fr+п (Qi> Qr, ^i> • ••• л) dfj.. .d/„. (2.3.11) n\ . л-0 При подстановке y = 0 это выражение сводится к fr(Qi, •Qr). Упражнение. Соотношение (2.3.1) между Qs и fn представляет собой линейное отображение в векторном пространстве объектов вида (2.1.4). Матрица этого отображения Й дается выражением (л; Н, Н, •••. | Q | s; Ti, т2, • ••, т.,) — = z 6 (Н — Ti) 6 (12 — т2)... 6 (tп т„), (2.3.12) (S П)! 1 где -----гт (S—л)! О при s < п. 46
Хотя все физические процессы ограничены во времени, на прак- тике довольно часто это можно не учитывать. Так, при изучении шума в электронных устройствах обычно не интересуются эффек- тами, связанными с включением и выключением. Описание, в кото- рое длительность процесса не входит, с одной стороны, проще, а с другой — является более адекватным. Таким образом, мы при- ходим к изучению множеств точек с плотностями, не стремящимися к нулю при ±оо. Такие множества не могут быть описаны с помощью Qs, так как условие нормировки (2.1.3) требует обращения Qs на бесконечности в нуль. Понятно, что этот недостаток можно устранить с помощью введения вымышленного длинного интервала времени Т, но это приведет к появлению в уравнениях величины, не имеющей отношения к делу. В то же время описание функций fn переносится на этот случай без дополнительных ухищрений. Особый интерес представляют случайные события, у которых стохастические свойства не меняются со временем. Их называют стационарными и определяют соотношением /ЛДЧ-т, Д + т, .... Гп4-т) = /„(Д, Д, .... /„) (для всех п, th т). (2.3.13) В частности, плотность событий Д может быть постоянной. Как уже говорилось в § 2.2, если случайные события стационарны и неза- висимы, множество состояний называют дробовым шумом. В этом случае в соответствии с (2.3.4) получаем /П(Л, Д. • Д) = (Л)П- Следовательно, дробовой шум полностью определяется единствен- ным параметром, а именно своей плотностью. Альтернативное на- звание «пуассоновский процесс» показывает, что он может рассмат. риваться как стохастический процесс (мы в этом убедимся в § 4.2), Упражнение. Вычислите L ([с]) для дробового шума. Упражнение. Примените результаты (2.3.9) и (2.3.10) к дробовому шуму. Упражнение. Катод подогревают переменным током таким образом, что веро- ятность испускания электрона в интервале времени (т, т4-бт) есть Ф (т) dr независимо от испускания других электронов. Найдите функции [п, опи- сывающие события, состоящие в опускании электронов. 2.4. ФОРМУЛА ОБРАЩЕНИЯ Последовательность уравнений (2.3.1) выражает функции jn через линейные комбинации Qs. В этом параграфе мы получим обратные формулы, которые выразят Qs через Так как эти ре- зультаты не будут нами использоваться в дальнейшем, материал настоящего параграфа можно рассматривать в качестве упражнения. Первый шаг состоит в задании величины/, которая действует как единичный оператор на пространстве состояний. Возьмем точку в пространстве состояний, т. е. положительное целое г и действи- 47
тельные числа 0lt 02, 0Г. К каждому 0Р присоединим окрест- ности длиной е и определим индикатор: ХР(0 = 1 Для 0Р — 1/2е < t < 0р-!-72е, Хр(0 = 0 для |/—ОрО1/^. Будем считать е настолько малым, что никакие две окрестности не перекрываются, и в конечном счете е устремим к нулю. Пусть также х—характеристическая функция дополнения всех окрестностей Х(0 = 1— S Хр(0- р=1 Кроме того, мы введем А (п) для символа Кронекера 6п>я. Для А (п) используем следующее представление: 2п г* rl Ь А(л)-( (2.4.1) о И наконец, определим функцию / в пространстве состояний с по- мощью соотношения /jTt, т2, .... xJ) = e_/' 2 Xi('Vft)- 2 ХзЬо,)-.- (Jl = 1 (J2= 1 •• S Хг(трг) А! 2 7(то)\ (2.4.2) <?r=l \<7=1 Эта функция зависит параметрически от г, 0lt 02, . . ., 0Г и е. В качестве второго шага вычислим среднее значение /, вы- разив его через 05: 00 </> = г£1 £ i Х1(М-•-Хг(-Чг) X s =0 ' Oj, ..., v' S • • •, Ts)dTi. . .dx^. \e=i / Для того чтобы получить ненулевой вклад, нужно выбрать из пере- менных интегрирования набор г переменных и приписать им г ок- рестностей: -./>=£4- (г)r! jЛ (х xQs(0i...............................0r, xrtJ, . . ., x,)dxr+1.. ,dxs, где е считалось достаточно малым, чтобы заменить каждый множи- тель е-1хР(О дельта-функцией. Кроме того, подынтегральное выра- жение обращается в нуль, как только одна из оставшихся пере- 48
менных интегрирования попадает в дополнение окрестностей. Поэтому остается только область интегрирования, порядка es~r. Следовательно, в пределе выживает только член с s = r, так что <Z> = Qr(0j, 02, . . ., 0Д (2.4.3) Третий шаг состоит в расписывании среднего I через Используя (2.4.1), получаем 2л <7> = е-^^( V Xi(tOi)-• •хДтОг)Пехр[1^Х(то)])- О ' . .... а г ° Поскольку %(та)— либо ноль, либо единица, получаем 2Л = Х1(т0,). • .Хг(Ьг)П {1 + (eik— Ох(ь)}) = о ’ ..° 2л » "8'rf (ei*~!)" 2XJ(ni)---Xr(T;Or)xhar + 1)---X(Tar + n)>. О ' n = 0 (2.4.4) Кратное суммирование проводится повеем значениямап <г2, . . ., ог, но при этом подразумевается выполнение неравенств <гг+1 < <тг+2 < . . . . .. <уг.п. Каждый член, в котором два значения а совпадают, равен нулю. Следовательно, среднее значение под интегралом в (2.4.4) имеет вид z / = 4г i • • • Xr (zr)x (*r+i) •• • X (tr-rn) fr+n (*i, • • •, ^+n) d/f • • d/rt „. (2.4.5) ^Множитель 1/м! заменяет ограничения на ar+j, ..., or+n.) Для малых e функции /р сводятся к дельта-функциям, а у равна еди- нице, исключая набор интервалов с общей длиной ге. Следовательно, (2.4.5) сводится к ' / = .....0' С + л) d/r+I.. .d/r + n + O(F/+1). Подставляя это выражение в (2.4.4) и замечая, что интегрирование приводит множитель (е‘*—1) к (—1)", находим среднее значение I, выраженное через /п в пределе е 0: 05 <b = V 4^(0,, tr+A........................./r+„)d/r+1...d/r+n.(2.4.6) Окончательный результат определяем, комбинируя (2.4.6) и (2.4.3). После упрощения обозначений получаем 05 -----0г) = £ •••• 0г- п = 0 ’ (2.4-7) 49
Эта формула дает выражение набора функций Q, через набор функ- ций fn и представляет собой обращение формулы (2.3.1). Упражнение. Проверьте результат явно для случая независимых точек. Упражнение. Предположим, мы обобщили определение /, положив Д (л) =- 6„,.v с некоторым фиксированным целым N. Какое выражение получим в ре- зультате для </> и какова его интерпретация? Упражнение. Вероятность иметь в точности Л' 5» 1 точек в заданном интервале (?а. дается выражением (л(2х(та)-Л/ где х — индикатор интервала. Покажите, что эта вероятность имеет вид х _ у 'ь Р\r Ua’ __ЛЛ)!” ' п - dzrl. (2.4.8) ' "=Л' ' ' ;; Сравните результат с (2.3.9). Упражнение. Матрица П, определенная в (2.3.12), отображает вектор {1, 0. 0) в нуль. Получается, что мы нашли в (2.4.7) обратную к ней матрицу. Как разрешить этот парадокс? Пример. Фотон движется в среде, в которой он с вероятностью Р в еди- ничное время порождает вторичный фотон с помощью стимулированного излу- чения. Допустим, вы хотите узнать распределение вероятности ps числа s вто- ричных фотонов. Вероятность того, что п вторичных фотонов испускается в моменты G. t-г... tn независимо от событий в другие моменты времени, есть /-г, ---. М-Р". Используя (2.4.7), получаем С?з(Т1. т2..т5) = р*е-₽Г, где Т — время движения в среде. Следовательно, т Ps 4-5Qs(T1.......Ts)dT1...dTs-l&e-ST. (2.4.9) О Этот результат становится очевидным, если заметить, что события, состоящие в испускании вторичных фотонов, статистически независимы. Предположим далее, что среда безгранична, но за единичное время пер- вичный фотон может поглотиться с вероятностью а. Тогда fnUi. t-i..../п) = Р'1 ехр [—ос max Zv], Аналогичные вычисления теперь дают при условии а > Р 1 v (-•)", ; „ f Р У'^ (РМУ ’ s! *-» п! П S' \ а ) (1—Р/а)1-1 м=о (2.4.10) Соответствующая производящая функция вероятности имеет вид X (2.4.11) Полное число фотонов, порожденных в каскаде (вторичных, третичных и т. д.). будет вычислено в (3.6.11) 50
2.5. КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ Кроме функций распределения fn полезна ввести еще одну последовательность симметричных функций gm, называемых корре- ляционными функциями. Эти функции определяют через /„ с помощью следующего кластерного разложения: /i(4) = £i(C), /2(Ч, ^) = £1(Ч)£1(/2)+£2(6. U, /з(Ч> С, ^з) ~= £1 (Ч) ё1 (О §1 (М г Ч~£1(Ч)£2(С, G) + £1 (^2) £а (-1, /3) -т-£1(/з)£2(^. h)-rg3(ti, t2, t3), ............................................. ..... (2.5.1) Общее разложение функции /„ получается с помощью следующего правила. 1. Разбиваем переменные t2, . . .,tn на подмножества всеми воз- можными способами (не считая пустого множества, но включая пол- ное множество, как одно из возможных под- множеств). 2. Для каждого разбиения берем произ- ведение функций g для отдельных подмно- жеств. 3. Суммируем эти произведения по всем возможным разбиениям. Например, /в содер- жит член (см. рис. 2) £1(^в)£2(Л, ^з)£з(^21 4> ^з)- (2.5.2) рис g Член (2.5.2) в „ кластерном разложении Вскоре мы используем следующую экви- функции /6 валентную формулировку правила: 1'. Представим целое число п в виде суммы положительных целых чисел, не обязательно различных. Чтобы представить их в виде суммы разных чисел, выберем неотрицательные целые k такие, что • 1 -|- /?2 2 -|- • 3 -4- . . . -4- kп • П — П. (При этом условии все k, начиная с kn и далее, авмоматически равны нулю.) Такое представление числа п будем называть разбие- нием п. 2'. Образуем произведение k2 множителей k2 множителей g2 и т. д. £i (Ч)£1(^2)-• •£i(^,)£2(^,-1- ^,+г)-• • • 3'. Строим все различные члены, соответствующие данному раз- биению, получающиеся перестановкой переменных /. При этом члены не считаются разными, если они отличаются один от другого только порядком переменных в отдельных функциях g, или порядком мно- 51
жителей g. Одному разбиению соответствует __________________________________п!____________ k2'.. . ,kn\ (I!)*' (2! )*’... (п\)кп (2.5.3) членов, построенных указанным способом. 4'. Суммируем все эти члены, а затем выполняем суммирование по всем возможным разбиениям числа ЛЕ /Ж, С, 4) = 2 2 (2.5.4) разбиения перестановки где введены сокращенные обозначения того, что имеется множи- телей gj с различными аргументами, k2 множителей g., и т. д. Теперь докажем фундаментальное тождество СО 1 +Х4’ f • -V(tn)fn (Л- = n= 1 ' 'J •HUgU'i, G---,.dtm (2.5.5) Подставляем в первую строку fn в виде (2.5.1). Различные члены, полученные в соответствии с п. 3' правила и принадлежащие к одному разбиению, дают одинаковые вклады в интеграл. Тогда первая строка может быть записана в виде 1+Х Ц п разбиения Z?i! ХТГ ndftirV2... . (2.5.6) Суммирование проводится по всем значениям п и для каждого от- дельного значения п по всем его разбиениям. Но каждый набор целых чисел k является разбиением некоторого п. И наоборот, все разбиения всех чисел п получаются присвоением каждому k в вы- ражении (2.5.6) неотрицательного целого значения. Единственным исключением является случай одновременного обращения в нуль всех чисел k. Следовательно, эту сумму можно записать в виде кратной суммы по всем значениям k, а один недостающий член дополняется дописыванием единицы перед всем выражением. Таким образом, для первой строки выражения (2.5.5) получаем <30 <30 £ Т»'! X rJ-jr f v(t')v(t")g2(t', /") d/'d/"'/2. . . a,=o b ' k2=o - ' - । Это выражение идентично второй строке формулы (2.5.5), что и требовалось доказать. Первая строка выражения (2.5.5) является 52
производящим функционалом (2.3.7) функции fn. Следовательно, формула (2.5.5) может быть представлена в виде 00 logL([t>]) — V ~ u(ti)v(t2). v(tm)gm(tl, t2, ZJdZid/2. . .dtm. m = I ’ J (2.5.7) Из этой записи видно, что logL является производящим функцио- налом функции gm, так же как кумулянты генерировались лога- рифмом производящей функции моментов. Естественно, с помощью (2.5.7) можно дать определение gm и затем доказать, что они удо- влетворяют соотношениям (2.5.1). Основной причиной введения корреляционных функций является их следующее свойство: если точки независимы, все gm при т > 1 равны нулю (это свойство может быть легко доказано). Если возни- кает физическая ситуация, в которой точки являются почти неза- висимыми, то можно ожидать, что gm будут быстро убывать. Однако это указание скорее является физическим соображением, чем мате- матической истиной. Во многих случаях можно ожидать, что точки будут статисти- чески зависимыми только в течение коротких отрезков времени. Формальное выражение этого «свойства кластеризации» можно запи- сать в виде lim gm + т’ (Л, /2, . . ., tm, /,л+1 + т, /,л+2 + т, • . tm~m- 4- т) = 0 (2.5.И Т->'ЗЭ (для всех т, т', /ъ . . ., /т+ш-). То же самое свойство, выраженное в терминах имеет вид Иш (/i, t.,, ..., tn, /„^4-т, /Пт,4-т, ..., Г„-.л-4-т) — — t-1, , /я.24-т......../„^ + т)] = о (2.5.9) (для всех п, п , /х, . . ., /я+я-), иногда его называют свойством про- изведения. Упражнение. Проверьте (2.5.5) для независимых точек. Упражнение. Покажите, что (2.5.1) и (2.5.4) эквивалентны. Упражнение. Используя результат (2.3.9), покажите, что характеристическая функция для N точек в интервале (ta, tb) имеет вид е'*Л’> = ехр V—т1 2 \ gm (Н. h, • • tm) d/i d/2. . ,dtm. (2.5.10) -m = 1 ’ "ta В частности, вероятность того, что в интервале не окажется точек, такова; Po(ta, tb) — exp = *b y, C g«(<i, t2, .... tm) dH d/2.. ,dtm. (2.5.11) ’ ta 53
2.6. ВРЕМЯ ОЖИДАНИЯ Предположим, что задано случайное множество точек, представ- ляющее последовательность событий. Можно поставить следующий вопрос: если мы начинаем наблюдение в некоторый момент вре- мени /0, как долго нам придется ждать, пока произойдет следую- щее событие? Естественно, время 6 от момента времени /„ до сле- дующего события является случайной переменной, принимающей значения в интервале (0, оо), а ее плотность вероятности де(0; /0) является величиной, которой мы интересуемся (w параметрически зависит от если множество событий не стационарно). Этот вопрос возникает, в частности, в задачах теории массового обслуживания. Функцию распределения щ/(0; /0) попадания фотонов, излученных при люминесценции, измеряют также с помощью электронных при- боров. Мы хотим выразить функцию w (9; tn) через величины, опреде- ляющие случайное множество. Обозначим p0(t„, /О-Е0) вероятность того, что между моментами времени и /0Н-9 события не проис- ходит. Тогда ш(0; /0) d0 — вероятность того, что первое событие с момента времени t„ произойдет в промежутке времени между/„ + 0 и t0 + 0 4 d0,— равна р0 (t0, /„40)—pQ(ti>, 4 + 9 + d0). Следовательно. &у(0; /«)== —/о + 0). (2.6.1) Величина p0(t0, t0 + 0) выражается через функции распределения с помощью соотношения (2.3.10). Подставляя этот результат, находим w(9; М = Л(^-т0) + / tu ..., tn)dt± ... d/„. (2.6.2) "=1 ' t' Это соотношение выражает распределение вероятности времени ожидания через последовательность функций распределения случай- ного множества. Упражнение. Найдите ш(0; /0) для независимых событий. В частности, для дробового шума справедливо выражение ш(0; /0)ехр [— 0/J. (2.6.3) Упражнение. Выведите следующую формулу, выражающую к> (0; /0) через кор- реляционные функции: ш(0: 4) = Ро(4, 4 40) l£i (С 9) “ X £о-г0 4" ---р— С gm El (^0 /1, ••• (2.6.4) т = 1 4 tn Упражнение. Покажите, что 54
В правой части этого выражения нужно сначала вычислить вариационную производную по с в точке Д-0, а затем вместо v подставить отрицательный индикатор (/о, 6> —0). Можно сформулировать еще одну задачу: предположим, мы заре- гистрировали событие в момент времени ta, требуется найти функ- цию и’(0 | /,.), описывающую распределение вероятности промежутков времени, по истечении которых произойдет следующее событие. Сов- местная вероятность того, что одно событие произойдет в промежутке времени между ta — Ata и ta, и того, что в течение времени (/(,, tb -ь d/b) событие не произойдет, дается формулой [Ро(С, — -|Ро(^-dC, /ь)-рп(/а-(1/я, /ь4-д^ь)]d/a Atb~^. tb}. (2.6.6) fl а ш b Условную вероятность события в промежутке (tb, tb 4- d/J при усло- вии того, что другое событие произошло в интервале (/„ — d/a, /и). можно получить разделив выражение (2.6.6) на /, (/a) d/„— вероят- ность события в промежутке (/„ — d/„, ta) (правило Байеса (1.3.3)). Тогда распределение вероятности времени ожидания tb — ta после регистрации события в момент tn дается формулой w ((. -./ 11 1 ----!— (2 6 7) С помощью (2.3.10) распределение вероятности можно выразить через функции распределения ^(tb- ta\ta) =77(7j VAA, + X zb -'L—r1 \fn<AA, tb, ... d(„], (2.6.8) ”= 1 ta Примечание. Рассмотрим еще один вывод этого результата, который позво лит нам его лучше понять. Случайное множество точек на оси времени можно представить как ансамбль большого количества отдельных множеств выбороч- ных значений. Из этого ансамбля выделим подансамбль таких множеств выбо- рочных значений, которые содержат одну точку, принадлежащую интервалу ta — &ta. Этот подансамбль, в свою очередь, представляет собой случайное множество точек. Величины, принадлежащие этому новому случайному мно- жеству, будем обозначать с помощью тильды. Искомое распределение времени ожидания ш(0 | tа) совпадает с а>(0; /а) и представляет собой аналог (2.6.1), примененный к подансамблю с заменой 1п на 1а. Заметим, что точка с запятой в (2.6.1) заменяет черту в (2.6.7)! Для того чтобы определить а1 (9; /а), можно использовать формулу (2.6.2) при условии, что мы найдем сначалаТеперь функция распределения fn может быть интерпретирована следующим образом: t2 .... t п) d/a d/2 ... d/„ - это вероятность для интервалов (И, И-rd/J. (G. G-r d/2) и т. д. содержать точку при условии того, что одна точка лежит в интервале (ta—d/a, ta). 55
Тогда правило Байеса дает In Hi, '2. • • •, tn) - /n^1(Za’ Zg) (п 1,2,...). (2.6.9) 11 \la> Таким образом, мы выразили функции распределения подансамбля через исход- ные функции распределения. В соответствии с (2.3.10) получаем cd Za-tO /й+е) = ь-г^-Х f fn+l(ta, /1,-. tn)dt,... d/„(2.6.10) !l\ta) , n- J n~ 1 ta и в соответствии с (2.6.1) получаем z«)=7777j z« + eH- x t„x e fn- 2 (t a, ~[-0, 11, ... t n) d/ j . . d/„f. "=1 ’ ta Эта формула совпадает с (2.6.8). Упражнение. Найдите распределение промежутков времени для независимых событий. Упражнение. Для дробового шума ш(0; /0) =~ w (0О) не зависит от tПокажите, что ю(0|га)- к<(0) также обладает этим свойством. Тогда время ожидания, отсчитываемое от произвольного момента времени, окажется тем же самым, что и отсчитываемое от одного из событий. С одной стороны, это очевидно, гак как момент времени, в который произошло событие, можно выбрать в качестве произвольного момента времени t0 и этот выбор не влияет на статистику остальных событий. С другой стороны, это парадоксально, так как среднее время, прошедшее с момента последнего события, предшест- вующего времени должно быть тем же самым. Следовательно, среднее время между событиями, взятое по обе стороны от t9, удваивается. Пояс- ните этот парадокс. [См. обсуждение в „Weglangenparadoxon" by F. Zernike in Hanbruch der Phvsik, 4 (Geiger and Scheel eds., Springer, Berlin 1929), p. 440]. Упражнение. Покажите, что для дробового шума распределение промежутков времени между данным событием и k-м событием, считая с данного, имеет вид ку*(9)= v*0*-* 1)! (2.6.11) (•/‘^распределение. которое в этой связи называют также «эрланг-^-распре- делением» *). Упражнение. Покажите, что (ср. (6.5)) wHb~ta)\ta)=-^j | 6v[la^b) |р=_х. Упражнение. Обобщите (2.6.8) для случая, когда задано более одного события. Упражнение. Докажите (2.6.9), сначала определив условную вероятность Qs для подансамбля, а затем выведите из нее соответствующую функцию fn. Упражнение. Если событие было зарегистрировано в момент времени t.a, то плотность вероятности для регистрации некоторого другого события (нс обя- зательно следующего за ним) в момент времени tb составляет /2 (ta, tb)/fi (ta). Парная функция распределения определяется соотношением ,, . , (Z а* ^b) _ , _д_ Sz (ta, tb) g{ а' b ~ frUa)fl(ta)' * Kosten L., Stochastic Theory of Service Systems (Pergamon, Oxford, 1973). 56
Обобщите это определение на точки в трехмерном пространстве и убедитесь в том, что это есть парная функция распределения в статистической механике. Упражнение. Условная вероятность (т | 1а) — это вероятность того, что, заре- гистрировав событие в момент ta, вы зарегистрируете еще k событий между 'а и Эту функцию называют функцией Пальма. Выразите qk (т | ta) через ГЛАВА 3 СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ В этой главе определяются стохастические процессы и некоторое количество вспомогательных концепций. Обсуждается вопрос, почему эти понятия применяются в физике. Выводятся их общие свойства, подробно рассматриваются некоторые примеры. 3.1. ОПРЕДЕЛЕНИЯ Если определена стохастическая переменная X, из нее можно вывести бесконечное количество других стохастических переменных, а именно все величины У, определенные с помощью некоторого ото- бражения f как функции переменной X. Эти величины Y могут быть математическими объектами любого вида, в частности они могут быть и функциями, зависящими от дополнительной переменной /: КИО-ИХ, /). Такую величину У (t) называют случайной функцией или, по- скольку в большинстве случаев в качестве t берут время, стоха- стическим процессом. Таким образом, стохастический процесс — это просто функция двух переменных, одна из которых—время, а дру- гая — стохастическая переменная X, определенная в гл. 1. Если вместо X подставить одно из ее возможных значений х, то полу- чится обычная функция от / rv(n----7(x, t), которую называют выборочной функцией или реализацией процесса На физическом языке стохастический процесс можно представить как „ансамбль" таких выборочных функций. На основе заданной плотности вероятности Рх (х) переменной X’ легко образовать средние. Например, 'Y(tY> $ Yx(t)Px(x)dx. В более общем случае берем п значений tlt t.,, ., t„ переменной времени (не обязательно все разные) и образуем /г-й момент: Y (/,) Y (/.2) ... У (/„)> = j Yx (tt) Yx . . . Yx (tn) Рх (х) dx (3.I. J) 57
Представляет определенный интерес автокорреляционная функция X (П, А) - «Т (Л) У (/=);> = < {У (У) —У (/1)» {У (М-<К(/=)>} - - Yd^Yit, )>-<Y (/1Ь<Г(У>. (3.1.2) Для /, -- она сводится к зависящей от времени дисперсии <<У/(1)'2 >_о2(/). Стохастический процесс называют стационарным, если моменты не меняются при сдвиге ио времени, т. е. когда выполняется соот- ношение У (1,-Д) Y (/„--j- т) . . . Y (tn^- т) -- Д’ (/J Y (t„) ... Г (/„)> (3.1.3) для всех п, всех т и всех .... В частности, когда ДД не зависит от времени, удобно вычесть эту константу из Y (/) и иметь дело со случайным процессом Y (/)=У (t) — ДД с равным нулю средним значением. Автокорреляционная функция x(/j, /,2) стационарного процесса зависит только от |—t.2\ и не меняется при вычитании константы. Во многих случаях существует констан- та тг такая, что t.,) обращается в ноль или становится пре- небрежимо малой для |Д— /,2( ть,. В таких случаях т, называют автокор ре ляци онным временем. Как отмечалось ранее в § 2.3, чисто стационарные процессы в природе не существуют (не считая лаборатории). Но когда про- должительность процессов намного превышает длительность изучае- мого явления, их можно приближенно рассматривать как стационар- ные. Единственное условие состоит в том, что длительность должна быть много больше автокорреляционного времени. Процессы, не обла- дающие конечным т,,, никогда не «забывают», что они были когда-то в прошлом включены, и поэтому не могут рассматриваться как при- ближенно стационарные. Стохастическая величина Y (/) может иметь несколько компонент Yj {() (/—1, 2, . . ., г). В таких случаях часто бывает удобно записы- вать ее как вектор Y (1). Тогда автокорреляционная функция заме- няется на корреляционную матрицу: У, У, У- Д (ТПД(А) • (3.1.4) Диагональные элементы представляют автокорреляции, недиагональ- ные элементы — взаимные корреляции*. В случае стационарного про- цесса с нулевым средним значением это равенство сводится к сле- дующему: А,7 (т) - -У (/) Yf (/т)> yi (о) Yj (т)>. * Эти термины общеприняты в физике, однако они не вполне согласуются с (1.3.8) н (1.3.9). 58
Отметим следующее очевидное свойство автокорреляционной функ- ции стационарных процессов: Л„( т). (3.1.5) Когда Y (/) является комплексной величиной (например, амплитудой осцилляций), ее можно рассматривать как двухкомпонентный про- цесс, однако зачастую удобнее сохранить комплексные обозначения. В этом стучае можно определить комплексную автокорреляционную функцию х(т) = «К (о) * Y (т)>д = х(— т) *, (3.1.6) которая часто является полезной, несмотря на то что она содержит меньше информации, чем корреляционная 2 X 2-матрица. Упражнение. Пусть заданы функция ф (/). зависящая от t, и случайная пере- менная X. Тогда (3.1.7] является стохастическим процессом. Вычислите его n-й момент, дисперсию и автокорреляционную функцию (т. е. выразите их через стохастические свойства переменной X). Упражнение. Найдите соотношение, связывающее корреляционную 2х2-матриц\ комплексного процесса и его комплексную автокорреляционную функцию. Упражнение. Возьмите в качестве X случайное множество точек (см. гл. 2) и определите стохастический процесс У (/) = 6 (г--та). (3 1.8) О ~ 1 Найдите <У (1)> и (И) У Упражнение. Тот же вопрос для процесса Y(t)=_- 2 ф(/-тв), (3.1.9) <7— 1 где ф —заданная функция конечной ширины. Упражнение. Когда в (3.1.9) точки в случайном множестве т5 независимы н рас- пределены стационарно с плотностью v, результат имеет вид ф (т) dr, ф (т) ф (г Ч-т) dr. (3.1.10) - <£ — X Эти соотношения называют теоремой Кэмпбелла *, и мы будем называть этот процесс процессом Кэмпбелла. Упражнение. Пусть У — процесс Кэмпбелла. Найдите характеристическую функ- цию для значения У (!) в момент времени I. Покажите, что его кумулянты имеют вид <<У (t)m»=v {ф(т)}-« йт. — 05 * Campbell N. R. Proc. Camb. Philos. Soc. 15,117 (1909); Rice S. O.. Bell System Technical Journal, 23, .282 (1944) u 24,46 (1945), reprinted in Wax, 59
Упражнение. Пусть У (t) — sin Ц>,' + X), где X имеет постоянную плотность вероятности в интервале (0.2л). Найдите автокорреляционную функцию процесса У. Упражнение. Для того же самого У (?) покажите, что характеристическая функ- ция совместного распределения У (Б). У (Г2) при о> 1 имеет вид Jo (У + ^2+2*1^2 cos (/j —И Тогда | 1/11 < 1, | уг | < 1 и Рг(У1, ‘У. Уг, - 1 2 где Уда--полиномы Чебышева. Упражнение. Пусть стохастический У(.Т Л.., дл, 1+ у 2m^Tm\iy1)Tm{y2}cosrn^i— /2) L ш -1 процесс У (/) определен соотношением J - - п <?<£--- п 1. где п пробегает все целые значения, {Х„}— бесконечное множество стоха стических переменных с одинаковыми распределениями, g— стохастическая переменная в интервале (0,1), имеющая постоянную плотность вероятности в этом интервале. Покажите, что У (!)—стационарный процесс, и найдите его автокорреляционную функцию. 3.2. СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ В ФИЗИКЕ Роль вероятности вообще и стохастических процессов в частности в физике является предметом многочисленных глубоких исследова- ний. Здесь же мы просто хотим сделать несколько практических замечаний. а. Почему стохастические процессы вошли в физику? Ответ со- стоит в том, что многие явления зависят от времени исключительно сложным образом, настолько сложным, что это исключает возмож- ность их вычисления и даже наблюдения. Однако такие явления могут иметь средние черты, которые можно наблюдать и которые должны подчиняться простым законам. Например, точное мгновен- ное значение сил, действующих со стороны молекулы газа на пор- шень меняется исключительно быстро и непредсказуемо, но после интегрирования по малым временным интервалам (происходящим автоматически из-за инерции поршня) оно становится плавной функ- цией, подчиняющейся закону Бойля. Аналогично, мгновенные флуктуации тока в цепи, содержащей омическое сопротивление или вакуумную лампу, очень сложны, но после возведения в квадрат и вычисления интеграла по малым временам получается величина, связанная простыми законами с другими физическими величинами. Часто высказывается мнение, что вероятностное рассмотрение в физике оправдывается тем, что мы пренебрегаем точным микро- скопическим состоянием *. Однако это и другие антропоморфные * Tolman R. С., цитированный в (3.1.5); Jaynes Е. Т.. Phys. Rev. 106.620 u 108,171 (1957); The Maximum Entropy Formalism, Levine R.D. and Tribus M eds.. M.I.T Press, Cambridge, Mass. 1979). 60
объяснения—только одна половина правды. В частности, при таком подходе не объясняется, почему некоторые переменные можно уст- ранить усреднением, а другие, например полную энергию или химический состав газа,— нельзя. В действительности, из опыта мы знаем, что, несмотря на пренебрежение большинством микро- скопических переменных, все же можно выявить закономерности макроскопического поведения и сформулировать их в виде общих законов. Таким образом, ясно, что точные значения этих микроско- пических переменных не важны и, следовательно, по ним можно провести усреднение. Это свойство изучаемых систем, а не наблю- дателя. Задача физики—объяснить, каким образом происходит это чудо и, в частности, понять, что отличает не имеющие отношения к делу микроскопические переменные от остальных макроскопиче- ских. Грубо говоря, переменные, которые быстро меняются во вре- мени,— это несущественные переменные, хотя строгое разграничение переменных на существенные и несущественные затруднительно. Как мне кажется, это основная проблема статистической механики. б. Каким образом стохастические процессы входят в физику? Для определенности рассмотрим одноатомный газ, состоящий из Л молекул в ящике с жесткими отражающими стенками. Микросостоя- ние этой системы определяется 6.V координатами и импульсами. Выбираем фиксированный момент, который назовем «начальный мо- мент времени»; 6Л'’ значений координат и импульса в этот момент времени обозначим х. С помощью уравнений движения начальное микросостояние единственным образом определяет микросостояние в любой другой момент времени. Физическая величина Y, связан- ная с системой, является функцией 6Л' переменных. Примерами та- ких величин могут служить число частиц в элементе объема или сила, действующая на поршень. Значение Y в момент / является функцией Yx(t), зависящей только от х. t. Основная идея статистической механики состоит в том. что си- стему можно заменить соответствующим а н с а м б л е м таких систем, которые описываются теми же уравнениями движения, но имеют другие начальные микросостояния х. Структура ансамбля опреде- ляется функцией плотности р (х) таким образом, что р (х) dx пред- ставляет число выборочных систем, обладающих начальными микро- состояниями, принадлежащими элементу объема dx. Подстановка ансамбля в случае отдельной системы превращает х в стохастиче- скую переменную X. Множество выборочных значений Л состоит из всех возможных микросостояний, а плотность вероятности с точ- ностью до нормировки равна р: РхМ- -р-^-......... \ р (%'» dx' Поскольку мы приняли эту основную идею, остается выбрать соот- ветствующее распределение Рх. с его помощью вычислить средние и интерпретировать получившиеся числа как наблюдаемые значения 6-
физических величин. Ансамбль служит просто средством представ- ления распределения вероятности', вероятность того, что х принад- лежит определенному элементу фазового пространства dx, равна доле выборочных систем ансамбля, принадлежащих этому интервалу. Подстановка ансамбля для реально существующих систем при- водит к тому, что каждая физическая величина Y (Z) становится стохастическим процессом, среднее значение и моменты которой можно связать с наблюдениями. Наблюдаемое давление на поршень отождествляется скорее со средним по ансамблю сил, с которыми отдельные молекулы действуют на поршень, чем со средним значе- нием сил по времени. Вопрос о том, почему и в каком случае оба вида средних совпадают, является фундаментальной проблемой обо- снования равновесной статистической механики, но выходит за пре- делы темы этой книги *. Понятно, что такой подход не ограничен газом одноатомных молекул. Например, если тяжелая частица погружена в газ легких частиц, а х—начальные значения всех координат и импульсов тя- желой частицы и легких частиц, то Yx (/) может являться коорди- натами или скоростью тяжелой частицы. Из теории броуновского движения (см. гл. 8) известно, что средняя скорость подчиняется макроскопическому закону затухания, в то время как его авто- корреляционная функция определяет коэффициент диффузии. Опять-таки основная идея статистической механики (для стационар- ных процессов) состоит в том, что можно использовать среднее по ансамблю вместо среднего по времени, которое непосредственно связано с наблюдениями. в. Но это еще не все, потому что усреднение по начальному состоянию х не упрощает задачу, так как для нахождения Yx(t) все еще необходимо решить микроскопические уравнения движения. Решить уравнения Лиувилля отнюдь не проще, чем эти уравнения. Довольно существенный добавочный элемент состоит в решающем предположении, называемом Stosszahlansatz, молекулярным хаосом или приближением случайных фаз. В результате этого допущения из рассмотрения исключаются несущественные быстро меняющиеся пере- менные, что приводит к дифференциальным уравнениям, описываю- щим эволюцию только медленно меняющихся переменных. Напри- мер, скорость химической реакции между двумя компонентами X и Y можно считать пропорциональной произведению их концентра- ций независимо от того, каковы точные значения координат и ско- ростей молекул. Полученные в результате дифференциальные уравнения являются макроскопическими уравнениями. Примеры: уравнения для скоростей химических реакций, уравнение затухающих колебаний гармониче- * Обзор и обсуждение обширной литературы по этой проблеме см. Farquhar I Е . Ergodic Theory in Statistical Mechanics (Interscience. London, 1964); Ba- lescu R., Equilibrium and Nonequilibrium Statistical Mechanics (Wiley, Nev/ York 1975) Appendix; Penrose O., Reports on Progress in Physics, 42, 1937 (1979). 62
ского осциллятора для маятника в воздухе, уравнение диффузии (закон роста населения). Все эти уравнения являются приближен- ными, в действительности же существуют небольшие отклонения от них, которые проявляются как флуктуации. Они являются стоха- стическими, которые и составляют предмет настоящей книги. Флуктуации, естественно, нельзя найти точно, что было бы равно- сильно решению микроскопических уравнений. Однако их стохасти- ческие свойства подчиняются довольно простым законам. Более того, для того чтобы установить эти законы, требуется повторить предположение о случайности, которое делалось при выводе макро- скопических законов. Такой подход к теории флуктуаций мы будем называть мезоскопическим. Мезоскопическое приближение дает более подробное описание, чем макроскопическое, поскольку оно вклю- чает в себя описание флуктуаций, однако оно обрезает микроско- пические уравнения с помощью повторного предположения о слу- чайности. Повторное предположение о случайности является центральным местом в рассуждении— это видно из того, что получающиеся макроскопические и мезоскопические уравнения необратимы, в то время как лежащие в их основе микроскопические уравнения обра- тимы во времени. С тех пор как Больцман впервые использовал свой Stosszahlansatz, было сделано много попыток исключить это основное предположение*, обычно заканчивающихся тем, что оно пряталось под ковер математического формализма. Ясно, что кроме чистой математики необходимо еще что-то, что- бы понять, почему природа входит в противоречие с нами только в тех процессах, в которых энтропия возрастает, хотя обратные процессы также совместимы с микроскопическими уравнениями дви- жения. Это фундаментальная проблема обоснования статистической механики необратимых процессов. г. До сих пор наши рассуждения основывались на классической механике. Квантовая механика дает дополнительную непредсказуе- мость, которая связана с основами теории, а не со сложной приро- дой системы. Стохастическая природа радиоактивного распада исклю- чительно квантово-механического происхождения. Естественно, раз- ница между классическими и квантовомеханическими флуктуациями туманна, поскольку природа (насколько нам известно) в своей основе квантова. Однако следует понимать, что для ответа на воп- рос «почему стохастические процессы входят в физику?» нет необ- ходимости обращаться к квантово-механической неопределенности. Действительно, стохастические методы применяются также к движе- нию комет и игре в рулетку. Классическое усреднение по всем микроскопическим состояниям в некоторой области фазового пространства эквивалентно усредне- *См.: Ter Haar D., Rev. Mod. Phys., 27, 289 (1957); Davies P. C. VV., The Physics of Time Asymmetry (Surrey University Press, London, 1974). 63
нию в квантовой механике по всем векторам (единичной длины) в линейном подпространстве гильбертова пространства системы. Это равносильно усреднению по полной ортонормированной системе еди- ничных векторов в этом подпространстве, что является более при- нятой процедурой. Упражнение. Равновесие описывается не зависящим от времени ансамблем. Докажите, что в этом случае У'(/) является стационарным стохастическим процессом. При этом, естественно, предполагается, что гамильтониан не зависит явно от времени (система автономна: не испытывает влияния извне), то же самое предполагается относительно Y: она изменяется со временем только вследствие зависимости от положения в фазовом про- странстве. 3.3. ПРЕОБРАЗОВАНИЕ ФУРЬЕ СТАЦИОНАРНЫХ ПРОЦЕССОВ Рассмотрим однокомпонентный действительный процесс Y (/) в некотором фиксированном интервале 0 < t < Т. Каждая реализа- ция Yx(t) является обычной функцией времени и может быть раз- ложена в ряд Фурье в этом интервале. Чтобы избежать комплекс- ных коэффициентов, мы используем синус-преобразование Фурье: ЕД/) X ^T.xsin ’ i • ,1=1 1 1 Коэффициенты ряда Фурье Л, заданы выражениями т Ап.х ^\sm . ~t'}Yx(t)dt (3.3.1) о и удовлетворяют тождеству Парсеваля т .1-. 4' j Yx(tYM- (3.3.2) п=1 о Если рассмотреть все возможные значения х вместе с их плот- ностью вероятности Рх (.г), то величины Л„>д. становятся стохастиче- скими переменными Ап. Например, их среднее т <Л„..==Д fsin {^?дЕ(фд/, о а усредняя (3.3.2), получаем т 'Ж J >1=1 о Предположим, Y (t) — стационарный случайный процесс с равным нулю средним значением и конечным временем автокорреляции ге, 64
тогда <Y (/)2> не зависит от времени и 00 X у<Л2> = <Г2>. п — 1 В этом отношении средний квадрат флуктуаций <У2? выражается через сумму членов, каждый из которых относится к одной синусо- идальной волне с частотой пп'Т. Вопрос состоит в том, чтобы узнать, как полный квадрат <"У2> распределен по частотам, или, другими словами, найти спектральную плотность флуктуаций S(co), определенную соотношением V 1<Д2(>. (3.3.3) (о < лп,}Т < ю * Дю Для того чтобы иметь возможность взять Лю малым, надо выбрать Т большим и тогда много значений п попадет в интервал Лоз. Ответ на поставленный нами вопрос дает теорема Винера — Хинчина, которая утверждает, что S (<о) — это косинус-преобразова- ние автокорреляционной функции: .S («)) = cos (wt) х (т) dx. (3.3.4) b Чтобы доказать это, нужно только представить в (3.3.3) явное вы- ражение коэффициентов Фурье (3.3.1): г т /1 •> - 4 С* », С a ' дм л/1 / ' х f / j.\ \ <A-rt/ yg- \ dZ \ dZ sin -у- sin -у- с У (Z) Y(t )? о о Т T-t 4 С . :int 1, Р . лп (t 4- т) , х 1 sm-^-dZ \ sin—~------------7z(T)dT. I£ j I j 1 ' о -t Поскольку мы предположили, что х(т) быстро убывает при | т | > тг, X с» \ | х (I) | dr = 2 у (т) |dx < оо. — х О Кроме того, Т можно выбрать большим по сравнению с интерва- лом т, на котором х(х) заметно отличается от нуля. Далее понятно, что второй интеграл может быть взят в пределах от —оо до оо: <Л2> =sin2d/ j cos dx -i- 0 — ao T 05 4 p . nnt nnt ,, p лит , , , — у \ sin ~y- cos -jr- d/ \ -y- x (x) dx = 0 —go 4 T p лит . . j = j2--y \ cos-y x(x) dx. 65
Подставляя этот результат в (3.3.3) и предполагая, что х(т)— функция, достаточно гладкая для того, чтобы можно было под- ставить интервал Дсо, получаем се се cos х (т) dr = у cos (сот) х (т) dr. — 00 —05 Поскольку в интервале Дю имеется (77л) Дю членов, в результате находим X S (со) Дсо Дсо ~ — ~ \ cos(cot)x(t) dr. — ОС Это и есть желаемый результат (3.3.4). Упражнение. Теорему Винера — Хинчина (3.3.4) можно представить в другом виде: 30 S (со) -- \ е1'итх (т) Нт, - 30 S (7) -- 4 cos (2л/т) н (т) Нт, о где / = <о/(2л) — обычная частота. Для комплексного процесса 30 S (со) — — cos (сот) и (т) с1т, — со где х—комплексная автокорреляционная функция (3.1.6). Упражнение. Если У имеет г компонент и они все действительны, естественно определить 30 S,y (w) ==-~ J cos (mT) Kij (т) (3.3.5) о Тогда спектр флуктуаций произвольной линейной комбинации Z — У с/У,- i дается выражением Sz (со) =- S,y (со) ctCj. Найдите аналогичную формулу И для г комплексных компонент. Упражнение. Спектральная плотность процесса Кэмпбелла, определенная вы- ражением (3.1.9) со стационарным независимым т4, имеет вид S (со)= 2v | ф(ы) |2, (3.3.6) где ф—Фурье-образ от ф. Упражнение. Отклик инерционного гальванометра с критическим демпфирова- нием на импульсе тока при t =0 есть ¥(/) —cte-V*. Найдите спектраль- ную плотность отклика на стационарный поток независимых случайных импульсов. Упражнение. Катод испускает электроны в независимые случайные моменты вре- мени. Выведите соотношение Sz(7) = 2e</> (3.3.7) 66
для спектральной плотности флуктуаций тока, где / = и/(2л)— частота. Это теорема Шотки для дробового шума в насыщенном токе диода *. Упражнение. Пусть F(f)— флуктуирующая часть электрического тока. Вомно- t гих случаях бывает проще измерить перенесенный заряд Z (/)=.- SJ V(i")d/'- о Покажите, что его спектральная плотность У связана с флуктуациями заряда «теоремой Макдональда» **: 00 S (ш) 5 s‘n '% (02> (3.3.8) о ^Указание. Сначала покажите, что (d/d/) <Z(/)2> = 2 J Верхний предел интегрирования в (3.3.8) определен в смысле Чезаро *** или с помощью обеспечивающего сходимость множителя е~Ет. В частности, для дробового шума, заданного соотношением (3.3.7), имеем **** «{Z (О2}» =е </> г.) 3.4. ИЕРАРХИЯ ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ Предположим, что некоторый стохастический процесс Yx (t) задан описанным в § 3.1 способом. Тогда плотность вероятности для Ух(/) получить значение у в момент времени t дается выражением Л (У, /) = p{(/-r¥(Z)}Px(x)dx. (3.4.1) Аналогично, совместная плотность вероятности того, что Y прини- мает значения в момент времени и у.2 в момент /2 и т. д. до Уп, есть Pn{yi, ty, у-2, ty • • уп, tn) = ... 6{y„-rx«,;)}PA.(x)dx. (3.4.2) Таким образом, задается бесконечная иерархия плотностей вероят- ности Рп (и=1, 2, ...). Эти распределения позволяют вычислить все средние, использовавшиеся нами ранее, такие, как 'Y (ti)Y (t2) ... Y (/„)> = == 5 У1У1 Упрп (Уъ ti', У Л У, • • •; Уп, tn) dz/i dy2 . .. dyn. Хотя правая часть соотношения (3.4.2) имеет смысл и тогда, когда некоторые моменты времени совпадают, мы будем полагать, что распределения Рп определены только для разных моментов времени. Тогда иерархия функций Рп удовлетворяет следующим четырем «условиям непротиворечивости»: * Schottky W., Ann. Physik, 57,541 (1918); Van der Ziel A., Noise (Prentice- Hall, Englewood Cliffs, N. J., 1954). ** MacDonald D. К. C., Report on Progress in Physics, 12,66 (1948). *** Titchmarsh E.C. The Theory of Functions (Oxford University Press, 1932). **** Milatz J. M. W. Nederl. Tijdschr. Natuurk., 8,19 (1941). 67
1) ^>0; 2) Рп не меняется при внутренней перестановке пар (хк, tk) и (xt, /(); 3) ^Рп(У1, ti, •••; У„-!, уп, tn)dyn = ~^П-1(У1у • • • ’> Уп-1’ 4) Jpji/i, /1)dy1=l. Функции Рп позволяют вычислить все средние и, значит, опре- деляют стохастический процесс (на самом деле эта спецификация в значительной степени избыточна, поскольку в соответствии с п. 3 любое конечное число функций Рп может быть опущено без потери информации). Колмогоровым было доказано*, что произвольный набор функций, удовлетворяющий четырем условиям непротиворе- чивости, определяет стохастический процесс Y (t) в том смысле, как он был определен в § 3.1. Следовательно, иерархия совместных плотностей вероятности дает еще одну равноценную возможность определить стохастические процессы, которая служит альтернативой определению, данному в гл. 1. Правда, в общем доказательстве конструкция переменной X, соответствующая данной иерархии, достаточно абстрактна. Однако, как разъясняется в § 3.2, в физи- ческих приложениях X известно a priori. Условная вероятность Piutiji, /2|z/j, —это плотность вероят- ности того, что величина Y принимает значение в момент вре- мени t,, если известно, что в момент времени ее значение было уг. Сформулируем это по-другому: из всех выборочных функций Yx(t) ансамбля выбираем те, которые удовлетворяют условию, что они проходят через точку yv в момент tp, часть этого подансамбля, попадающая в интервал у.2, у2 -р dt/2 в момент t.2, обозначают PL ।, (у2, (^{Ух, /1)ф/2. Ясно, что вероятность । j неотрицательна и нормирована: ^^i|i (У-2 > С IУ15 G) Ф/2 =- 1. В более общем случае можно зафиксировать значения величины Y в k различные моменты времени t2, . .., tk и интересоваться совместной вероятностью в другие / моментов времени tk+l, . . ., tk,.t. Таким образом, мы приходим к общему определению условной вероятности: РI {к (Ук~1^ f 1’> • • • ; Ук ' I' 1-1 I Ук1 Ci • Укч tk) ~ Рк-> liVi' С’- ', У к- t Ук ‘ I- ^fe + li • -! Ук-rh - 1) (3 4 3) Рк(У1’ fli Ук’ ‘к) ' ' * Kolmogoroff A. Grundbegriffe der Wahrscheinlichkeitsrechnung, Ergebn. Mathem. Frenzgeb., 2, no. 3 (Springer, Berlin, 1933)-Foundations of Probability Theory (Chelsea Press, New York, 1950); Friedman A. Stochastic Differential Equations and Applications I Acad. Press, New York, 1975) Ch. I. Papoulis A., Probability, Random Variables and Stochastic Processes (McGraw-Hill, New York, 1965) Gewohnliche Differentialgleichungen mit zufalligen Parametern (Aca- demie-Verlag, Berlin, 1972). 68
По определению, Рцк симметрична по парам переменных в мно- жестве, содержащем k пар, и в множестве, содержащем / пар пере- менных. Эта условная вероятность также может трактоваться как вероятность в подансамбле тех выборочных функций, которые попа- дают в k заданных интервалов в моменты tly t.2, . .., tk. Обобщением понятия характеристической функции на стохасти- ческие процессы является характеристический функционал. (В другой связи эта идея была использована в § 2.3.) Пусть Y (/) — заданный случайный процесс. Введем произвольную вспомогательную пробную функцию k(t). Тогда характеристический или генерирующий моменты функционал, зависящий от k (/), определяется с помощью следую- щего соотношения: G [(/?)] -Дехр 00 i § k(t)Y(t)dt — со \ /• (3.4.4) Обозначение G ([/г]) подчеркивает, что G зависит от всей функции k, а не от ее значения в какой-либо определенный момент времени /. Сходимость интеграла не должна вызывать беспокойства, потому что класс функций k можно ограничить только теми из них, кото- рые быстро убывают при достаточно больших |/|. Раскладывая (3.4.4) по степеням k, получаем G(R - 00 Vj /72 ^т Ш) <Г(/3) ... У (/,„)> d/3 ... d/m. (3.4.5) т-0 ' v Тогда каждый момент совместного распределения У(73), Y (Л2), ... можно найти как коэффициент при члене с й(/1)й(/2) ... в этом выражении. Аналогично, кумулянты могут быть найдены из выра- жения logG ([я])- X -- Z \k (A) ...k (t,n) &;Y{tp ... У (/J у d/3 . . . d/M. (3.4.0) rn — 1 ° Процесс является стационарным, когда все Рп зависят только от разности времен: Р„(Уи у2, . . .; у„, in — т)-- G; у-2, С; • • у„, Q- Необходимым, но отнюдь не достаточным условием для этого яв- ляется независимость функции Рг (yt) от времени. Процесс называют гауссовым, если все его функции Рп (много- мерные) являются гауссовыми распределениями. В этом случае все 69
кумулянты, кроме m = 2, обращаются в нуль и 6 ([/г)] = ехр [i \k (^) (/г)> — -^k(ti)k(Q (ЗАЛ) Гауссов процесс полностью определяется его средним значением <Г(/)> и вторым моментом <Г (/t) Y (/2)>. Гауссовы процессы осо- бенно просты в обращении и поэтому хорошо изучены. Их часто используют для приближенного описания таких физических про- цессов, при описании которых можно пренебречь кумулянтами более высокого порядка. В гл. 9 будет показано, что это предпо- ложение оказывается приемлемым во многих случаях, но гл. 9 и 11 показывают, что это отнюдь не всегда так. Упражнение. Рассмотрите случай когда Р в (3.4.3) равны нулю. Упражнение. Определение гауссова процесса было бы спорным, если бы оно было несовместно с § 3.4. Покажите, однако, что когда некоторое Рп гауссово, то гауссовы и все Рболее низкого порядка. Покажите также, что условные вероятности гауссовы. Упражнение- Вычислите иерархию функций Рп для процесса (3.1.7), полагая ф (t) > 0. Проверьте, что условия п. 1—4 удовлетворяются. Упражнение. Выразите характеристический функционал процесса (3.1.7), через характеристическую функцию случайной переменной X. Упражнение. Вычислите характеристический функционал процесса Кэмпбелла и выведите для кумулянтов следующее соотношение: ОС «У ((хУ'ЧУ (t-iYn= . . .»= {ф(Н —т)}'л1 {ф(/2 —т}га-’. . . бт. (3.4.8) — со .Упражнение. Пусть x(t), p(t) — координаты и импульс свободной частицы. Начальные значения х (0), р (0) представляют собой случайные переменные с заданным распределением Р± (х, р, 0). Тогда {*(/), р (/)} образуют дву- мерный случайный процесс. Вычислите Pi (Хх, plt G), Р2 (хх. гх; х2, р2, G). Т’1|1(х2, р-2, /2|хь Pi, Н) и функции Р„ более высокого порядка. Упражнение. Переменная х (/) в предыдущем упражнении сама по себе является стохастическим процессом. Вычислите функции распределения для случая Pi (х, р, 0) = (2л)ехр [—1/2 (х2-) р2)]. Упражнение. Пусть У(1) (t) и Р2> (?) — два случайных процесса с иерархиями р>(1> н Пусть «х и а2—два неотрицательных числа, причем ах-4-а2=1. Покажите, что Pn~a,iP™-)-а2Рл’ («выпуклая комбинация») тоже является допустимой иерархией. Какой случайный процесс она описывает? Упражнение. Покажите, что факториальные кумулянты (1.3.13) для процесса Y даются выражением 00 log G ([*])= У _1_ С ... (ei* («_ I) >.- tn. (J rn— 1 X|K((x) ... K(^)jdZx ... d/,„. (3.4.9) Упражнение. Случайное множество событий определяет процесс У (/) = = 2jd(^ — tn). Применив (3.4.9), выведите другим способом выражение (2.5.10). 70
Упражнение. Покажите, что настоящее определение «стационарности» через Рп эквивалентно определению (3.1.3). Упражнение. Пусть (X (/), У (0)—двумерный стохастический процесс с иерар- хией Определим функцию Рп (хъ it; .. .; хп, tРп (хъ уъ 0; ...; х„, уп, t^dyi ... dyn. (3.4.10) Покажите, что эти частные функции распределения снова определяют процесс X (/). 3.5. КОЛЕБАНИЯ СТРУНЫ И СЛУЧАЙНЫЕ ПОЛЯ Большая часть стохастических процессов в физике и химии от- носится к марковскому типу, и поэтому они включены в материал следующей главы. Однако имеется пример, иллюстрирующий при- менение и не марковского процесса. Рассмотрим следующую физи- ческую задачу: невесомая упругая струна закреплена при х = 0 и x = L. Пусть у(х)— поперечное смещение, тогда энергия упругой деформации струны, форма которой определяется функцией у(х), имеет вид (35|) о Когда струна подвергается воздействию тепловых флуктуаций (из-за окружающего ее воздуха), у (х) становится случайной функцией, х играет роль переменной, которую мы до сих пор называли /. Можно ожидать,, что вероятность реализации любой частной зави- симости у (х) пропорциональна величине e-E/(kT) —. еХр (3.5.2) где р= l/(kT), Т—температура воздуха. Это приближенное соотношение (по крайней мере до тех пор, пока мы не научимся различать и учитывать отдельные «формы» у(х), т. е. пока не научимся интегрировать в пространстве функций у). Чтобы сформулировать эти эвристические идеи точно, определим стохастическую функцию Y (х), выборочными реализациями которой являются функции у(х). Возьмем п различных точек xv в интер- вале (0, L) и пронумеруем их числами от 1 до п: 0 < хг < х., < ... < хп < L. (3.5.3) j В каждой точке xv зададим интервал (yv, yv + dyv). Энергия струны, приходящаяся на эти интервалы, равна — ( । У:)2 2 \ xj 1 х2—Xj (Уп Уп—iY Хп — Хп-1 Уп L- хп 71
Для удобства записи введем обозначения хо = 0, t/o = 0, xn^.1 = Lr уп + 1==0, тогда это выражение для энергии можно записать в виде 1 У'' (Уу г 1 —уу )2 Проделав эту подготовительную работу, определим иерархию Р,., полагая Рп(Уг, уп, .r„)--= /2л£ / Р у \(2л(ху+1-Л-)? ехр 2 Д. х Г \ -1 V _j (3.5.4) Это выражение определяет Рп, когда xv удовлетворяет условиям (3.5.3). Для другого упорядочивания Рп определено условием сим- метрии (см. п. 2 § 3.4). Выполнение условия совместимости п. 1 § 3.4 очевидно. Условие п. 3 § 3.4 может быть проверено с помощью явного вычисления, условие п. 4 § 3.4 справедливо из-за нормирую- щего множителя, который мы дописали перед произведением. Более того, для больших п, т. е. для достаточного частого разбиения ин- тервала (0, £), понятно, что Рп согласуется с интуитивной форму- лой (3.5.2). Тогда соотношение (3.5.4) определяет стохастический процесс, который отражает физическую идею состояния теплового равновесия струны. Каждое Рп представляет собой многомерное распределение Гаусса, так что мы имеем дело с гауссовым процессом. Это обстоятельство позволяет использовать соотношение (3.1.6). Далее находим <Г(х5)>=0 и для хг<^х2 cK(xt)K(x2)> (3.5,5) Р Lj Заметим, что вследствие нестационарное™ процесса * его авто- корреляционная функция зависит не от I хд—х>|, и даже содержит полную длину струны L. Следовательно, теорема Винера — Хинчина непосредственно неприменима, однако аналогичное вычисление коэффициентов Фурье Ап дает <Лп>^=0 и <Л,гЛ«> = й„т-#т4-- (3-5.6) п гп' П1П П-Л2, р ' Это равенство просто означает, что флуктуации нормальных мод некоррелированяы и каждой нормальной моде соответствует энер- гия 4JiT. (Множитель 1/2 возникает из-за того, что колебания нашей струны затухают и струна не имеет кинетической энергии.) * Поскольку наша переменная х, а не t, слово «однородный» было бы более подходящим, но этот термин мы будем использовать в другой связи (см. § 4.4).
Примечание. В соответствии с этим вычислением среднее значение полной энергии оказывается бесконечным. Для физической струны это не является парадоксом, потому что выражение для энергии (3.5.2) становится неприме- нимым при слишком малых длинах волн. Однако аналогичное вычисление применимо к электромагнитным волнам, распространяющимся между двумя отражающими зеркалами при х=0 и x=L. В этом случае можно ожидать, что формулы остаются справедливыми при всех длинах волн, поэтому беско- нечное значение энергии представляет собой проблему. Этот парадокс назы- вается ультрафиолетовой катастрофой Рэлея—Джинса. Он был разрешен введением планковских квантов. Здесь можно добавить, что эта трудность позже появится вновь, когда окажется, что каждый осциллятор обладает энергией в нулевой точке. Эта энергия существует также в пустом пространстве и не зависит от темпера- туры. Следовательно, ее можно вычесть из полной энергии, что не должно отразиться на наблюдаемых фактах. Однако разность между энергией в нуле- вой точке поля между зеркалами и поля в вакууме не равна нулю и зависит от L. Следовательно, это приводит к возникновению силы между зеркалами, которая является макроскопическим вариантом силы Вад-дер-Ваальса, дейст- вующей между молекулами. Эта сила подробно изучена *. Упражнение. Физик разложил бы у(х) по нормальным модам и зная, что средняя потенциальная энергия гармонического осциллятора равна 1/2fe7', применил формулу (3.5.6). Выведите таким путем формулу (3.5.5). Упражнение. В выражении (3.5.6) замените множитель 1/Р на распределение Планка и найдите таким способом квантово-механический аналог формулы (3.5.5). Упражнение. Рассмотрите струну, состоящую из точечных масс, соединенных гармоническими пружинами и закрепленную на концах: yv Уу+1~г Уу-i— %Уу- Уи~О, уп 1 = 0. Вычислите '.у^уц'; в тепловом равновесии и покажите, что в этом случае не возникает трудностей с расходимостями. Родственной, но более сложной концепцией является понятие случайного поля, которое возникает в теории излучения**. Пусть и (г, О — поле, подчиняющееся некоторому не зависящему от вре- мени линейному дифференциальному уравнению в частных произ- водных, например Г2«—^-0. (3.5.7) Решения этого уравнения можно представить в виде суперпозиции нормальных мод uq (г, /): « (г, /). (3.5.8) в Связанное с этим равенством выражение для энергии решения пред- ставляет собой сумму энергий нормальных мод: а * Langbein D. Theory of Van der Waals Attraction (Ergebn, exakten Naturw., 72; Springer. Berlin, 1974). ** Другие приложения могут быть найдены в кн.: Preston С. Random Fields (Lecture Notes in Mathematics, 534; Springer, Berlin, 1976). 73
Тепловое равновесие описывается ансамблем, т. е. А становится случайной переменной с распределением вероятности (в классической статистике), пропорциональным е-Е'(*т)== (3.5.9) q Таким образом, величины Aq представляют собой независимые гаус- совы случайные переменные с равными нулю средними значениями. Соответственно и (г, 7) становится также случайным полем, т. е. слу- чайной функцией четырех переменных г, t, а не только одного t. Будем интересоваться ее стохастическими свойствами, например двухточечной корреляционной функцией <ц(Г1, /i)u(r2, /2)> = 5<Л<А'>МГЬ ^i)«<r(r2, Q = qq‘ = 2(21Ч)-1гМг1’ zi) ui (г2- Q- (3.5.10} <7 В бесконечном пространстве нормальные моды образуют непре- рывное множество и (3.5.8) должно быть интегралом. Это затрудняет применение (3.5.9), и поэтому все поле часто помещают в большой куб Q. В качестве граничных условий можно выбрать ц = 0 на стенках Q, но нормальные моды принимают более простой вид, если потребовать, чтобы и были периодическими функциями с перио- дом Q. Результаты не зависят от этих манипуляций при условии, что Q в конечном счете устремляется к бесконечности. Вычислим (3.5.10) для реального поля, подчиняющегося волно- вому уравненью (3.5.7). Действительные решения уравнения (3.5.7) имеют общий вид и(г, Z) = 2[aQei(’'”‘?0 + aJe“i<‘"”‘'/’]- (3.5.11) Здесь q — вектор с дискретными пространственными компонентами: Ч=( —"х, — пи, —пф |q| с целыми пх, пу, пробегающими значения от —оо до + оо, L — ребро куба Q. Для каждого q имеется только один комплексный коэффициент ач~ a'qA- ia."q, его действительная и мнимая части пред- ставляют собой коэффициенты, которые мы раньше называли А . Полная энергия Е - 1 С {(vn)2 + (dtu)2} dr - 2Q X <?2 (а’2 д- <). В тепловом равновесии в соответствии с (3.5.9) имеем <<> = <<>--(4Q₽?2)-1, или aqa*,> = 6яа. (2Qp</2)-!; <aqaq,> = <aqaq,> = 0. 74
Теперь легко находим <u(rlt G)«(r2> /2)> = — У (2йр<?2)_ 1 {ei<?<г' -'Щ-ыщ-щ -j- е~'я<г1-гг) -< о, -ц)|. q Для больших Q сумму по q можно заменить интегралом, принимая во внимание, что в единичном объеме q-пространства имеется [Т/(2л)]3 дискретных значений: £ • • • - (£И • • d3(i- q Тогда, полагая — г2-=р, t2— t.2 — i, получаем <Ы(гъ /1)«(г2, ^)>=2₽wJ^-(ei<?,p’i‘?T + e-i’-pti‘'T). Упражнение. Докажите, что (3.5.11) является общим решением и что изменяя его можно подобрать aq для любых заданных начальных значений и и dtu. Упражнение. Вычислите <и (дц, t1)u(x2, t2)> для вибрирующей струны. Упражнение. Покажите, что (3.5.12) обращается в нуль внутри светового конуса и равно £77(4л | Г1 — г2|) вне его. Рис. 3. Одна из реа- лизаций ветвящегося процесса общего вида 3.6. ВЕТВЯЩИЕСЯ ПРОЦЕССЫ Существует класс процессов, которые хотя и не являются мар- ковскими, но все же в значительной степени могут быть рассмотрены явно*. Такие процессы чаще встречаются в задачах о популяциях, чем в физике. Впервые подобная задача была рассмотрена в 1874 г., когда Гальтон поставил вопрос о том, связано ли отмирание родовых имен высшего света в Англии со статистикой или с бесплодием богатых людей. Рассмотрим популяцию бактерий или дру- гих клеток, размножающихся давлением. Клет- ка, имеющая возраст т, с вероятностью у (т) At делится на две клетки в течение последующего промежутка времени d/, каждая из которых образует новую ветвь родового дерева. За- дача состоит в определении вероятности Р(п, t\m, 0) иметь п индивидуумов в момент t, если при / = 0 их было т. Модель, конечно, можно изменить, например, включив в нее вероятность смерти. Такой подход применим также к каскадам в кос- мических лучах или к нейтронам в реакторе, если допустить воз- можность рождения более чем двух частиц в каждом событии (рис. 3). Однако в этих двух случаях у не зависит от возраста, что делеет задачу марковской и, следовательно, более простой (см. гл. 4). * Harris Т. Е. The Theory of Branching Processes (Springer, Berlin, 1963); Jagers P. Branching Processes with Biological Applications (Wiley, London, 1975). 75
Особенности, определяющие ветвящиеся процессы, следующие 1) с каждого индивидуума начинается семейство потомков; 2) все эти семейства обладают одинаковыми стохастическими свойствами; 3) они не взаимодействуют друг с другом (если эволюция семейств зависит от спаривания между индивидуумами, то это уже не ветвя- щийся процесс). Как следствие п. 3, условная вероятность Р (п, t\m, 0) пред- ставляет собой свертку т множителей Р(п, t\ 1, 0). Это приводит к первому тождеству для производящей функции вероятности ветвя- щегося процесса, начинающегося с т индивидуумов при t =0: F(z, t\m, 0) = {/7(z, Z| 1, 0}'л. (/>0). (3.6.1) Следовательно, достаточно изучить потомство от одного индивидуума. Вероятность деления клетки, имеющей возраст х, за время dr есть y(x)dx. Это означает, что вероятность деления клетки зависит только от ее возраста. Допустим, что некоторая клетка родилась при / = 0. Пусть w (т) — вероятность того, что клетка достигнет возраста х, ни разу не разделившись. Тогда оу(О) —0 и du/(x) =— у (х) w (т) dx. (3.6.2) Таким образом, w однозначно определяется функцией w (х) = ехр — § у (х') dx' о (3.6.3) Вероятность того, что в момент времени t имеется всего одна клетка, в точности равна w(t). Вероятность того, что эта клетка испытает деление за время, прошедшее между моментами х и x-j-dx, есть — dna(x), что следует из (3.6.2). Если это случится, популяция будет состоять из двух вновь рожденных клеток, каждая из которых породит свою родовую ветвь. Тогда вероятность иметь п клеток в момент времени t, если в начальный момент времени / = 0 была только одна клетка, дается выражением t Р(п, /|1, 0) = 6П гцу(1)—^dna(x)P(n, t j 2, х). (3.6.4) о Это второе тождество для ветвящихся процессов*. Умножая это тождество на z" и суммируя по п = 1, 2, 3, ..., получаем t F(z, ф, 0) = zw(0— $ d^(x)/7(z, 112, х). (3.6.5) о * Здесь предполагалось, что возможно деление только на два индивидуума (см. упражнение). 76
Из-за однородности по времени, которая вытекает из п. 2, имеем F (z, t\2, i) = F(z, t—т|2, 0)={/7(z, t—т|1, 0)}2. Подстановка этого выражения в (3.6.5) после перегруппировки чле- нов дает t F (z, 1, 0) — z = —J do, (т) [{f (z, t—t| 1, 0)}2—z] —- 0 t (3.6.6) = — J w' (t — f) [{F(z, t' 11, 0)}2—z] dr', о Это уравнение содержит только одну неизвестную функцию F(z, Г | 1, 0), оно определяет производящую функцию вероятности и, следовательно, распределение вероятности, поскольку у(т) известно. Таким образом, рассмотрение ветвящихся процессов сведено к реше- нию нелинейного интегрального уравнения. К сожалению, это можно сделать явно только лишь для нескольких видов функции у(т). Упражнение. Решите задачу для y(x) = const. Упражнение. Предположим, индивидуум, имеющий возраст т, обладает вероят- ностью yv (т) разделиться на v = 0, 1, 2, ... новых индивидуумов за еди- ничное время. Пусть Ф(£, = — соответствующая производящая функция вероятности. Выведите для этого случая интегральное уравнение, аналогичное (3.6.6): t F (г, t\ 1. 0) =--zu> (Г)+ § w(t — t') <D{F (z, t' | 1, 0), t — t'}At' = t ° (3.6.7) = z+ (t — t’) [Off (z, t' | 1, 0), t — Г}—z<D(l, t — t')] At' о при соответствующем определении w. Упражнение. Продифференцируйте (3.6.6) по z и положите z=l. В результате получится интегральное уравнение для <n>t, которое можно решить. Упражнение. Задача Гальтона — Ватсона в оригинальной постановке была сформулирована для дискретной переменной времени t = 0, 1, 2, ..., нуме- рующей последовательность поколений. Покажите, что в этом случае /7t(z) = F/-1(A(z)), (3.6.8) так что Ft(z) — t-я итерация функции Fj(z). Те же самые уравнения при- менимы к электронным каскадам в умножающих трубках * и фотонным умножителям на стимулированном излучении **. Упражнение. В случае фотона в бесконечной среде с поглощением и стимули- рованным излучением F1(z) описывается выражением (2.4.11). Производя- * Woodward Р. М. Proc. Camb. Philos. Soc., 44, 404 (1948). ** Van Vliet К. M., Zijlstra R. J. J. Physica, 89 A (1977); Van Vliet К. M., Zijlstra R. J. J., Van Kampen N. G. in: Noise in Physical Systems (Proc. Fifth Intern. Conf, on Noise; D. Wolf ed., Springer, Berlin, 1978). 77
щая функция для zn-поколения дается непрерывной дробью 1+е 9 0 0 1 + 0 —0z’ где 0-1-P/а, Найдите отсюда F <-> 1-0”-(0-0^ 1_0ш + 1_(0_0и + 1)г • (3.6.9) Упражнение. Для того же случая последовательных поколений введем Ft(z) — производящую функцию распределения вероятностей всех потомков в поко- лениях 1, 2. ..., /. Покажите, что T1(z) = ft_1(zF1(z)). (3.6.10) Упражнение. Для фотона в бесконечной среде функция Ft (z) равна (2.4.11). Производящая функция полного количества вторичных фотонов в каскаде имеет вид Ft(z)= (1 +0)t_{(1+0)t_1)z • (3.6.11) Упражнение. Формула (3.6.11) может быть получена и по-другому. Пусть P{N) — вероятность того, что налетающий фотон порождает общее коли- чество М вторичных фотонов в каскаде. Тогда P(A')=P^,.ri’ps 2 P(N1)P(Ni) ... P(NS), s— 1 Afj+A'2-r... + W5:=A'-s где ps—то же самое, что и в (2.4.11). ГЛАВА 4 МАРКОВСКИЕ ПРОЦЕССЫ В настоящей главе определен и описан подкласс стохастических процессов, обладающих свойством марковости. Такие процессы наи- более важны в физике и химии. В оставшейся части книги мы будем иметь дело исключительно с марковскими процессами. 4.1. СВОЙСТВО МАРКОВОСТИ Марковский процесс определяется как стохастический процесс, обладающий следующим свойством: для любого набора п последо- вательных моментов времени (т. е. /j < t2 < . . - < tn) имеет место соотношение Р1 | п- 1 {Уп^п I У1, ’ Уп~1у ^п-1) = Р1 I 1 (^п» ^п\Уп-1' ^п-1), (4.1.1) 78
которое означает, что условная плотность вероятности в момент времени tn однозначно определяется заданным значением уп_1 в мо- мент tn_r и не зависит от каких-либо величин в более ранние моменты времени. Величину называют вероятностью перехода. Марковский процесс полностью определяется двумя функциями Р1(Уъ h) и P!\i(y2, /J- По этим двум функциям можно восстановить всю иерархию. Действительно, положив tr t.2 < t3, имеем Р3 (i/l, У2.1 ^2> У31 ^з) ~Р-г{Уъ У21 ^г) I г (f/s> ^з|Уп У21 = РЛУ1, ti)Pi\dy2, 1-1\У1, (^Р^ЛУз, (з\У21 С). (4.1.2) Продолжая этот алгоритм, можно последовательно найти Рп. Это свойство делает марковские процессы особенно удобными в обраще- нии и служит причиной, по которой они оказываются столь полез- ными во многих приложениях. Упражнение. Покажите, что число нейтронов в ядерном реакторе является марковским процессом (ср. с примечанием § 3.6). Упражнение. Азартный игрок играет в орла и решку. Пусть —его капитал после t бросков. Покажите, что Yt является дискретным по времени мар- ковским процессом, и найдите его вероятность перехода. Упражнение. Рассмотрите обычное дифференциальное уравнение x-f(x\ Запи- шите решение, имеющее начальное значение х0 в момент Го, в виде х - = <р (хп. t — Л>). Покажите, что х удовлетворяет определению марковского процесса с вероятностью перехода RjJx, 'о) =6|х — ф(х0, г — /0)|. (4.1.3) Это равенство справедливо также для многомерного х. Покажите, что любой детерминированный процесс является также марковским, хотя и сингулярного типа. Упражнение. Хотя определение марковского процесса и выделяет одно направ- ление времени, из него же следует аналогичное свойство для обратного упорядочения по времени. Докажите это с помощью (4.1.2). Наиболее старым и хорошо известным примером марковского процесса в физике является броуновское движение*. Тяжелая частица погружена в жидкость, состоящую из легких молекул, которые сталкиваются с ней случайным образом. Вследствие этого под влиянием большого количества малых и, по-видимому, некорре- лированных скачков скорость тяжелой частицы изменяется. Для простоты будем рассматривать движение как одномерное. Частица, имеющая скорость V, в среднем будет испытывать больше встречных столкновений, чем соударений, направленных по ходу движения. Следовательно, вероятность определенного изменения скорости 6V' * По поводу истории броуновского движения см.: G. L. de Haas-l.oren.tz, Thesis (Leiden, 1912) перевод на немецкий; «Заметки» в: A. Einstein, Investiga- tions on the Theory of Brownian Movement (A. D. Cowper transL, R. Furth ed. with notes, Methuen, London, 1926; Dover PubL, New York, 1956); S. G. Brush, Archive for the History of Exact Sciences 5, 1 (1968/69)—S. G. Brush, The Kind of Motion We Call Heat (North-Holland, Amsterdam, 1976) Vol. 2, Ch. 15. 79
в следующий отрезок времени Л/ зависит от V, но не зависит от скорости в более ранние моменты времени. Значит, изменение ско- рости тяжелой частицы во времени является марковским процессом. Когда вся система находится в равновесии, процесс является стацио- нарным и его автокорреляционное время представляет собой время затухания начальной скорости. Этот процесс подробно изучен в § 8.4. Однако оказывается, что такая картина не дает согласия с экспе- риментами по броуновскому движению. Качественный скачок в пони- мании произошел, когда Эйнштейн и Смолуховский поняли, что это не то движение, которое наблюда- ется экспериментально. Действительно, между дву- мя последовательными наблюдениями положения ✓ * броуновской частицы ее скорость увеличивается и k + f уменьшается множество раз, так как интервал меж- Рис. 4. Траек- Ду двумя наблюдениями значительно превышает ав- Т°кой частиН°ы токорреляционное время скорости. То, что наблю- дается, является результирующим смещением, про- исшедшим после большого количества изменений скорости. Предположим, серия наблюдений одной и той же броуновской частицы дает последовательность координат Хг, Х2, .... Каждое смещение Xk + i—Хк (рис. 4) случайно, но его распределение вероят- ности не зависит от предыстории, т. е. не зависит от Хл_1( Хк_.2, . . . . Следовательно, марковским процессом является изменение не только скорости, но и координаты X частицы, измеренной в крупномасштаб- ной шкале времени, что предписывается условиями эксперимента. Эта картина является основой теории броуновского движения, приведен- ной в § 8.3. Этот пример демонстрирует несколько характерных черт, имеющих общее значение. Во-первых, понятно, что свойство марковости выпол- няется только приближенно. Если предыдущее смещение Хк—Хк'_1 оказалось большим, то в точке Хк более вероятна большая скорость. Эта скорость сохраняется в течение короткого времени (порядка времени автокорреляции скорости), и вследствие этого большие зна- чения следующего смещения Хк+1—Xh окажутся более предпочти- тельными. Таким образом, тот факт, что время автокорреляции скорости не нуль, приводит к некоторой корреляции между двумя последовательными смещениями. Этот эффект мал при условии, что время между двумя наблюдениями значительно превышает автокор- реляционное время скорости. Аналогично, сама скорость является марковским процессом только приближенно, потому что столкновения с молекулами не являются мгновенными, а имеют определенную длительность. В тече- ние времени столкновения изменения скорости в ближайшем прош- лом дают некоторую информацию о характере соударения и, следо- вательно, об изменении скорости в ближайшем будущем. Этот эффект мал при условии, что каждое отдельное столкновение происходит очень быстро, т. е. время взаимодействия мало, как если бы частицы 80
были почти твердыми сферами. В дополнение нужно, конечно, пред- положить, что движение броуновской частицы не вызывает упорядо- ченного течения в окружающей жидкости; такое течение могло бы влиять на вероятность столкновения в более поздние времена таким образом, действовать как накопитель памяти, нарушающий свойство марковости. Числовые расчеты * показали, что скорость выделенной молекулы газа не является марковским процессом как раз по этим причинам**. Вторая, менее выраженная, черта состоит в том, что одну и ту же физическую систему можно описать двумя разными марков- скими процессами в зависимости от уровня огрубления. Другим примером того же факта является диссоциация газа, состоящего- из бинарных молекул: АВ^А+В (предполагается, что этот процесс происходит в присутствии фоно- вого инертного газа, который обеспечивает необходимые столкнове- ния). При достаточно грубом описании можно считать, что каждая молекула АВ имеет определенную вероятность быть разбитой за единичное время в результате какого-либо столкновения. Следова- тельно, изменение концентрации в промежуток времени между t и t + Л/ имеет определенное распределение вероятности, зависящее от концентрации в момент времени t, но не зависящее от ее значения в предыдущие моменты времени. Таким образом, на этом уровне огрубления концентрация является марковским процессом. При бо- лее подробном описании различают колебательные состояния моле- кулы и изучают механизм расщепления, в котором последователь- ные столкновения перебрасывают молекулу с уровня на уровень, пока не перебросят через потенциальный барьер. Эти случайные блуждания по колебательным уровням представляют другой пример марковского процесса, который будет описан более подробно в § 7.5. Применимость понятия марковского процесса не ограничена од- нокомпонентными процессами, но распространяется также на про- цессы, имеющие г компонент. Примеры: три компоненты скорости броуновской частицы, г химических компонент в реагирующей сме- си. Сделаем, однако, одно существенное примечание. Можно пренебречь некоторым количеством компонент любого г- компонентного стохастического процесса, а оставшиеся s компонент снова составят стохастический процесс. Однако если /"-компонент- ный процесс был марковским, то процесс, образованный из s < г * Alder В. J. and Wainwright Т. Е. Phys. Rev. Letters 18, 988 (1967); W. W. Wood in: Fundamental Problems in Statistical Mechanics HI (Proc. Intern. Summer School at Wageningen, 1974; North-Holland, Amsterdam, 1975). ** Даже без упорядоченного течения марковское свойство нарушается возможностью захвата броуновской частицей молекулы, с которой произошло предыдущее столкновение. Однако, если частица тяжелая, такое событие происходит редко. 81
компонент, вообще говоря, уже не будет марковским. Если извест- ны не все, а только несколько компонент, то этого еще не доста- точно для предсказания вероятности на будущее даже для этих же самых нескольких компонент. В первом из вышеприведенных при- меров каждая компонента скорости сама по себе является марков- ским процессом, однако во втором примере будущее распределение вероятности для количества вещества каждой из химических ком- понент определяется имеющимися в настоящий момент количествами вещества во всех компонентах. Наоборот, если заданный физический процесс не является мар- ковским, иногда можно его представить как часть марковского процесса, вводя дополнительные компоненты. Эти дополнительные компоненты нужны для явного описания информации, которая в естественном случае содержалась бы неявно в прошлых значениях переменных. В качестве примера снова рассмотрим броуновскую частицу, но на этот раз в поле неоднородной внешней силы. Тогда изменение скорости в течение времени А/ уже не определяется од- ними столкновениями, а зависит также от внешней силы и, следо- вательно, от положения частицы. Координаты частицы зависят от скорости во все предыдущие моменты времени, так что скорость частицы уже не является марковским процессом. Однако двухком- понентный процесс, образованный скоростью и координатами части- цы, является марковским (см. § 8.7). Любую замкнутую изолированную физическую систему в прин- ципе можно описать с помощью марковского процесса, если ввести все микроскопические переменные как компоненты Y. Действитель- но, микроскопическое движение в фазовом пространстве детермини- стично и, следовательно, обладает свойством марковости (ср. с (4.1.3)). Физический вопрос, однако, состоит в том, можно ли найти намно- го меньшее множество переменных, изменение которых со временем’ будет описываться многокомпонентным марковским процессом. Хо- рошо известен, но все еще остается загадочным экспериментальный факт, что это действительно возможно для большинства многоча- стичных систем в природе. Конечно же, такое описание даже в лучшем случае является приближенным на ограниченно макроско- пическом, очень грубом уровне. Такое сведение к намного меньше- му числу переменных называют сверткой или проекцией, но обос- нование этого приближения затрагивает фундаментальные проблемы статистической механики и все еще является объектом многочис- ленных дискуссий*. Предостережение. В физической литературе эпитет «марковский» часто используют с вольностью, достойной сожаления. Этот термин обладает маги- ческой притягательностью, которая привлекает использовать его в интуитив- ном смысле, выходящем за рамки его определения. Читатель должен остере- гаться таких ловушек. * См. литературу к § 3.2. 82
I. Когда физик говорит о «процессе», он обычно подразумевает опреде- ленное явление, включающее время. Что касается процесса, определенного таким образом, было бы неправильным обсуждать вопрос, является ли он марковским или нет, пока не будут определены переменные, в которых он будет описываться. Искусство физика состоит в выборе переменных, которые делают описание приближенно марковским. 2. Критерий (4.1.1) является условием на все функции распределения Рп иерархии. Нельзя утверждать, что процесс марковский, имея информацию только о нескольких первых функциях Рп. С другой стороны, если известно, что процесс марковский, то, конечно же, знания функций Рг и Р2 достаточно, чтобы определить весь процесс. 3. Часто возникают уравнения вида Р(у. t). Q[P(y, ?)], (4.1.4) где Q — линейный или нелинейный оператор, действующий на переменную у. В соответствии с этим уравнением Р(у, tn} в любой момент времени ?0 одно- значно определяет Р (у, t) при любых t > ?0. Из этого факта зачастую делают неправильный вывод, что У (?)— марковский процесс. Сначала нужно выяснить, что означает Р(у, /). Если окажется, что это Pt (у, t), то уравнение просто указывает, что одновременное распределение вероятности величины Y (t) опи- сывается дифференциальным уравнением, но это уравнение не дает информа- ции о функциях распределения высших порядков, которые входят в (4.1.1). Например, для любого стационарного процесса имеет место уравнение Pi(y, 0 = 0, но, конечно же, не все стационарные процессы являются мар- ковскими. С другой стороны, уравнение (4.1.4) может означать, что любое решение с начальным условием Р (у, 10) --Я>(у — у0) идентично вероятности перехода .Pj । j (у, t | у0, ?0). Действительно, основное кинетическое уравнение, выведен- ное в следующей главе для марковских процессов, относится к тому же типу. Однако оно не может гарантировать марковости ввиду того, что ничего не говорит нам о функциях распределения высших порядков*. 4. Иногда из уравнений следует, что Р выражается через все более ранние значения Р, например t P(t)=-^ G(t, l')P(l')dt', (4.1.5) о где G— линейный оператор, действующий на переменную у. Основная мысль состоит в том, что решение с начальным значением Р (у, 0)^ 6 (у — у(1) пред- ставляет собой Pt । j (у, 11 у0, 0). Из этого «немарковского» уравнения можно сделать вывод, что У (?) при ? > 0 не может быть марковским процессом. Однако уравнение (4.1.5) не означает, что необходимо знать значения Р* । , (у, t' | у0, 0) в предшествующие моменты времени для того, чтобы узнать их будущие значения. Контрпример будет дан в (4.2.9). Упражнение. Должно ли случайное блуждание с памятью (1.7.8) называться марковским процессом? (Ответ дан в § 4.5.) Упражнение. В качестве примера (4.1.4) решите уравнение дР%’ ~ Р Р(у~~У'’ АУ'~Р(У> (~ 00 < У < °0) — со * Оператор Q в основном кинетическом уравнении линеен. Можно пока- зать, что вероятность перехода марковского процесса не может удовлетворять нелинейному уравнению вида (4.1.4). Аргументы в пользу этого утверждения аналогичны использованным в работе D. Polder, Phil. Mag. 45, 69 (1954). 83
с начальным условием Р (у, 1„) = д(у— у„). Если У (?) — стохастический процесс, вероятность перехода которого Рг । t (у, t | у„, /0) дается этим ре- шением, он не может быть марковским, потому что решение не удовлет- воряет уравнению Чепмена — Колмогорова (следующий параграф). 4.2. УРАВНЕНИЕ ЧЕПМЕНА — КОЛМОГОРОВА Интегрируя тождество (4.1.2) по у2, получаем для ti < t2 < t3 PiiVlt tit Узу t3) = -= Pi (У1, ti) Pi 11 (y2, t21 yt, Pi 1 1 (y3> ta I y.,, t2) dy2. Разделив обе части на Рг (iji, tj), получим Pi 1 1 (l/з, t3 I yi, ti) = = 5^11/3|г/2, t2)Pl{i(y.2, t2\yu tjdy.,. (4.2.1) Это соотношение называют уравнением Чепмена—Колмогорова *. Этому тождеству должна удовлетворять вероятность перехода лю- бого марковского процесса. Упорядочение по времени существенно: t2 лежит между ty и t3. Уравнение, конечно же, справедливо и в том случае, когда у является вектором, имеющим г компонент, и в том, когда у принимает только дискретные значения, но интеграл в этом случае является суммой. Как отмечено в § 4.1, любой марковский процесс полностью определяется функциями Рг и Рщ], потому что по ним можно по- строить всю иерархию Рп. Эти две функции не могут быть выбраны произвольно, а должны удовлетворять двум тождествам: 1) уравнению Чепмена — Колмогорова (4.2.1); 2) очевидному, но необходимому соотношению РЛу-1, РцЛУ2, /2|1/1, Л) df/i- (4.2.2) И наоборот, любые две неотрицательные функции Рх, Pi । ., удов- летворяющие этим условиям непротиворечивости, однозначно опре- деляют некоторый марковский процесс. Упражнение. Уравнение Чепмена — Колмогорова (4.2.1) утверждает, что про- цесс, имеющий начальное значение у} в момент Н, достигает значения у3 в момент t3 через любое из возможных значений у2 в промежуточный мо- мент времени /2- В каком месте марковское свойство входит в уравнение? Упражнение. Предположим, что решение уравнения Чепмена — Колмогорова известно и мы хотим его использовать для построения марковского про- цесса. Как это можно сделать и какой свободой при этом мы еще обладаем? * Его называют также уравнением Смолуховского, но мы будем избегать этого названия, поскольку оно беспорядочно используется для тесно связан- ных, но неодинаковых уравнений. Более ранняя ссылка (на Бэчеллера (Bache- Иег))дана в работе Е. W. Montroll and В. J. West in: Studies in Statistical Mechanics VII (E. W. Montroll and J. L. Lebowitz eds., North-Holland, Am- sterdam, 1979), p. 76. 84
Упражнение. Пусть У имеет множество возможных значений 1. Покажите, что Pi | , (<А 1 I у'- = ^.{1. 1 {1_e-2V(/-n | б/, г/, (4 2 3) удовлетворяет уравнению Чепмена — Колмогорова. Покажите, что это не противоречит соотношению Рг (у, <) L'a (6у, iby,-1)- Марковский про- цесс, определенный таким образом, называют дихотомическим марковским процессом или случайным «.телеграфным процессом». Упражнение. Предположим, что величина У принимает два возможных значе- ния и вероятность скачкообразного изменения за время dZ есть у dZ. По- кажите, что Y (Z)— тот же самый процесс, что и выше. Упражнение. Запишите соотношение (4.2.3) в виде 2х2-матрпцы и сформули- руйте уравнение Чепмена — Колмогорова как свойства этой матрицы. Упражнение. Пусть У (t) — процесс, в котором величина У принимает значе- ния 0, 1, a Z может иметь только три значения. Тогда существуют восемь выборочных функций. Из этих восьми мы приписываем вероятность 1/4 каждой из следующих четырех: 1, 0, 0; 0, 1, 0; 0. 0, 1; 1, 1, 1. Остальные четыре имеют нулевую вероятность. Покажите, что этот про- цесс удовлетворяет уравнению Чепмена — Колмогорова, но не является марковским *. Упражнение. Приведенную выше модель можно распространить на бесконеч- ную последовательность единиц и нулей путем объединения таких трип- летов. Является ли эта последовательность стационарным процессом? Упражнение. Если вероятность перехода Рг । г (у2, t21 yt, ZJ зависит от Z,, Z2 только посредством их разности 12 — Zx, то, вообще говоря, возможно вы- бирать Pi в (4.2.2) так, что марковский процесс получится стационарным. Однако приведенное ниже выражение (4.2.4) является исключением. Следующие два примера марковских процессов имеют особую важность: 1. Легко проге ыгь, что для —оо < у < оо уравнение Чепмена— Колмогорова удовлетворяется, если считать, что для /2 . имеет место Р,, , (9„ м/,) - y—j ехр | - ] <Т2.4) Выбрав Pj (z/i, 0) — (z/j), определим нестационарный марковский процесс, который называют винеровским процессом или процессом Винера—Леви**. Обычно его рассматривают только для t > 0, и вначале он был изобретен для описания стохастического поведения координаты броуновской частицы (см. § 8.3). Плотность вероятно- сти при t > 0 в соответствии с (4.2.2) имеет вид РЛУ, ехр |^-|. (4.2.5) V 2nt L I * Е. Parzen, Stochastic Processes (Holden-Day, San Francisco, 1962), p. 203. Другие примеры такого эффекта даются в работах Р. Levy, Comptes Rendus 228, 2004 (1949) u W. Feller, Ann. Mathem. Statist. 30, 1252 (1959). ** N. Wiener, J. Math, and Phys. 2, 131 (1923); Cox and Milller, p. 205, 85
2. Величина Y (t) принимает только значения п~~0, 1, 2, . /7^0. Марковский процесс определен соотношением РцЛп,, /2|«1( Л)^2, 1 ‘ J v 2 21 А/ (п2— ^]_)! (4.2.6) У(^ t Рис. 5. Выборочная функция про- цесса Пуассона При этом подразумевается, что Рг ।, = 0 для п.г < Таким об- разом, каждая выборочная функция y(t) представляет собой после- довательность шагов единичной высоты в случайные моменты вре- мени (рис. 5). Эта последователь- ность однозначно определяется мо- ментами времени, в которые эти шаги совершаются. Эти моменты времени образуют случайное мно- жество точек на оси времени. Их количество между любыми двумя моментами времени распределено по закону Пуассона (4.2.6). По- этому Y (/) называют пуассоновским процессом, он описывает ту же ситуацию, что рассмотрена в § 2.2. Упражнение. Запишите иерархию функций Рп для винеровского процесса. Упражнение. Докажите следующие соотношения для винеровского процесса: <У(/1)У(/2)> = М1п(/], /2); (4.2.7а) <{У (Д)-У (Z2)} {Y (Z3)~Y (Д)}> = (.Д, Z2) 0 (t3, Z4). (4.2.76) Правая часть (4.2.76) означает длину перекрытия обоих интервалов. Упражнение. Докажите также для винеровского процесса, что при 0 < /4 < /2 ^y-Y>y, =-yi, z х ______Л 4 yYl/2 —-Г- У2, ' I о ' -2---h, «У1У>уг~~Г- (Z2 — И). 4 2 (4.2.7b) (4.2.7г) Здесь t/j, у2 обозначены У (/Д, Y (/2); символ < >г означает условное среднее при постоянном г. Упражнение. Найдите моменты <У (/Д У Д2) . . . Y (tn)> винеровского процесса. (Используйте (1.6.11).) Упражнение, Покажите, что (4.2.5) удовлетворяет уравнению диффузии _ д"Р dt дуг (4.2.8) для О- 1/2. Каково решение для произвольного D > 0? Упражнение. Убедитесь в том, что определение (2.2.6) непротиворечиво. Упражнение. Определите для пуассоновского процесса те же величины, что и в (4.2.7). Упражнение. Вероятность перехода Р t । г (у, t | t/0, 0) винеровского процесса подчиняется (4.1.5), когда G — заданный оператор с ядром G(y,t\y', /-)-^--у==-ехр ^дЛ')]- (4-2’9) 86
Упражнение. Как замечено в §4.1, марковский процесс с обращенным направ- лением времени также является марковским процессом. Постройте иерар- хию функций распределения для такого обращенного марковского процес- са и убедитесь в том. что его вероятность перехода удовлетворяет урав- нению Чепмена — Колмогорова. 4.3. СТАЦИОНАРНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ Стохастические процессы, которые одновременно являются мар- ковскими и стационарными, представляют собой интерес, в част- ности для описания равновесных флуктуаций. Предположим, что замкнутая изолированная физическая система описывается величи- ной или множеством величин Y (/), которые можно рассматривать как марковский процесс. В том случае, когда эта система нахо- дится в равновесии, Y (/) является стационарным марковским про- цессом. В частности, не зависит от времени и является обычным Рис. 6. /?С-цепь с со- противлением, под- держиваемым при по- стоянной температуре Рис. 7. Шунтирован- ное сопротивление при фиксированной температуре равновесным распределением величины Y. определенным в соответ- ствии с равновесной статистической механикой. В качестве примера рассмотрим систему, состоящую из цепи, образованной сопротивле нием R и емкостью С (рис. 6). Флуктуирующее напряжение Y (/) на конденсаторе в хорошем приближении является марковским про- цессом при условии, что индуктивностью цепи можно пренебречь. Когда R поддерживается при постоянной температуре Т, напряже- ние Y (I) является стационарным марковским процессом и P1 ” ( 2лЬТ ') ехр [ ~ ~2kT | ’ В качестве альтернативного примера можно привести флуктуации тока в цепи, образованной шунтированным сопротивлением при постоянной температуре (рис. 7). Даже тогда, когда система находится в стационарном состоянии, отличном от равновесия, определенные физические величины могут описываться стационарными марковскими процессами. В качестве примера можно привести флуктуации тока в цепи, изображенной на рис. 7, когда в нее добавлена батарея, что означает постоянную 87
разность потенциалов и, следовательно, ненулевой средний ток. Другим примером является броуновская частица в однородном гра- витационном поле: ее вертикальная скорость является стационар- ным процессом, однако это утверждение несправедливо относительно ее координаты. Вероятность перехода Рг ।, стационарного марковского процесса зависит не от двух времен, а только от временного интервала, для этого случая введем специальные обозначения Pl | 1 ((/2, ^2 I У11 Л) ~ ((/2 I (4.3.1) где т—Тогда уравнение Чепмена — Колмогорова принимает вид (т, т' > 0) Л+Г-Ш «/) = S Т'т-(f/31 t/a) Tt(i/2 [ dt/a. (4.3.2) Если понимать интеграл как произведение двух матриц или инте- гральных ядер, то это уравнение можно переписать в следующем виде: (г, т'^0). (4.3.3) Примечание. Хотя формулы (4.3.2) и (4.3.3) справедливы только при поло- жительных т и т', определение (4.3.1) не ограничено положительными т. Однако величины Тх и Т.х связаны тождеством. Вспоминая значения Pi|i (см. (3.4.3)), получаем при т -/2— Рг(У\, У-z, '‘2) -’ Тх(у->\ i/i) Pi (i/i)- (4.3.4) Поскольку Р2 симметрична, имеем Тх (yt I У1) Pi (У1) -- Т -г ((У1 I Уг) Pi (у2)- (4.3.5, Это тождество справедливо для всех стационарных марковских процессов и поэтому может быть применено к физическим системам, находящимся в рав- новесии без дополнительного вывода его из уравнений движения. Однако это тождество не следует путать с соотношением детального равновесия, которое отличается от него тем. что имеет -|-т в члене, стоящем в правой части равен- ства. Детальное равновесие является физическим свойством, которое не вы- текает из явного определения Тх , но требует физического вывода (см. § 4.6). Для того чтобы избежать неправильного использования уравнений (4.3.2) и (4.3.3), мы условимся, что в будущем не будем использовать символ Тх для отрицательных т. Упражнение. Мы не исключаем т --0, но определяем (у2 I У1) 6 (у2 — уг). (4.3.6) Покажите, что это равенство согласуется с (4.3.2) и (4.3.3). Упражнение. Покажите, что (4.3.2) также может быть справедливым, когда и тит' отрицательны. (Если только мы не должны исключать отрицательные значения.) Упражнение. Убедитесь в том, что дихотомический марковский процесс (4.2.3) стационарен и удовлетворяет уравнению (4.3.3). Что может означать 7'_т в этом случае? Покажите, что уравнение (4.3.3) несправедливо при т > 0, т' < 0. Упражнение. Автокорреляционная функция стационарного марковского про цесса дается выражением Х $ У1У'Тт । yPi P1 dyi dy2 0)’ (4.3.7> 88
Упражнение. Докажите тождества j Т\ (у-2 I У\) di/2 -- 1, (4.3.8) Л (1/21.1/1) (1/1' dt/1 = Р\ (уУ (4.3.9) Выведите отсюда, что если Тх рассматривать как оператор, то он имеет собственное значение, равное 1 с левым собственным вектором х|? (у) = = 1 и правым Р1. Самым известным примером стационарного марковского процесса является процесс Орниипейна — Уленбека * **, определенный соотноше- Н ИЯМИ 1 I Л(//() --Д=е’'2 (4.3.10) Тт(/л|/Л) --.T==L=exp I - (4.3.11) 1\.-low 2л(1—e-2t) I 2(l--e-'i’) J v ' Читателю не составит труда убедиться в том что оба условия непротиворечивости, приведенные в § 4.2, удовлетворяются. Перво- начально этот процесс был построен для описания стохастического поведения скорости броуновской частицы (см. § 8.2) Ясно, что он имеет нулевое среднее значение и автокорреляционную функцию простого вида х(т)~е~х. (4.3.12) Процесс Орнштейна--Уленбека стационарен и обладает свойствами гауссовости и марковости. Теорема Дуба*" утверждает, что имеется практически только один процесс, обладающий этими тремя свой- ствами. Под словами «практически один процесс» мы понимаем, что допустимы линейные преобразования величин у и t и что имеется еще один, хотя и тривиальный, процесс, обладающий такими же свойствами (см. упражнение ниже). Дадим набросок доказательства. Пусть Y (/)— стационарный ' гауссов марковский процесс. Путем сдвига и изменения масштаба системы координат мы можем убе- диться в том, что РДу) равно (4.3.10). Вероятность перехода — гауссова и, следовательно, имеет общий вид ~ , р. “4 (АуУ->Ву,у,+Су\) где А, В, С, D- функции, зависящие от т. Условие нормировки (4.3.8) дает D ---- ИС - ВТ А, * G. Е. Uhlenbeck and L. S. Ornstein. Phys. Rev. 36. 823 (1930); reprinted in Wax. ** J. L. Doob, Annals of Math. 43, 351 (1942); reprinted in Wax. Other theo- rems about Gaussian processes are given in J. L. Doob, Ann. Mathem. Statist. 15, 229 (1944). 89
в то время как из (4.3.9) следует дополнительное условие В2-- А (А — 1). Остается только один неизвестный параметр А, который можно- выразить через другой неизвестный параметр — автокорреляционную функцию, используя формулу (4.3.7), которая дает Л=(1—х2)-1. Отсюда (t/21 У1) - / - ехр [ — (f • (4.3.13) р 2л(1 — х2) I ZU—х f 1 Теперь возьмем третий момент времени /3 = /2-гт' (т'> 0) и, использовав (4.3.2), получим *(G—G) = $ Уз^Уз $ (у3[ y.2)dy2, (4.3.14). (f/г | У1) У1Р1 (1/1) &У1 — К (Д /2) (/а G)- Это функциональное соотношение для функции х(т) показывает, что х(т) :-- e-VT. (4.3.15) Подстановка этого результата в (4.3.13) завершает доказатель- ство (ср. с (4.3.11)). Вторая теорема утверждает, что если Y (t)— стационарный гаус- сов случайный процесс, имеющий экспоненциальную автокорреляцион- ную функцию х (т) = х (0) e-VT, то Y (/) — процесс Орнштейна — Уленбека и, следовательно, марков- ский процесс. Для доказательства предположим, что процесс имеет нулевое среднее значение и единичную дисперсию. Тогда произво- дящий функционал (3.4.7) имеет вид G ([/?])-- ехр | — 1 JJ*(r1)fe(;2)e-vH--M j , что совпадает с производящим функционалом процесса Орнштейна — Уленбека. Упражнение. Найдите производящий функционал и все моменты процесса Орн- штейна — Уленбека. Упражнение. Пусть ф— случайный угол и 0еСф< 2л. Пусть Р|(д)- 1(2л) и 7’т(ф[ф|))— решение уравнения дТт(ф) д2ТТ (ф) ~= Г»(ф1фо) = 6(ф —фо)- (4.3.16) Найдите функции Рп для этого негауссова стационарного марковского процесса. Упражнение. Определим случайный процесс К! f с фиксированными а и ф, как в предыдущем упражнении. Покажите, что его спектральная плотность имеет лоренцевский вид (1.2.2). Упражнение. Выведите (4.3.13) из (1.6.12). Упражнение. «Абсолютно случайный процесс» определяется свойством Рп(У1, G; у2, • ••; уп. t„)=rP1(yi, ti)Pi(yz, td...Pi(yn. tn). 90
Постройте такой процесс, обладающий тремя свойствами, обусловленными в теореме Дуба. В каком месте нашего доказательства мы упустили эту возможность? Упражнение. Найдите три примера процессов, каждый из которых обладает двумя, но не тремя свойствами, обусловленными в теореме Дуба. Упражнение. Докажите, что для любого гауссова процесса (с нулевым сред- ним и единичной дисперсией) условное среднее в точке Z2 при заданном значении в точке ti имеет вид <Y (М>у Н)У1- (4.3.17) Тогда для марковского процесса следует, что при Zj < 12 < x(Z3, ?i) = x(Z3, Z.2)x(Z2, /J. (4.3.18) Упражнение. Пусть У — гауссов марковский процесс, имеющий г переменных- Примените линейное преобразование, с тем чтобы Pi (у, t) ~ ехр [— 1/г!Г|• Затем выведите для автокорреляционной матрицы соотношение K(t3. ti) (A</2<Z3). (4.3 19) Если процесс является еще и стационарным, то отсюда следует, что /С(т)~ е-тй с постоянной матрицей G *. Упражнение. Покажите, что (4.3.11) удовлетворяет уравнениям £Т_ д д‘-Т дт^ду2У2 '• ду1 дТ дТ . дРТ дт dyi ду[ (4 3.20) (4.3.21) которые представляют собой прямое н обратное уравнения Колмогорова для процесса Орнштейна—Уленбека (ср. с. (6.10.9)). Упражнение. Пусть Y (t)—процесс Орнштейна — Уленбека: определим Z (t) ~ t С = \ У (Z') dZ' при /ДгО. Процесс Z (Z) является гауссовым, но не является 0 inrстационарным, ни марковским. Покажите, «то <Z(Z1)Z(Z2)> = e-,J‘+-e-Z! — 1— е“~'4-2 min (4. Z2). Упражнение, Для того же процесса Z(t) найдите характеристический функ- ционал и используйте его для получения следующего соотношения: cos {z (Zi) — Z (r2)}> = ехр [— e-1 Z1-'2i + 14-1 и —G |]- Упражнение. В процессе Орнштейна—Уленбека измените масштаб переменных: у = ау', / = — и покажите, что в соответствующим образом выбранном пределе по а и f) величина Pi 11 сводится к вероятности перехода для вине ровского процесса. Упражнение. Более общая формулировка второй теоремы дана в [2, р. 94|. Пусть Y (Z)— нестационарный гауссов процесс с дисперсией о2 (Z); р (/г, t2) = x(Zj, t3)!a (Zj) a (t2) — его коэффициент корреляции. (1.3.9). Тогда соот- ношение (ср. с (4.3.18)) р (Z3- Zt) — p(Z3, Z2)p(/2, Zj) (.'i Z 2 «л. Z;() является необходимым и достаточным условием марковости процесса Y (/). Убедитесь в том, что винеровский процесс удовлетворяет этому соотношению. Упражнение. Если Y (Z) — процесс Орнштейна — Уленбека, определенный выше, * См. [5, с. 130, замечание II] также R. F. Fox and G Е. Uhienbeck, Phys. Fluids 13, 1893 (1970). 91
И t > /1 > /2 > • • > tn, то <У (/) Y (/j) Y (/2) ... У (/„)> .--<У (/) Y (I.) Y (/2) ... У (/„)>. Следовательно, если гр (t [У]) — функционал, зависящий от 1 и всех значе- ний У во все предшествующие t моменты времени, то имеет место равенство * <У (/) <р (/, [У])> = (у (П ^)-<У (О Ф>. 4.4. ВЫДЕЛЕНИЕ ПОДАНСАМБЛЯ В § 3.4 было отмечено, что, налагая условие на выборочные функции стохастического процесса, можно определить подансамбль. Эта концепция «выделения подансамбля» оказывается особенно по- лезной в случае стационарных марковских процессов. Поэтому мы рассмотрим этот случай более строго. Пусть стационарный марковский процесс Y (I) задан функциями (//,) и Тх (у21 уг). Возьмем выделенный момент времени t,} и за- фиксируем величину г/0. Определим новый нестационарный марков- ский процесс Y* (/) для y^t0, полагая Р'ЛУк = (4.4.1а) М/А- Л) = Л2-ц(«/2|г/1)- (4.4.16) В несколько более общем случае можно выделить подансамбль, в котором в зафиксированный момент времени 19 значения Уо рас- пределены в соответствии с заданным распределением вероятности р(уп). Это равносильно тому, что Р*ЛУ1, М= 5 (4.4.2а) РЬЛУ-^ ^1) = 7'/2-fl(t/2|V:)- (4.4.26) Этот процесс можно рассматривать как усиленный вариант смеси процессов (4,4.1). Эти процессы нестационарны из-за условия, выделяющего опре- деленный момент времени /0. Однако их вероятность перехода зави- сит только от разности времен, так же как и вероятность перехода исходного стационарного процесса. Нестационарные марковские про- цессы с вероятностью перехода, зависящей только от разности вре- мени, называют однородными **). Они часто оказываются подансамб- лями стационарных марковских процессов в смысле, описанном выше. Однако винеровский процесс, определенный в § 4.2*,’ является при- * V. Е. Shapiro and V. М. Loginov. Physica. 91 А, 563 (1978). ** Название относится к однородности во времени, К сожалению, это может привести к путанице, потому что процесс может быть однородным в пространстве, т. с, инвариантным относительно сдвигов в пространстве в состоянии у. Поэтому чаще мы будем употреблять длинное выражение «мар- ковский процесс со стационарной вероятностью перехода». 92
мерой однородного процесса, который нельзя представить как под- ансамбль стационарного марковского процесса. С физической точки зрения выделение подансамбля означает, что система должна находиться в определенном равновесном состоянии. Можно ожидать, что по прошествии большого времени система вер- нется к равновесию, так что Р*ЛУ1, — Л (У1) при/-оо. Так как это должно быть справедливым при произвольном р(уп), то должно выполняться условие (4.4.3) Доказательство того, что это в самом деле так, является одной из принципиальных проблем теории марковских процессов (см. § 5.3). Выделение однородного процесса из стационарного марковского процесса является обычной процедурой в теории линейного отклика. В качестве примера * возьмем образец парамагнитного материала, помещенный в постоянное внешнее магнитное поле В. Намагничен- ность Y в направлении поля является стационарным стохастическим процессом с макроскопическим средним значением и малыми флук- туациями около него. На минуту предположим, что это марковский процесс. Функция Pj (у) дается каноническим распределением Sp e-(H-BY).nkT) (4.4.4) Здесь Н — оператор Гамильтона системы в отсутствие внешнего поля, Y—оператор, соответствующий намагниченности, a Sp является квантово-механическим эквивалентом классического интеграла по фазовому пространству. Теперь предположим, что для — оо < t < t0 индукция магнит- ного поля есть В + АВ и в момент времени это значение скачком изменяется и становится равным В. Тогда распределение в момент имеет вид Р (^ Sp е-{Н-(В + дв) (4.4.6) При t > /0 намагниченность Y будет однородным процессом с на- чальным распределением р, заданным (4.4.5) и той же самой веро- ятностью перехода, что и в равновесном случае с внешним полем В. Следовательно, (/)>* = 5$ yTt-tAy\y^P{y^) &У»&у. (4.4.6) * R. Kubo and К. Tomita. J. Phys. Soc. Japan 9. 888 (1954); С. P. Slichter, Principles of Magnetic Resonance (Harper and Row, New York, 1963) R. Lenk. Brownian Motion and Spin Relaxation (Elsevier. Amsterdam, 1977). 93
Таким образом, путь, по которому макроскопическое среднее при- спосабливается к новому полю В, определяется вероятностью пере- хода равновесных флуктуаций в этом поле. Если интересоваться только линейным откликом, то можно по- лучить более изящный результат. Разложение (4.4.5) в первом порядке по ДВ имеет вид А Я Р (У) = Рг (у) + {у- <Г>Я} Л (у) + о (ДВ2), где РДг/) — распределение (4.4.4); <К>» — соответствующее среднее. Подстановка этого выражения в (4.4.6) после небольших алгебраи- ческих вычислений дает <У (/)>*=--/У >йН-4^-><(/-/„). Таким образом, необратимая релаксация средней намагниченности (в линейном приближении) определяется автокорреляционной функ- цией равновесных флуктуаций. Это является примером знаменитой флуктуационно-диссипативной теоремы, хотя обычно эта теорема формулируется в терминах частот *. Примечание. Мы предположили, что Y (/)— марковский процесс. Однако обычно наибольший интерес представляют материалы, в которых наблюдаются эффекты памяти, поскольку они дают больше информации о микроскопических магнитных моментах и их взаимодействии. В этом случае полученные выше результаты остаются формально правильными, однако надо иметь в виду сле- дующую особенность. По-прежнему остается верным то, что р (t/0) — это функ- ция распределения величины Y в момент времени в который выключается малое поле В. Однако уже несправедливо, что это распределение р (уи) одно- значно определяет подансамбль и тем самым будущее Y (t). Теперь уже важ- но знать, что система «стареет» в присутствии поля В 4- ДВ, так что ее плот- ность в фазовом пространстве является канонической не только по перемен- ной Y, но и по всем другим переменным, которые определяют ее будущ’ее. Следовательно, полученные формулы неприменимы к зависящим от времени полям В(<), если только изменения не настолько медленны, что система спо- собна все время поддерживать равновесное распределение, соответствующее мгновенному значению В (/). Упражнение. Из винеровского процесса выделите подансамбль, соответствую- щий Y (ti,)- у.,. Найдите эволюцию среднего <У (/)> при t > /0. Найдите также дисперсию <<У (/2)>> в этом ансамбле. Упражнение. Тот же вопрос для процесса Орнштейна — Уленбека. Упражнение. Процесс с независимыми приращениями — это однородный Марков скнй процесс с вероятностью перехода 7\ (у-г I Ui) ~ Тт (1/2 — Ух)- (4.4.7) Он не является подансамблем стационарного процесса. Для таких про- цессов тождество (4.2.2) можно разрешить с помощью преобразования Фурье. Покажите, что получающаяся в результате функция Р1 (у, t) стре- мится к гауссову виду. Примерами служат винеровский процесс и слу- чайные блуждания. * Н. В. Callen, and R. F. Greene, Phys. Rev. 86, 702 (1952); R. F. Greene and H. B. Callen, Phys. Rev. 88, 1387 (1952); De Groot and Mazur. 94
4.5. МАРКОВСКИЕ ЦЕПИ Особенно простым классом марковских процессов являются мар- ковские цепи, которые мы определим с помощью следующих свойств *. 1. Множество возможных значений Y представляет собой ди- скретное множество состояний. 2. Переменная времени дискретна и принимает только целые значения /=..., —2, —1,0,2, .... 3. Процесс является стационарным или по крайней мере одно- родным, так что вероятность перехода зависит только от разности времен. Конечными марковскими цепями называют такие цепи, у кото- рых множество возможных значений представляет собой конечное число N состояний. Они широко изучены, так как хотя и являются простейшими марковскими процессами, но обладают большинством характерных для них черт**. Первая функция распределения веро- ятности Рг (у, I) является М-компонентным вектором р„ (/) (п = 1, 2, ..., N). Вероятность перехода Тх(у2\у1) представляет собой N х ^-матрицу. Марковское свойство (4.3.3) приводит к матричному уравнению (т —0, 1, 2, ...). (4.5.1) Распределение вероятности p(t), возникающее из начального рас- пределения р(0), в матричных обозначениях (индексы не выписы- ваем) имеет вид р(/) = Гр(0). (4.5.2) Следовательно, изучение конечных марковских цепей равно- сильно изучению степеней МхЛ'-матриц Т, о которых известно только, что: 1) их элементы неотрицательны, 2) сумма элементов в каждом столбце равна единице. Такие матрицы называются стохастическими ***, они были изу- чены Перроном и Фробениусом. Ясно, что у матрицы Т имеется левый собственный вектор (1, 1, ..., 1) с собственным значением, равным 1, и, следовательно, правый собственный вектор ps такой, что Тps = ps. В соответствии с (4.3.9) это и есть функция Рг (у) * Это определение представляет собой компромисс. Некоторые авторы определяют марковские цепи только с помощью первого свойства, другие — только второго свойства. Большинство авторов не включают третье свойство в определение, но рассматривают только такие случаи. Ср. со сноской в [1, р. 340]. ** См. например: J.G. Kemeny and J. L. Shell, Finite Markov Chains (Van Nostrand, Princeton, 1960); D. L. Isaacson and R. W. Madsen, Markov Chains, Theory and Applications (Wiley, New York, 1976). *** Чтобы отличать их от случайных матриц, т. е. матриц, у которых элементы являются стохастическими переменными. 95
для стационарного процесса. Она не обязательно соответствует со- стоянию физического равновесия, но, например, может представ- лять стационарное состояние, в котором поддерживается постоян- ное течение. Принципиальной задачей теории является доказатель- ство того, что для любого начального р (0) имеет место lim p(f)--- lim Tfp(0) (4.5.3} t -r x t •-+- x Из теорем Перрона и Фробениуса следует, что это справедливо практически всегда, кроме нескольких исключений *. Однако мы не будем развивать здесь этот подход, потому что в следующей главе выведем все соответствующие результаты для непрерывного времени другим способом. Упражнение. Найдите иерархию совместных функций распределения Р„ (у,, И: t/2, . . .; уп, б>) (переменные у и t — целые) для конечной марковской цепи, определенной заданными функциями Т и 0). Упражнение. Для случая Л' ---2 запишите наиболее общее Г и найдите соот- ветствующее ps. Затем докажите, что (4.5 .3) справедливо с двумя исклю- чениями. Упражнение. Дихотомический марковский процесс (4.2.3) можно свести к мар- ковской цепи, если рассматривать распределение вероятности только в последовательные эквидистантные моменты времени. По- стройте соответствующее Т и исследуйте, имеют ли место вышеуказанные исключения. Упражнение. Предположим, Т разбивается на два блока, как на рис. 8, Покажите, что в этом случае собствен- ный вектор р-! не единствен и собственное значение I вырождено. У системы есть два множества состояний, переходы между которыми невозможны. Как изменится соотношение (4.5.3) для этого случая? Упражнение. Сформулируйте задачу о случайных блужда- ниях из § 1.4 как марковскую цепь. Из-за бесконеч- ного множества возможных значений здесь нет нормировки ps. Устра ните этот недостаток, рассмотрев случайные блуждания на циклическом массиве N точек таком, что (Л'-~ 1)-я позиция совпадает с первой. Най- дите р5 для этой конечной марковской цепи. Правильно ли, что каждое решение стремится к р-’? Упражнение. Для иллюстрации приближения к равновесию Эренфест приду- мал следующую модель**: Л' шаров, помеченных номерами 1, 2..........Л', поделены между двумя урнами. Каждую секунду случайно из множества 1, 2...Ас равной вероятностью выбирается число, и шар с этим но- мером переносится из одной урны в другую. Состояние системы опреде- ляется числом п шаров в одной из урн. Процесс является марковской цепью с Рис. 8. Разло- жимая матрица перехода Покажите, что биномиальное распределение является стационарным ре- шением. * См., например, F. R. Gantmacher, Applications of the Theory of M'atricest (fnterscience, New York, 1959), or Cox and Miller, p. 120. ** P. and T. Ehrenfest, /Mathem.— Naturw. Blatter 3 (1906)=P. Ehrenfest Collected Scientific Papers (M. Klein ed., North-Holland, Amsterdam, 1959) p. 128; M. Kac, Probability and Related Topics in Physical Sciences (intersci- ence, London, 1959) pp. 73 ff; H. Falk, Physica 104A, 459, (1980). 96
Модель случайных блужданий можно обобщить путем включе- ния статистической корреляции между двумя последовательными шагами таким образом, что вероятность a-шага в том же направле- нии, что и предыдущий шаг, отличается от вероятности P-шага в обратную сторону («случайные блуждания с памятью»). В этом случае пространственная переменная Y уже не является марковским процессом, потому что ее распределение вероятности в момент вре- мени г +1 зависит не только от ее значения в момент времени г, но также и от значения в момент г — 1. Однако марковский харак- тер процесса может быть восстановлен путем введения этого пред- шествующего значения явно в качестве добавочной переменной. Двухкомпонентный процесс (Yt, Y2), в котором Y1— координата в любой момент времени г, a Y2— предшествующая координата в мо- мент г—1, снова является марковским процессом. Если обозначить пит соответственно значения Yr и Y2, то матрица перехода име- ет вид Т(п2, mJ/ij, т,) = [6„з, „1Ь1(а6П1, и>+1 + Р6П1, и,-1)н- + б»2, „,-1 (₽бп,, И1 + 1 + 1)] бЯ1, (4.5.5) Ее можно подробно изучить потому, что этот процесс снова уда- лось свести к марковскому. Стохастический процесс, который можно свести к марковскому путем введения марковской переменной, бу- дем называть марковским процессом второй степени, если же не- обходимо добавить большее число переменных, то это будет мар- ковский процесс более высокой степени*. Случайные блуждания на квадратной решетке в двумерном слу- чае или в случае - большего числа размерностей сложнее, чем в одномерном случае, но существенных трудностей не вызывают. Например, легко показать, что средний квадрат расстояния после г шагов снова пропорционален г. Однако в многомерном случае можно также поставить задачу с исключением объема, которая опи- сывает такое случайное блуждание с «памятью», что никакой узел решетки не может быть занят более одного раза. Эту модель ис- пользуют для упрощенного описания полимера: каждый атом угле- рода может находиться в любой точке пространства, заданной только фиксированной длиной связей и ограничением, что никакие два атома углерода не могут находиться в одном месте. Эта задача была объектом широких исследований приближенными **, численны- ми *** и асимптотическими **** методами. Они показали, что средний квадрат расстояния между концами полимера из г связей при боль- * По поводу этих и других обобщений см.: М. N. Barber and В. W. Ninham, Random and Restricted Walks (Gordon and Breach, New York, 1970). ** P. J. Flory, Principles of Polymer Chemistry (Cornel University Press, Ithaca, 1953); I. M. Lifshitz, A. Yu. Grosberg and A. R. Kokhlov, Rev. Mod. Phys. 50, 683 (1978). *** C. Domb J. Gillis and G. Wilmers, Proc. Phys. Soc. 85, 625 (1965). **** S. F. Edwards, Proc. Phys. Soc. 85, 613 (1965). 97
ших г пропорционален г6''5. Однако достаточно полного решения задачи найти не удалось. Трудность состоит в том, что эта модель существенно не марковская: распределение вероятности пространст- венной координаты следующего атома углерода зависит от коорди- нат не только одного или двух, а всех предыдущих атомов. Эту модель формально можно рассматривать как марковский процесс, если добавить бесконечное число переменных, чтобы учесть всю предысторию, но это не может помочь решению задачи. Упражнение. Матрица перехода (4.5.5) для случайных блужданий с памятью действует в слишком большом пространстве, потому что имеют значения только состояния гп--- п ± 1. Почему, несмотря на это, результат получа- ется правильным? Упражнение. Найдите более простой способ сведения случайного блуждания с памятью к марковской цепи путем добавления второй переменной У2, принимающей только два значения. Упражнение. Средний квадрат расстояния случайного блуждания с памятью легко найти с помощью следующего альтернативного метода (ср. с (1.7.8)). Он равен (А|.\о...Лг)“. где каждая Х% принимает значения ±1 и <AftAft + 1> 0. Упражнение. Найдите средний квадрат расстояния после г тагов при слу- чайном блуждании на квадратной решетке в d измерениях. Упражнение. Найдите средний квадрат расстояния после г шагов случайного блуждания на двумерной квадратной решетке и если U поворотов запре- щено. (Это не является задачей с исключением объема, потому что каж- дое место можно занимать много раз при условии, что интервал между возвращениями составляет не менее двух шагов.) Упражнение. Покажите, что для одномерного случайного блуждания с па- мятью распределение стремится к гауссову. 4.6. ПРОЦЕССЫ РАСПАДА Рассмотрим кусок радиоактивного материала, содержащий п0 ак- тивных ядер при t = 0. Число Л' (/) активных ядер, выживающих через время t > 0, является нестационарным стохастическим про- цессом. Это чисто марковский процесс, потому что распределение вероятности величины Л’(/2) при /2 > tr при условии, что не зависит от предыстории. Эти же вычисления оказываются при- менимыми к испусканию света возбужденными атомами, просачива- нию молекул кнутсеновского газа через небольшое отверстие, гибели вражеских войск при случайной стрельбе и разрушению клеток радиацией. Их используют для описания поглощения электронов, космического излучения в материале, при этом под t понимают по- перечную толщину *. Этот процесс представляет собой просто совокупность взаимно независимых процессов распада определенных ядер. Пусть w — ве- роятность выживания отдельного ядра за время tr. Даже до вы- * Н. J. Bhabna and W Heitler, Proc. Roy. Soc., A 159, 432 (1937); Bha- rucha — Reid, Ch. 5. 98
числения w можно утверждать, что вероятность выживания и, ядер ^1) = (П°'} ®"‘(1—w)n»~n'. \п1 / (4.6.1) Отметим, что эта формула справедлива для всех целых значений nt при условии, что биномиальные коэффициенты равны нулю, когда п1 < 0 или пг > п0. Используя стандартные вычислительные приемы классической теории вероятностей, из этой формулы можно вывести = wn„. W (4.6.2) Теперь мы должны вычислить вероятность выживания w = w (tr), если известно, что вероятность распада за единичное время для выжившего ядра постоянна и равна у. Эта задача нами уже реше- на (см. (3.6.3)). Результат при постоянном у имеет вид w (t) = e~vt. (4.6.3) Явное выражение величины Рг для нашего нестационарного про- цесса получим, подставив это выражение в (4.6.1): РЛП1, /1) = f/I°4)e-v^«.(l—е-^)"«-«х. (4.6.4) \Л1 / Та же формула позволяет выписать вероятность перехода для /2 > P1|1(n2, it I «ь /J = (П1~\ е*7 п* (1 —е-7 (6-^i))'ii-«2. (4.6.5) \^2 / Совместно они полностью определяют марковский процесс. Примечание. Из формулы (4.6.4) видно, что в пределе И —* ос Pj (П, оо) = 6„, 0. (4.6.6) Тогда вся вероятность сосредоточивается в состоянии N — 0, которое поэтому называют абсорбирующим или поглощающим. Все другие состояния (N 1) исчерпываются с течением времени; их называют переходными. Они могут встречаться только тогда, когда продукты распада исчезают в бесконечно большой области. Для конечных физических систем переходные состояния исключены (см. § 5.5). Если наш радиоактивный образец поместить в непро- ницаемый контейнер, то вероятность повторного поглощения испущенных час- тиц будет отлична от нуля. Такая ситуация встречается при испускании и поглощении фотонов атомами в лазерах. Применим этот пример для иллюст- рации одного важного места, которое нам понадобится в следующей главе. Вероятность перехода (4.6.5) при /2 — ti — 0 сводится к Л И ("г- 'll"'' ^) = 6Л1.Пг- (4-6-7) как это и должно быть. Теперь возьмем t2— П = т и, опустив члены второго и более высокого по- рядка по т, получим Н-г-г |П1, П)=-6г»„ Из(1— ултО-г-бщ-!, П2«1?т + 0(т2). (4.6.8) 99
Легко заметить, что последний член представляет собой вероятность того, что одно нз zij активных ядер распадается в течение времени т; вероятность боль- шего числа распадов является величиной более высокого порядка по т. Пер- вый член представляет собой вероятность отсутствия переходов. Амплитуда начального символа Кронекера выбирается в соответствии с условием норми- ровки условной вероятности (1.3.4). Упражнение. Проверьте с помощью непосредственного вычисления, что (4.6.5) удовлетворяет уравнению Чепмена — Колмогорова. Упражнение. Получите для производящей функции вероятности процесса N (И) выражение F (z) =. <zN (<* *’> = {1 +w(z— 1)}п» (4.6.9) и выведите из него формулу (4.6.2), а также найдите дисперсию процесса А(/0. Упражнение. Найдите факториальные кумулянты (1.2.17) для процесса распада. Упражнение. Представьте процесс распада как ветвящийся процесс и исполь- зуйте (3.6.7) для получения таким способом формулы (4.6.9). Упражнение. Некая марковская цепь для двух состояний имеет одно погло- щающее и одно переходное состояния. Какой вид имеет матрица пере- хода Г? ГЛАВА 5 ОСНОВНОЕ КИНЕТИЧЕСКОЕ УРАВНЕНИЕ Основное кинетическое уравнение представляет собой разновид- ность уравнения Чепмена — Колмогорова для марковских процессов, но оно проще в обращении и более тесно связано с физикой. Оно станет основным стержнем большей части книги. 5.1. ВЫВОД ОСНОВНОГО КИНЕТИЧЕСКОГО УРАВНЕНИЯ Рассмотрим марковский процесс, который для удобства выберем однородным, так что матрицу перехода можно написать в виде 7\. Уравнение Чепмена—Колмогорова (4.3.2) представляет собой функ- циональное соотношение для Тт, с которым довольно трудно рабо- тать в реальных приложениях. Основное кинетическое уравнение оказывается более удобным видом того же самого уравнения. Оно является дифференциальным уравнением, полученным в результате предельного перехода, когда разность времен т' стремится к нулю. Чтобы выполнить предельный переход, необходимо сначала выяс- нить, как ведет себя Тх> при стремлении т' к нулю. В предыдущем разделе мы показали, что 7\' (у21 уд при малых т' имеет вид * тт' (г/21У1) = (1 — аох’) 8 (уг—yj) + < W (у21 У1) + О (?'), (5.1.1) где 1Г (у21 уд—вероятность перехода за единичное время из состоя- ния уг и у2; следовательно, W(y21У1) >0. (5.1.2) * Символ О (т') использован для обозначения некоторого члена, о котором известно только, что О (т')/т' стремится к нулю, при т'—>-0. 100
Коэффициент 1—аот' перед 6-функцией представляет собой веро- ятность того, что в течение времени т' перехода не происходит; отсюда следует * ао(У1) = W (у2\ ух) dyt. (5.1.3) Это следует и из (4.3.8). Пока соотношение (5.1.1) мы примем на веру, но обещаем читателю продолжить обсуждение этого важного места в § 10.1. Теперь подставим это выражение для ТХ' в урав- нение Чепмена — Колмогорова (4.3.2): тт+т- (Уз I У1) = [1 — «о (Уз) <] Л (Уз I У1) + < $ (Уз I Уз) Л (У21 у,) dy2. Разделим на т', перейдя к пределу т'—* 0 и использовав (5.1.3). Получим Д Л (Уз I Ух) = j (Уз | Уз) Тх (у21 У1) — W (у21 уз) Тх (у„1 yj} dy2. (5.1.4) Это дифференциальная запись уравнения Чепмена — Колмогорова, справедливая для вероятности перехода любого стационарного марковского процесса, удовлетворяющего соотношению (5.1.1); ее называют основным кинетическим уравнением. Будет полезным понять это уравнение на более качественном уровне. Сначала отметим, что Тх{у2\ух) совпадает с функцией рас- пределения РПУз) подансамбля, определенного начальным значе- нием ух. Тогда, опуская ненужные индексы, запишем ^>22 = J{^(y|y')/3(y'I t)-W(y'\y)P(y, t)}dy’. (5.1.5) Это обычный вид основного кинетического уравнения. Функция Р(у, t) не обязательно относится к подансамблю, определенному начальным значением, а может быть определена некоторым началь- ным распределением Р (у, 0) (ср. с § 4.4). Если множество возможных значений Y является дискретным множеством состояний, пронумерованных числами п, то это урав- нение сводится к = V {Wnn.pn. (t)-Wn.nPn (/)}. (5.1.6) п' При такой записи уравнения становится ясен смысл: основное кине- тическое уравнение представляет собой балансовое уравнение {отра- жающее приход—расход) для вероятности каждого состояния п. Первый член соответствует возрастанию вероятности из-за переходов из других состояний п', а второй — уменьшению вероятности из-за переходов в другие состояния. Следует помнить, что Wnn’^0 для * Обоснование обозначения а0 (у) станет ясным из (5.8.2). 101
п'^п, а член с п' = п может быть опущен при суммировании. Мы специально использовали название «основное кинетическое уравне- ние» только в этом единственном смысле*, т. е. только для диффе- ренциального вида уравнения Чепмена — Колмогорова, а не для любых его немарковских или нелинейных модификаций, не говоря уже о нестохастических уравнениях. С другой стороны, мы не огра- ничиваем применимость нашего названия только дискретным случаем (5.1.6) в отличие от непрерывного случая (5.1.5), потому что это различие не имеет существенного значения. Предостережение. Заменяя (5.1.4) на (5.1.5), мы проясняем физический смысл, но одновременно увеличиваем опасность неправильной интерпретации. Основное кинетическое уравнение —это уравнение для вероятности перехода величины Y (/), а не для ее плотности вероятности Рг {у, t). Имея в виду (4.4.1а) или (4.4.2а), можно сказать также, что это уравнение для величины Pi(y, t) любого подпроцесса, который может быть выделен из Y (t) наложе- нием начального условия. Тогда все решения основного кинетического урав- нения имеют физический смысл. Уравнение, одно решение которого случайно совпадает с Рг для одного стохастического процесса, не является основным кинетическим уравнением. Только имея а виду эту интерпретацию можно безопасно использовать уравнение (5.1.5) вместо (5.1.4)**. Основное кинетическое уравнение не только более удобно при математическом рассмотрении, чем исходное уравнение Чепмена— Колмогорова, но также имеет непосредственную физическую интер- претацию. Величины W (у [у') At или Wnn’At являются вероятно- стями перехода в теченйе короткого времени. Поэтому их можно вычислить для заданной системы с помощью того или иного при- ближенного метода, применимого при малых временах. Самый извест- ный из них—зависящая от времени теория возмущений Дирака, приводящая к золотому правилу Ферми: Отт Wnn ~ ~г~\ Н'пп,\2 р(Еп) п, (символы п, п' нумеруют собственные состояния невозмущенного гамильтониана, Н'пп, —матричный элемент возмущения в гамильто- ниане, а р— плотность невозмущенных уровней). Основное кинети- ческое уравнение позволяет определить эволюцию системы на боль- ших временах. В этом подходе два временных масштаба можно рассматривать отдельно — за счет предположения, о марковости. Эта интерпретация основного кинетического уравнения означает, что оно играет совсем не такую роль, как уравнение Чепмена — Колмогорова, которое нелинейно и просто отражает марковский характер процесса, но не содержит информации о его специфических * A. Nordsieck, W. Е. Lamb, and G. Е. Uhlenbeck, Physica 7, 344 (1940). ** Oppenheim and К- E. Shuler, Phys. Rev. В138, 1007 (1965); P. Hanggi and H. Thomas, Z. Phys. B26, 85 (1977). Обобщенное основное кинетическое уравнение в кн.: V. Kenkre Statistical Mechanics and Statistical Methods in Theory and Application (U. Landman ed., Plenum, New York, 1977),—является, однако, уравнением для одного выбранного процесса. 102
особенностях. В основном кинетическом уравнении вероятности перехода рассматриваются как заданные частным видом системы, и тогда остается линейное уравнение для вероятностей, которое определяет состояние (мезоскопическое) системы. В качестве примера рассмотрим распадный процесс из § 4.6 в терминах основного кинетического уравнения. Вероятность рас- пада у за единичное время является свойством радиоактивных ядер или возбужденных атомов и в принципе может быть рассчитана путем решения уравнения Шредингера для этой системы. Чтобы найти эволюцию на больших временах набора излучателей, запишем вероятность Р (п, t) того, что имеется п излучателей, выживших к моменту времени t. Вероятность перехода от п' к п за короткое время А/ дается выражением TL\t (п | п') = 0 для п > п', = n'ykt для п = п'— 1, - Л (А/)2 для п < п— 1. Тогда в соответствии с (5.1.1) имеем Wnn' = ум (и =^= п ). Подстановка в (5.1.6) дает основное кинетическое уравнение Рп(0 = Т(«+ 1)Р„+1(0—ynpn(t). (5.1.7) Нужно решить это уравнение с начальным условием р.,(0) ^п,п„- В § 4.6 было получено явное решение в дифференциальном виде, здесь же мы просто покажем, что некоторые частные резуль- таты можно получить, не зная даже полного решения. Отметим, что оказывается очень полезным следующий прием (если он срабаты- вает). Его применимость ограничена одним простым частным видом так называемого «линейного» основного кинетического уравнения, определенного в § 6.1. Умножим (5.1.7) на п и выполним сумми- рование по п: 00 00 2 прп = у 2 п(п + V)pn+j—y 2 гррп = п — 0 п-0 п — 0 00 св оо = Т 2 (п——Y 2 п2рп = — у 2 прп. (5.1.8) п—0 п—0 п-0 Таким образом, для среднего значения стохастической перемен- ной Лг (/) находим 4<A'(O> = -Y<.V(O>. (5.1.9) Решая это простое уравнение для с начальным значением <У(О)> = по, получаем <W(/)> = noe-v'. (5.1.10) Этот результат совпадает с (4.6.2) (ср. с. (4.6.3)). 103
Упражнение. Постройте основное кинетическое уравнение для дихотомического марковского процесса (4.2.3). Упражнение. Решите основное кинетическое уравнение и найдите таким спо- собом (4.2.3). Упражнение. Физически очевидно, что решение уравнения (5.1.7) с рп (0) = = 6П, я,, должно обращаться в нуль (при всех для п > п0. Покажите, что это действительно следует из (5.1.7). Тогда результат не должен зави- сеть от того, как производится суммирование в (5.1.8): до и » или до п = п0. Упражнение. С помощью вычислений, аналогичных (5.1.8), найдите </V (Г)2> и «А (t)2» для процесса распада и сравните результаты с (4.6.9). Упражнение. Случайное блуждание с непрерывным временем определено сле- дующим образом. Состояниями являются все целые числа (— оо < п < оо). Частица может совершать скачки между соседними состояниями. За ко- роткое время d/ она с равной вероятностью 1/2у df может совершить скачок вправо или влево. Постройте основное кинетическое уравнение для рп (1) (ср. § 6.2). Упражнение. В популяции п бактерий каждая отдельная бактерия с вероят- ностью а умирает за единичное время и с вероятностью Р порождает новую бактерию. Постройте основное кинетическое уравнение («процесс рождения — гибели», ср. с гл. 6). Упражнение. Запишите основное кинетическое уравнение для процессов с не- зависимыми приращениями, определенных в (4.4.7), и решите его. Исполь- зуя это решение, покажите еще раз, что Рг стремится к гауссову распре- делению. Упражнение. Марковский процесс с факторизованной матрицей перехода IJ7 (У I У') = и (У)v (у') (Для У У') называют процессом кенгуру. Покажите, что такое основное кинетическое уравнение можно решить, т. е. что Р (у, t) можно выразить через Р (у, 0) с помощью интегралов. Указание. Выведите интегральное уравнение для о (t) = v(y) Р (у, t) dy и решите его с помощью преобразования Лапласа. Упражнение. Найдите явное решение процесса кенгуру с v(y) = const и объ- ясните результат (процесс Кубо—Андерсена; дихотомический марковский процесс является частным случаем). Упражнение. Пусть (Л (t), Y (/)) — марковский процесс, зависящий от двух переменных. Предположим, что его вероятности перехода за единичное время обладают следующим свойством: W (х, у\х', у') dy не зависит от у'. Покажите, что частный процесс X (/), определенный в (3.4.10), тоже является марковским. 5.2. КЛАСС W-МАТРИЦ Для многих случаев оказывается удобным использовать обозна- чения для дискретных состояний; обобщение на непрерывный случай с формальной точки зрения можно сделать просто и без дополни- тельных математических трудностей. Основное кинетическое уравне- ние (5.1.6) можно записать в более компактном виде, если опреде- лить следующую матрицу W: W„„'= для п^п', w„„ = - 2 wn.n. п' п) 104
Запишем это по-другому: Wn„’ = Wnn'-8nn. (5.2.1) \ п" ) Тогда (5.1.6) принимает вид p(/) = SW,„1-p„-(0, (5.2.2) п' или короче /(/) = Wp(0, (5.2.3) где р — вектор с компонентами рп. Формальное решение уравнения (5.2.3) с заданным начальным значением рп (0) можно записать в виде р(/) = е™>(0). (5.2.4) Это выражение для p(t) иногда оказывается удобным, но не позволяет найти явного вида p(t). В качестве общего метода реше- ния уравнений типа (5.2.3) нельзя использовать методы, основанные на собственных векторах и собственных значениях матрицы W, потому что W не обязана быть симметричной и не все решения могут быть получены как суперпозиция ее собственных мод (см., однако, § 5.7). Любые общие результаты должны основываться на следующих двух свойствах матрицы W: для (5.2.5а) 2Ж„---0 для каждого п’. (5.2.56) п Эти свойства сохраняются при одновременной перестановке строк и столбцов, что эквивалентно переобозначению состояний. Но они не сохраняются при произвольном преобразовании подобия W S-1WS. Поэтому в данной задаче такие преобразования не приносят пользы. Матрицу, обладающую свойствами (5.2.5), будем называть W-мат- рицей. А теперь перечислим некоторые следствия, вытекающие из свойств (5.2.5). Наши утверждения являются строгими для конеч- номерных W-матриц. Часто они оказываются применимыми также к системам, имеющим бесконечное счетное или непрерывное мно- жество значений, но в этом случае они оказываются лишь полезной, но не всегда применимой путеводной нитью. Соотношение (5.2.56) означает, что у матрицы W есть левый собственный вектор if> = (1, 1, 1, ...) с нулевым собственным зна- чением, тогда у нее есть также и правый собственный вектор <р с тем же самым собственным значением: W<p = 0. Естественно, их может быть несколько. Каждый собственный вектор является не зависящим от времени решением основного кинети- 105
ческого уравнения. Если он нормирован, то представляет стацио- нарное распределение вероятности системы при условии, что его компоненты ср„ неотрицательны. В следующем параграфе мы пока- жем, что это условие выполняется. Но сначала мы обсудим частные случаи матрицы W, для которых можно получить больше инфор- мации об этих собственных векторах. Матрицу W называют вполне приводимой (или разложимой), если с помощью соответствующей одновременной перестановки строк и столбцов ее можно привести к виду А 0\ W = ko в'. (5.2.6) где А и В—две квадратные матрицы меньшей размерности. В этом случае состояния разбиваются на две группы, переходы между которыми невозможны. Легко заметить, что А и В тоже являются W-матрицами. Следовательно, у них тоже есть собственные правые векторы ср-4 и срв с нулевым собственным значением. Тогда у мат- рицы (5.2.6) есть по крайней мере два линейно независимых собст- венных вектора с нулевыми собственными значениями: /А 0\ Лрл\ /А 0\ /0 \ А вХ° 7 = ° и !\° вАф^=0’ Если матрица (5.2.6) оказывается разложимой, то это означает, что имеются две невзаимодействующие системы, описывающиеся двумя основными кинетическими уравнениями с матрицами А и В соответственно. Нетривиальным примером является система, в ко- торой при всех переходах сохраняется энергия: для каждой энерге- тической оболочки Е имеется свое собственное кинетическое урав- нение и свое собственное стационарное распределение сря. Стацио- нарные решения полного основного кинетического уравнения пред- ставляют собой их линейные суперпозиции с произвольными коэффициентами n£: ф =-• 2 Е Все ср, построенные таким способом при дополнительных условиях Лт.->0 и 2^=1, Е представляют собой стационарные распределения полной системы. Это состояния, в которых энергия распределена по разным энерге- тическим оболочкам. Матрицу W называют (не вполне) приводимой, если она может быть представлена в виде А D W40 в). (5.2.7) 106
где А и В — опять квадратные матрицы, но D — вообще говоря, нет; А опять является W-матрицей, но в общем случае суммы элемен- тов, образующих столбцы матрицы В, являются отрицательными величинами. Очевидно, у матрицы (5.2.7) есть собственный вектор с нулевым собственным значением ч’ = ко / Чтобы придать этому утверждению физический смысл, рассмотрим основное кинетическое уравнение, соответствующее (5.2.7). Обо- значив а и b два набора компонент, запишем Ра = 2 ^аа'Ра' “Г 2 ^аЪ’РЬ’, . ь’ (5.2.8) Pb '— ™ЬЬ‘рЬ' • Ь' Последняя строка составляет замкнутую систему уравнений для ръ, т. е. для ее решения не нужно знать ра. Но рь оставляют свобод- ными вероятности состояний а: = У BW)A У / У Daft- ']Pb. (5.2.9) b b' \ b у Ь’ \ а /' Состояния b обедняются, и решение основного кинетического урав- нения может быть стационарным только если все его компоненты Ь равны нулю. Такие состояния b называют переходными, в то время как множество состояний а, в которых собирается вероятность, называют поглощающими. Будем называть W-матрицу расщепляющейся, представить в виде А О w= О В если ее можно (5.2.10) D Е С о о Здесь А и В — W-матрицы, С — квадратная матрица, и по крайней мере некоторые элементы матриц D и Е не равны нулю. Расщеп- ляющаяся матрица разложима с дополнительным свойством, заклю- чающимся в том, что при выбрасывании столбцов и строк, соответ- ствующих переходным состояниям, остающаяся матрица является разложимой. Если бы матрицы D и Е обратились в нуль, то W-мат- рица была бы разложимой, но мы предполагаем, что этого не про- исходит. Имеется три набора состояний, обозначенные а, Ь, с. Состояния с являются переходными и выливаются ваий. Имеется по крайней мере два линейно независимых собственных вектора с нулевыми собственными значениями: срл 0 .0 j ’о <ря о 107
Упражнение. Если W — 2х2-матрица, то экспоненту в (5.2.4) можно вычислить непосредственно, раскладывая в ряд по степеням W. Используйте этот метод для решения основного кинетического уравнения дихотомического марковского процесса. Упражнение. Покажите, что следующая матрица в соответствии с определением, данным в тексте, приводима: Упражнение. В качестве примера расщепляющегося процесса рассмотрим рас- пад л_-мезона: р. - -Ц v —> е ~ + v 4- v 4 v. Определите состояния a, ft, с и запишите W-матрицу для этого процесса. Упражнение. Если W имеет вид (5.2.6), (5.2.7) или (5.2.10), то все степени W* (ft = 0, 1, 2, ...) имеют один и тот же вид. Упражнение. Пусть у W-матрицы есть собственный вектор с неотрицательными компонентами, некоторые из которых равны нулю. Тогда W-матрица при- водима. Если у W есть вырожденное собственное значение, то у нее есть два собственных вектора с неотрицательными компонентами. Упражнение. Пусть у W-матрицы имеется два линейно независимых собствен- ных вектора с положительными компонентами, а собственные значения равны нулю, тогда W разложима. Упражнение. Пусть W имеет вид -^5.2.7), а элементы матрицы D неотрицательны и никакие другие условия на матрицу D не налагаются. Тогда либо все состояния ft являются переходными, либо W является расщепляющейся или даже разложимой. Имеется по крайней мере одно переходное состоя- ние, если только D # 0. Все состояния ft являются переходными, когда у D имеется хотя бы один не равный нулю элемент в каждом столбце. Упражнение. Ветвящийся процесс в § 3.6 не является марковским и поэтому не удовлетворяет основному кинетическому уравнению, если только у не является независимой от т. Запишите основное кинетическое уравнение для этого частного случая. Что можно сказать о переходных и поглощающих состояниях? Упражнение. Убедитесь в том, что использование понятий «поглощающее» и «переходное» в § 4.6 не противоречит настоящим определениям. Упражнение. W-матрицу можно представить в виде графа, в котором вершины представляют состояния, а прямая линия проводится из одной вершины п в другую п' при Wn'n > 0. Каким образом в таком графе можно изобра- зить переходное и поглощающее состояния? Упражнение. Примером, в котором имеется бесконечное множество состояний и к которому неприменим анализ, проведенный в настоящем параграфе, является бесконечное случайное блуждание с непрерывным временем Рп — Pn + l^T Рп-1—%Рп- (5.2.11) Покажите, что в этом примере отсутствует стационарное распределение и что все состояния являются переходными (ср. с. § 6.2). 5.3. ПРЕДЕЛ БОЛЬШИХ ВРЕМЕН Основное кинетическое уравнение обладает следующим фунда- ментальным свойством: при t оо все решения стремятся к ста- ционарным или к одному из стационарных решений, когда IT-мат- рица является расщепляющейся или разложимой. Опять-таки это утверждение является правильным в строгом смысле только в слу- 108
чае конечного числа дискретных состояний. Для случая, когда имеется бесконечное число состояний, тем более для непрерывного пространства состояний, бывают исключения, например случайное блуждание (5.2.11). Однако даже в этом случае это свойство яв- ляется полезным наводящим соображением для физиков, которые хорошо знают, что почти все системы стремятся к равновесию. Поэтому мы даже не будем стремиться дать полное доказательство, охватывающее все возможные случаи, а ограничимся только случаем конечного пространства состояний. Имеется несколько способов дока- зательства теоремы, связанных со свойством (5.2.5), которое опре- деляет класс W-матриц. 1. Математики вводят дискретное время, задавая конечный вре- менный шаг А/, и тем самым сводят процесс к марковской цепи с матрицей перехода 7\ =ехр (WA/). Тогда теоремы Перрона и Фро- бениуса, упомянутые в § 4.5, дают полный ответ. Для физиков такой подход кажется довольно искусственным и к тому же переносит проблему на доказательство теорем Перрона — Фробениуса. 2. Физики строят функцию, которую они называют энтропией (или Н-функцией, или функцией Ляпунова). Эта функция изменяется монотонно и является ограниченной, поэтому она должна стремиться к пределу. Это, конечно, является общим принципом в физике, но мы интересуемся только его приложением к основным кинетическим уравнениям, которое мы обсудим в § 5.5. Следует отметить, что это доказательство также является правильным в строгом смысле только для случая конечного числа состояний. 3. В частном случае, когда W-матрица симметрична и, следова- тельно, может быть приведена к диагональному виду, достаточно показать, что все ее собственные значения отрицательны, кроме нулевого собственного значения, относящегося к стационарному реше- нию. Это свойство симметрии часто можно вывести из свойства детального равновесия (см. § 5.6) и соответствующего разложения по собственным функциям, данного в § 5.7. Однако свойство деталь- ного равновесия не является универсальным и существует много приложений основных кинетических уравнений с несимметричными W. 4. Другие доказательства даны Кирхгофом, который использовал теорию сетей*, и Ульманом, который использовал математические неравенства, включающие выпуклость**. 5. Следующее относительно простое доказательство основано на интуитивной мысли, что переходы стремятся перенести вероятность от состояний, имеющих большую равновесную долю, к состояниям с меньшей равновесной долей. Другая версия доказательства наме- чена в последнем упражнении § 5.9. * J. Schnakenburg, Rev. Mod. Phys., 48, 571 (1976). ** A. Uhlmann, Wissens. Z. Karl—-Marx — Universitat Leipzig, Mathem.— Naturw. Reihe 27, 213 (1978); A. Wehrl, Rev. Mod. Phys. 50, 221 (1978); R. Kubo. Perspectives in Statistical Physics (H. J. Raveche ed., North-Holland, Amster- dam, 1981). 109
Сначала докажем две леммы. Пусть ср(/)—любое решение основного кинетического уравнения, не обязательно нормированное или положительное. В заданный мо- мент времени t положительные, отрицательные и равные нулю ком- поненты будем отличать, используя индексы и, v, w соответственно: Пусть U (/)— сумма положительных компонент: ^(0 = 2ф«(0- (5.3.1) и Очевидно, что U (t) положительна или равна нулю, если множество компонент и пустое. Наша первая лемма утверждает, что U (/) является монотонной невозрастающей функцией, зависящей от t. Функция U (f) изменяется со временем, во-первых, за счет измене- ния каждого члена суммы (5.3.1), а во-вторых, за счет того, что в определенные моменты времени одни члены суммы исчезают из нее, а другие — появляются в ней. В течение временного интервала между этими моментами времени из (5.2.56) имеем £/(/) > S Wu„.cp„. + S WuvKf,v. '\ = и и \ и' V' J - 2 i - S Уше -% W + 2 ( 2 wuv- \ qv. (5.3.2) и' V W 2 V' \Ju J Каждый член неположителен, поэтому (5.3.3) В тот момент, когда члены появляются или исчезают в сумме (5.3.1), функция U (fy недифференцируема, но она остается непре- рывной, потому что в этот момент времени появляющиеся и исче- зающие члены равны нулю. Значит, U (/) непрерывна всюду и удовле- творяет (5.3.3) всегда, кроме дискретного множества моментов вре- мени; следовательно, она не может возрастать. Лемма доказана. По аналогии с (5.3.1) определим отрицательную сумму: V(/) = 2Х (/). (5.3.4) V Функция V (/) не убывает, поскольку U — V — const. Отсюда выте- кает следствие: если начальные значения <р„ (0)3^0 для всех п, то <ря(/)^0 пРи всех / > 0. Если бы основное кинетическое уравнение не имело этого свойства «сохранения положительности», то оно не могло бы правильно описывать эволюцию распределения вероятно- стей. Из (5.3.3) следует, что U (I) стремится к пределу [/(оо)З^О и, аналогично, V (f) стремится к V (оо). Наша вторая лемма утверждает, что если W-матрица не является разложимой или расщепляющейся, то по крайней мере одно ПО
из этих предельных значений равно нулю, так что в конце концов все ф„(/) будут иметь один и тот же знак или будут равны нулю. Знак определяется начальными значениями, потому что 2 Ф« (0 = const = С. ♦ (5.3.5) п Если С —О, то все должны стремиться к нулю. Без потери общности мы можем положить С^О и доказать, что Е(оо) = 0. Для доказательства этой второй леммы отметим, что (7(оо) = 0. Это не противоречит (5.3.2) только тогда, когда каждый из трех членов равен нулю. Для этого имеется несколько возможностей. 1. Множество компонент и пусто, т. е. ф„(оо)^0 для всех п. Так как мы положили С 3^0, то Ф„(°о)-'-=0 и С/(оо) = У(оо)-= 0. 2. Множество компонент и не пустое, но оба множества компо- нент v и w пустые. Тогда очевидно, что У(оо) —0. 3. Ни множество компонент и, ни и не пусты, но множество w пусто. Тогда должно выполняться W,,и. = ^«„< = 0, так что W-мат- рица имеет вид 0 \0 W£)U,/ Тогда W разложима и, следовательно, исключается из леммы. 4. Ни одно из множеств и, и, w не пусто, тогда должно выпол- няться равенство Wvu, = Wwn. так что W-матрица имеет вид /W„„, о wU!B,\ о wra, WOT,, . \0 Wm„ Тогда W приводима. Записав аналог уравнения (5.3.2) для функ- ции V (/), находим также WOTO, = 0, так что W относится к расщеп- ляющемуся типу и также исключается из леммы. Это завершает доказательство второй леммы. Следствием этой леммы является то, что компоненты не зависящего от времени ре- шения либо все неотрицательны, либо все неположительны. Для ста- ционарного распределения вероятности имеем, естественно, потому что С=1. Теперь предположим, что р™ (t) и /?„'(/) — рас- пределения вероятностей, удовлетворяющие основному кинетическому уравнению, которое не является ни разложимым, ни расщепляю- щимся. Тогда (/) = р{п (0~Рп' (t) является решением, для кото- рого С = 0. Тогда Из этого следует, что, во-первых, не может существовать более одного стационарного распределения; во-вторых, что любое другое решение стремится к стационарному. Это и есть желаемый результат. 111
Упражнение. Покажите для непрерывного множества состояний, что функция также является монотонно убывающей, и докажите, что если решение было положительным, то оно н останется положительным. Почему уже нельзя утверждать (если рассуждать строго), что решение должно стремиться к стационарному распределению? Упражнение. Среднее время', которое система проводит в переходном состоя- нии дается выражением 00 j Pb (О о Покажите, что 6^, можно найти нз уравнения У В6&.0^ = -рь(О). (5.3.6) Ь' Упражнение. Предположим, что W-матрица относится к расщепляющемуся типу (5.2.10) и система сначала находилась в переходном состоянии с0. Полная вероятность того, что система окажется в конце концов в одном из состоя* ний а, составляет Рл(ос)= — У Do, с(С-1)ССо- а, с Упражнение. Пусть п —О, 1, 2, ... и ос Ро — — р<1 + У 'XvPv, v= 1 Pv ~ Pv-l -( 1-Wv) Pv . (v= 1, 2, . . . ). Найдите стационарное решение для случая, когда У (Ху — оо. Покажите, что если У txv сходится, то стационарных решений не существует. 5.4. ЗАМКНУТЫЕ ИЗОЛИРОВАННЫЕ ФИЗИЧЕСКИЕ СИСТЕМЫ В этом названии слово «физический» означает, что система должна рассматриваться микроскопически в терминах уравнений Гамильтона или Шредингера. «Замкнутая» означает отсутствие какого-либо обмена с внешним миром, так что множество микроскопических переменных фиксировано. «Изолированная» означает, что она не подвергается воздействию внешних, зависящих от времени сил, так что энергия является интегралом движения, а траектории системы в фазовом пространстве принадлежат единственной энергетической оболочке. Кроме того, мы должны предположить, что система финитна в том смысле, что мера каждой отдельной энергетической оболочки конечна. В соответствии с равновесной статистической механикой для систем с заданным значением энергии имеется равновесное распределение (микроканонический ансамбль), которое можно найти пользуясь только лишь изучением поведения системы в фазовом пространстве *. * В действительности, необходим добавочный критерий устойчивости, см.: М. Е. Fisher, Archives Rat. Meeh. Anal. 17. 377 (1964); D. Ruelle, Statistical 112
Когда имеется дополнительный интеграл движения, например угло- вой момент в цилиндрическом сосуде, энергетическая оболочка рас- падается на подоболочки, каждая из которых соответствует фикси- рованным значениям этих констант. Переходы между подоболочками невозможны. С другой стороны, эргодическая теория утверждает, что если система находится на определенной оболочке, ее движение покрывает всю оболочку при условии, что при определении этой оболочки были учтены все интегралы движения* *. Предположим теперь, что такую систему можно описать на мезо- скопическом уровне с помощью основного кинетического уравнения. Это означает, что подоболочку, которой принадлежит система, тоже можно поделить на «фазовые клетки» таким образом, что эволюцию системы можно будет приближенно описать в терминах вероятностей перехода Wnn- между двумя любыми клетками л, п'. Тогда эти вероят- ности Wnn' обладают определенными добавочными свойствами по сравнению с (5.2.5), которые, вообще говоря, не справедливы для W-матриц, описывающих открытые или нефизические системы, такие, как популяции. Эти свойства являются предметом настоящего и сле- дующих двух параграфов. Во-первых, понятно, что полная W-матрица разбивается на отдель- ные блоки для отдельных подоболочек. Следовательно, мы можем рассматривать отдельную подоболочку. В соответствии с эргодическим свойством оставшийся блок W-матрицы является неразложимым и, следовательно, имеется единственное стационарное решение р„. Далее нам известно, что psn должны совпадать с равновесным распределением реп, что определяется объемом фазовой, клетки п: Z^nn-p^ = (Z^n'n}pen- (5.4.1) п’ \ п' ) Это соотношение между вероятностями перехода, коэффициенты Рп должны быть известны и определяются обычной статистической механикой**. Кроме того, по определению, реп не равно нулю и, следовательно, переходные состояния отсутствуют, так что W для каждой подоболочки является неприводимой. В качестве примера возьмем газ в цилиндрическом сосуде. Кроме энергии имеется еще один интеграл движения — угловой момент, направленный вдоль цилиндрической оси. Тогда 6Л^-мерное фазовое пространство разбивается на подоболочки размерности 6/V— 2. Выде- Mechanics, Rigorous Results (Benjamin, New York, 1966). Набор точечных частиц с взаимным притяжением представляет собой пример, которому этот критерий не удовлетворяет и для которого, следовательно, не существует статистической механики. * A. I. Khinchin, Mathematical Foundations of Statistical Mechanics (G. Gamow trans!., Dover Publ., New York, 1949); R. Balescu, Equilibrium and Nonequilib- rium Statistical Mechanics (Wiley — Interscience, New York, 1975) Appendix. ** Повсюду мы используем верхние индексы е для термодинамического равновесия и s для любого стационарного, т. е. не зависящего от времени реше- ния основного кинетического уравнения. 113
лим небольшой объем в сосуде и обозначим Y (?) находящееся в нем число молекул. В соответствии с § 3.2 Y (/) является стохастической функцией с множеством возможных значений п = 0, 1,2...........N. Каждое значение Y = п определяет фазовую клетку*. Можно ожи- дать, что Y(t) является марковским процессом, если газ достаточно разрежен, и что р„ приближенно является распределением Пуассона, если выбранный нами объем намного меньше объема сосуда. И наконец, коснемся детального равновесия, которое мы обсудим более серьезно в § 5.6. Уравнение (5.4.1) просто устанавливает очевидный факт, что в равновесии сумма всех переходов за единичное время в любое состояние должна уравновешиваться суммой всех переходов из состоя- ния п в другие состояния п'. Более сильная формулировка деталь- ного равновесия состоит в том, что для каждой пары п, п' отдельно переходы должны уравновешиваться: Wnn.pen, = Wn,npen. (5.4.2) Это справедливо для замкнутых изолированных конечных физических систем при определенных ограничениях, сформулированных в § 5.6. Ввиду того что ргп известно из обычной статистической механики, это соотношение снова является свойством вероятностей перехода. Свойство детального равновесия можно также применить к систе- мам, взаимодействующим с тепловым резервуаром, с помощью про- стого приема, суть которого состоит в том, что такая система рас- сматривается как подсистема большей системы, включающей тепловой резервуар. Примеры: газ, взаимодействующий с тепловым резервуа- ром, набор атомов, взаимодействующих с электромагнитным полем излучения, и, наконец, система спинов, взаимодействующих с реше- точными фононами. Обозначим ₽„ энергии различных состояний не- большой исследуемой системы. Пусть Е— фиксированное значение энергии полной системы. В термодинамическом равновесии вероят- ность того, что небольшая система находится в состоянии п, с точ- ностью до нормировки равна той части объема фазового пространства полной системы, в которой малая система находится в состоянии п. Этот объем представляет собой произведение объема фазового про- странства gn малой системы и объема фазового пространства тепло- вого резервуара с энергией Е— еп. В соответствии со статистической механикой последний множитель представляет собой ехр Ц$(£ — 8„)| = ехр [1s(£) —е„] = const ехр [ —^]' (5.4.3) где k — постоянная Больцмана, S — энтропия теплового резервуара, Т — его температура. Тогда соотношение детального равновесия для * Их называют «г-звездами» no Р. and Т. Ehrenfest in: Encyklopadie der mathematischen Wissenchaften, Band 4, Nr. 32 (Teubner, Leipzig, 1912); trans- lated by M. J. Moravcsik under the title: Conceptual Foundations of the Statistical Approach in Mechanics (Cornell University Press, Ithaca, 1959). 114
систем, взаимодействующих с тепловым резервуаром при темпера- туре Т, имеет вид Wnn,gn.e-^l^^wn,ngne-^m. (5.4.4) Отметим, что это соотношение не требует детального знания о резер- вуаре, а только подразумевает знание его общих термодинамических свойств *. Примечание. Идея детального равновесия впервые возникла в кинетике химических реакций. Предположим, что в смесн химических веществ сущест- вует цикл из трех возможных реакций, напри- мер такой, что показан на рис. 9. Уравнение (5.4.2) утверждает, что в равновесии каждая реакция идет слева направо и справа налево одинаково ча- сто. В связи с этим утверждение может показаться интуитивно очевидным. При- чина для такого ощущения состоит в том, что, наверное, можно заблокировать одну реакцию, не нарушая равновесия и ско- Рис. 9. Цикл из трех реак рости других реакции. И конечно же, цнй поскольку атомы больше не могут пере- мещаться по кругу, а только вперед или назад, свойство деталь- ного равновесия не более чем равновесное свойство. В других при- ложениях кажется маловероятным, что один канал между двумя состояниями можно заблокировать не повлияв на остальные; дейст- вительно, это не может быть всегда правильным, потому что деталь- ное равновесие (5.4.2) справедливо только при определенных огра- ничениях, которые будут сформулированы в § 5.6. Упражнение. Покажите, что члены, опущенные при разложении S (Е— еп) в (5.4.3), стремятся к нулю при стремлении размеров теплового резервуара к бесконечности («термодинамический предел»). Упражнение. Два объема заполнены газом и связаны друг с другом некоторым количеством отверстий разного размера. Что можно сказать о течении г'азов через эти отверстия, основываясь на соотношении детального рав- новесия? Упражнение. Атом испытывает переходы между состояниями Еп вследствие поглощения и испускания фотонов. Вероятности перехода Wnn’ связаны соотношением (5.4.4). Покажите, что для атома это является гарантией иметь в состоянии равновесия распределение Больцмана. 5.5. ВОЗРАСТАНИЕ ЭНТРОПИИ Следующие вычисления дают еще одно, более привычное физи- кам доказательство приближения к стационарному распределению. Кроме того, настоящее доказательство дает некоторую информацию о том, почему происходит это приближение, а именно почему неко- * В частности, нет необходимости привлекать квантовую механику, см.: J. F. Dobson, Chem. Phys. Letters 61, 157 (1979). 115
торый функционал, зависящий от функции распределения, монотонно возрастает. В действительности оказывается, что таких функциона- лов много, и мы обсудим причины, по которым один из них играет особую роль в физике и широко известен под названием «энтропия». Настоящее доказательство более ограничено, чем приведенное в § 5.3,— ведь мы заранее должны предположить, что существует всюду положительное стационарное решение. Известно, что для замк- нутой изолированной физической системы существует стационарное решение основного кинетического уравнения, для обозначения кото- рого мы будем использовать символ реп. Однако настоящее доказа- тельство, с одной стороны, применимо также к другим случаям, в которых нет переходных состояний, а с другой стороны, не тре- бует предположения о детальном равновесии или каком-либо дру- гом соотношении симметрии типа (5.4.2). Рассмотрим основное кинетическое уравнение (5.2.2). Предполо- жим, что существует нормированное стационарное решение реп и Рп > 0. Возьмем произвольную неотрицательную выпуклую функцию f(x), определенную при положительных х: 0<х<оо, /(х)>0, /"(х)>0. (5.5.1) Определим величину И соотношением (5.5.2) П \ Рп / п где хп — сокращенное обозначение для рп/реп- Ясно, что /7(/)^0 и =Е г м (Wnn'Pn- - wn.nPn)= пп' = S Wnn.p'n. {xn.f (xn)-xn>f (х„0). (5.5.3) пп' Теперь для произвольного набора нетрудно убедиться в пра- вильности тождества 2^пл^(Ф„-фп') = 0. (5.5.4) пп' Выбираем = f (х„)—xnf' (х„) и прибавляем получившееся тождество к (5.5.3): = Е Wnn-pen. {(хп>-хп) Г (х„) + / (х„) - / (х„.)}- (5.5.5) пп' Как следует из рис. 10, для любой выпуклой функции f мно- житель { } отрицателен, если только хп=^хП’. Отсюда следует, что И (/) монотонно убывает. Поскольку функция Н (/) убывает, но не может стать отрица- тельной, она должна стремиться к пределу. В этом пределе выра- 116
жение (5.5.5) должно обратиться в нуль*. Это возможно только тогда, когда хп^=хп- для всех пар состояний п, п', у которых Wnn^0. При этом подразумевается, что каждая хп- равна всем тем хп, кото- рые можно получить из нее с помощью цепочки преобразований с ненулевыми вероятностя- ми. Тогда имеются две воз- можности: либо п покры- вает все состояния, либо оно покрывает подмноже- ство состояний, не свя- занное ненулевой вероят- ностью перехода с каким- либо состоянием вне это- го подмножества. В пер- вом случае р„(°°) про- порционально ffn и должно быть равным ему по ус- ловию нормировки. В по- следнем случае 1Г-матрица Рис. 10. Свойство выпуклых функций S разложима, поэтому можно просто по- ложить, что рп(ао) пропорционально реп внутри подмножества, но в разных подмножествах константы пропорциональности могут от- личаться друг от друга. Упражнение. На самом деле функцию f называют выпуклой, если f" (х) > 0, и строго выпуклой, если /"(х) > 0, как требовалось в (5.5.1). Покажите на контрпримере, что простой выпуклости недостаточно для наших целей. Упражнение. Докажите (5.5.4). Упражнение. Если соотношение детального равновесия (5.4.2) выполняется, то для правой части (5.5.3) можно написать ~гГ , W ппг Рп’ (Хп-—xn){f (хп) — f (ХП')}- пп' Даже не используя (5.5.4) видно, что это выражение может быть отрица- тельным. Сравните с (5.7.17). Упражнение. При специальном выборе (5.5.6) находим, что (5.5.5) отрица- тельно, если при всех положительных х, у выполняется неравенство х log х—х log у—х+ у is 0, причем равенство имеет место только при х = р. Докажите это так назы- ваемое неравенство Клейна ** непосредственно. Для наших целей годится любая выпуклая функция /(х), опре- деленная при х^О и ограниченная снизу, например можно было бы использовать /(х) —х2 или /:(х) = ха (а > 1)***, Однако мы по привычке выберем /(x) = xlogx, Н=^Рп (5.5.6) п Рп * Это обычный аргумент при доказательстве //-теорем, но в действитель- ности он является строгим только если число состояний п конечно. ** О. Klein, Z. Phys., 72, 767 (1931). *** См.: J. A. Wehrl, rev. Mod. Phys., 50, 221 (1978). 117
так как эта функция обладает двумя дополнительными свойствами, которые придают ей больший физический смысл. Первое свойство состоит в том, что этот частный вид можно использовать для доказательства приближения к равновесию в раз- реженном газе, описываемом кинетическим уравнением Больцмана. Уравнение Больцмана нелинейно, и для доказательства того, что его решения стремятся к равновесным, нужна иная техника. Эта техника основана на выборе Н в виде (5.5.6); другие выпуклые функции в этом случае использовать нельзя *. Между прочим, урав- нение Больцмана не является основным кинетическим уравнением для плотности вероятности, а является уравнением эволюции для функ- ции распределения частицы в одночастичном шестимерном фазовом пространстве («ц-пространстве»). Однако линеаризованное уравнение Больцмана имеет ту же структуру, что и основное кинетическое уравнение (ср. с. § 11.5). Второе дополнительное свойство (5.5.6) состоит в том, что оно делает Н аддитивной величиной в следующем смысле. Возьмем две независимые системы с состояниями п и т и вероятностями рп и qm. Их можно рассматривать как одну комбинированную систему, у которой состояния обозначены (n, т), с вероятностями pnqm. Тогда функционал Н комбинированной системы является суммой функ- ционалов отдельных систем: Z/’n9CT,og-^2- = V pn log^L + £ qm log п. т РпЯт п Рп т Отсюда можно сделать вывод, что если система состоит из газа или является твердым телом, Н является экстенсивной величиной. Эти два дополнительных свойства величины И, заданные (5.5.6), совместно с ее монотонным убыванием привели к ее отождествле- нию с энтропией, определенной вторым законом термодинамики. Однако следует ясно понимать, что Н является функционалом не- равновесного распределения вероятности, в то время как энтропия определена для термодинамически равновесных состояний **. Поэтому настоящая концепция энтропии является обобщением термодинами- ческой энтропии; обобщенная энтропия S = — kH + Sn, (5.5.7) где k—множитель, определяющийся единицами измерений S, a So — постоянный член, не зависящий от рп. В равновесии Н = 0, так что So является термодинамической энтропией, которую можно из- менить только путем внешнего воздействия. Соотношения (5.5.7) совместно с (5.5.6) просто определяют разность значений энтропии между равновесным и неравновесным состояниями. * Р. А. Р. Moran, Proc. Camb. Philos. Soc., 57, 833 (1961). ** Или по крайней мере, локально-равновесных, см.: N. G. van Kampen, Physica, 25, 1294 (1959). 118
5.6. ДОКАЗАТЕЛЬСТВО СООТНОШЕНИЯ ДЕТАЛЬНОГО РАВНОВЕСИЯ Докажем соотношение детального равновесия для классических изолированных систем*. Квантово-механическое доказательство в принципе такое же, но требует большей предварительной работы **. Как разъяснялось в § 3.2, в классической механике обозначают клетку в фазовом пространстве. Однако оказывается более удобным использовать непрерывные переменные и записать соотношение де- тального равновесия (5.4.2) в виде W(y\y')P4y')-W(y'\y)P^y). (5.6.1) Здесь у обозначены значения, которые принимают макроскопические наблюдаемые величины Y(q, р). Мы докажем (5.6.1) при следующих двух условиях. 1. Функция Гамильтона системы, ответственная за микроскопи- ческое движение, является четной функцией всех импульсов рк. Это требование исключает внешнее магнитное поле и вращение пол- ной системы как целого. 2. Переменные Y также являются четными функциями импульса. Если эти условия не выполнены, то, вообще говоря, доказать (5.6.1) нельзя, но тогда выполняется аналогичное соотношение, ко- торое мы выведем позднее. Пусть система описывается f координатами qk и f импульсами рк (&= 1, 2, . . ., /), которые образуют 2/-мерное фазовое пространство Г. Уравнения движения имеют вид -ЁД. - дН Р) йРк - _ дН Yb Р} /с, fi d/ “ dpk ’ dt dqk ’ 1 ' Условие 1 определяет следующее свойство инвариантности. Если в (5.6.2) произвести замену = — (5.6.3) то уравнения в переменных t, qk, рк будут иметь тот же самый вид, что и для t, р, q. Таким образом, каждой возможной траек- тории в Г соответствует еще одна, полученная путем отражения величин рк, проведенная в обратном направлении, которая также является решением (5.6.2). Сформулируем это более точно. Пред- положим, в некоторый момент времени наша система находится в точке (</, р) фазового пространства Г. Через некоторое время т она будет находиться в точке (<?', р'), однозначно связанной с (<?, р) уравнениями движения. Тогда справедливо и то, что если старто- вать из точки (<?', —р'), то по прошествии времени т система ока- * Более геометрическое доказательство дал Вигнер, см.: Е. Р. Wigner J. Chem. Phys. 22, 1912, (1954); см.: N. G. van Kampen, Fortshritte der Physin, 4, 405 (1956). Настоящее алгебраическое доказательство аналогично приведен- ному в [7, рр. 93 ff]_ ** N. G. van Kampen, Physica, 20, 603 (1954). 119
жется в точке (q, —р). Это свойство уравнений движения назы- вают инвариантностью относительно обращения времени. Это место является отправной точкой для доказательства соотношения деталь- ного равновесия. Введем сокращенные обозначения. Обозначим х точку (</, р) в Г-пространстве, и пусть Xх = (<?', р')—точка, в кото- рую система переносится через время т. Далее, x = (q, —р), так что х = х. (5.6.4) Тогда инвариантность относительно обращения времени выражается соотношениями (хт)т = х или хт = (х)-т. (5.6.5) Понятно, что операция, обозначенная чертой, сохраняет фазовый объем в Г: dx=dx. (5,6.6) Вследствие свойства 2 имеем ^7 (°) = К* (°), (5.6.7) отсюда следует У- (/) = Y-t (0) = K-_t (0) = Yx-t (0) = Yx (- t). (5.6.8) Далее, поскольку равновесная функция распределения является функцией, зависящей от интегралов движения, причем она должна быть четной функцией скоростей, имеем РехМ = Рех(х). (5.6.9) После этих приготовлений запишем Р-ЛУ1, 0; У2, т)=$ — Еж(0)]6[у2 — Y x(x)\Pex(x)dx = )проведем замену переменных в интеграле, заменив х на х) = $ б [Ух - Y- (0)] 6 [у2 - Y- (т)] Р'х (х) dx = использовав (5.6.7). (5.6.8), (5.6.9), (5.6.6), получим) = 5 5 [У1 - Yx (0)] 6 [уг - Yx (- т)] Р‘х (х) dx = = Р2(У1, 0; у2, —х) = Р2(у2, °; Уъ х). Таким образом мы нашли соотношение симметрии для Р2, кото- рое сразу же можно перенести на соотношение для । t: /’111(1/2, т\У1, 0)P4yi) = Pi\i(yi, х\у2, 0)Ре(у2). (5.6.10) Если переменные Y таковы, что Y (/) является марковским процес- сом, то это соотношение можно записать в виде Тх (У 21 Ух) Ре (У1) = Tx(yt] у 2) Ре (уг) (5.6.11) 120
и с определением (5.1.1) оно дает (5.6.1), что и требовалось доказать. Теперь предположим, что условие 1 не выполнено. В частности, пусть имеется внешнее магнитное поле В с векторным потенциа- лом А. Тогда функция Гамильтона будет содержать (р —еА)2 вместо р2 и не будет сохранять свой вид при замене р на —р. Однако это можно исправить, если одновременно изменять знак поля. Тогда преобразование (5.6.3) будет отображать траектории (5.6.2) с полем В на обратные траектории (5.6.2) с полем —В. Как следствие этого, вместо (5.6.1) находим 1Т’(у|/; В)РЧ/) = ^(/|у; -В)Р-(у). (5.6.12) Здесь мы предположили, что переменные Y являются четными функциями скоростей, значит, и р — еА, так что клетки фазового пространства снова отображаются на самих себя. В случае вращения системы как целого (как в центрифуге *) необходимо также обра- тить угловую скорость Q. Тогда результат, записанный в дискрет- ных обозначениях (5.4.2), имеет вид wnn.(B, Q) р:,.В, (5.6.13) С другой стороны, предположим теперь, что р) является четной функцией рк, но что некоторые из переменных Y (q, р) яв- ляются нечетными функциями рк. Четные и нечетные Y характери- зуются соотношением Y+(q, p)^Y+ (q, — р); Y_ (q, р) = — Y_ (q, - p). Например, в гидродинамике локальные плотности частиц и энергии являются четными функциями, в то время как три компоненты ско- рости течения — нечетными. Понятно, что равновесие не может от- личаться для разных направлений времени и, следовательно, Ре(У+, у-) — Ре(у+, У-)=~-Ре(у). Те же аргументы приводят к w(y±, У-\У+, y'-)Pe(y') = w(y'+, У-\У+, —У-)Ре(У)- (5.6.14) Примечание. Соотношение детального равновесия (5.4.2) или (5.6.1) утверж дает, что матрица W является виртуально симметричной и, как будет видно в следующем параграфе, это гарантирует ее приводимость к диагональному виду. Соотношение (5.6.14) также является свойством W, но само по себе не гарантирует диагонализуемости W, и мы будем называть его расширенным соотношением детального равновесия. Соотношения (5.6.12) и (5.6.13) не яв- ляются свойствами матрицы, но связывают вероятности перехода в одной си- стеме с вероятностями перехода в другой. Поэтому мы не будем связывать их с названием «детальное равновесие». Расширенное свойство детального равно- весия окажется важным для § 10.4. Упражнение. Из (5.4.2) следует, что матрица Vnn- = [^]-1/2W„„4^1l/2 (5.6.15) * G. J. Нооушап and S. R. de Groot, Physica 21, 73 (1955); [7, pp. 264 ff] 121
симметрична и может быть приведена к диагональному виду. Выведите отсюда, что W можно привести к диагональному виду, и выразите ее соб- ственные функции и собственные значения через собственные функции и собственные значения матрицы V. Упражнение. Найдите оператор 7? такой, что (5.6.14) эквивалентно утвержде- нию о симметричности комбинаций Почему это нельзя использо- вать для диагонализации W-матрицы? Упражнение. Из (5.6.3) понятно, что импульсы представляют собой либо настоящие скорости, либо их линейные комбинации. Это не требуется при общем каноническом преобразовании. Покажите, что независимо от выбора переменных всегда существует автоморфизм х -* х, обладающий свойст- вами (5.6.4) — (5.6.7), и что, следовательно, доказательство остается спра- ведливым. 5.7. РАЗЛОЖЕНИЕ ПО СОБСТВЕННЫМ ФУНКЦИЯМ Как уже упоминалось выше, свойства (5.2.5), характеризующие W-матрицу, еще не гарантируют существования матрицы S такой, что произведение S-1№S диагонально. Добавочное свойство деталь- ного равновесия (5.4.2) или (5.6.1) делает W симметричной в опре- деленном смысле и, следовательно, диагонализируемой. В этом па- раграфе мы рассмотрим вытекающие отсюда следствия. Без потери общности предположим, что W неразложима. Вслед- ствие свойств симметрии (5.4.2) или (5.6.1) это означает, что она также не приводится к виду (5.2.7). Если бы некоторые из реп могли обращаться в нуль, это было бы не так, но нам известно, что в замкнутой изолированной физической системе все состояния имеют ненулевую вероятность. Уравнения для собственных функций и собственных значений имеют вид — 7.Ф;.. (5.7.1) Мы обозначили —X собственные значения, так как в дальнейшем будет видно, что они ^0. Тем же символом X будем помечать собственные функции, однако для вырожденных собственных значе- ний это обозначение должно быто усовершенствовано. Имеется одно собственное значение 7v = 0, соответствующее Ф0 = ре, и мы знаем, что Фо положительна. В § 5.3 было доказано, что это собственное значение не вырождено. Из (5.7.1) следует, что выражение /Л0 = 2ХФле~Х/ (5.7.2) с произвольными константами ск является решением основного кине- тического уравнения. В том случае, когда имеется непрерывный спектр собственных значений, сумма должна быть заменена интег- ралом по X. Предположим, что мы нашли все собственные значения и собствен- ные векторы, удовлетворяющие (5.7.1). Возникает вопрос, является ли решение (5.7.2) полным, т. е. представляет ли оно все решения кине- тического уравнения. Другими словами, можно ли найти для каж- 122
дого начального распределения р(0) соответствующие константы такие, что р(0) = 2аФх. (5.7.3) Для финитной W-матрицы из линейной алгебры следует, что ответ на этот вопрос должен быть положительным, если W-матрица сим- метрична. Если W является оператором в бесконечномерном прост- ранстве, то математические условия усложняются, но в качестве наводящего соображения можно считать любой симметричный опера- тор диагонализуемым, как это обычно бывает в квантовой механике. Сейчас мы покажем, что свойство детального равновесия гарантирует симметрию оператора W. Будем использовать обозначения для непре- рывного множества возможных значений. В пространстве действительных функций Ф(у) определим скаляр- ное произведение любых двух функций Фиф соотношением (Ф, Ф) = f Ф^(У) dy = (ф, Ф). (5.7.4) J \У) Функция Ф имеет норму И(Ф, Ф). Функции, имеющие финитную форму, составляют наше гильбертово пространство. Свойство деталь- ного равновесия (5.6.1) теперь можно выразить с помощью (Ф, >¥ф) = (Ф, >¥Ф) = (>¥Ф, ф). (5.7.5) Это соотношение определяет симметрию оператора W. Мы приходим к заключению, что система собственных функций полна. Кроме того, отсюда следует, что собственные значения действи- тельны и что любые два собственных вектора ортогональны в терми- нах скалярного произведения (5.7.4). Для дискретных собственных значений собственные векторы можно нормировать, так что (Фъ фи) = би- (5.7.6) В частности, при Х = л' = 0 условие нормировки дает (Фо, Фр)=(>Ф0(«/)(1(/=1. (5.7.7) Это условие приводит к тому, что функция Фо (у) оказывается не просто пропорциональной, а тождественной ре(у). Для непрерывного спектра или непрерывной части спектра (5.7.6) надо заменить на (Фх, Фи) = б(Х—Г). (5.7.8) Вследствие этой ортонормированности коэффициент в (5.7.3) можно найти с помощью обычного приема: а = (фх(//), р(У, 0)). (5.7.9) Полнота выражается соотношением ЕФч ([Л Фч х (5-7'10) 123
Решение основного кинетического уравнения с заданным началь- ным значением Р (у, 0) имеет вид ЕР Фа (и'} 0)d/. (5.7.11) Примечание. Кроме вопроса о том, является ли набор собственных функ- ций полным, на практике часто приходится сталкиваться со следующим вопро- сом. Предположим, для определенного оператора W имеется возможность определить множество решений (5.7.1). Необходимо узнать, представляют ли они все возможные решения. Для финитной матрицы W на этот вопрос можно ответить, подсчитав число найденных линейно независимых векторов Ф^. Для некоторых задач в бесконечномерном гильбертовом пространстве можно непосредственно показать, что найденные решения образуют полный набор (см., например, § 6.8). Обычно предполагают, что любой разумный система- тический метод вычисления собственных функций позволяет найти все функции. Но в некоторых задачах в виде исключения появляются одна или несколько дополнительных собственных функций. Упражнение. Сформулируйте рассмотренные выше уравнения для случая вырож- денных собственных значений. Упражнение. Покажите, что \¥-матрица W= 1/2 J/2 1 3 —2 0 1 -3 (5.7.12) не имеет полного набора собственных векторов. Тем не менее найдите e<w. Упражнение. Покажите, что с0=1 и (5.7.2) можно записать в виде Р(у, О = Ре(У)^ J еЛф1(у)е Kt. о (5.7.13) Упражнение. Покажите, что (5.7.10) подразумевает также и ортогональность. Упражнение. Получите следующие выражения: для вероятности перехода ХГ’ (У) (у) Гт(У|/) = Е.^ф;(-^- е-Ч (5.7.14) для равновесной автокорреляционной функции х(т)= У е-^Г £ уФ} (у) dpT (5.7.15) LJ J и для спектра флуктуаций 5 и=- Е с^2- (5-7-16> Упражнение. Каждая Ф^(р), кроме Фо (р), при некоторых значениях у должна становиться отрицательной; следовательно, собственные функции сами по себе уже не являются плотностями вероятности. Почему это не опровер- гает следствия в § 5.3 н почему это не наносит никакого ущерба общему решению (5.7.2) или (5.7.14)? Разложение по собственным функциям приводит к тому, что раз- личные величины, имеющие отношение к стохастическим процессам, выражаются через них; примерами могут служить сотношения (5.7.13) —(5.7.16). Оно такл^е упрощает некоторые выкладки, в част- ности доказательство приближения к равновесию. Действительно, 124
в соответствии с (5.7.13) достаточно доказать, что все X кроме Х = 0 положительны, значит, W является отрицательно полуопределенной. Для любого вектора рп = хпреп в гильбертовом пространстве в тех же обозначениях, что и в § 5.5, имеем (р, W/7) = £ (Wnn,Pn'- гл,п/7п) = пп' Рп = У Хп (W пп,реп,хп, — wn.npenxn} = — 4- £ wnn.pen, (хп — хп,)2. пп' пп. Действительно, это выражение отрицательно, если только все хп не равны друг другу и вектор рп не пропорционален реп. Из этого вывода могло бы быть одно исключение. Когда много вероятностей W пп. обращается в нуль, состояния п разбиваются на две группы, не связанные друг с другом вероятностями перехода. Но в этом случае W-матрица должна быть разложимой. Этот результат составляет третье доказательство приближения к равновесию, но это доказательство ограничено W-матрицами, имеющими свойство симметрии, выраженное соотношением детального равновесия. Однако оно не исключает возможности непрерывного спектра. В качестве другого примера результата, полученного с помощью разложения по собственным функциям, рассмотрим выражение (5.7.16) для спектральной плотности флуктуаций. Немного изменив обозна- чения, перепишем его в виде (5717) о Это выражение можно интерпретировать как суперпозицию дебаев- ских функций релаксации (1 + со2т2)-1 с временами релаксации т. Весовая функция £(т) суперпозиции может быть непрерывной или состоять из дельта-функций, но в соответствии с (5.7.16) не прини- мает отрицательных значений. Следовательно, 5(й>) монотонно убывает, когда со пробегает значения от 0 до оо. Можно также получить асимптотическое разложение S(co) для ю —* оо. Разложим каждый отдельный член в (5.7.16) по степени 1/<о2: S (<о)=| Е *2V+1 [ j (</) ]2= =I е s [ I d/ ]2 w)2v+i<i)>- Определим транспонированную матрицу W соотношением W(y|i/') = — W (у' | у), тогда 5 (со) = | Е J у'^ (/) W У Фх (У) ЧГ^уЛу. 125
Суммирование по X можно выполнить с помощью (5.7.10): = ~ Д/фо(/)б(г/ —у') W2v+1(/d(/-- 00 = |Е ^У+1<У^2У+1У>е- (5.7.18) Это выражение является асимптотическим разложением. Отметим, что коэффициенты разложения можно находить, не решая основное кинетическое уравнение, а просто применяя оператор W конечное число раз. Упражнение. Альтернативным определением матрицы W является тождество Ф (у) Wip(y) dy= WO(p) dp для всех Ф, ф. Соотношение детального равновесия выражается с помощью Wpe (У) Ф (У) = Ре (У) W (у) ф (у) при всех ip. Упражнение. Покажите, что коэффициенты в разложении (5.7.18) можно также записать, использовав у — <у> вместо у. Упражнение. Выведите тождество 2 / 1 \е где (W — но)-1— резольвента оператора, связанная с W. Упражнение. Пусть заряд конденсатора Q описывается основным кинетическим уравнением. Спектр флуктуаций в равновесии удовлетворяет соотношению 2 lim S/(<o) = —— <QW(?>e. 0)-* оо Л- Упражнение. Пусть Y—стационарный марковский процесс, который описывается основным кинетическим уравнением с оператором W. Пусть Р2(ух, tx, у2, ii)—его двухвременнбе распределение, G2(fei, И; k2, t3)—его характе- ристическая функция. Выведите соотношение G2(^, G; k2, /2) = <eiW^-z‘>'Vei^>e, t2<tx. Результат не изменится, если kx и k2 поменять местами. Что это означает физически? Упражнение. Выведите (5.7.18), не используя разложения по собственным функциям. Указание: Примените последовательное интегрирование по частям к (3.3.4) и используйте (4.3.7). 5.8. МАКРОСКОПИЧЕСКОЕ УРАВНЕНИЕ Пусть Y—физическая величина марковского типа, имеющая заданное начальное значение у0. В качестве примеров можно пред- ставить себе ток в электрической цепи или набор чисел, представ- ляющих количества различных молекул, участвующих в химической реакции. Основное кинетическое уравнение определяет их распреде- 126
ления вероятности при всех t > 0. Однако в обычной макроскопи- ческой физике пренебрегают флуктуациями и рассматривают Y как нестохастическую однозначную величину у. Эволюция у (/) опи- сывается детерминистическим дифференциальным уравнением для у(/), которое называют феноменологическим макроскопическим урав- нением. Примерами могут служить закон Ома, уравнения для ско- ростей химических реакций в химической кинетике и уравнения, описывающие рост популяций. Какова логическая связь между такими макроскопическими уравнениями и основным кинетическим уравнением? Поскольку основное кинетическое уравнение определяет полное распределение вероятности, то должна быть возможность вывести из него макроскопическое уравнение как приближение, в котором флуктуациями можно пренебречь. В настоящем параграфе мы собираемся дать этот вывод качественным способом. Системати- ческое рассмотрение дается в § 9.3. Для определенности рассмотрим замкнутую изолированную физи- ческую систему. Если при / = 0 величина Y принимает точное зна- чение у0, то плотность вероятности Р (у, /) в начальный момент времени имеет вид 6(</—у0). При увеличении t она стремится к Ре(у)- Если у0 макроскопически отличается от значения Y, это означает, что у,, выходит далеко за пределу ширины распределения Ре(у), так как макроскопически наблюдаемые значения велики по сравне- нию с равновесными флуктуациями. Мы также знаем из опыта, что флуктуации остаются малыми в течение всего процесса. Это озна- чает, что для каждого t величина Р (у, t) является функцией, зави- сящей от у, имеющей форму острого пика. Положение этого пика является хорошо определенной величиной, имеющей неопределен- ность порядка ширины пика, которая должна быть отождествлена с макроскопическим значением у(/). Для определенности обычно пользуются более точным определением: У(П-'Y^t = уР (у, f)dy. (5.8.1) Однако следует понимать, что это не вызвано логической необходи- мостью: любое значение внутри пика можно было бы использовать в качестве макроскопического значения y(t)*. С увеличением t пик целиком сдвигается вдоль оси у из своего начального положения у(0) = уо к своему конечному положению у (оо) = <У>е. (Ширина только возрастает от начального нулевого значения до своего конечного значения, равного ширине Ре.) Это движение определяет эволюцию у(/) и, следовательно, макроскопи- * Отождествление макроскопического значения со средним иногда обосно- вывается тем, что для получения результата надо много раз повторить' изме- рения, а затем усреднить результаты этих наблюдений. Однако измерение силы тока или давления и т. д. обычно недостаточно точно для наблюдения флуктуаций и усреднение просто служит для уменьшения экспериментальных погрешностей. 127
ческое уравнение. Имея в виду эту картину, мы готовы вывести макроскопическое уравнение. Прежде всего мы знаем точное тождество d ,z f* дР(у, t) , = ^y{w(y\y')p(y', о — W(y’\y)P(y, /)}dt/di/' = =$$(/—y)W(y'\y)p(y, t)&yty'- Определим моменты перехода* av (у) соотношением аЛУ)^(у'~УГ№(у'\у)Ау' (v = 0, 1, 2, . . .). (5.8.2) Тогда имеем точное следствие основного кинетического уравнения: -^<y>t = ^а1(у)Р(у, t)dy = <at(y)> t. (5.8.3) Теперь если аг(у) окажется линейной функцией у, это уравнение будет иметь вид, совпадающий с = (5.8.4). Следовательно, в этом случае мы находим точное макроскопическое уравнение, описывающее эволюцию величины у(/), определенной соотношением (5.8.1). Однако если а, (у) не является линейной функцией у, то уже нельзя больше утверждать, что (5.8.4) совпа- дает с (5.8.3). Но, раскладывая аг (у) вблизи <V>, получаем (У)> = О1«У?) + 72<(У-<Г»2>а; (<У>) + • • •• (5.8.5) Это соотношение уже не является самосогласованным уравнением, содержащим только величину <У>, так как в него входят также высшие моменты. Поэтому эволюция во времени величины <У>уже не определяется самим средним <Y>, но подвержена действию флуктуаций относительно этого среднего. Макроскопическое прибли- жение состоит в пренебрежении этими флуктуациями и учете только первого члена в разложении (5.8.5). В этом приближении уравне- ние (5.8.4) справедливо, даже если функция аг (у) нелинейна. Тогда получаем макроскопическое уравнение у-аДу). (5.8.6) Примечание. Из нелинейного иитегродифференциального уравнения для Р{у, I) мы вывели нелинейное уравнение для у (/); значит, существенно * Сначала они были названы Мойалом производными моментами, J. Е. Moyal, J. Roy. Statist. Soc. (В) 11, 150 (1949),— но это название не прижилось, так что я попробовал дать другое. Отметим, что а0 в (5.1.3) является просто низ- шим моментом перехода. 128
линейное основное кинетическое уравнение может соответствовать физическому процессу, который в лабораторных условиях должен рассматриваться как нелинейное явление, поскольку его макроскопическое уравнение нелинейно. Этот факт не покажется парадоксальным, если иметь в виду, что разница между линейным и нелинейным случаями хорошо определена только для урав- нений. Было бы ошибочно проводить различие для физических явлений, пока не выработано их математическое описание. Ньютоновские уравнения движе- ния планет нелинейны, но уравнение Шредингера для Солнечной системы линейно. Связь между линейным и нелинейным уравнениями не является сущностью аппроксимации. Линейное уравнение Лиувилля является грубым эквивалентом нелинейных уравнений движения молекул. В общем случае любое линейное уравнение в частных производных математически эквивалентно уравнениям для его характеристик, которые могут быть нелинейными*. Справедливо также, что вблизи равновесного значения уе можно аппроксимировать нелинейное макроскопическое уравнение (5.8.6) линейным уравнением ^-!У(Л”УеЬ=аНУг)[у(О— уН- (5 8.7) Однако эта линеаризация является добавочным приближением, не связанным с линейностью основного кинетического уравнения. Можно добавить, что усло- вие приближения к равновесию требует, чтобы величина (уО была отрица- тельной, что приводит к тому, что различные коэффициенты переноса, такие, как омическое сопротивление цепи, оказываются положительными. Можно также вывести приближенное уравнение для ширины распределения. Начнем с точного тождества (У'г~Уг) w (y'\y)P(y) dtydy'---- = 5 П (у'—Уу 2У (у' ~~ У)} w (У'\ У)р (У) АУ АУ' = = <а2(Г),г^2(Уах(Г);,. Тогда дисперсия о2 (/) = — <Y'>2t удовлетворяет соотношению <Й2 <(Y(У)>,. (5.8.8) Когда аг и а2 — линейные функции у, это уравнение совпадает с do2 ^ = а2(У(П) + 2а2й;(у(/))? (5.8.9) где штрихом обозначено дифференцирование. Когда аг и а., нели- нейны, последнее уравнение можно рассматривать как приближен- ное: оно справедливо, когда флуктуации малы. Понятно, что, для того чтобы макроскопическое приближение было истинным, необхо- димо, чтобы флуктуации были малы. Обосновывая, что это в самом деле так, мы до сих пор обращались лишь к собственному опыту, теперь же, используя (5.8.9), это можно связать со свойствами основного кинетического уравнения. В (5.8.9) величина а2 > 0, по определе- нию, (у) < 0 при у = уг в некоторой окрестности. (Случай а((у?) = 0 * I. N. Sneddon, Elements of Partial Differential Equations (McGraw-Hill. New York, 1957). 129
(5.8.11) рассмотрен в гл. 10.) Отсюда следует, что а2 стремится увели- читься со скоростью а.2, но эта тенденция сдерживается вторым членом. Тогда о2 стремится стать равной а2/(2|а(|). (5.8.10) Условие, при котором уравнение (5.8.6) является приближенно справедливым, состоит в малости второго члена в (5.8.5): ggg'i 4а j В нем утверждается, что вторые производные, ответственные за на- рушение линейности, должны быть малы. Получив уравнение (5.8.9) для дисперсии, включим в рассмот- рение второй член в (5.8.5) и получим поправку к макроскопиче- скому уравнению Г-МуИ’/ЖМ (5.8.12) В гл. 9 будет показано, что это уравнение совместно с (5.8.9) в самом деле дает следующее приближение после макроскопического уравнения (5.8.6)*. Пояснение. Макроскопическое уравнение (5.8.6) является дифференциаль- ным уравнением для у, которое однозначно определяет у (Г). когда задано на- чальное значение у (0). В следующем приближении (5.8.12) эволюция у зави- сит также от дисперсии флуктуаций. Причиной этого является то. что у флук- туирует относительно у и вследствие этого чувствует значение о, не только в у, но также и в его окрестности. Этот эффект пропорционален кривизне «j; наклон Oj несуществен, поскольку флуктуации в этом приближении симмет- ричны. Однако уровень флуктуаций определяется вторым уравнением (5.8.9). которое все же содержит наклон щ. Тот факт, что мы теперь имеем два уравнения, а именно (5.8.12) и (5.8.9). означает, что у (t) уже не определяется только у (0), а зависит также От на- чального значения о2. Казалось бы, можно надеяться, что после короткого начального переходного времени о2 подстроится, быстро достигнув асимптоти- ческого значения, зависящего только от мгновенного значения у(/). так что после короткого перехода справедливым окажется «перенормированное» урав- нение для у. Однако это не так: временной масштаб, на котором о2 достигает значения (5.8.10), определяется коэффициентом аг в (5.8.9) и поэтому сравним с масштабом изменения самого у (см. (5.8.7)). Разделения масштабов не про- исходит, и потому нельзя выделить одно уравнение, содержащее только у. Эта ситуация аналогична той, что встречается в кинетической теории разре- женной плазмы’’*. В низшем порядке по плотности *** одночастичная функция распределения электронов удовлетворяет уравнению Власова. Приближение следующего порядка дается двумя связанными уравнениями для одночастич- ной и двухчастичной функций распределения. С другой стороны, в кинетиче- * N. G. van Kampen in: Fundamental Problems in Statistical Mechanics (proc. NUFFIC Summer Course; E. G. D. Cohen ed., North-Holland, Amsterdam. 1962); R. Kubo, K- Matsuo, and K. Kitahara, J. Statist. Phys. 9. 51 (1973). ** N. Rostoker and M. N. Rosenbluth, Phys. Fluids 3, 1 (1960). *** Или, вернее, по плазменному параметру 4rje2/(^Td). где e — заряд элект- рона, a d— среднее расстояние между электронами. 130
ской теории газов Боголюбов * предложил приближенную схему, в которой все высшие порядки дают поправки к одночастичной функции распределения, но его схема неудачна **. Упражнение. Найдите моменты перехода и макроскопическое уравнение для процесса распада и процесса Пуассона. Упражнение. Определите моменты перехода в случаях, когда Y имеет большее число компонент. Покажите, что матрица (Ц (уе) должна быть отрицательно определенной или по крайней мере полуопределенной. Упражнение. Докажите следующую теорему***. Макроскопическое уравнение линейно тогда и только тогда, когда функция Q(y) = y—'у'^ является левым собственным вектором матрицы W. Упражнение. По аналогии с (5.8.11) покажите, что, для того чтобы (5.8.12) было хорошим приближением, нужно потребовать выполнения условий j «з I -< I «11 и (а)')2 < | a'i j3/a2. (5.8.13) Упражнение. Выведите исправленное макроскопическое уравнение ДА (5.8.14) 2at'! 2<7i.ai 2<ц Упражнение. Нет необходимости решать (5.8.12) и (5.8.9) одновременно. По- скольку а- появляется в (5.8.12) как поправка, достаточно вычислить а- из (5.8.9), используя для у неисправленное макроскопическое значение, которое дает уравнение (5.8.6). Тогда уравнения (5.8.12) и (5.8.9) можно заменить следующей системой (Kubo et al., loc. cit.). Положите ,(/> = - у -р и и решите у-- at (у); (5.8.15а) с^а2 -a.. (y)-^2fli (у) о2; (5.8.156) и — а\ (у) и -г (у) о2. (5.8.15в) Сравните с (9.4.8). Упражнение. Покажите, что эту систему уравнений можно решить, т. е. све- сти к некоторому количеству интегрирований. У = !«1 1 - 5.9. СОПРЯЖЕННОЕ УРАВНЕНИЕ В дополнение к основному кинетическому уравнению иногда имеет смысл определить Q = WQ, (5.9.1) где W — снова транспонированная или сопряженная к W матрица. Для дискретного множества возможных значений это можно запи- сать в явном виде — QnWn'n- (5.9.2) * Боголюбов Н. Н. Проблемы динамической теории в статистической физике. М, —Л., 1946. ** Е. G. D. Cohen in: Fundamental Problems in Statistical Mechanics II (Proc. Second NUFFIC Summer Course; E. G. D. Cohen ed., North-Holland. Amsterdam, 1968). *** N. G. van Kampen in: Stochastic Processes in Chemical Physics (К. E. Shu- ler ed., Interscience, New York, 1969). 131
Формальное решение (5.9.1) имеет вид Q(/)=e^Q(0). (5.9.3) По-другому можно написать Q (/) = Q (0) e<w, (5.9.4) где вектор Q теперь записан в транспонированном виде, т. е. как матрица, имеющая одну строку. Понятно, что решение этих урав- нений эквивалентно решению самого основного кинетического урав- нения. Важность сопряженного уравнения вытекает из следующих трех соображений. 1. Предположим, существуют множество состояний п и система, которая находится в одном из п состояний с вероятностью /?„(/). Эволюция этой системы описывается основным кинетическим урав- нением. Пусть Q-—некоторое число или свойство, связанное с си- стемой так, что в каждом состоянии п оно имеет значение qn. Тогда среднее от Q в момент времени t есть 2?«Рл(0- Это можно выра- зить через начальное распределение = 2?„(e'wU/^(0). (5.9.5) пп' В соответствии с (5.9.3) это уравнение можно интерпретировать следующим образом. Определим зависящий от времени вектор qn(t), /поставив условие, что при / = 0 его компоненты равны q', а при >0 он эволюционирует в соответствии с уравнением (5.9.1). Тогда среднее от Q в момент времени t равно среднему от q„(t) по начальному распределению: Q t 2 qnpn (/) 2 Яп (t)pnW. (5.9.6) n n Таким образом, имеется формальный перенос временной зависи- мости с распределения вероятности на наблюдаемую величину, по аналогии с квантово-механическим преобразованием от представле- ния Шредингера к представлению Гейзенберга. Соответственно можно определить зависящий от времени вектор <?(;), положив QW-e^Q, (5.9.7) так что <;Q;,=«?(/)>„. 2. Пусть pn,m(t)— решение основного кинетического уравнения с Рп, т (0) 6„, т. Тогда по индексу т оно удовлетворяет сопряжен- ному или «обратному» уравнению Рп, т (0 - 2 т. (/) - 2 Рп. т- (0 (5.9.8) т' tn' 132
Доказательство очевидным образом следует из факта, что формаль- ное решение уравнения (5.9.8) имеет вид Рп. a(0 = (e!4V, тождественный решению (5.9.4) основного кинетического уравнения. 3. Следующий факт легко проверить, но он достаточно важен, чтобы сформулировать его в виде теоремы. Если W удовлетворяет соотношению детального равновесия, то каждое решение pn(i) ос- новного кинетического уравнения связано с решением qn(t) сопря- женного уравнения соотношением (5-9.9) Рп Сформулируем это по-другому: каждый правый собственный вектор <р„ связан с левым собственным вектором ЧД (с тем же самым соб- ственным значением) следующим образом: * п • е Рп (5.9.10) Это полезно помнить при решении основного кинетического урав- нения, потому что левые собственные векторы зачастую оказывают- ся более простыми функциями п, чем правые. Действительно, для Х,-~0 имеем <[„ - реп, в то время как 1. Однако сопряженное уравнение чаще всего используют в зада- чах с поглощающими границами и задачах, связанных с проблемой первого прохождения (см. § 6.10). Упражнение. Запишите формулы этого параграфа для непрерывных многомер- ных переменных. Упражнение. Убедитесь, что характеристическая функция G (k. t) распределе- ния Р\Ау- О марковского процесса является величиной типа (5.9.7). Упражнение. Выведите (5.9.8) способом, аналогичным тому, которым выводи- лось основное кинетическое уравнение в § 51. Начните вывод с уравне- ния Чепмена — Колмогорова (4.2.1). Упражнение. Для марковских процессов, которые не являются стационарными или однородными, имеются прямое, или основное, кинетическое уравне- ние и обращенное уравнение дР. I . (У- ! | Уч, (* ---!------------~ (у | у ) Pr j ] (у'. 1 ! уи. <(,) di,-': (5.9.11а) дР, I , (У< I I Уч- to) д ---------~:--------- | р 1 (у, /1 у', /,,) wz„ (у' | у„) ву', (5.9.11б) где W; (у j у') — зависящая от времени вероятность перехода. Упражнение, Из (5.9.2) следует, что наибольшее из qn убывает, а наимег.ь- шее возрастает. Покажите, что (для конечного числа состояний) qn (?) стремится к постоянному значению, которое не зависит от п. Потом с помощью (5.9.6) распространите этот результат на рп (t) и таким спосо- бом заново выведите результаты § 5.3. 133
ГЛАВА 6 ОДНОШАГОВЫЕ ПРОЦЕССЫ Одношаговые процессы (или процессы рождения — гибели) явля- ются специальным классом марковских процессов, они широко рас- пространены и могут быть детально проанализированы. 6.1. ОПРЕДЕЛЕНИЯ; ПРОЦЕСС ПУАССОНА Многие стохастические процессы относятся к специальному ти- пу, называемому процессами рождения — гибели или процессами ге- нерации— рекомбинации. Мы будем применять более свободный термин одношаговые процессы Процессы такого типа определены как марковские процессы с ке'у'орывным вр. -^нем. множество воз- можных значений которых сосгииг чисел п, а матрица перехода W допускает только пер-. <• меж.;- соседними участками: W^-ГпЛ.^ -с. • . >л^«'). (6.1.1) Диагональные элементы матрицы гыреходл имеют вид W„„ - = — (rn --rgn). а основное кинетическое уравнение записывают в виде Т gn)Pn- (6.1.2) Коэффициент гп представляет собой вероятность того, что за еди- ничное время произойдет переход из состояния п в п — 1, в то Рис. II. Одношаговый процесс и вероятности перехода время как gn — вероятность перехода за то же время в состояние п 1 (рис. 11)*. Одношаговые процессы имеют место тогда, когда стохастический процесс связан с поглощением и испусканием фотонов или частиц, с переходами в возбужденное состояние и обратно в атомах или ядрах или с переходами электронов в полупроводниках, с рожде- нием или гибелью индивидуумов, с приходом и уходом покупате- лей. Название не предполагает, что переходы из состояния п на * Обозначения коэффициентов гп и gn происходят от слов рекомбинация и генерация (recombination и generation) носителей заряда в полупроводниках; в задачах, связанных с процессами рождения и гибели, их часто обозначают и Кп. 134
два и большее число шагов за время А/ запрещены, но при этом подразумевается, что вероятность таких переходов есть О (А/2) или по крайней мере O(AZ). В тех случаях, когда происходит рождение пар или множественное рождение или когда имеет место диффу- зия нейтронов в делящихся веществах, а в каждом акте деления выделяется несколько дополнительных нейтронов, это требование не выполняется. Одношаговые процессы можно подразделить на следующие три подкласса по виду множества возможных значений: а) множество возможных значений состоит из всех целых чисел, — оо < л < оо; б) множество возможных значений является полубесконечным. скажем, п — 0, 1,2, . . .; в) множество возможных значений конечно, n = 0, 1, 2, . .., N. Если множество возможных значений состоит из нескольких ин- тервалов, разделенных промежутками, то переходы через промежутки невозможны, так что процесс распадается на несколько независи- мых процессов, относящихся к классам б) или в). Если точка п = 0 является границей, то уравнение (6.1.2) теря- ет смысл для л-0 и должно быть заменено на Ро = ггрг— g„p0. (6.1.3) Иногда удобнее воспользоваться другой возможностью и объявить уравнение (6.1.2) справедливым для п — 0 с определением I rB = g_1^0. (6.1.4) Аналогично, верхняя граница N нуждается в специальном уравнении P.V “ £,V-1P.V-1 ГЛ'Р,Х (6.1.5) либо в дополнительном определении Av-i = ^v = 0. (6.1.6) Другое подразделение одношаговых процессов основывается на коэффициентах г„, gn. 1. Коэффициенты постоянны, не зависят от п всюду, кроме, мо- жет быть, границ, Процессы такого типа мы будем называть слу- чайными блужданиями (хотя этот термин часто используют для бо- лее общего случая). Такие процессы рассмотрены в следующем параграфе. 2. Коэффициенты являются линейными функциями п, но одно- временно оба не равны константе. Процессы такого типа будем на- зывать линейными одябшаговыми, их общее решение дано в § 6.6. Отметим, что здесь должна быть по крайней мере одна граница, поскольку в противном случае могут появиться отрицательные зна- чения вероятностей перехода. 135
3. Все другие случаи будем называть нелинейными. Они состав- ляют предмет гл. 9. Однако нужно понимать, что основное кине- тическое уравнение по определению всегда линейно относительно неизвестной рп, а термин «нелинейный» в данном случае относится к коэффициентам. Важным примером одношагового процесса с по- стоянными вероятностями перехода является процесс Пуассона, определяемый соотношениями Р,г (0) - 6,. (6.1.7) где q— постоянный параметр. Основное кинетическое уравнение имеет вид (6.1.8) Это случайное блуждание на множестве целых чисел п = 0, 1, 2, . . ., с шагом только в правую сторону, но в случайные момен- ты времени. Связь с гл. 2 становится более ясной, если восполь- зоваться следующим альтернативным определением. Каждое слу- чайное множество событий можно рассматривать в терминах стоха- стического процесса К, если определить Y (t) как число событий, происшедших между начальным временем i -=0 и временем /. Каж- дая выборочная функция состоит из единичных шагов и принимает только целочисленные значения п=-0, 1, 2, ... (см. рис. 5). Вооб- ще говоря, этот процесс К — немарковский; но если события неза- висимы (в том смысле, как и в § 2.2), то q (t) di является вероят- ностью сделать шаг в течение времени между моментами i и t у- d/ независимо от того, что происходило раньше. Если q к тому же еще не зависит от времени, то Y является процессом Пуассона. Упражнение. Найдите гп и g„ для процесса распада из § 4.6 и определите, к какому подклассу принадлежит этот процесс. Упражнение. Покажите, что процесс Пуассона согласуется с (2.2.6). Отметим, что процесс Пуассона нестационарен, даже если случайное множество событий стационарно в соответствии с опре- делением «стационарности» для случайных событий. Причина состоит в том, что Y (t) представляет собой полное число событий, считая с началь- ного момента времени. Упражнение. Для независимых нестационарных событий в соответствии с оп- ределением (2.2.1) уравнение (6.1.8) остается справедливым, несмотря на то что q теперь зависит от времени (зависящий от времени «дробовой шум»). Снова найдите pn(t). 6.2. СЛУЧАЙНОЕ БЛУЖДАНИЕ С НЕПРЕРЫВНЫМ ВРЕМЕНЕМ Рассмотрим неограниченное симметричное случайное блуждание: коэффициенты гп и gn постоянны и равны друг другу. Эту кон- станту можно включить в определение единиц времени, так что 136
кинетическое уравнение, как и в (5.2.11), имеет вид P=--Pn^i + Pn-1 —2р„ (—оо<п<оо). (6.2.1) Это случайное блуждание отличается от случаев, рассмотренных в § 1.4 и 4.5, тем, что время изменяется непрерывно. Теперь ве- роятности перехода берут за единичное время. Этот простой пример зачастую оказывается достаточным для иллюстрации более сложных процессов, в частности он содержит существенные черты физиче- ского процесса диффузии*. В качестве начального распределения возьмем рп(О)^6„,о. (6.2.2) Этого достаточно, потому что из-за инвариантности относительно сдвигов по п эта формула охватывает также случай р„(0)=^6в га для каждого т, а с помощью подходящего выбора суперпозиции этих состояний можно воспроизвести любое начальное распределе- ние. Существует много способов решения дифференциально-разност- ного уравнения (6.2.1); мы выберем метод, который можно исполь- зовать и в более общих случаях. Хорошим инструментом является производящая функция вероятности F(z, t), определенная в (6.1.2): f(z, /)--2’zn/'rt(0, (6.2.3) где z — вспомогательная переменная. Поскольку 2/МО-’1 и п pn(t)^O, эта функция наверняка существует при |z| =--1. Она об- ладает свойствами: F(l,/)-l, F'(l, t) n(t) . ( > F(l, /)^<n(02>-<n(0>- Штрих обозначает дифференцирование no z. Часто удобнее исполь- зовать другую форму последних двух уравнений: —— ^ <«(/)>, 1)2 1 pi (6.2.5) I |г=] Г= — Упражнение. Установите соотношение между производящей функцией вероят- ности и характеристической функцией. Выведите тождества (6.2.4) и (6.2.5) из известных свойств последней. * По поводу приложения к химическим задачам см.: W. J. Shugard and Н. Reiss, J. Chem, Phys., 65, 2827 (1976). 137
Упражнение. Выведите для всех п Z~"~1F(Z’ Z)dz- (6-2.6) Интеграл берется по единичной окружности. Упражнение. Для случайного блуждания с дискретным временем рассматрива- лись шаги в фиксированные моменты времени. Предположим теперь, что- моменты времени, в которые совершаются шаги, случайно распределены по Пуассону. Покажите, что эта ситуация описывается уравнением (6.2.1)*. Уравнение (6.2.1) теперь можно записать как уравнение для F(z, t). Умножим (6.2.1) на zn и просуммируем по всем п: F(Z, t). (6.2.7) Это дифференциальное уравнение можно проинтегрировать. Общее решение имеет вид F(z, 0-..Q(2)expp(z + l-2)j. (6.2.8) Решение содержит произвольную функцию Q(z), которая должна быть выбрана, чтобы удовлетворить начальному условию (6.2.2). Это условие в терминах F имеет вид F(z, 0) - 1. Подстановка в (6.2.8) дает 1 /’(4 O)-Q(z). Тогда окончательное решение для производящей функции имеет вид F(z, t) -- expj t lz -j- -----------------2j|. (6.2.9) Раскладывая это выражение по степеням z, т. е. 00 k. l = <3 можно найти Рп\ч - X-(/.}_«)!/!• (6.2.10) Суммирование здесь производится по всем целым значениям I, для которых и I, и п 4 I неотрицательны. Упражнение. Часто вместо (6.2.10) удобнее использовать (6.2.9). Выведите с помощью (6.2.5) соотношения <п («)>-- о, <п(/)Ъ - 2/. v * D. Bedeaux, К. Lakatos-Lindenberg, and К- Е. Shuler, J. Mathem. Phys. 12, 2116 (1971); Feller II, p. 177; Cox and Miller, p. 239. 138
Тогда средний квадрат расстояния, проходимого за время от 0 до t, воз- растает пропорционально /, как и в случае случайного блуждания с дис- кретным временем. Как это можно было бы показать, не решая основного кинетического уравнения явно? Упражнение. Покажите, что (6.2.10) можно также представить в виде Pn(/)-e-«/|n|(2Z), (6.2.11) где 1п — функция Бесселя n-го порядка мнимого аргумента. Убедитесь непосредственно, что (6.2.11) удовлетворяет (6.2.1). Запишите также таким способом решение уравнения (6.2.1) с произвольным начальным значе- нием рп (0). Упражнение. Из известных свойств /„ следует асимптотическое выражение для больших / (более точно: /~»ос, п при фиксированном значении п2//); (/) —ехр [- п2/(4/)|. (6.2.12) У 4л1 Выведите этот результат с помощью (6.2.6) и метода перевала. Упражнение. Повторите вычисление, проведенное в тексте, используя G (k, t) вместо F (г, /). Упражнение. Асимметричное случайное блуждание на бесконечной решетке описывается основным кинетическим уравнением + — (аЧ-₽) Рп (« ₽). (6.2.13) Оно описывает диффузию в присутствии внешней силы. Решите это урав- нение с помощью преобразования рп (П ---Чп (0 (₽/а)'!/г ехр [- - (а-(- р — 2}z ар) 11. (Более прямой метод будет следовать из общего рассмотрения в § 6.6.) Найдите <n')t и v<n2;>f Упражнение. Пусть pn(t) — решение уравнения (6.2 1) с начальным значением Рп (0) ~ 6„, т +6,|, _ т _ 1 (т .д-0). Из-за симметрии результирующий поток вероятности между —1 и 0 дол- жен обратиться в нуль. Следовательно, рп (?) ограничена значениями п д. 0 и является случайным блужданием на полубесконечиой области с отражающей границей с уравнением на границе Ра = Р1 — Ра- Упражнение. Пусть Уп— винеровский процесс, Уд, У2.......Уг— случайные блуждания с разными длинами шагов и вероятностями перехода. Пока- жите, что Ко-1-У1--!-УгЧ- •••4-Уг является процессом с независимыми при- ращениями (см. (4.4.7)), и найдите их вероятности перехода. 6.3. ОБЩИЕ СВОЙСТВА ОДНОШАГОВЫХ ПРОЦЕССОВ Можно сильно сократить запись формул, если ввести оператор шага Е, который определим по его действию на произвольную функ- цию /(«): Е/(п)1), = (6.3.1) Если п меняется от —оо до оо, то оператор Е можно рассмат- ривать как настоящий оператор в функциональном пространстве, но в случаях, когда имеются одна или две границы, Е лучше счи- тать простым обозначением для сокращения записи. Большинство 139
его свойств очевидны, но мы, в частности, отметим следующее: 2 Sin) Е/(п) - 2 Цп)Е-^(п) (6.3.2) ;г = 0 п— 1 для любой пары дробных функций /, g. Разные пределы суммиро- вания в двух членах этого выражения создают неудобство, однако, к счастью, на практике эта разница часто оказывается несущест- венной либо потому, что пределы бесконечны (и и (или) g доста- точно быстро обращаются в нуль на бесконечности), либо потому, что недостающие члены можно добавить к сумме, поскольку они итак равны нулю. Например, член сп=О можно прибавить к пра- вой части, когда /’(О)-О или когда g(--l) приписано нулевое зна- чение. С помощью этого символа основное кинетическое уравнение для одношаговых процессов можно записать в виде ----- (Е 1) гпРп (Е -1 - I) SnPn. (6.3.3) Это выражение остается справедливым в граничных точках, если потребовать выполиечия усл< вий (6.1.4) и (6.1.6). В качестве при- мера (6.3.2) вычислим ’ 2 п (Е“!) гпРп Г 2 п (Е-1 — 1) £прп 2Г^(Е~1— + 2^/’и(Е—i)n--=- (6.3.4) Этот результат интуитивно ясен и не отличается от (5.8.3). Примечание. Коэффициенты гп и g„ не могут быть отрицательны, но могут быть равны нулю. Если для некоторого k оба коэффициента и обра- щаются в нуль, то это означает, что переходы между состояниями k — t и k невозможны. Следовательно, процесс распадается на два отдельных процесса Если для некоторого k коэффициенты г % > 0, т0- т0 переходы из k в k—1 возможны, но обратные переходы запрещены. Можно ожидать, что состояния n'^k исчерпаются и что вся вероятность сосредоточится в состояниях п <_ k. Тогда множество состояний п < k является «поглощающим» в смысле, опре- деленном в § 5.2. Действительно, в этом случае для n^k. Случай г*~-0, > 0, естественно, аналогичен данному. Упражнение. Примените эти рассуждения к основному кинетическому уравне- нию для радиоактивного распада и найдите таким способом поглощающее состояние. Упражнение. Напишите правую часть уравнения (6.3.3) в виде W-матрицы. действующей на вектор {р,.}. Покажите, что два случая, выделенные в приведенном выше примечании, соответствуют разложимой и приводимой матрицам перехода. Упражнение. Выведите ~ :'п2)^2 -П (g:l~ ГпУ) + П, . (6.3.5) Упражнение. Найдите дифференциальное уравнение для производящей функ- ции F (г, t), предположив, что гп и gn — многочлены по п. Упражнение. Уравнения (6.3.4) и (6.3.5) для случайного блуждания (симмет- ричного или несимметричного) можно решить. Найдите решения и срав- 140
ните их с соответствующими решениями, полученными в предыдущем параграфе. Упражнение. Найдите также решения уравнений (6.3.4) и (6.3.5) для общего случая линейного одношагового процесса. Почему их нельзя решить в не- линейном случае? Теперь найдем общее выражение для стационарного решения одношагового процесса. Из уравнения (6.3.3) имеем О - (Е - 1) гпр*п -4- (Е-1 —-1) gnps„ = (Е - 1) (г,Л- Е '^.,Н}. В этом уравнении утверждается, что { } не зависит от п: ГпРп - J (6.3.6) Константу мы обозначили —J потому, что она представляет резуль- тирующий поток вероятности из состояния п в состояние п—1. Сначала рассмотрим случай (в), т. е. п = 0, 1, 2, . . ., N. Подстав- ляя в (6.3.6) или (6.1.4), находим, что J = 0. Следовательно, (6.3.6) утверждает, что rnPl~=gn_iPn--i- Применяя это соотношение повторно, приходим к - 2 • • glgo $ Р»" ’ СТ Р»- (6.3.7) (6.3.8) Это определяет все p';t через ps0, которая потом фиксируется усло- вием нормировки: _L 1 V • gn-' (6 3 4) Рп Г1Г.,...ГП ' > Тот же результат (6.3.8) применим также к полубесконечной области /г-6, 1, 2, ... . Для бесконечной в обе стороны области при имеем (6.3.8), а для /г-дСО из (6.3,7) получаем gngri t-1 • • g'-jg-l (6.3.10) Однако в этом случае уже нельзя доказать, что J — 0. Необходимо исключить возможность постоянного потока из — оо в д-оо, как в асимметричном случайном блуждании. Такие решения могли бы описывать, например, диффузию в открытой системе, такую, как диффузия в среде между двумя резервуарами с различными плот- ностями. Стационарное решение уже не единственно и зависит от текущего значения J, которое зависит от дополнительной информа- ции, характеризующей рассматриваемую физическую задачу. Упражнение. Найдите явное выражение для стационарного распределения в случае гп----- an2, ; 1) с постоянным а, р (ср. с § 6.10). Упражнение. Тот же вопрос для rn = an2. gn — ^- 141
Упражнение. Покажите, что общее дается выражением р s । gtt- I ~ ~2 п П Т н | Гп _ ] Г11-}Г 11-2 Упражнение. Результат (6.3.8) молчаливо подразумевает, что все гп отличны от нуля. Обсудите случай, когда z> =-0 для некоторого 1г. Найдите р*п для этого случая. Упражнение. Найдите стационарное распределение для асимметричного слу- чайного обсуждения с отражающей границей, описывающегося для п Д»1 уравнением (6.2.13) с а > р, совместно со специальным граничным уравнением Ро=-«Р1 —РРи- (6.3.11) (Эта модель описывает диффузию тяжелых частиц в гравитационном поле или в центрифуге; ср. с § 8.3.) Упражнение. Два объема Й) и Й2 связаны отверстием. В них находится газ из Л’ невзаимодействующих молекул. Основное кинетическое уравнение для числа п молекул в имеет вид Р„ - а (Е— 1) ripn- (J (Е-1- 1) (Л’—п) р„. (6.3.12} Найдите стационарное распределение. Упражнение. Найдите стационарное распределение для процесса радиоактив кого распада, описывающегося основным кинетическим уравнением (6.1.7). решение уравнения (’б.3.6) с J РО при gr,-ig;,_2. . -gj | ~ Гп_1ГП-2. П ] -4- const {6.3.13) Г пг п-1 ?! п при п < 0. Упражнение. В случае полубескснечного интервала стационарное распределе- ние дается (6.3.3) и (6 3.9) с Л’ —оо. Изучите условия на гп и Йл. при которых (6.3.9) сходится. Найдите примеры, в которых эти условия не выполняются. Каковы физические следствия нарушения сходимости? Предположим, имеется замкнутая изолированная физическая система, неравновесное поведение которой адекватно описывается одношаговы.м основным кинетическим уравнением для одной пере- менной. Тогда, предполагая эту переменную четной функцией, мы знаем, что выполняется соотношение- детального равновесия, кото- рое для одношаговых процессов имеет вид r„Pn^gn-lPn-l- (6.3.14) Это уравнение имеет тот же вид, что и (6.3.7). Конечно, для изо- лированной системы стационарное решение основного кинетического уравнения ps совпадает с термодинамически равновесным распреде- лением ре. Однако для ясного понимания надо отличать логический статуе (6.3.7) от (6.3.14). Уравнение (6.3.7) —это просто основное кинети- ческое уравнение с левой частью, положенной равной нулю; простой вид этого уравнения связан с тем, что его применимость ограничена одношаговыми процессами. Оно не имеет физического смысла и по- этому применимо как к открытым системам, так даже и к нефизи- ческим системам, таким, как популяции. С другой стороны, урав- нение (6.3.14) выражает физический принцип: когда равновесное распределение рс рассматривается как известное из равновесной ста- 142
тистической механики, уравнение устанавливает связь между веро- ятностями перехода гп и gn, которая должна иметь место, если система является замкнутой и изолированной. Упражнение. Примените соотношение детального равновесия к уравнению (6.3.12) и найдите соотношение между а и р. Покажите, что они равны, когда Й!=Й2, и выведите следующее заключение; термодинамика запре- щает существование отверстий, пропускающих в одну сторону, или зер- кал, с одной стороны отражающих частицы, а с другой—пропускающих их. Упражнение. Пусть и Л' в предыдущей модели стремятся к бесконечности при конечном значении плотности У/Йг —р. Запишите основное кинети- ческое уравнение и покажите, что стационарное решение является рас- пределением Пуассона. (Можно ли было бы это узнать a priori?) О чем нам говорит соотношение детального равновесия в этом случае? Упражнение. Для одношагового процесса W является тридиагональной матри- цей. С помощью (6.3.8) можно построить аналогичное преобразование, которое делает матрицу симметричной, как в (5.6.15). Докажите таким способом, что любой конечный одношаговый процесс имеет полную систему собственных функций и что его автокорреляционная функция состоит из суммы экспонент *. Упражнение. Отсюда можно вывести заключение, что никакие два собственных значения не совпадают. Указание Последовательно решая уравнения для собственного вектора, покажите, что любому собственному значению соответствует единственный собственный вектор. 6.4. ПРИМЕРЫ ЛИНЕЙНЫХ ОДНОШАГОВЫХ ПРОЦЕССОВ Эти процессы были определены в § 6.1 как одношаговые про- цессы, в которых г„ и --линейные функции п в случае, если они не равны константе одновременно. При этом должна быть одна граница, чтобы предотвратить появление отрицательных вероятно- стей перехода. Некоторые примеры мы уже сосчитали: процесс рас- пада в § 4.6 и флуктуации плотности газа в упражнении из преды- дущего параграфа. Здесь мы перечислим еще несколько примеров, предоставляя читателю возможность разобраться в деталях в качестве самостоятельного упражнения, даже если они не указаны формально как упражнения. 1. Квантованный гармонический осциллятор, взаимодействующий с полем излучения. Пусть п~=0, 1, 2, ... — состояния осциллятора, обладающие энергией /iv(n 4-1/2). Вероятности перехода пропор- циональны матричным элементам дипольного момента, которые равны нулю всегда, за исключением переходов между соседними состоя- ниями; следовательно, это одношаговый процесс. Матричный элемент перехода между состояниями п—1 и п пропорционален п. Вероят- ность скачка за единичное время из л—1 в п есть gn-i = fin, где р — множитель, который зависит от плотности излучения р с часто- той v, но не зависит от п. Вероятность скачка из п в п—1 есть * Подробнее по поводу общих теорем, касающихся тридиагональных матриц, см.: L. Н. Wilkinson, The Algebraic Eigenvalue Problem (Clarendon, Oxford, 1965), p. 335 f. 143
r(n) = an с аналогичным множителем а. Основное кинетическое уравнение имеет вид р„ = а(Е — 1)пРи + р(Е-1— 1)(п+ 1)Р„- (6.4.1) Стационарное решение имеет вид распределения Паскаля р’= const (Р/а)п. (6.4.2) Пусть полная система, состоящая из гармонического осцилля- тора плюс поле излучения, приходит в равновесие. Тогда из равно- весной статистической механики известно, что p.e - const ехр | — -^j. (6.4.3) Поскольку это выражение должно совпадать с (6.4.2), имеем 1=ехр[~ irj- <6-4-4) Но существует возможность продвинуться дальше. Поскольку gn должно быть пропорционально плотности р имеющихся фотонов, можно написать p-Лр, где Л может зависеть от v, но не от р. Поскольку излучение является спонтанным и стимулированным, можно записать а^- В + Ср. Подстановка в (6.4.4) дает В A^vl(kT)_c- Это знаменитый эйнштейновский вывод закона Планка; для того, чтобы завершить его, надо принять во внимание, что при больших Т распределение должно совпадать с законом Рэлея — Джинса *. 2. Усиление в мазерах **. Пусть п — число квантов в данной моде электромагнитного поля в объеме, содержащем возбужденные атомы или молекулы. Кванты уходят из системы сквозь стенки со ско- ростью гпап, но и возникают за счет стимулированного излуче- ния и прямой накачки gn = fin + у. Из (6.3.4) следует, что <п(/)> возрастает при р > а экспоненциально, а при р < а стремится к Таким образом, в стационарном состоянии накрчка у усиливается множителем (а — р)~]. Из (6.3.5) для флуктуации в стационарном состоянии находим * A. Einstein, Physik. Zeits., 18, 121 (1917). ** К. Shimoda, H. Takahashi, and С. H. Townes, J. Phys. Soc. Japan, 12, 686 (1957). 144
Само стационарное распределение является отрицательным бино- миальным или распределением Поля. Термодинамически равновес- ное распределение ре не реализуется, поскольку система подвержена постоянной накачке. 3. Поглощение. Большой резервуар содержит газ, состоящий из молекул с практически постоянной плотностью р. Молекулы могут поглощаться на небольшой поверхности, имеющей N поглощающих участков. Если п — число поглощенных молекул, легко видеть, что r„ = an, = — п). Основное кинетическое уравнение оказы- вается таким же, как (6.3.12). Значит, читатель уже знает, что стационарное решение является биномиальным распределением: Рп = const(„)(«) (6.4.5) Из сравнения (6.4.5) с распределением р*п, заданным равновесной статистической механикой, следует 1 - р---------— , (6.4.6) а И (2лтйТ)3/2 ' ’ где £—внутренняя функция распределения поглощенной молекулы. 4. Химические реакции приводят к большому разнообразию ос- новных кинетических уравнений, большая часть которых нелинейна. Общее рассмотрение дано в гл. 7. Здесь же мы возьмем простую схему реакции k А^Х. (6.4.7) Здесь предполагается, что вещества А настолько много, что его количество пд практически постоянно. Пусть п — число молекул вещества X. Это число за единичное время с вероятностью gn = knA увеличивается на единицу и с вероятностью rn = k'n уменьшается на единицу (k, k' — константы реакции): рп = k’ (£—l)npa + knA(Е-1 — 1) рп. (6.4.8) Стационарное решение является распределением Пуассона. Причина заключается в том, что молекулы X возникают и аннигилируют независимо друг от друга. В схеме реакции, в которой несколько молекул X реагируют совместно, они уже не являются независи- мыми и функция распределения отклоняется от пуассоновской (см. § 7.3). 5. Рост популяции. Пусть п — число индивидуумов в популяции определенного типа, такого, как бактерии. Каждый индивидуум за единичное время с вероятностью а может умереть, а с вероят- ностью Р — породить добавочную особь, а и Р считают фиксирован- ными и независимыми от возраста индивидуума, иначе процесс не был бы марковским. Тогда г„ = ап и grn = P«. Согласно (6.3.4), 145
имеем уравнение -^-<п> = (Р — а)<п>, которое выражает закон Мальтуса экспоненциального роста (при Р > а). Согласно (6.3.5), дисперсия удовлетворяет уравнению ^ = 2(Р-а)о2 + Ф-г-а)<п> (6.4.9) и, следовательно, также возрастает экспоненциально. Отметим, что наблюдение <п> определяет только значение 0 — а, а наблюдение отклонений от среднего дает f)-l а. 6. Каскады космических лучей. Когда электроны космического излучения попадают в поглощающий материал (например, свинец), вследствие тормозного излучения, сопровождающегося рождением пар, возникают дополнительные электроны. Пусть t — поперечная толщина, п — число электронов (положительно и отрицательно за- ряженных). Баба и Гейтлер * описывали этот каскад с помощью одношагового процесса с r„ = 0, g„ = p. Основное кинетическое урав- нение совпадает с (6.1.8), но начальное значение р„(0) = 6„,,, так что АЛО—JSJe-^ (п= 1,2,3, ...). Средний квадрат флуктуаций <п> — 1, что меньше наблюдаемого. Фурри** улучшил модель, взяв /„ — О, и нашел р„(0 = е-^(1—e-v<)"-i. Это распределение Паскаля с <п>==е‘>’< и дисперсией сг„(О -- —1). Причина, по которой флуктуации столь велики, состоит в том, что каскадный процесс не только увеличивает среднее число электронов, но увеличивает также флуктуации относительно этого среднего. В более поздних работах учитываются также погло- щение электронов, их распределение по различным энергиям и фо- тоны как самостоятельная сущность***. Упражнение. Полагая, что гармонический осциллятор (см. п. 1) стартует из состояния п0, найдите <п> и Он как функции t и убедитесь, что они стре- мятся к своим равновесным значениям. Упражнение. Запишите основное кинетическое уравнение для примера в п. 2 и используйте его для нахождения <п> и как функций t. Упражнение. Вычислите распределение р„ для примера в п. 3 с помощью ста- тистической механики и покажите, что оно имеет вид (6.4.5) совместно с (6.4.6). * Н. J. Bhabha and W. Heitler, Proc. Roy. Soc., A 159, 432 (1937). ** W. H. Furry, Phys. Rev., 52, 569 (1937). Этот процесс получил назва- ние процесса Фурри. *** [3] On the Theory of Stochastic Processes and their Application to the Theory of Cosmic Radiation (Wiley, New York, 1943); J. Nishimura in: Encyc- lopedia of Physics, 46/2 (S. Flugge ed., Springer. Berlin, 1967). 146
Упражнение. Запишите основное кинетическое уравнение для автокаталити- ческой реакции А + Х~^2Х, где обратной реакцией пренебрегаем. Обсудите следствия. Упражнение. В примере п. 5 возьмите р < а и найдите стационарное распре- деление. Упражнение. Запишите основное кинетическое уравнение для модели Фурри каскадов космических лучей. Обратите внимание, оно отличается от модели роста популяции, что дает то же уравнение для <п>, но другое для <п2>. Упражнение. Улам рассмотрел одномерное движе- ние одной частицы, которая отскакивает впе- ред и назад между двумя стенками, одна из которых фиксирована, а другая осциллирует со скоростью ± 1/2 (рис. 12). Скорость (ее мо- дуль) v частицы изменяется на г>-|-1 при ло- бовом столкновении и на v—1, когда частица догоняет удаляющуюся стенку. Гамерслей заме- нил эту динамическую задачу на стохастиче- скую путем введения следующего аизаца (Stosszablansatz), который физически разумен, когда фиксированная стенка находится далеко, ио обходит реальную проблему: как стохасти- ческие аспекты возникают из лежащей в их основе детерминистической динамики? Вероят- ность того, что столкновение произойдет за время At, равна odr, и отношение встречных столкновений к столкновениям, в которых ча- стица догоняет стенку, есть |ЛС|/|ВС| = =(^+х/2)/(^—1/з)- Далее, начальное значение v берется равным 1/2, так что единственно возможными значениями для v являются 1/2-)- + п (где n = 0, 1, 2, ...). Покажите, что осно- вное кинетическое уравнение имеет вид (6.4.1) с = 1/2. Покажите, что средняя ско- Рис. 12. Отскакивающая частица в модели Гамер- елея рость неограниченно возрастает и ее флуктуации нарастают с равной бы- стротой *. 6.5. ЕСТЕСТВЕННЫЕ ГРАНИЧНЫЕ УСЛОВИЯ В примерах предыдущего параграфа и в большинстве других приложений коэффициенты гп и gn представляют собой не наборы чисел, а задаются довольно простыми аналитическими функциями г(п), £<„>, зависящими от переменной п. Если бы это было не так, то не было бы никакой надежды найти явные решения, кроме случая, когда число состояний очень мало. Однако это также предполагает, что специальные уравнения (6.1.3) и (6.1.5) на границах должны восприниматься совершенно серьезно и их нельзя включить в общее уравнение с помощью простого приема, описанного в (6.1.4) и (6.1.6), не нарушив аналитического характера. Следовательно, когда имеются * Статьи Улама и Гамерслея опубликованы в кн.: Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, Vol. Ill (J. Neyman ed., University of California Press, Berkeley 1961). 147
две границы, основное кинетическое уравнение необходимо запи- сывать в виде трех отдельных уравнений: рп — г(п-\- l)p„+1+g(n— — {r(n) + g(n)} рп (6.5.1) для п=1, 2, ..., N — 1 и Л = г(1)Р1—g(O)po, (6.5.2) PN^g(N— Oftv-i-r(M)pN. (6.5.3) Замечание. Может случиться так, что влияние границ распространяется на несколько дополнительных уравнений. Примером служит модель диффу- зионно контролируемой химической реакции в § 6.7. Кроме того, следует отметить, что могут встречаться «примеси», т. е. внутренние участки, на кото- рых гп и gn могут отклоняться от значения, задаваемого аналитическим выражением, использованным в (6.5.1). Тогда уравнения для рп для двух или большего количества внутренних участков должны записываться отдельно. На некоторое время мы исключим такие усложнения. Однако существует специальный тип границы, для которого этот исключительный характер может быть сделан безвредным. Рассмот- рим класс б) в § 6.1, т. е. п = 0, 1, 2, ... . Мы будем называть границу /г = 0 «естественной», если: 1) общее уравнение (6.5.1) справедливо вплоть до n— 1, так что имеется одно уравнение (6.5.2) на границе; * 2) кроме того, г(0) = 0. В этом случае можно использовать следующий прием. Объявляем, что уравнение (6.5.1) справедливо при всех п от —оо до +°о, но будем рассматривать только такие решения этого урав- нения, у которых начальные значения р„(0) равны нулю при п < 0. Понятно, что если рп (t) при п < 0, то оно останется нулем при всех t > 0, потому что условие / (0) = 0 гарантирует отсутствие переходов из состояния 0 в состояние —1. Следовательно, общее уравнение (6.5.1) сводится к (6.5,2) при /г = 0. Тогда граничное условие просто ограничивает возможный выбор начальных условий. Но оно уже больше не появляется в самом уравнении, что очень сильно облегчает его решение. Причина, по которой границы в физических задачах часто ока- зываются естественными, становится понятной, если рассмотреть простой пример радиоактивного распада из § 4.6. Вероятность того, что произойдет испускание, пропорциональна числу п радиоактивных ядер и, следовательно, автоматически обращается в нуль при /г = 0. Это же справедливо, когда п — число молекул определенного сорта в химической реакции или число индивидуумов в популяции. Всегда, когда п по своей природе не может стать отрицательным, для любого разумного основного кинетического уравнения должно выполняться г (0) = 0. Однако это не исключает возможности того, что при малых п происходит что-нибудь особенное, нарушающее аналитический характер г (/г), как это имеет место в примере с диф- фузионно контролируемыми реакциями. Границу, которая не яв- ляется естественной, мы будем называть искусственной (см. § 6.7). 148
Упражнение. Покажите, что коэффициенты в уравнении (6.5.2) и (6.5.3) нельзя изменить, не нарушив закон сохранения вероятности. Упражнение. Предположим, что граница при п = 0 такова, что требует двух дополнительных уравнений для ра и рг. Сколько дополнительных коэффи- циентов появится, если вероятность должна сохраняться? Что произойдет в случае для k добавочных уравнений? Упражнение. При каких условиях верхняя граница при n — N будет естест- венной? Упражнение. Убедитесь в том, что все границы в § 6.4 являются естественными, а граница, заданнная (6.3.11),— нет. Упражнение. Используя (6.3.4), докажите, что для задач, связанных с линей- ными одношаговыми процессами, естественная граница обладает тем свой- ством, что <п> не может пересечь ее. 6.6. ЛИНЕЙНЫЙ ОДНОШАГОВЫЙ ПРОЦЕСС С ЕСТЕСТВЕННЫМИ ГРАНИЧНЫМИ УСЛОВИЯМИ Уравнение, которое нужно решать, можно записать в виде р„ = а(Е — l)(r±n)pn + b(E-1— 1)(^-т-п)р„, (6.6.1) с постоянными a, b, г, g. Сначала мы не будем обращать внимания на границы и рассмотрим его как разностное уравнение для — оо < п < оо с начальным условием = Далее мы поло- жим а =^= О, b Ф 0, а^=Ь. Из общего решения, найденного таким путем, можно получить различные частные случаи, подставляя частные значения или переходя к соответствующим пределам. Опять используем производящую функцию вероятности (6.2.3). Умножим (6.6.1) на г" и просуммируем по всем п, в результате получим °- = а У (г"~1 - zn)(r + n) + b У (г" +1 - г" (g + п)рп = = аг I F + a(l~z)-^- + bg(z — l)F + b(z2-z)^ = = (l-z)(a^ta)^- + (l-z)(^-^)F. (6.6.2) Это линейное дифференциальное уравнение для F можно решить, воспользовавшись стандартным методом характеристик*. Характе- ристические кривые в (z, /)-плоскости определяются соотношением а 4 dz " (1-г) (а-Ьг)' Уравнения для кривых получим, проинтегрировав это соотно- шение (рис. 13): 2z_£_e<6-o)z = C, а — Ьг * I. N. Sneddon, Elements of Partial Differential Equations (McGraw-Hill, New York, 1957), Ch. 2. 149
Рис. 13. Характеристические кри- вые уравнения (6.6.2) для а=1, 6 — — 1 где С—постоянная интегрирования, с помощью которой различаются ха- рактеристические кривые. Изменение F вдоль каждой отдельной харак- теристической кривой определяется соотношением dz ___ d log F a—bz ar/z— bg ’ которое дает F(z, t) — z~r(a—bz)r~&-const. Константу можно выбирать по-раз- ному для каждой характеристики, и поэтому она является произвольной функцией Й(С). Тогда общее реше- ние уравнения (6.6.2) принимает вид F(z, t) = z~r(a—bz)r~sQx х f ——. (6.6.3) \ а — bz } ' ' Определим теперь эту функцию Q таким образом, чтобы удовлет- ворить начальному условию рп(0) = 6пта. Запишем это начальное условие в терминах F: F(z, ty = zm. Подстановка в (6.6.3) дает Q ( = zm+r(a—bzy~r. Временно введем переменную £, определив ее соотношениями г !—2 7__ “С—1 a—bz ’ b'Q- 1 ’ Тогда наше уравнение для Й дает \т + г (‘Ь—а \&-г Подставляя это выражение для й в (6.6.3), окончательно приходим к г/, а Гав-6Ч-а(1-е)г-1 |m>rra~te.-Z>(l-8)zl-m-g g ’ j a—b J [ a—b J ’ ' ’ ’ 1 где e = e<b-a)f. Упражнение. Получите основное кинетическое уравнение для случайного блуж- дания как предельный случай (6.6.1) и найдите таким способом (6.2.9). Упражнение. Убедитесь в том, что F (1, t)= 1, и найдите первые два момента п как функции t. Проверьте, что они удовлетворяют уравнениям (6.3.4.) и (6.3.5). 150
Упражнение. Если в (6.6.1) подставить п~— п.', то получится другое основное кинетическое уравнение того же типа. Каковы коэффициенты a', b', г', g этого нового уравнения? Покажите, что полубесконечную область возмож ных значений, простирающуюся до —оо, всегда можно преобразовать в область (0, оо). Как уже упоминалось раньше, должна быть по крайней мере одна граница, чтобы предотвратить появление отрицательных зна- чений для г„ или gn. Без потери общности в качестве такой границы можно выбрать нижнюю границу при д = 0. Тогда (6.6.4) имеет смысл только при т^О. Однако необходимо также, чтобы это выражение не содержало отрицательных степеней z, иначе оно ока- жется просто решением дифференциального уравнения (6.6.1) без границ и не будет являться решением настоящего основного кине- тического уравнения с границей. Это условие удовлетворяется, если г = 0, т. е., чтобы наше решение работало, необходимо, чтобы гра- ница была естественной. Тогда F можно записать в виде F(z, t) (a—Ь)г[а'(1—е)-|-(ае—b)z]m(a — be— b(l—b)z)~'”_< (6.6.5 Дальше необходимо выделить несколько случаев. Во-первых, предположим, что область возможных значений — это (0, сю). Тогда g„ = b(n + gr) должна быть неотрицательной при всех п^О, что предполагает: либо b > О, g^O, (6.6.6) либо b = 0, bg = P^O. (6.6.7) В первом случае (6.6.5) применимо, как оно есть, а в последнем случае нужно взять предел b ^0 при bg = fi. В результате получим F(z, t) = [1 — в 4- вг]“ exp | — (1 —е)(1 —z) j, (6.6.8) где е — e~at. Во-вторых, пусть область возможных значений конечна: О^/г^ЛТ Тогда допустимы обе возможности (6.6.6), (6.6.7) и еще b<0, g^ — N. (6.6.9) Для того чтобы функция (6.6.5) была решением, она должна быть многочленом по z степени N для каждого m = 0, 1, 2, ..., N. Тогда —g — N, так что gn = b' (N — п) для Ь' =— Ь>0. Значит, верхняя граница должна также быть естественной, и F принимает вид F(z, t) = (а4- b')~N[a(l —в)4- (ав-ь b') г]т х X [a4-b'84-b' (1—b)z]jV~'”, (6.6.10) где в = ехр[— (a + b')f\. Систематизируем различные случаи, для которых мы нашли решение, выписав их в виде итоговой таблицы: 1) область (—сю, оо) с постоянными коэффициентами (случайное блуждание); 151
2) область (0, оо) с естественной границей; следовательно, гп — апг тогда как gn дается либо выражением (6.6.6), либо выраже- ниями (6.6.7); 3) область (О, V) с двумя естественными границами г„ = ап и gn = b'(N—п); 4) исключительный случай, упомянутый в следующем упраж- нении. Упражнение. Условие г = 0 не единственный способ избежать появления отри- цательных степеней в (6.6.5); можно потребовать а = 0. Обсудите этот случай. Упражнение. Покажите, что все примеры § 6.4 относятся к п. 1—4, выписан- ным в итоговой таблице, и решите основные кинетические уравнения. Упражнение. Для примера 5 § 6.4 покажите, что Г а—ае-(₽-“м Ро (О = ------• I Р—ае_<Р"“’* J Докажите, что имеется положительная вероятность этого, что популяция вымрет на ранней стадии и никогда не увеличится. Отсюда следует, что о2 должна быть по крайней мере порядка <н>2. Упражнение. Для п. 2 из итоговой таблицы положите а > b и перейтите к пре- делу F (г, оо). Что произойдет при b > а? Упражнение. Предельный случай в п. 2 получается при а—Ь. Покажите, что это приводит к F (г, /) = |а/-|-(1 —at) z]m [ 1 -)-at—atz]~m~g. Изучите соответствующее основное кинетическое уравнение и его явное решение рп (<)• Упражнение. Найдите равновесное распределение для п. 3. Упражнение. Долгоживущее радиоактивное вещество А распадается в В через два промежуточных короткоживущих изотопа: А -> X -> Y -+ В. Если ко- личество вещества А полагается постоянным, то совместное распределение чисел п, т ядер X, Y подчиняется основному кинетическому уравнению для двух переменных. Рпт — & (Ец - 1) Рпт + Р (Ега 0 ^Рпт'Х (Еп Ещ 1) Яр пт' где Ел. Ега—операторы шага для п, т соответственно. Решите это урав- нение с начальным условием рпт (0) — 6П, о6м,о и покажите, что по про- шествии достаточно большого времени рг,т представляет собой произве- дение двух распределений Пуассона. Упражнение. В качестве обобщения предыдущего упражнения рассмотрите цепочку химических реакций, включающую г переменных: 3 V1 ?! Тг-1 В— Ль X! —Х2, Х'2 - Х'з. .... Xr_,------->ХГ, а, «г «Г-1 “г Xi - - Alt Х2 — А2, .... Xr_j---► ХЛ -ЛГ. Покажите, что основное кинетическое уравнение можно в принципе ре- шить с помощью производящей функции, зависящей от г переменных. В частности, докажите, что все решения стремятся к стационарному сов- местному распределению Пуассона *. * Эта схема была использована Тукером как модель образования опухоли (карциномогенеза). 152
6.7. ИСКУССТВЕННЫЕ ГРАНИЧНЫЕ УСЛОВИЯ Мы определим их как границы, на которых вероятность запол- нения одного или большего числа участков подчиняется специаль- ным уравнениям и- не описывается теми аналитическими выраже- ниями г(п) и g(n), которые применяются при других п. Многооб- разие возможных искусственных границ, конечно же, безгранично. Можно выделить класс резких границ, определенный таким образом, что к нему относятся такие границы, у которых специальные урав- нения пишутся только для концевых участков. Другой ограничен- ный класс составляют отражающие границы, и к нему относятся такие границы, которые сохраняют полную вероятность; поглощаю- щими границами являются такие, на которых вероятность обра- щается в нуль. Последнее определение нуждается в пояснении. В качестве примера рассмотрим систему уравнений для рп с п = 0, 1, 2, . . .: Рп--Pn+i + Pn-i — 2Рп (п--1, 2, ...); (6.7.1а) —2/?„. (6.7.16) Участок л = 0 является резкой искусственной границей. Эти урав- нения можно интерпретировать как случайное блуждание на — оо < п -'Zoo, в котором переходы из —1 в 0 невозможны: прогулка пьяницы по лужайке с бездонной ямой на одном краю. Полная ве- роятность не сохраняется: X (6-7.2) п = 0 Читателя, шокированного еретическим утверждением, что распре- деление вероятности не нормировано на единицу, можно успокоить двумя способами. Во-первых, можно интерпретировать рп как плот- ность ансамбля независимых частиц, каждая из которых совершает случайное блуждание, пока не свалится в яму навсегда. Тогда не- сохранение (6.7.2) просто означает, что полное число оставшихся частиц уменьшается. Другой способ состоит в том, что всегда можно свести дополнительное состояние, которое мы будем называть поту- сторонним (или лимбо-состоянием) и помечать звездочкой. Вероят- ность р* находиться в этом состоянии по определению составляет = 1 —(6.7.3) п — 0 и (6.7.2) удовлетворяет А = А>. (6.7.4) Система уравнений (6.7.1), дополненная (6.7.4), дает вклад в ос- новное кинетическое уравнение на расширенном пространстве состоя- ний п = «, 0, 1, 2, ..., причем это уравнение сохраняет должным образом выбранную вероятность. Его W-матрица обладает лимбо-со- 153
стоянием * как поглощающим состоянием—в нашем случае без- донной ямой. Введение лимбо-состояния является чисто формальным приемом, потому что система (6.7.1) сама по себе является замкнутой системой уравнений для величины рп (п = 0, 1, 2, .. .). Поэтому мы все равно будем называть ее основным кинетическим уравнением, несмотря на то что ее матрица не является W-матрицей. Решив ее, можно потом определить /?»(/), использовав (6.7.3) или (6.7.4). Отме- тим, что среднее время, которое блуждающая частица проживет перед тем, как попадет в лимбо-состояние, дается выражением » X “ <с » 5 = — 2 \tpndt= s (6.7.5) 0 "=°0 n=00 Среднее берется по ансамблю независимых блуждающих частиц. Перечислим теперь некоторые примеры искусственных границ. Один пример с резкой отражающей границей был сосчитан в (6.3.11). Рис. 14. Случайные блуждания с поглощающей границей 1. Летучий газ растворен в инертном растворителе. Молекулы газа диффундируют, пока не достигнут поверхности и не испарятся. Заменяя диффузию каждой молекулы одномерным случайным блуж- данием, получаем систему уравнений (рис. 14) = 2р„ (n= 1, 2, . ..); (6.7.6а) Po^Pi—(1 +с)р,>. (6.7.66) На граничном участке п = 0 молекула имеет нормальную вероят- ность за единичное время вернуться на участок 1, но также веро- ятность с испариться за то же время. Это резкая поглощающая граница (когда с > 0). Лимбо-состояние представляют испарившиеся молекулы. При с = 0 граница является отражающей. Для с—1 получаем (6.7.16) как частный случай, отличающийся тем, что вероятность шага в лимбо-состоянии та же самая, что и для других шагов в левую сторону. Этот частный случай резкой поглощающей границы будем называть полностью поглощающей границей. Он особенно важен в связи с проблемой первого прохож- дения (см. § 6.10), но это отнюдь не означает, что он является единственно возможным случаем поглощающей границы. 154
2. Диффузионно контролируемая химическая реакция*. Моле- кула А блуждает в растворе, пока не встретится с определенной молекулой В, с которой она может образовать связанное состояние, а молекула АВ, естественно, может снова диссоциировать. Эту кар- тину можно схематически представить как случайное блуждание на полурешетке п = 0, 1, 2, . .., где п = 0 представляет связанное состояние. Основное кинетическое уравнение в этом случае имеет вид pn=^Pn+i + pn-i— 2рп (п 2, 3, ...), (6.7.7а) Pi = Р2 + УРи~ 2pi, (6.7.76) —YPu- (6.7.7в) Это пример нерезкой отражающей границы. Стационарное решение имеет вид Рп — 7Рв (Для п>1), где р0 — произвольный множитель, который нельзя найти из основ- ного кинетического уравнения (6.7.7), но который можно использо- вать для нормировки распределений. Однако ясно, что его нельзя нормировать как распределение вероятности, поскольку ^Рп^00- Физическая причина этого, конечно, состоит в том, что молекула А блуждает в бесконечном пространстве. Чтобы исправить его, нужно ввести газ, состоящий из независимых молекул А с определенной плотностью р. Или, более точно, р—это среднее число молекул А на достаточно удаленном участке п 1. Эта ситуация соответствует нормировке ур„ = р. Теперь можно применить соотношение деталь- ного равновесия (5.4.2). В результате получим уро = Р1, у = ре-х/(*г), (6.7.8) где х—энергия связи. Отметим, что для у = 0 уравнения (6.7.7) сводятся к (6.7.1): бесконечная энергия связи превращает связан- ное состояние в поглощающую границу. 3. В знак уважения к тому факту, что искусственные границы очень распространены в теории массового обслуживания, мы вклю- чили один пример такого типа, несмотря на то что он далеко вы- ходит за пределы темы, указанной в названии настоящей книги **. В телефонной сети одновременно может поддерживаться N связей; число связей в любой момент времени есть п = 0, 1,2, . . ., N. Связи устанавливаются в случайные моменты времени до тех пор, пока * А. М. North. The Collision Theory of Chemical Reactions in Liquids (Meth- uen, London, 1964). ** D. R. Cox and W. L. Smith, Queues (Methuen, London and Wiley, New York, 1961); J. W. Cohen, The Single Server Queue (North-Holland, Amster- dam, 1969). 155-
телефонная сеть способна поддерживать их: gn = const = P для n = 0, 1, 2, .V—1; ^л- = 0. Уже установленная связь прерывается в случайный момент времени г„ = а/г. (Это довольно нереалистическое положение необходимо для того, чтобы выполнялось свойство марковости.) Основное кинети- ческое уравнение имеет вид 0ро, (6.7.9а) рй^а(п4-1)р„+1+₽р„_1 —(а/г + Р)р„ (п=1, 2, .. .,Л'—1), (6.7.96) Pn = $Pn-i—<*NpN. (6.7.9в) Здесь при п = 0 имеет место естественная граница, а при n = N — искусственная резкая отражающая граница. Упражнение. В процессе радиоактивного распада состояние п = 0 является поглощающим. Покажите, что уравнения для остальных рп (я=1, 2, ...) составляют основное кинетическое уравнение с поглощающей границей. Состояние п = 0 играет роль лимбо-состояния. Упражнение. Для того же самого процесса распада покажите, что для любого N 1 состояния п - N удовлетворяют некоторому основному кинетиче- скому уравнению с поглощающей границей. Его лимбо-состояние состоит из всех состояний с п < N. Упражнение. Сосуд содержит газ неустойчивых молекул, диссоциация которых описывается процессами распада. В случайные моменты времени добавоч- ные молекулы попадают в сосуд или рождаются в нем. Основное кинети- ческое уравнение имеет вид рп = (Е — 1)прп + а(Е~1 — Г) рп (п-=1, 2, ...), (6.7.10а) Ро = Р1~ Wo- (6.7.106) Является эта граница естественной или искусственной? Упражнение. Для одношагового процесса в общем виде (6.5.1) покажите, что информация «п --0 является резкой поглощающей границей» определяет уравнение для р0 с точностью до одной положительной константы, как в (6.7.66). Упражнение. Для неограниченного симметричного случайного блуждания явное решение граничной задачи с поглощающими границами можно получить с помощью принципа отражения. Решите основное кинетическое уравне- ние с начальным условием рп (0) = 6пга—- 6„, _,л. Решение pn(t) для п > 0 удовлетворяет Рп = Рги-1 + Рп-1 — %Рп (п> 1), (6.7.11а) Р1 = Рг —2pi. (6.7.116) Это основное кинетическое уравнение для случайного блуждания с погло' щающей границей при п=(). Упражнение. Решите тем же методом основное кинетическое уравнение Р» = Р« + 1 + Рп_!— 2рп (п > 1). (6.7.12а) Р1 = Р-2 + 2р0 —2pi, (6.7.126) Ро = Р1 —2р0, (6.7.12b). которое описывает случайное блуждание с нерезкой отражающей границей * * По поводу более сложных приложений принципа отражения см.: М. Schwarz and D. Poland, J. Chem. Phys., 63, 557 (1975). 156
Упражнение. Решите основное кинетическое уравнение с резкой отражающей границей Рп^= Pn + i+Pn-1 — 2рп (п > 0), (6.7.13а) Ро=Р1 — Ро- (6.7.136) 6.8. ИСКУССТВЕННЫЕ ГРАНИЧНЫЕ УСЛОВИЯ И НОРМАЛЬНЫЕ МОДЫ Только некоторые задачи с искусственными границами можно рассматривать с помощью принципа отражения. В этом параграфе мы изложим метод нормальных мод, который в принципе пригоден для задач с искусственными границами всех типов. Вместо того чтобы развивать этот метод во всей полноте, мы продемонстрируем его на примере 2 из § 6.7 — на модели диффузионно контролируе- мых химических реакций. Для того чтобы решить систему уравне- ний (6.7.7), сначала нужно найти нормальные моды. Зная из § 5.7, что собственные значения действительны и неположительны, положим Pn(f)=^vne-Xt. Величина ф„ должна быть собственным вектором основного ки- нетического уравнения (6.7.7); значит, (2 —Х)срп = <р„Ь1 + ф„_1 (ц = 2, 3, ...), (6.8.1а) (2 — А,)Ф1 = Ф2 + уф0, (6.8.16) (у—Х)фп = <Р1. (6.8.1b) Первая строка представляет собой разностное уравнение с постоян- ными коэффициентами, которое можно решить стандартным способом (аналогичным введению плоских волн в дифференциальных уравне- ниях) с помощью анзаца фп = гп, где г находится из решения сле- дующего уравнения: 2-Х = ?+1/г. (6.8.2) Это уравнение имеет два решения z1T z2 при 1. Следовательно, (рп = С,г"-1-С22'‘. (6.8.3) Для того чтобы уравнение (6.8.1а) удовлетворялось при всех указанных п, это выражение для <р„ должно быть справедливым для всех <р„, т. е. для п=1, 2, 3, ... . Оставшаяся величина ф0 и кон- станты С2 подбирают так, чтобы удовлетворить двум другим уравнениям: (2-А) (СА + С2г2) = Ctzf + C2z~ + уФо, (6.8.4а) (у—X)(p0 = C1zI + C2z2. (6.8.46) Исключая ф0 и используя (6.8.2), получаем __£i__ Zi4~ (1 — у) z2-}-у—2 z2+(l — y)zi + y—2 157
Ограничения на допустимые значения X получим, изучая пове- дение фи при больших п. Если два корня уравнения (6.8.2) дейст- вительны, то по крайней мере один из них должен иметь абсолют- ное значение, много большее единицы (исключая частные случаи Zi==z2 = ±l, описанные в следующем параграфе). Тогда (6.8.3) экс- поненциально возрастает при больших п. Физически это означает, что плотность молекул А экспоненциально возрастает, что, вообще говоря, не запрещено, но не имеет отношения к диффузионно конт- ролируемым химическим реакциям. Математическая причина для отбрасывания таких решений состоит в том, что оставшиеся решения образуют полную систему, т. е. их достаточно, чтобы воспроизвести любое начальное состояние, которым мы будем интересоваться. Соответственно будем рассматривать только такие значения X, для которых корни уравнения (6.8.2) комплексны. Поскольку они должны лежать на единичной окружности, можно положить г! = еы, z2 = e"i,?, (6.8.5) Следовательно, Х- 2—2cos q = 4 sin’z(]/4*?). (6.8.6) Величина X является действительной и 0^Х<74. Далее, отношение £1 = _ 2 — 2 cos g — у + уе-!1? g g 7 Сг 2 — 2 cos q — у + уе’’ по модулю равно единице и поэтому его можно записать в виде e2ir> с действительной функцией ц (<у). Подстановка в (6.8.3) дает ф)? ’ = С cos [qn + т] (7)] (n—1, 2, 3, ...). (6.8.8) Это плоская волна со сдвигом фазы ц, определяемым границей. Остальные компоненты для п —0 получаются из (6.8.1в): „(?> - _ С C°S *1" 2 — 2 cos q— у (6.8.9) Резюме: для каждого q в интервале (6.8.5) мы нашли одну соб- ственную функцию. Ее компоненты при п>0 даются выражением (6.8.8), а компонента для — выражением (6.8.9). Естественно, они определены с точностью до постоянного множителя С. Связан- ное с ними собственное значение определяется формулой (6.8.6). Упражнение. Среди найденных здесь решений нет стационарного решения, упомянутого в § 6.7, хотя очевидно, что оно удовлетворяет (6.8.1). Где оно было потеряно? Упражнение. Проверьте, что нули знаменателя в выражении (6.8.9) сокраща- ются с нулями числителя. Выведите альтернативное выражение С <Ро?,= J cos9- Упражнение. Величина t) определена с точностью до прибавления числа, крат- ного л. Покажите, что значение ц можно сделать единственным, выбирая (6.8.10) 158
т|(0) =0 и делая аналитическое продолжение. Покажите, что аналитичес- кая функция т] (?), полученная таким путем, является нечетной: П (—?) = — »)(<?)• (6.8.11) Упражнение. Покажите, что функция S (9) = e2IT,(<z\ определенная соотноше- нием (6.8.7), обладает следующими свойствами, перекликающимися со свойствами S-матрицы *: 1) S (q)* = S (q)~l = S (—а) для всех действительных q; 2) S (9) голоморфна в верхней полуплоскости и стремится к конечному зна- чению в пределе Im 9-гее. Нам осталось показать, что найденные моды образуют полную систему. Для этого выберем нормировку С = К2/л и докажем усло- вие полноты (5.7.10). Сначала берем т > 0, п > 0 и доказываем, что J cos [qm + т] (q)] cos [qn + т) (</)] dq = 8nm. (6.8.12) Используя (6.8.11), для левой части можно записать — С (ei<f е2'11 е<"г ^">) d<y. Второй член в подынтегральной функции есть желаемая 6,лп. Можно показать, что первый член обращается в нуль, если рас- смотреть замкнутый контур в комп- лексной (/-плоскости (рис. 15). Функ- ция e2i11(<?) является периодической и, -*— согласно приведенному выше упражне- ~ нию, голоморфной и ограниченной в верхней половине комплексной (/-пло- скости. Тогда из-за наличия множи- I I теля е'"<п+т) вклад от пунктирной ли- т ' нии (рис. 16) обращается в нуль, когда она сдвигается на бесконечность, а вклады от двух вертикальных прямых сокращаются вследствие периодичности.".>• ) доказывасч для ft, гп >> и. д % Случай, когда п или т или оба РисУ 15 Контур интегрирова. они обращаются в нуль, требует от- ния в комплексной 9-плоскости дельного доказательства. Вычисления в этом случае аналогичны вышеприведенным, и мы предоставляем их читателю. * N. G. van Kampen and I. Oppenheim, J. Mathem. Phys. 13, 842 (1972). Такое использование S-матрицы для описания воздействия границы было рас- пространено на гидродинамику Волинесом (Р. G. Wolynes, Phys. Rev. А 13, 1235, 1976) и на газовую динамику Наказото (К. Nakazato, J. Phys. Soc. Japan, 43, 1154, 1977). 159-
Теперь легко увидеть, что при п>0 решение основного кине- тического уравнения (6.7.7) с начальным значением р„(0) —6„,л имеет вид Л Pn(i)= J <p^,e-«2-2COS<7) о (6.8.13а) Это следует из общей формулы (5.7.11), поскольку в настоящем слу- чае весовой множитель Ф„ в знаменателе (5.7.11) постоянен при и> 0. Однако для п --=0 он равен 1/у, так что Л Ро (0 = Т $ фо’Мп'е"-2cosd<7- о (6.8.136) Уравнения (6.8.13) дают распределение вероятности молекулы при t > 0, когда известно, что она стартует из состояния т при t--0. Например, если молекула в начальном состоянии находится в свя- занном состоянии т = 0, то вероятность того, что в момент времени она все еще будет (или вновь окажется) связанной, составляет У J (<ро0)2е~' (2~2 cos,?) dq = § cos2 М?)е 4/ЬШ -‘Г&Я- (6.8.14) о г о Упражнение. Найдите аналог (6.8.12) для п-т-О. Упражнение. Какова вероятность того, что молекула, находящаяся в связанном состоянии, будет находиться в нем, не покидая его в течение времени /? Упражнение. Покажите, что в противоположность этому среднее время, соот- ветствующее (6.8.14), бесконечно. Упражнение. Решите граничную задачу (6.7.6) с поглощающей границей. Пока- жите, что для с—1 решение совпадает с найденным с помощью принципа отражения (ср. с (6.7.12)). Упражнение. Решите (6.7.13) с помощью метода, изложенного в настоящем параграфе. Упражнение. В качестве модели диффузии в гравитационном поле возьмите асимметричное случайное блуждание (6.2.13) для п ---0, 1, 2, ... с резкой отражающей границей. Упражнение. Решите следующее основное кинетическое уравнение для случай- ного блуждания между двумя отражающими границами: Ра- Р2 — Рч< Pn=^Pn + i + Pn-i—2pn (п = 1, 2...V—1). PN^PN-1 — PN- Поскольку область возможных значений теперь ограничена с двух сторон- приходим к уравнению для собственных значений q, которое можно решить- Убедитесь в том, что найдены все У-j-l собственные функции. 160
6.9. НЕЛИНЕЙНЫЕ ОДНОШАГОВЫЕ ПРОЦЕССЫ Когда функции г (п) и g(n) нелинейны по п, обычно невозможно* найти явное решение основного кинетического уравнения, кроме стационарного. Приближенное рассмотрение мы приведем в гл. 8, а систематический приближенный метод будет развит в гл. 9. Здесь же мы просто перечислим некоторые типичные примеры. 1. П олупроводник с собственной проводимостью. Валентная зона может вместить N электронов, зона проводимости — М. Когда М может существовать n = 0, 1, 2, ..., N возбужденных электронов. Каждый из них может рекомбинировать, когда он встретит одну из п дырок; следовательно, г(п) = ап2. Каждый из N — п оставшихся в валентной зоне электронов может совершить переход в одно из М — п вакантных мест; следовательно, g (п) = 0 (N — п) (/И — п). Гра- ницы при « О и n — N являются естественными. Основное кинети- ческое уравнение имеет вид р„ = а(Е- 1)пХ + Р(Е-1— 1)(Л^п)(/И — п)р„. (6.9.1) Стационарное решение (6.3.8) имеет вид '’"=const( J(J(J . (6.9.2) которое является частным случаем гипергеометрического распреде" ления. Оно совпадает с р* при условии, что аир связаны соотно- шением детального равновесия (6.4.4), где /iv —энергетическая щелв, разностью энергий внутри каждой зоны пренебрегаем. В случае фотопроводника Р увеличивается на константу у, про- порциональную интенсивности падающего света. Система больше не замкнута, и новая Р уже не связана с а соотношением детального равновесия. Стационарное решение (6.9.2) уже больше не совпадает с термодинамически равновесным. Другое замечание состоит в том, что воздействие падающих фотонов можно представить с помощью простого добавления у к вероятности генераций только при условии, что моменты времени, в которые фотоны попадают в фотопроводник, некоррелированы (дробовой шум). Когда они коррелированы, число п уже не является марковским процессом и необходимо более сложное описание (см. § 13.3). 2. Диссоциация и рекомбинация двухатомного газа: Nх атомов X и Ny атомов Y образуют п молекул ХУ в объеме Q. Предположим, что в этом объеме находится достаточно инертных молекул, которые сталкиваются с молекулами вещества, и вероятность диссоциации за единичное время оказывается равной г(п) = ап. Для рекомбина- ции атом X должен встретиться с атомом К; следовательно, g (п) = — Р(Хх — п)(Ху — п). При п = 0 и при меньшем из Nx или Ny * То есть известные методы не работают, как это показано явно в работе: N. Dubin, A Stochastic Model for Immunological Feedback in Carcinogenesis (Lecture Notes in Biomathematics Nr. 9; Springer, Berlin, 1976). 161
имеются естественные границы. Тогда р* = const-(^Y)Qr)n! (|)л. (6.9.3). Это распределение совпадает с р„, найденным из обычной статисти- ческой механики, при условии, что a Q \ mxmY ) v Чх£г где t, обозначает внутреннюю функцию распределения. 3. Химическая реакция. Рассмотрим автокаталитическую реакцию k A+XZZ2X, (6.9.4) k' где вещество А находится в таком избытке, что количество пА можно рассматривать как постоянное. Если Q —объем, пА/& — концентрация вещества А, то мы имеем gn = k (пл/й) п, где k — константа реакции, которую обычно вводят в химической кинетике. Аналогично, г„ = (^7й)п(п — 1), потому что две молекулы X должны столкнуться для того, чтобы одна из них исчезла. Основное кинетическое уравнение имеет вид = “ 1 >п (п““ 1) Р» + (Е-1 — 1) (6.9.5) Его стационарное решение представляет собой равновесное распре- деление (6-9-6* Это распределение Пуассона. Его среднее <п>е = krifjk' совпадает с макроскопическим значением, которое дается законом действующих масс. Более общие химические реакции рассмотрены в гл. 7. 4. Рост соперничающей популяции. Пусть п — число индивидуумов в популяции бактерий определенного вида. Каждая особь может умереть с вероятностью а и образовать новую особь за счет деления с вероятностью 0 за единичное время; а и 0 полагают фиксирован- ными и не зависящими от возраста особи, в противном случае про- цесс нельзя было бы считать марковским. Соперничество приводит к дополнительной смертности, и вероятность гибели особи у(п— 1) пропорциональна имеющемуся количеству других особей. В макро- 162
скопическом уравнении для скорости можно заменить п— 1 на п: n = (fi — а)п — уп2. (6.9.7) Это соотношение называют уравнением Мальтуса—Верхульста. Сто- хастической формулировкой этой модели является одношаговый про- цесс с g(n) = §n, r(n) = an4-yn(n—1). (6.9.8) Следовательно, основное кинетическое уравнение имеет вид р„ = а(Е- рлрп + рф--1- 1)пр„ + у(Е-1)п(п-1)р„. (6.9.9) Мы продолжим изучение этого уравнения в § 11.4. 5. Явление сверхсветимости связано с распадом очень высоко лежащего возбужденного коллективного состояния набора атомов путем последовательного испускания фотонов. Вероятность находиться в состоянии n = 0, 1, 2, ... подчиняется основному кинетическому уравнению * ** p„ = (E-l)r(n)p„ (n = 0, 1, 2, .... М-1), (6.9.10а) PN= — r(N)pN. (6.9.106) Заметьте, что шаги происходят только в одну сторону, как в радио- активном распаде («процесс одной только гибели»). Вследствие этого в принципе имеется возможность получить яв- ные выражения для собственных функций и соб- ственных значений, хотя и возникают трудности для случая, когда г (п) принимает одинаковые значения в двух разных точках п. 6. «Диод Алкемейда» * *. Модель такого диода представлена на рис. 16. Он целиком находится в тепловом равновесии, но рабочие функции Wlt обеих диодных пластин различны, в резуль- тате имеется контактная разность потенциалов Ус. Соответственно равновесный заряд на конденсаторе равен Vc/C. Пусть п — избыток электронов на ле- вой пластине конденсатора над этим равновес- ным значением, а V =—еп/С — соответствующий избыточный потенциал. Электроны, которые пе- репрыгивают слева направо, встречают пороговый потенциал Wlf так что значение г„ постоянно и равно А. Величина А дается формулой Ричард- сона. Электроны, перепрыгивающие справа нале- во, встречают потенциал W2 -j- + V = + V; следовательно, [g2 1 ~Itc nJ • * J. H. Weiss, J. Statist. Phys., 6, 179 (1972). ** Ibidem. Рис. 16. Диод Ал- кемейда (6.9.11) 163
Эти соотношения остаются справедливыми при п < 0 при условии, что V не превышает Ус. Примечание. Разница между линейными и нелинейными одношаговыми про- цессами имеет большее физическое значение, чем это следует из математиче- ского различия между линейными и нелинейными функциями г (п) и g(n). Во многих случаях п означает количество объектов, таких, как электроны, кванты илн бактерии. Основное кинетическое уравнение для рп линейно по п, когда эти объекты не взаимодействуют друг с другом, но следуют своей собственной случайной предыстории независимо от других. Нелинейный член в уравнении означает, что судьба каждого объекта подвержена воздействию общего коли- чества других, в частности как это продемонстрировано выше на примере 4. Тогда линейные основные кинетические уравнения играют роль, аналогичную идеальному газу в теории газов. Этот вопрос более формально описывается в § 7.6. Упражнение. Полупроводник n-типа, не слишком нагруженный, можно описать с помощью (6.9.1) с М Js> N, Перейдите к соответствующему пределу М —> оо и найдите соответствующее основное кинетическое уравнение и равновесное распределение. Упражнение. При слабом возбуждении (низкие температуры) в (6.9.1) можно перейти к пределу М оо, N —> оо. Получающееся основное кинетиче- ское уравнение (с новым Р) имеет вид р„ = а (Е— 1) n2p„ + P (Е-1- 1) рп. (6.9.12) Оно будет использовано в § 9.2 в качестве примера. Выведите его, найдите равновесное распределение и соотношение между а и р. Упражнение. В примере 2 перейдите к пределу Ny —>. оо. Получающееся основ- ное кинетическое уравнение линейно и его можно решить. Упражнение. Покажите, что среднее от (6.9.6) действительно совпадает с вели- чиной, дающейся законом действия масс. Упражнение. Покажите, что собственные значения (6.9.10) равны Х„ = г(п), и найдите соответствующие собственные функции, когда вырождения не происходит. В модели Вейса r(n) n(N— п), так что собственные выра- жения дважды вырождены. Как можно справиться с этой трудностью? Упражнение. Следующая модификация модели урны Эренфеста нелинейна * **. Имеются две урны, каждая из которых содержит смесь черных и белых шаров. Каждую секунду я достаю одной рукой шар из одной урны, а другой рукой —шар из другой урны и перекладываю их. Запишите разностное уравнение для вероятности рп (t) получить п белых шаров в левой урне. Упражнение. Найдите стационарное решение (6.9.9) и выведите, что всякая популяция в конце концов вымрет**. Как это можно было бы предсказать с помощью интуиции? 6.10. ПРОБЛЕМА ПЕРВОГО ПРОХОЖДЕНИЯ Для простоты сначала рассмотрим случай неограниченного блуж- дания из § 6.2. Можно задаться следующим вопросом. Предположим, что частица, совершающая случайные блуждания, стартует с участка т при / = 0; сколько ей потребуется времени, чтобы впервые достичь заданного участка У? Естественно, это время первого прохождения будет различным для разных реализаций этого блуждания и, сле- * Р. S. de Laplace, Theorie analytique des probabilities (3 rd ed., Courcier, Paris, 1820), p. 292. ** M. Malek-Mansour and G. Nicolis, J. Statist. Phys., 13, 197 (1975). 164
довательно, является случайной переменной. Нам надо найти ее распределение вероятности, в частности среднее время первого про- хождения *. Пусть <?„(/) —вероятность того, что в момент времени t блужда- ющая частица находится на участке п, не побывав на участке N. Это qn (t) можно представить как плотность ансамбля частиц, совер- шающих случайные блуждания, которые все стартуют из т при / = 0 и движутся независимо, и каждый раз, когда одна из них попадает в N, она выходит из игры, т. е. не дает больше вклада в плот- ность qN. Понятно, это означает, что</(/) удовлетворяет основному кинетическому уравнению для случайного блуждания с поглощающей ямой на участке N. Чтобы закрепить эту мысль, возьмем т < N и запишем Яп = Яп+1 + Яп-1-^Яп (n^'V —2), (6.10.1а) Я1У-1~ Я.М-2 %Ям-1- (6.10.16) Эти уравнения нужно решить с заданным начальным условием Яп (0) = 6„.„,. Тогда число блуждающих частиц, которые к моменту времени t попали на участок N, дается величиной qt (/), где q. = qN-,. (6-10.2) Распределение отрезков времени, характеризующих первое прохож- дение, дается числом, а вернее, долей частиц, совершающих слу- чайное блуждание, которые попали на участок N за время, прошед- шее между t, /Ч-d/. Пусть эта доля равна fm(/)d/. Тогда(/) как раз и есть величина (6.10.2). Тогда проблема первого прохождения совпадает с граничной задачей (6.10.1) с поглощающей границей. Ограничения на случайное блуждание не являются необходимыми. Для произвольной одношаговой задачи (6.1.2) проблема первого прохождения эквивалентна следующей задаче с поглощающей гра- ницей: ^ = (Е-1)гА + (Е-*-1)^„ (ПСЛ/-2), (6.10.3а) <7yV-l = 'Г ^А'-гЧл’-а — ёх'-1Ям-1- (6.10.36) Решив это уравнение с начальным условием qn (0) = 6П< получаем fm (f) = 7* (/) = ём-1Ял--1- (6.10.4) Заметим, что (6.10.3) можно интерпретировать как исходный одношаговый процесс, обрезанный на участке N с граничным усло- * Это является центральной темой в теории марковских цепей, см.: J. Н. В. Kemperman, The Passage Problem for a Stationary Markov Chain (Uni- versity of Chicago Press, Chicago, 1961); Keilson, Markov Chain Models (Springer, New York, 1979). 165
вием 7iV = 0. Полная вероятность когда-либо достичь Л/ есть ® N-1 ЛЛ-, м = i f,n (t) dt = (oo) = 1 - 2 qn («>)• (6.10.5) о Если она равна единице, то среднее время первого прохождения со .V - 1 “ Lv. т = $ tfm (/) d/ = 2 $ qn (0 dz. (6.10.6) о - “ о В § 11.2 будет показано, что это среднее можно найти явно, не решая полного основного кинетического уравнения. Приведем не- сколько примеров, приводящих к проблеме первого прохождения. 1. Диффузионно контролируемая реакция в § 6.7 в пределе /=-- оо: молекула,, попавшая на участок п шгчезьзт навсегда. 2. Число особей п в популяции: .да н популяция выми- рает. Аналогичные уравнения прш,,-.-:имы к автокаталитическим реакциям, таким, как A + XZ12X. (6.10.7) Когда число п молекул X обращается в нуль, они перестают выра- батываться. 3. Двухатомная молекула может иметь последовательность колеба- тельных уровней л = 0, 1, 2, . .., ДО. Последовательные столкновения заставляют ее перескакивать с уровня на уровень, вперед и назад, но если она достигает (ДО-|-1)-го уровня, она диссоциирует. Эта задача изложена более подробно в § 7.5. 4. Нейрон получает последовательные случайные электрохими- ческие импульсы, пока его потенциал не достигнет порогового зна- чения, при котором нейрон разряжается*. Упражнение. Запишите те же самые уравнения для случая N > т. Упражнение. Резкая поглощающая граница (6.7.6) содержит один свободный параметр с, являющийся скоростью, с которой частицы исчезают с край- него участка. В задачах первого прохождения этот параметр фиксирован самим уравнением. Покажите, что (6.7.6) описывает проблему первого про- хождения для случайного блуждания, когда либо с=1; либо с = оо. Эти случаи в § 6.2 мы называли «полностью поглощающими». Упражнение. Решите проблему первого прохождения для симметричного слу- чайного блуждания. Покажите, что любая граница достигается с вероят- ностью лдг, я--1, но среднее время первого прохождения бесконечно. За- метьте, что это также отвечает на вопрос, как долго азартный игрок с начальным капиталом т может подбрасывать монету, пока не разорится. Упражнение. Решите проблему первого прохождения для асимметричного слу- чайного блуждания. Упражнение. Обозначьте V оператор правой части (6.10.3). Тогда /и(0 = ^-1(е/¥)л'-1,и- (6.10.8) * А. V. Holden, Models of Stochastic Activity of Neurones (Lecture Notes in Biomathematics 12, Springer, Berlin, 1976), Ch. 7. 166
Рис. 17. Вывод обратного уравнения для распределения fm (/) времени первого прохождения Часто используют следую- щий альтернативный способ вычисления функций распре- деления fm (t) времени перво- го прохождения. Возьмите одношаговый процесс и по- ложите m^N. Тогда, по определению, /iV(Z)==0 при Г>0. Далее, fN_ДО) = gN>1, потому что частица, старто- вавшая из N—1 в момент t = 0, с вероятностью gN_r dZ достигнет N в течение сле- дующего отрезка времени dZ. Однако при всех других т для этого потребуются по крайней мере два шага, поэтому вероят- ность для них оказаться там же в течение dZ сказывается порядка (dZ)2 или выше. Следовательно, /,л(0) = 0 для m^N— 2. Теперь рассмотрим малый временной интервал (0, dZ) (рис. 17). В течение этого времени точка, стартовав из/п(+;#—1), может перепрыгнуть в /п +1 с вероятностью gm dZ, в /п —1 с вероятностью rm dZ или остаться в т с вероятностью 1—gm dZ— rmdZ. Отсюда находим А» (0 =: (1 — gm М — гт dZ) fm (t — dZ) + + gmdt — dZ) + rm dZ/„_t(Z — dZ). Тогда для m^N—1 получаем /m gmfm + 1 T" 7mfm-1 (gm m) /tn gm (^л> 1) fm “Ь ^m (^<n 0 /m' (6.10.9) Это соотношение называют обратным уравнением. Для наших целей его нужно решить с граничным условием //V(Z) = 0 и начальным условием Упражнение. Покажите, что матрица в правой части уравнения (6.10.9) яв- ляется транспонированной матрицей V уравнения (6.10.3)*. Тогда решение уравнения (6.10 9) /m(Z) = (e'v)m,jv-ig^i (6.10.10) идентично решению (6.10.8) уравнения (6.10.3). Упражнение. Рассмотрите двухшаговый случайный процесс: в любой момент времени имеются вероятности сделать один шаг влево или вправо. Снова найдите уравнение для fm (/). * Этот факт применил к диффузионно контролируемым реакциям Тачия: М. Tachiya, J. Chem. Phys., 69, 2375 (1978). Аналогичная задача была рассмот- рена Розенстоком: Н. В. Rosenstock, J. Mathem. Phys., 21, 1643 (1980). 167
Третий метод основан на использовании «уравнений восстановле- ния». Пусть — решение основного кинетического уравнения для неограниченного одношагового процесса с начальным условием рл, „ (0) = 6„, Пусть /л — решение с тем же начальным условием того же самого начального блуждания, но обрезанного поглощающей границей при N > т, a —снова вероятность первого прохож- дения между t и 14- d/. Установим тождество, связывающее эти три величины. Если п — любой участок с п^Л', то частица, стартуя из т может попасть в п либо непосредственно, т. е. без прохода через Nr либо она может в некоторый момент времени, скажем между t' и /'id/', сначала попасть в состояние .V. В последнем случае она имеет вероятность pn,N{t — t') попасть затем в п. Это выражается тождеством t Рп. т (0 = Яп. т (П + J f,n (f) Мрп. N (t-O, (6.10.11) 0 которое называют уравнением восстановления *. В этом уравнении возьмем п = ЛЁ Тогда, по определению, (/) = 0, и мы получаем t Av.m(/) = $/т(/')рл', w (/ — /') (6.10.12) о Поскольку решение начального одношагового процесса известно, это выражение является интегральным уравнением для Его легко решить с помощью преобразования Лапласа. Полагаем со ^-^pn,m(t)dt = pn^(s), (6.io.i3> о fm(s) определяем аналогично. Тогда (6.10.12) сводится к PN.m(s) = fm(s) Pn,n(s), а мы приходим к тождеству /m(s)= , (6.10.14) PN. лф), которое выражает распределение времени первого прохождения в N со стартовой точкой в т через решение начального основного кинетического уравнения для одношагового процесса. Упражнение. Примените (6.10.14) для нахождения распределения времени пер- вого прохождения для симметричного блуждания и сверьте полученный результат с результатом, найденным ранее в упражнении. * D. R. Сох, Renewal Theory (Methuen, London, 1962). 168
Упражнение. Покажите, что рп. т (s) удовлетворяет разностному уравнению — ^n.m + spn, m(s) = (E— 1)гпрп< „ (s) + (E-1 — l)gnPn, m («)• (6.10.15) Упражнение. Выведите соотношение 1тИУ+1.лФ) Упражнение. Как модифицируется тождество (6.10.11), если т < N < п? Упражнение. Предположим, что потенциал на мембране нейрона является одношаговым процессом со значениями м = 0. 1, 2, ..., N—1, а когда достигаются значения N, нейрон разряжается и его потенциал падает до нуля. Покажите, что распределение времени разряда дается формулой F(S) = PJV( m(s)/pAr, 0(S). Упражнение. Из (6.10.14) следует, что / (s) = f —Дггг ) --U j (6.10.17) \S— W J N, m1 \s —w X Если W — финитная матрица, то все, что нужно сделать,— это расписать два минора матрицы s—W. Примените это для системы с двумя состоя- ниями и покажите, что получающееся в результате среднее время прохож- дения является величиной, обратной соответствующей вероятности пере- хода, как этого и следовало ожидать. Упражнение. Случайное блуждание с границей п — 0, на которой доля а является поглощающей, описывается с помощью выражений Рп = Рп + 1 + Рп-1—2рп ("5а2), Pi=Ра + (1 — а) ро—2pj, Ро ~ Pl— Ро- Для частицы, стартующей из п0, скорость поглощения есть 7?a(Z|n0) = = аРо, (О Проверьте уравнение восстановления t Rail I По) ==«7?! (г Irto)4-(1 — a) ^Ra(t — t' | 1) fli (C | n0) dZ', о где (Z | и0) — распределение времени первого прохождения. (Ср. J. В. Pe- dersen. Chem. Phys., 72, 3904 (1980.) ГЛАВА 7 ХИМИЧЕСКИЕ РЕАКЦИИ Химические реакции дают широкое поле приложений для стоха- стических методов, некоторые из них мы уже использовали в качестве примеров. Эта глава немного отклоняется от основной линии книги, ее цель — обеспечить твердую основу таких приложений. Последние два параграфа посвящены темам, представляющим более общий интерес, однако изложенный в них материал легче сформулировать в химическом контексте. 169-
7.1. кинематика химических реакций Рассмотрим замкнутый объем Й, содержащий смесь химических веществ X, (/ = 1, 2, ..., J). Пусть Пу—число молекул вещества Ху. Набор {пу} удобно пред- ставить геометрически с помощью вектора и в J-мерном пространстве состояний. Целые значения п7 образуют решетку. Каждый узел решетки в «октанте» неотрицательных значений соответствует состоя- нию смеси, и наоборот (рис. 18). Когда происходит химическая реакция, состояние смеси изме- няется. Типичная реакция определяется набором стехиометрических коэффициентов sy, Гу в виде s-,Xi : s2X2 4 . . . —» rjXj + г2Х2 4- , . .. (7.1.1) Обе части формулы можно записать как сумму по всем индексам /, если допускаются нулевые значения коэффициентов Sy и г-. Если для какого-либо k выполняется условие sk = — то соответствующее вещество Xfc является катализатором. Если rk > sk > О,, то Xfc является автокатализатором. До сих пор Sy и ry были определены с точностью до общего множителя, но теперь давайте договоримся для sy брать то число молекул, которое действительно необходимо для вступ- ления в реакцию при их столкновении. Ре- акции, которые происходят через промежу- точные шаги (цепные реакции), нужно записывать как последовательность прос- тых реакций, вызванных столкновениями молекул, а промежуточные продукты реак- ции следует включить как отдельные компо- ненты в веществе Ху. Поскольку трехчастичные столкновения редки, на практике встречаются только реакции, у которых равна 1, или 2, или, возможно, 3, если присутствует катализатор. Но настоя- щее теоретическое рассмотрение не ограничено этими случаями*. Каждый акт реакции типа (7.1.1) меняет состояние {лу} смеси на {Пу-гГу—Sy}. В геометрическом представлении это означает, что он изменяет вектор состояния п, добавляя к нему вектор с компо- нентами v,- гj—Sj. Когда происходит реакция, вектор состояния пробегает последовательность узлов решетки, лежащих на прямой. Эта прямая не может простираться до бесконечности и, следова- тельно, должна оканчиваться на одной из границ физического октанта. * Наше описание в значительной мере является идеализацией действитель- ных химических реакций, как это напр. описывается в работе: J. В. Anderson. Advances in Chemical Physics. 41 (I. Prigogine and S. A, Rice eds., Wilev, New York, 1980). 170 Рис. 18. Пространство состояний бинарной смеси
С реакцией (7.1.1) связана обратная реакция 2r,X,-2s,X,. (7.1.2) Воздействие этой реакции на вектор состояния приводит к вычитанию из него V. Тогда, стартуя с начального состояния п°, обе реакции вместе приводят к тому, что вектор состояния движется по дискрет- ной цепочке узлов решетки, лежащих на прямой между двумя гра- ницами физического октанта. Доступными точками являются n = n°-Hv, (7.1.3) где | принимает все целые значения, лежащие между верхней и нижней границами. Теперь рассмотрим другую реакцию sj, г) и будем считать, что возможна и обратная ей реакция. Становится доступной вторая цепочка узлов решетки, начинающаяся в и". Совместно с предыдущей реакцией становится достижимой сеть точек, а именно n« + £v + rv' (£, Г=..., -1, о, 1 ...). (7.1.4) Если таким путем учесть все возможные реакции, образуется подре- шетка точек, доступных из п°. Однако понятно, что она не может покрывать весь октант, потому что 2 п/ ограничена. / Если реакция происходит в замкнутом сосуде, то не существует другого способа изменения nf. Значит, эта ограниченная подрешетка представляет собой множество доступных состояний системы. Физи- ческий октант распадается на такие подрешетки, и система не может выйти за пределы той подрешетки, которой принадлежит ее началь- ное состояние п°. В открытых системах имеются добавочные возмож- ности изменения п; они будут рассмотрены в § 7.3. Существует возможность параметризовать подрешетку доступных состояний способом, указанным в (7.1.4). Каждая возможная реак- ция р обладает вектором v<P). Все узлы решетки, доступные из п°, по построению имеют вид n = n° + i;ipv,p>. (7.1.5) р Каждый параметр £р принимает целые значения ..., —2, —1, О, 1, 2, . . .; его называют степенью продвижения, потому что он пока- зывает, как далеко продвинулась реакция*. Значения {|р} ограничены требованием пу^0 для всех /, но в следующем параграфе мы покажем, что это ограничение не вызы- вает трудностей. * Это понятие было введено Де’Дондером, Th. De’Donder, L’affinite (Gaut- hier—Villars, Paris 1927). Предлагались и другие названия: «прогрессивная переменная» [De Groot and Mazur, p. 199}, «степень распространения реакции» G. R. Gavalas, Nonlinear Differential Equations of Chemically Reacting Systems (Springer, Berlin, 1968) и «параметр реакции» [О. J. Heilmann, Kong. Danske Videnske. Selsk. Mat.— fys. Medd. 38, noli (1972)]. 171
Сначала предположим, что представление (1.5) единственно в том смысле, что каждая доступная точка и для заданного п° может быть представлена с помощью единственного набора значений {|р}. В этом случае (7.1.5) отображает подрешетку доступных состояний на решетку целых значений в пространстве с координатами £р. Каждый узел решетки в доступной части этого пространства соответствует одному и только одному состоянию смеси. Каждый акт реакции соответствует единичному шагу вдоль одной из координатных осей К сожалению, у нас нет оснований считать соотношение (7.1.5) единственным. С таким же успехом могут образоваться два разных набора £р, ведущие из п° в одно и то же состояние п. Это означает, что должен существовать набор целых чисел |р, не все из которых равны нулю, таких, что Sspy'P) =0. (7.1.6) Если это так, то все же можно найти меньший набор векторов решетки w'o>, такой, что каждая точка подрешетки доступных состоя- ний может быть единственным образом представлена соотношением п = п° + £ T]ow<o> (7.1.7) с целыми т]а. Тогда каждый узел решетки в пространстве с коорди- натами снова соответствует одному и только одному состоянию смеси. Однако если в ^-пространстве реакции соответствуют единич- ным шагам, то в ц-пространстве— нет. Поэтому мы практически ничего не выигрываем по сравнению с начальным представлением в пространстве состояний векторов и. Реакции, которые могут происходить в замкнутом сосуде, огра- ничены законами сохранения участвующих в них атомов. Пусть силовая а обозначает разные виды атомов. Предположим, что ве- щество Xj состоит из mf атомов вида а, где /п“ = 0, 1,2,.... Тогда стехиометрические коэффициенты (7.1.1) для каждого а удовлетво- ряют соотношениям 5 S//n“ = 2 rjmf или v • ш“ = 0. / Так как это выполняется для всех реакций, то подрешетка доступ- ных состояний полностью лежит на сечении гиперплоскостью, задан- ной выражением пт“ = Л“, (7.1.8) где Аа — полное число доступных атомов а. Все законы сохранения (7.1.8) не должны быть независимы. Если группа разных атомов остается вместе при всех реакциях, то это приводит к единственному закону сохранения. Например, реакция 2NO + C12 2NOC1 172
включает в себя три вида молекул, но законы сохранения для N и О совпадают. С другой стороны, кроме законов сохранения числа атомов могут существовать и другие законы сохранения. Например, если Xfe участ- вует только как катализатор, то пк со- храняется само по себе. Все законы сохранения совместно опре- деляют линейное подпространство узлов решетки в полном пространстве состояний. Доступное подпространство лежит в этом подпространстве и обычно совпадает с ним, но это не всегда так. Контрпримером может служить реакция 2Х iTt2Y, в которой две молекулы X при столк- новении могут превратиться в разные мо- дификации У. Закон сохранения «х + пу=Л опре- Рис. 19. Доступные состоя- ния для реакции 2Х 2Y при Л = 7 деляет прямую в двумерном пространстве состояний (рис. 19), но только каждый второй узел решетки до- ступен из заданного и". Пример. Пусть X;— мономер, а Ху—молекула полимера, состоящая из j таких мономеров. Предположим, что полимеры, максимальная длина которых ограничена величиной J, могут объединяться и разделяться: Х( +Ху Х,+у, (i j-йг 1, t-|-/<7). Имеется [7/2](7— [7/2]) реагирующих пар*. С другой стороны, имеется J компонент, дающих вклад в один закон сохранения: У му =л. /=1 Решетка доступных состояний лежит на гиперплоскости размерности (J—1) в /-мерном пространстве состояний. Понятно, что £р не может быть незави- симым, когда [7/2](7— [7/2]) > J—1 или 7 :=»4. В частности, для 7/э4 возможны четыре реагирующие пары: х1+х1^±х2, Xi+ х2 Х3, Xi Хз Х4, Х2-|- Х2 х4. Предположим, что сначала имеется только вещество X, так что п° — = {л°, 0, 0, 0}. Тогда nl = rtl—2|1— £2— £з, п2~ £1 — — ?4, пз — — Ls> __________ «4 = + U * [7/2]—это целая часть от 7/2, т. е. [7/2] = 7/2, когда число J четно и [7/2] = (7—1)/2, когда 7 нечетно. 173
Таким образом, четыре переменные пу- определяются четырьмя gp, но обрат- ное неверно, поскольку пу тождественно удовлетворяет соотношению fii -Т 2п-2 -Т Зл3 4^4 ~ ni. Упражнение. Обоснуйте, что в (7.1.1) нужно брать г,-< s,-, по крайней мере для одного I, и что, следовательно, реакция должна прекратиться на той стороне октанта, где п; = 0 (если только она уже не остановилась раньше на какой-либо другой стороне.) Упражнение. Изобразите пространство состояний и решетку доступных состоя- ний для реакции НгН-1г^-2Н1. (7.1.9) Обозначьте на картинке законы сохранения и параметр Упражнение. Проанализируйте тем же способом (хотя и без рисунка) схему реакции для H2 Br2z’2HBr: ВгН-М 2Вг + М, Вг.+ Н2 z: HBr-4-H, H -Br2.z НВг - Вг. Символом М обозначен некоторый инертный катализатор. Упражнение. Если Xj участвует исключительно в качестве катализатора, то его можно исключить, рассмотрев только лишь пространство состояний Х2, Х3, .... Покажите, что это не влияет ни на £р, ни на законы сохра- нения. Упражнение. Докажите, что любую подрешетку можно представить с помощью (7.1.7) при определенном выборе Указание. В качестве ш<а) выбе- рите наименьший из возможных векторов решетки и покажите, что ре- шетка, которую они генерируют, совпадает с подрешеткой. 7.2. ДИНАМИКА ХИМИЧЕСКИХ РЕАКЦИЙ В химической кинетике обычно записывают уравнения для ско- ростей реакций в терминах плотностей или «концентраций» с,-= ziy/Q. Для скорости, с которой происходит реакция (7.1.1), следуя Вант- Хоффу, возьмем К П<Л (7.2.1) /=1 ' где k+ — константа, включающая сечение рассеяния при столкнове- нии с требуемой молекулой, умноженная на вероятность того, что столкновение приведет к желаемому результату реакции. Точнее, (7.2.1) представляет собой число таких столкновений за единичное время в единичном объеме, в которых {п,} —* {л/ + rt — $>}. Тогда уравнения для скоростей реакций имеют вид (7.2.2) Примечание. Это уравнение, конечно же, не является универсальной нети - ной, но выполняется при следующих физических требованиях. 1. Смесь должна быть однородной, чтобы плотность в каждой точке Й была равна nj/Q. Для достаточно медленных реакций однородность может 174
быть достигнута или аппроксимирована с помощью взбалтывания. Отклоне- ния от однородности составляют предмет гл. 12. 2. Для того чтобы установилось распределение Максвелла по скоростям, упругие столкновения, не вызывающие реакции, должны быть достаточно ча- стыми. В противном случае частота столкновений не могла бы быть пропор- циональной произведению плотностей, а зависела бы от других деталей рас- пределения скорости. Это требование удовлетворяется в присутствии раство- рителя или инертного газа и на самом деле выполняется лучше, чем этого можно было бы ожидать. 3. Предполагается также, что внутренние степени свободы молекул также находятся в тепловом равновесии при той же температуре Т, что и скорости. Иначе доля столкновений, приводящих к реакции, зависела бы от деталей распределения по внутренним состояниям, а не только от концентраций. Однако долгоживущие возбужденные состояния можно учесть, перечислив их среди Xj, в качестве отдельных видов веществ *, но для этого необходимо четкое различие во временных масштабах. 4. Для того чтобы коэффициенты скорости можно было рассматривать как постоянные даже тогда, когда они сильно зависят от температуры, темпера- тура должна быть постоянной в пространстве и во времени. Эти предположе- ния, быть может, не очень реалистичные для многих действительных химиче- ских реакций, не противоречат каким-либо физическим законам, и поэтому в определенных экспериментах их выполнение может быть аппроксимировано с любой заданной точностью. Они гарантируют, что состояние смеси полностью описывается набором чисел {пу}. Выражение (7.2.1) является не точным, а средним числом столкновений, приводящих к реакции. Их действительное число флуктуирует относительно среднего, и мы хотим узнать результи- рующие флуктуации величины и,- относительно макроскопических значений, определяемых выражением (2.2). Для того чтобы описать их, нужно знать совместное распределение вероятности Р (и, /). Хотя эта величина и записана как функция от всех n7, она опре- делена только на подрешетке доступных состояний. По-другому ее можно представить как распределение на всем физическом октанте, которое обращается в нуль во всех точках, которые не являются доступными. Те же самые предположения, на которых основано макроскопи- ческое уравнение (7.2.2) (кроме небольшой, но существенной моди- фикации), приводит к основному кинетическому уравнению для Р определенного вида**. В (7.2.1) вероятность столкновения, вклю- чающего Sj молекул Xj, взята пропорциональной п^'; точнее, этот множитель должен иметь вид п,! nj — 1) (nz—2) . (ny — sz + 1) , • (7.2.3) * См.: J. Н. Gibbs and Р. D. Fleming, J. Statist. Phys. 12.375 (1975). От- метим, что понятие «основное кинетическое уравнение» в этих работах соот- ветствует нашему «уравнению скорости реакции». ** Основополагающими работами по основным кинетическим уравнениям в химии считаются: D. A. McQuarrie, J. Appl. Prob. 4,413 (1967); Е. W. Montrol in: Energetics in Metallurgical Phenomena III (Gordon and Breach, New York, 1967). 175
Мы будем сокращенно обозначать это выражение с помощью ((лу))’7. Тогда члены в основном кинетическом уравнении, соответ- ствующие прямой (7.1.1) и обратной (7.1J2) реакциям, имеют вид р(П, + (7-2-4> \ i 1 ! I Q J 1 где k_—постоянная скорость реакции для обратной реакции. Пол- ное основное кинетическое уравнение, включающее все реакции р, является суммой таких членов, каждого со своими собственными sp, rf, kp+, kp. Упражнение. Определите первый момент перехода ({п}) для Запишите макроскопическое уравнение для n.j. Упражнение. Покажите, что границы являются естественными в смысле § 6.5, т. е. основное кинетическое уравнение обеспечивает обращение в нуль распределения вероятности Р, когда одна из величин п, становится отри- цательной при условии, если такое обращение в нуль выполняется для начального Р. Отметим, что замена на ((Пу))*7 является существенной. Упражнение. Обоснуйте (2.3) следующим образом. Пусть ы—элемент объема, имеющий диаметр порядка радиуса взаимодействия между молекулами. Вероятность того, что в w содержится набор {sy} молекул, необходимых для реакции, дается выражением тт f f—V711 V'~sj VUJU; \ й/ Для co < Й это приводит к (7.2.3) с точностью до постоянного множителя. Упражнение. Когда возможна только единственная реакция, основное кинети- ческое уравнение (7.2.4) представляет одношаговый процесс на цепочке узлов решетки доступных состояний. Продемонстрируйте этот факт более четко, записав основное кинетическое уравнение в терминах степени про- движения g. Упражнение. Процесс, в котором два падающих протона поглощаются и по- рождают один испущенный фотон, описывается основным кинетическим уравнением * Р(п, т, /) = (ЕпЕйХ—1)п(п—1) тР (n, т, t). Сведите это уравнение к одномерному одношаговому процессу рождения. (Сравните с наблюдением в связи с (6.9.10).) 7.3. СТАЦИОНАРНОЕ РЕШЕНИЕ Большое каноническое распределение в идеальной смеси хими- ческих веществ дается выражением (Ну=0, 1, 2, ...), (7.3.1) * Н. D. Simaan, J. of Physics (London) All, 1799 (1979) 176
где Zj—функция распределения одной молекулы / в единичном объеме: г. = ^^y/2^e-ev/(*n„ (7.3.2) V Суммирование проводится по всем внутренним колебательным, вра- щательным и электронным состояниям. В соответствии с (7.3.1) ве- личины Пу представляют собой независимые пуассоновские перемен- ные со средними значениями </iy> = Qzy, a —равновесные значе- ния концентрации. Можно ожидать, что окажется стационарным решением на- шего основного кинетического уравнения (7.2.4). Подстановка по- казывает, что это в самом деле так при условии, что — (7.3.3) Использование известного равновесного распределения снова при- вело нас к соотношению между скоростями прямых и обратных переходов. Соотношение (7.3.3) называется законом действующих масс. Однако большое каноническое распределение (7.3.1) не может правильно описать флуктуации пу- в замкнутом сосуде. Этот факт очевиден, потому что, согласно этому распределению, ненулевые вероятности приписываются каждой точке октанта. В действитель- ности же достижимыми являются только узлы определенной подре- шетки. Правильное распределение пропорционально (7.3.1) на этой подрешетке и обращается в нуль вне ее: /,е(«) = СП^е'аг^(п, п»), (7.3.4) Здесь Д(п, п°) = 1, если и доступно из п°, и Д(п, п°) = 0, если п недоступно. Для того чтобы показать, что распределение (7.3.4) действительно является решением основного кинетического уравне- ния, заметим, что каждый член (7.2.4) полного основного кинети- ческого уравнения обращается в нуль при подстановке (7.3.1), а следовательно, и при подстановке (7.3.4), потому что (7.3.4) отли- чается от (7.3.1) только на множитель С для всех значений и, встречающихся в основном кинетическом уравнении. Пример. Диссоциация двухатомной молекулы: k+ X2^t2Xlt (7.3.5) Предположим, что, для того чтобы сделать возможными столкновения, исполь- зовано инертное вещество. Стехиометрические коэффициенты Si=l; s2 = 0; Г1 — 0; r2 = 2. 177
В качестве начального состояния мы выбираем nj —0, n2 = n“. Сохранение числа томов выражается равенством ni-j-2ns = 2nf. Доступные узлы решетки обозначены на рис. 20. В равновесии вероятность того, что смесь находится в состоянии, пред- ставленном такими точками, дается формулой (7.3 4). Для значений п2 веро- ятность Л2 Рис. 20. Пространство состояний реакции дис- социации (7.3.5) при о о п2-=3 п2! (24-2п2)! (7.3.6) п2! (2п°—2п2 Очевидно, что это не распределение Пуассона. По- другому, в терминах степени продвижения П!=2Е, n2~~nf— g (g^-0, 1, 2, nf). и меем ps (s) _ с_______!______( & (4-4).'(2g)! k J На языке § 5.2 полное основное кинетическое уравнение разло- жимо. Пространство состояний векторов п распадается на педре- шетки. между которыми переходы невозможны. Для каждой подре- шетки должны записываться свои отдельные основные кинетические уравнения. В соответствии с § 5.3 в каждой подрешетке вероятность, стремится к единственному стационарному решению. Любое реше- ние полного основного кинетического уравнения стремится к этому стационарному решению на каждой подрешетке, но веса, распреде- ленные по нескольким подрешеткам, фиксированы начальным усло- вием. Если начальное условие имеет вид Р(п, 0) = 6(п, п°), то все подрешетки, отличные от доступной из п°, имеют нулевой вес, что выражается формулой (7.3.4). Если мы захотим описать анса'мбль сосудов с различными п°, то веса окажутся различными и будут зависеть от начального ансамбля. В частности, для ансамбля, вы- бранного подходящим образом, может получиться (7.3.1), но это распре- деление не описывает флуктуации и с течением времени в одном- единственном замкнутом сосуде. Упражнение. При таком условии для величины А в (7 3.4) можно записать А (п, п°) = JJ б (n- тР, n’ ma), a где б(-, •) — символ Кронекера, а а пробегает по всем законам сохранения. Упражнение. Рассмотрим реакцию между двумя изомерами: XrrY. Определите распределение вероятности /ц в равновесии, включая норми- ровочную постоянную. Найдите также дисперсию и покажите, что она не согласуется с распределением Пуассона. 178
Упражнение. Из (7.3.6) получите для дисперсии <(АП1)Ъ_ <«1> 1 + 16^2- г1 о Отметим, что отклонение от Пуассона не исчезает в термодинамическом пределе. Упражнение. Убедитесь в том, что использование ((ny))s7 вместо более привыч- ной n.j J существенно в (7.2.4), так как иначе (7.3.4) не будет точным ре- шением. Упражнение. Проверьте, что обращение в нуль вероятности вне физического октанта ny 5s 0 учитывается автоматически, если положить л! Г (п~р 1)= оо для отрицательных целых п. Упражнение. Приведенный в тексте способ, которым было найдено стационар- ное решение (7.3.4), состоял в том, что мы заметили, что выражение (7.3.1) действительно удовлетворяет (7.2.4), однако это решение можно получить и систематическим способом*. Запишите (7.2.4) для стационар- ного решения в виде о= Ще(!гг(-! Выведите, что [ ] ~0 и затем найдите Ps. Упражнение. Метод предыдущего упражнения Оказался возможным из-за того, что (7.2.4) является виртуально одношаговым основным кинетическим уравнением, как упомянуто в одном из предыдущих упражнений. Запи- шите уравнение через £ и примените (6.3.8), чтобы найти стационарное решение. 7.4. ОТКРЫТЫЕ СИСТЕМЫ Значительно большее количество явлений можно описать как 'стационарные состояния открытых химических систем, т. е. систем, в которые могут инжектироваться молекулы и из которых могут выделиться специфические молекулы. Простейшая возможность со- стоим в инжектировании молекул X с постоянной скоростью Ь. Вы- деление X возможно до тех пор, пока имеется некоторое количество вещества X, и скорость выделения должна обращаться в нуль, когда п = 0 поэтому простейший вид скорости есть ап. Тогда мак- роскопическое уравнение для п молекул вещества X имеет вид п — Ь—ап+. . , (7.4.1) где многоточием обозначены результаты внутренних химических реакций, исследованных в предыдущих параграфах. Однако эти макроскопические члены еще не определяют выделе ния на мезоскопическом уровне и механизма инжекции. Простей- ший случай —тот, когда молекулы инжектируются независимо в случайные моменты времени (дробовой шум) и выделяются незави- симо. В выражении для вероятности перехода это соответствует * N. G. van Kampen, Phys. Letters, 59 А, 333 (1976). 179
членам W (п/п) = bbn, п,+14- ап'Ъп, + ... . Они приводят к следующим членам в основном кинетическом урав- нении: p„(O = b(E-i—l)Рп + а(Е-1)прп+ .. . . (7.4.2) Следует иметь в виду, что это отнюдь не единственный способ добавления членов в основное кинетическое уравнение, приводящих к макроскопическим членам (7.4.1). Например, молекулы могут ин- жектироваться в виде кластеров. Различный выбор мезоскопического описания будет сказываться на флуктуациях п. В общем случае, когда система подвергается внешним воздействиям, вычислить флук- туации нельзя, если сила задана только макроскопически, а нужно знать еще ее стохастические свойства. Для химических реакций имеется удобный и естественный спо- соб задания стохастических свойств механизма инжекции, который мы уже использовали в некоторых примерах. Можно предположить, что молекулы X образуются из вещества В, которое присутствует в больших количествах и медленно распадается в X. Тогда обра- зование вещества происходит практически с постоянной скоростью, а обратной реакцией можно пренебречь (например, образование ге- лия из урана можно считать постоянным). Другими словами, си- стему можно описать как предельный случай закрытой неравновес- ной системы. В этом случае В играет роль резервуара. Для того чтобы описать этот предельный случай более точно, рассмотрим реакцию * В — X. k' Основное кинетическое уравнение для совместного распределения имеет вид dtP(nx, пв, /) = *(ЕвЕх1-1)/гв^ + ^'(Её1Ех-1)«х^. Теперь пусть пв оо и k —* оо при постоянном kn.B=-b. Тогда kEBnB = knB 4” k —> b. Поскольку пв уже больше не встречается в качестве переменной, по ней можно выполнить суммирование и получить частное распре- деление для единственной величины 2^(«х, «в, t) = P(nx, t), пв dtP (пк, 0 = b (Ex1 -1) P + k' (Ex - 1) nxP. И наконец, перейдя к пределу kr —* 0, получим первый член (7.4.2). Член, описывающий выделение в (7.4.2), также можно получить как предельный случай реакции в замкнутом сосуде. Рассмотрим 180
реакцию k Xzr A k' с основным кинетическим уравнением dtP(nx, nA, /) =-& (ExExx — 1) nxP + &'(ЕХХЕА — 1)пАР. Выполнив предельный переход k' —>0 и просуммировав по пА, в результате получим второй член в (7.4.2). Коэффициент k, харак- теризующий скорость реакции, нужно считать постоянным и рав- ным а; тогда, поскольку в соответствии с (7.3.3) выполняется со- отношение k'!k = zx/zA — 0, внутренняя функция распределения А должна быть очень большой для того, чтобы действовать как сток. Упражнение. Дайте несколько других примеров основных кинетических урав- нений совместных с уравнением (7.4.1). Упражнение. Запишите основное кинетическое уравнение для реакции А;:гХ. 2Х~гВ, где А и В действуют как резервуары. Стационарное состояние обладает тем свойством, что при определенных значениях параметров результирую- щий перенос между А и В обращается в нуль. Покажите, что в этом случае стационарное распределение X является распределением Пуассона*. Упражнение. Вообще, в любой открытой системе с резервуарами А, В, С, ... и реагентами X, Y, Z стационарное распределение является мультипуассо- новским при условии, что в стационарном состоянии нет переноса веще- ства между резервуарами. 7.5. ОДНОМОЛЕКУЛЯРНЫЕ РЕАКЦИИ Совсем другой аспект химических реакций приводит к стохасти- ческим задачам иного типа. Рассмотрим реакцию диссоциации одной молекулы в газе: XY - X + Y. (7.5.1) Например, С2Н6С1 распадается на С.,Н4 + НС1. Если в начальном состоянии имеется чистый газ XY, реакция может произойти только тогда, когда молекула XY сталкивается с другой, и поэтому ско- рость реакции сначала должна быть пропорциональна квадрату плотности. Однако эксперимент свидетельствует о том, что на самом деле скорость пропорциональна первой степени плотности, по крайней мере для не слишком малых плотностей. Следуя Ф. А. Линдеману, этот факт объясняется с помощью следующей картины **. Столкновение мо- * Этим примечанием я обязан Ван ден Броку. ** N.B-Slater, Theory of Unimolecular Reactions (Cornell University Press, Ithaca, N.Y., 1959). См.: I. Amdur and G. G. Hammes, Chemical Kinetics (McGraw-Hill, New York, 1966); E. E. Nikitin, Theory of Thermally Unduced Gas Phase Reactions (Indian University Press, Bloomington, 1966). 181
лекул XY непосредственно не приводит к их диссоциации. Скорее оно приводит к переходу молекулы в возбужденное состояние (X Y) *, кото- рое является метастабильным, и молекула, находящаяся в этом состоя- нии будучи предоставленной сама себе, в конце концов диссоциирует. Тем временем, однако, может произойти другое столкновение, кото- рое может вернуть молекулу в основное состояние. Тогда реакцию (7.5.1) запишем в виде XY^(XY)*, (XY)* — X + Y. (7.5.2) Когда плотность п молекул XY достаточно велика, реакция, записанная первой строкой, поддерживает запас молекул (XY)* пропорциональным п. Каждая молекула (XY)* имеет определенную вероятность распасться за единичное время в соответствии с реак- цией, записанной второй строкой. Тогда вся реакция будет проис- ходить со скоростью, пропорциональной п, а не п- (см. упражнение ниже). Подход, в котором различают всего два состояния: одно устой- чивое, а другое — возбужденное,— не является реалистическим. Моле- кула XY обладает несколькими степенями свободы, соответствующими вращательным, колебательным и электронным движениям образую- щих ее частей. В этом случае имеется большое количество собст- венных состояний |v> с энергиями Ev (v-=0, 1,2, . . .). Строго говоря, при энергиях, превышающих энергию связи Еь, спектр непрерывен.. Однако даже при энергиях, превышающих Еь, существуют прибли- женно связанные состояния |v> с приближенно определенными энергиями Ev > Еь, как это известно из теории альфа-распада Гамова *.. Это означает, что они обладают очень малой вероятностью разде- литься за единичное время на X и Y. И только когда энергия превышает некоторое значение £а, называемое энергией активации, вероятность диссоциации становится заметной. После каждого столкновения молекула XY остается в некотором зависящем от времени состоянии |ф>= 2 <КМ- v=0 Набор N независимых молекул XY можно описать с помощью матрицы плотности ~ N * J. М. Blatt and V. F. Weisskopf, Theoretical Nuclear Physics (Wifey York, 1952), p. 383 ff. V y’ 182
В квазиклассическом приближении предполагается, что фазовые соотношения между av несущественны, так что мы не ошибемся, положив Л' /=1 где pv — вероятность того, что молекула XY находится в состоянии |v>. Для свободной молекулы вероятность pv постоянна во времени, если Ev < Еь, но возбужденное состояние может распадаться: pv = — rvpv (£v> Еа). (7.5.3а) Столкновения будут изменять pv и, поскольку имеется определен- ная вероятность за единичное время испытать столкновение задан- ного типа, имеем основное кинетическое уравнение Pv = 2 (W^-W^pJ. (7.5.36) ц Как подчеркивалось в § 4.1, это справедливо только в огрубленном масштабе времени, на котором столкновения можно рассматривать как мгновенные. Объединяя (7.5.3а) и (7.5.36), получим Pv (v-0, 1, 2, ...; Tv = 0 для Ev < £а). (7.5.4) ц Это уравнение не сохраняет вероятности. Однако сохранение вероятности можно восстановить, добавив уравнение для вероятности р* того, что молекула диссоциирует: Р* = S/’v, Р* = ^vPv (7.5.5) Система уравнений (7.5.4) и (7.5.5) является сохраняющим веро- ятность основным кинетическим уравнением. Диссоциированное сос- тояние * является поглощающим состоянием и; следовательно, р* (оо)1, /?v(oo)_0. Химиков, однако, интересует, как быстро произойдет эта диссоциация. Предположим, удалось решить (7.5.4) с начальным условием pv(O) = 6vo, которое означает, что молекула в начальный момент времени находится в основном состоянии. Тогда вероятность того, что она диссоциирует в течение времени от t до td-dt, есть p*(t) dt. Среднее время диссоциации есть (ср. с. (6.7.5)) X pp#(/)d£ (7.5.6) о Для того чтобы получить числовые результаты, необходимо, с одной стороны, знать и Fv, а с другой стороны, решить урав- нение (7.5.4). Мы не ставим своей целью описывать различные тео- рии и приближения, касающиеся первой задачи, но справедливости 183
ради отметим, что они в лучшем случае приводят к качественным результатам. Как следствие, имеется много возможностей для выбора таких выражений для и Tv, которые облегчают решение вто- рой задачи. Мы упомянем три подхода, однако следует отметить, что они представляют больший интерес как упражнения по стохас- тическим процессам, чем оказываются действительно полезными для вычисления скоростей настоящих одномолекулярных реакций. 1. Монтрель и Шулер* упростили уравнение (7.5.4), выбрав для» одношаговую матрицу перехода с обрезанием на поглощающей границе, что равносильно следующему: 1\, = 0 для V —0, 1, 2, . . ., N—1; Г,у > 0. Затем, чтобы получить аналитическое решение, они взяли для колебаний двухатомной молекулы Wvll, принадлежащие квантован- ному гармоническому осциллятору, что в этом случае кажется до- статочно разумным**. Тогда их основное кинетическое уравнение записывается в виде ^, = a(E-l)v/7v4-p(E-1-l)(v+l)pv (v = 0, 1, 2, ..., A7—1), pN = — aNpN + $NpN _! — YNpN, P^ = TnPn. (7.5.7) Достаточно трудоемкое решение получается путем определения собственных значений и собственных функций, как в § 6.8, которые оказываются некими странными многочленами Готлиба. К сожале- нию, скорость реакции, вычисленная при различных значениях а, р, N, Гуу, оказывается на несколько порядков величины меньше наблюдаемого значения. 2. Христиансен *** описывал диссоциацию, происходящую вслед- ствие последовательных столкновений, с помощью уравнения диф- фузии в «координатах реакции» q, которые для двухатомных молекул представляют собой расстояния между двумя ядрами. Диффузия про- исходит в потенциальном поле V(<?), имеющем максимум Еа. Для того чтобы произошла диссоциация, энергия молекулы должна пре- высить Еа. Диффузионное приближение предполагает, что состояния расположены очень плотно и что скачки малы по сравнению с ха- рактерным радиусом изменения потенциала. Эта картина привела Крамерса**** к изучению броуновского движения в потенциальном поле, которое рассмотрено в § 8.7. С помощью длинных выкладок * Е. W. Montroll and К. Е. Shuler, J.Chem. Phys. 26. 454 (1957); Advances in Chemical Physics. I (I. Prigogine ed.. Interscience, New York, 1958), p. 361; S. K. Kim, J.Chem. Phys.. 28, 1057 (1958). ** L. Landau and Ё. Teller, Physik. Z. Sovjetunion, 10, 34 (1936). *** J. A. Christiansen, Z. Phys. Chemie B33, 145 (1936). Дальнейшее развитие см. в работе: А. Р. Penner and W. Forst, J. Chem. Phys. 67, 5296 (1977); M. Man- gel, J.Chem. Phys. 72, 6606 (1980). **** H. A. Kramers, Physica 7, 284 (1940). 184
он получил выражение для времени диссоциации, составной частью которого является множитель exp [£a/(feT)], имеющий принципиаль- ное значение и названный множителем Аррениуса*. 3. Схема Монтреля—Шулера случайного блуждания в простран- стве энергий привела к проблеме первого прохождения. Схема Хрис- тиансена—Крамерса случайного блуждания в координатном прост- ранстве привела к проблеме диффузионного проникновения через по- тенциальный барьер. Оппенгейм, Шулер и Вейс ** заметили, чтозадачу проникновения можно свести также к проблеме первого прохожде- ния. Возьмем точку снаружи потенциального барьера. Среднее время, необходимое для того, чтобы в первый раз достичь точки q, равно среднему времени проникновения через потенциальный барьер при условии, что он достаточно высок. Этот подход мы разберем в § 11.2***. Упражнение. Запишите уравнения для скоростей реакций (7.5.2) и покажите, что скорость диссоциации на самом деле пропорциональна плотности XY. когда реакция, записанная второй строкой, намного медленнее той, кото- рая записана первой. Упражнение. Для случая двух состояний уравнение (7.5.4) можно записать в виде Ро = — ₽p«4-api, (7.5.8а) Р1 = ₽Ро—«Pi—YPi- • (7.5.86) Для среднего времени выживания найдите значение (а Т Р+ ?)/(??)• По- кажите также, что p0 + Pi убывает по экспоненциальному закону для больших t, но скорость убывания не определяется этим временем выжи- вания, если только у слишком мало. Упражнение. Диссоциация и рекомбинация в присутствии инертного раствори- теля описывается схемой Хг + М^Д Х4-Х4-М. Если молекула Х2 обладает внутренними состояниями v, то уравнение для скорости реакции имеет вид **** и где с — концентрация атомов X. Постройте основное кинетическое уравнение * Другой вывод был дан в работе: R. В. Griffiths, С. Y. Wang and J. Lan- ger, Phys. Rev. 149, 301 (1966). Вывод Крамерса применим также к одношаго- вым процессам, см. N. G. van Kampen in: Fundamental Problems in Statistical Mechanics, IV (Proc. 1977 Intern. Summer School in Jadwisin, Poland; E. G. D. Cohen and W. Fiszdon eds., Ars Polona, Warsaw, 1978); Suppl. Progr. Theor. Phys., 64, 389 (1978). ** I. Oppenheim, К. E. Shuler, and G. H. Weiss, Physica. 88A, 191 (1977). *** Та же самая задача была решена в теории образования центров крис- таллизации в работе: R. Becker and W. Doring, Ann. Physik 24, 719 (1935). Литературу см. в кн.: J. L. Katz and M. D. Donohue, Advances in Chemical Physics, 40 (I. Prigogine and S. A. Rice eds., Interscience, New York, 1979), p. 137. **** Брау называет это уравнение нелинейным основным кинетическим уравнением: С. A. Brau, J. Chem. Phys. 47, 1153 (1976). 185
Упражнение. Постройте основное кинетическое уравнение для процесса иони- зации многоуровневых атомов водорода в плазме протонов и электронов * Упражнение. Молекулы X обладают колебательными состояниями v = 0, 1, 2.........Сталкиваясь, онн могут обмениваться квантами колебаний в про- цессе ** Ху+1Ч- Xy-i 2Ху (v—1,2, ...)• Постройте основное кинетическое уравнение н получите из него уравнение для скорости реакции и равновесное распределение (для фиксированного числа частиц заданной энергии). Упражнение. Примером (7.5.4) является уравнение Рп = а(Е—1)прп + Р(Е-!—1)(п-|- 1)р„ — (а-\-Ьп)рп (ОС-И <со), которое использовалось как модель диссоциации ***. Решите его с началь- ным условием рл(О) = 6по и определите зависимость диссоциации от вре- мени. Для каких начальных условий диссоциация происходит по экспо- ненциальному закону? 7.6. КОЛЛЕКТИВНЫЕ СИСТЕМЫ В качестве конкретного примера возьмем молекулы идеального газа, однако наше рассмотрение остается справедливым и в более общем случае. Рассмотрим систему, которая может находиться в различных состояниях, которые мы обозначим п. Эволюция системы описывается основным кинетическим уравнением pn^^(Wnn.pn -Wn-npn). (7.6.1) п Мы будем называть эту систему молекулой, а состояние и—уравнениями для того, чтобы отличать их от той системы и состояний, которые мы сейчас введем. Рассмотрим большую систему, состоящую из набора N подобных молекул, независимых друг от друга, каждая из которых описыва- ется уравнением (7.6.1). Точное состояние этой коллективной системы определяется набором чисел пи п2, п3, . . ., nN, обозначающих уров- ни, на которых находятся несколько молекул. Вероятность того, что коллективная система находится точно в этом состоянии, пред- ставляет собой произведение вероятностей для отдельных молекул: PntPn2- .PnN- (7.6.2) Предположим теперь, что мы интересуемся вопросом о том, сколько молекул занимает каждый уровень, независимо от того, одинаковы * W. L. Hogarth and D. L. S. McElwain. Proc. Roy. Soc., A345, 251 and 265 (1975); A.W. Yau and H. O. Pritchard, Proc. Roy. Soc., A 362, 113 (1978) ** T. A. Bak and P. G. Sorenson in: Stochastic Processes in Chemical Physics (Advances in Chemical Physics 15; К. E. Shuler ed., Interscience, New York, 1969). *** K. F. Freed and D. F. Heller, J. Chem Phys., 61, 3942 (1974); V. Kenkre and V. Seshardi, Phys. Rev., A15, 197 (1977). 186
ли они. Таким образом, мы просто интересуемся глобальным сос- тоянием, которое определяется набором чисел заполнения {N} = Nlt ЛГ2, . . ., Nn...Вероятность того, что коллективная система на- ходится в этом глобальном состоянии, определяется формулой Р{{^}) = ^рП1Рп2. • .pnN, (7.6.3) где суммирование распространяется на все значения п12 п.г, . . ., nN, совместимые с заданными числами заполнения. Примечание. Следует понимать, что переход к описанию с помощью чисел заполнения является чисто алгебраической процедурой. В некотором смысле он аналогичен тому, который в квантовой механике называют вводящим в заблуждении термином «вторичное квантование». Единственное отличие состоит в том, что здесь мы умышленно исключаем информацию о тождественности молекул, в то время как в квантово-механи- ческих приложениях (например, к фотонам или электронам) такая информация отсутствует с самого начала вследствие неразличимости частиц. Мы по-преж- нему будем считать, что состояния описываются статистикой Больцмана. Вероятность глобального состояния (7.6.3) изменяется, когда одна из молекул совершает переход с одного уровня п' на другой уровень п. Вероятность того, что одна из Nn- молекул, находящих- ся на уровне п', совершает такой переход в течение времени А/, есть Wnn’Nn'^-t. Вероятность того, что совершает переход две или большее коли- чество молекул, порядка (А/)2. Следовательно, Р удовлетворяет основному кинетическому уравнению Р({ЛЧ,/)= 2 1)А>Р(^}, t). (7.6.4) п, п' Это основное кинетическое уравнение однозначно определяется ос- новным кинетическим уравнением для одной молекулы (7.6.1), по- тому что физика в обоих случаях одинакова. Сейчас мы покажем, что решения (7.6.4) также можно выразить через уравнения решения уравнения (7.6.1). Достаточно показать это для решения уравнения (7.6.4) с на- чальным условием, в котором все N молекул находятся на одном и том же уровне т: Р ({А}, 0) 6 (Уи, N) П 6( V„, 0), (7.6.5) п Ф т где буквой дельта обозначены символы Кронекера. Пусть pn,m(t) — решение уравнения (7.6.1) с pn, m (0) = 6 (и, т). При />0 каждая из молекул с вероятностью pn.m(i) занимает уровень/г. Тогда, согласно (1.3.11), вероятность того, что реализуются числа заполнения .V ъ N2, . . ., дается выражением ^({П 0 = ^ ){й,яИГ-{й.в(0}л'--- (7-6.6) 187
Понятно, что полиномиальный коэффициент обращается в нуль, кроме тех случаев, когда все Nn неотрицательны и сводятся к У. Это решение уравнения (7.6.4) с начальным условием (7.6.5) Распределение (7.6.6) является многомерным обобщением бино- миального распределения. Теперь рассмотрим ансамбль подобных систем, в' котором полное число У не является постоянным, а рас- пределено по Пуассону со средним значением (,V>. Тогда распреде- ление вероятности в этом большом ансамбле есть X т<) = Е^е-<Л'>Р({п/) = N=0 где <Л\> — <Л’> ,л (/) и т. д. Это выражение представляет собой произведение независимых распределений Пуассона. Упражнение. Проверьте с помощью прямой подстановки, что (7.6.6) удовлет- воряет (7.6.4). Упражнение. Выведите из (7.6.4), что средние <.V„> удовлетворяют тому же уравнению (7.6.1): Ф П/ ~ {^ПП' — Wn,n п' а следовательно, <A'„>f/W = p„,M(0. (7.6.7) Этот факт подтверждает, что наш набор молекул может служить ансамб- лем, предназначенным, согласно § 3.2, для наглядного представления ве- роятностей рп. Упражнение. Найдите решение уравнения (7.6.4), когда молекулы в начальном состоянии распределены по уровням произвольно. Упражнение. Покажите, что уравнение (7.6.4) можно интерпретировать как основное кинетическое уравнение для соответствующим образом выбран- ной схемы химической реакции. Упражнение. Предположим, мы группируем уровни в «фазовые ячейки», каж- дая из которых содержит один или большее число уровней. Тогда распре- деление вероятности чисел заполнения ячеек снова дается (7.6.6), где — вероятность того, что молекула, стартуя с уровня т, окажет- ся в ячейке п за врема t. Упражнение. Из уравнения (7.6.4) можно также вывести уравнения для вто- рых моментов. Проще всего этот результат выражается через факториаль- ные кумулянты (1.3.13): Ф = S wnn, [Hn-Nk] + 2 [адн- (7.6.8) п’ k' Эта формула использована в гл. 12. Возьмем частный случай, когда имеется только два уровня п = 1, 2. Тогда (7.6.4) сводится к уравнению P(N» N2, 0 = ^i2(Er1E2-l)^P + U/2I(E2-1E1-l)<V1P. 188
Поскольку N2 — N— Nu это можно записать как • P(h\, 0 = ₽(Е1-1-1)^-Л?1)/’ + а(Е1-1)Л?1Р. (7.6.9) Это линейное одношаговое основное кинетическое уравнение типа, изученного в § 6.6. Следовательно, такие уравнения можно интер- претировать как уравнения, описывающие ансамбль двухуровневых систем. Каждая такая система описывается простым кинетическим уравнением: А = —aPit-pA, (7.6.10) а = “а—Ра- Поскольку решение этого основного кинетического уравнения триви- ально, сразу находим решения уравнения (7.6.9) в виде (7.6.6). Эго объясняет, почему мы смогли решить линейное одношаговое основное кинетическое уравнение явно (хотя и не каждое из них можно интерпретировать таким способом). С другой стороны, когда коэф- фициенты одношагового основного кинетического уравнения являются нелинейными функциями п (как в § 6.9), т. е. когда молекулы взаимодействия, его решение оказывается существенно более труд- ным делом. Упражнение. Покажите, что решение процесса распада в § 4.6 является при- мером сведения основного кинетического уравнения к уравнению типа (7.6.10). Упражнение. Квантованный гармонический осциллятор в примере 1 из § 6-4 можно рассматривать как набор фотонов, каждый из которых является либо свя- занным, либо свободным Почему, несмотря на это, основное кинетическое уравнение (6.4.1) невозможно интерпретировать изложенным здесь спо- собом? Упражнение. Переформулируйте модель урн Эренфеста (см. (4.5.4)), заметив, что каждый шар может иметь два состояния * **. С точки зрения химика энтропия системы является макроскопи- ческой функцией состояния, т. е. функцией, зависящей от системы. В статистической механике энтропия является мезоскопической величиной, т. е. функционалом, зависящим от распределения веро- ятности. Но энтропия никак не может быть микроскопической величиной, потому что на микроскопическом уровне отсутствует необратимость * *. Мезоскопическая энтропия физической системы с состояниями, согласно (5.5.7), имеет вид S(0==-fe£A,log4 + se, (7.6.11) * F. G. Hess, Amer., Mathem. Monthly, 61, 323 (1954). ** Этот момент был убедительно обоснован П. н Т. Эренфестами в их знаменитой статье, цитированной в § 5.4. Однако этими аргументами часто пренебрегают, что приводит к «парадоксу», когда энтропия является интегра- лом движения, см : A. Wehrl, Rev. Mod. Phys., 50, 221 (1978). 189
где se = const в том случае, когда система является замкнутой и изолированной. Для энтропии набора У независимых одинаковых систем формула (7.6.11) дает {Л'} В соответствии с (7.6.3) S(t) = -kV 7’({/V})iognf-^yn + se = = -feV<A^>log4 + Se. (7.6.12) p” С учетом (7.6.7) это равно Ns, если не учитывать дополнительной константы. Обычно определяют еще равновесную энтропию Se таким образом, что Se = Nse. Но если независимые системы, образующие набор, представляют собой газы, занимающие один и тот же объем, то возможны разные способы определения 5е (парадокс Гиббса). В любом случае неравновесная часть мезоскопической энтропии набора является суммой неравновесных частей отдельных систем. Упражнение. Объем Q разделен на две отдельные части Q2. сообщающиеся через небольшое отверстие. Он заполнен идеальным газом; каждая моле- кула может находится в Й! и в Й2 и, следовательно, имеет два «уровня». Примените (7.6.10) для нахождения решения (7.6.9) и свяжите (7.6.11) посредством (7.6.12) с термодинамической энтропией. Упражнение. Донор окружен г участками решетки, обозначенными j, каждая из них имеет вероятность е 7 быть занятой акцептором. Если так, то имеется вероятность Ру за единичное время возбудить донор и перевести его в состояние акцептора. Предположим, при t = 0 имеется N таких до- норов, не зависящих друг от друга. Каково распределение вероятности числа выживших доноров в любое последующее время *? 7.7. СОСТАВНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ Следующую модель используют в самых разных приложениях, и, кроме того, она представляет общий интерес. Рассмотрим моле- кулу, имеющую некоторое число внутренних состояний, или «уров- ней» i. С каждой i она может перейти на какой-нибудь уровень j с заданной вероятностью перехода за единичное время уу,,. Далее молекула помещена в растворитель, в котором она диффундирует с коэффициентом диффузии, зависящим от ее состояния I. Вероят- ность найти молекулу, имеющую уровень i в момент времени t в точке пространства, с координатами г, окруженной объемом d3r, есть Рj (г, /) d3r. Когда молекула находится в состоянии i вероят- ность удовлетворяет уравнению A(r, /) = D,V2P,-(r, 0. (7.7.1) * A. Blumen and J. Manz, Chem. Phys., 71, 4694 (1979). 190
Эта модель использована для описания самодиффузии молекул воды в воде для объяснения данных по расстоянию нейтронов *. Основное кинетическое уравнение для P,(r, t) получается добав- лением к уравнению (7.7.1) скорости изменения, вызванной перехо- дами между уровнями: Р, (г, 0 = D,- V2P, (г, П + 2 {у,., Л (г, /)-уЛ,Л(г, /)} (7.7.2) ! В этом уравнении предполагается, что за время перехода коорди- наты г не изменяются и что вероятности перехода являются кон- стантами, не зависящими от г. Эту схему можно обобщить, заменив оператор диффузии в урав- нении (7.7.1) на оператор общего вида F,-, зависящий от i и дейст- вующий на координатные переменные. Например, физику хромато- графии объясняют** с помощью рассмотрения независимых молекул, которые могут либо находиться в жидкости (£ = 1), либо быть поглощенными на поверхности (i = 2). Когда они находятся в жид- кости, они увлекаются ее течением со скоростью V, так что Ft = -(vV), F2 = 0- (7.7.3) Можно, конечно, добавить какие-нибудь тонкости, такие, как диффузия в жидкости или поглощающие участки несколько типов ***. Поэтому полезно изучить основное кинетическое уравнение вида Л(г, 0 = F,A(r, 0 + 2{?мЛ(г, О-Тл/Л(г, 0}- (7.7.4) i Решив это уравнение, мы определим вероятность найти в момент времени />0 систему в состоянии (i, г), если при ( = 0 она была в состоянии (i0, г0). Эта задача разбивается на два последовательных шага: сначала можно определить, как молекула переходит с уровня на уровень независимо от ее положения г, а затем добавить ее поведение в зависимости от координат г. По этой причине мы исполь- зуем название «составные марковские процессы» для любого случай- ного процесса, удовлетворяющего основному кинетическому урав- нению (7.7.4). Возьмем частную реализацию вышеупомянутого процесса, т. е. предположим, что известна последовательность моментов времени тб, в которые происходят переходы, а также последовательность зани- * К- S. Singwi and A. Sjolander, Phys. Rev., 119, 863 (1960). ** J. C. Giddings and H. Eyring, J. Physical Chem., 59, 416 (1955); J. C. Giddings, J. Chemical Phys., 26., 169 (1957). *** Таким способом можно описать и некоторые немарковские процессы см.: G. Н. Weiss. J. Statist. Phys., 8, 221 (1973); К- Lindenberg and R. I. Cukier, J. Chem. Phys., 67, 568 (1977); N. G. van Kampen, Physisica, 96 A, 435 (1979). 191
маемых уровней 0<Т|<Г2< •" < *о (7.7.5) Вероятность при этом условии иметь координаты г выражается формулой ГЛ> (Г, 0]усл = ехр [(/ —ь) F(-s] ехр [(т5—т^) j х < ехр [(т2 -Tt) FJ ехр [тгР,о] Р,о (г, 0). (7.7.6) Решение уравнения (7.7.4) получают с помощью умножения (7.7.6) на вероятность того, что имеет место реализация (7.7.5), и после- дующим суммированием по всем реализациям. Для того чтобы найти эту вероятность, сначала отметим, что вероятность выживания на каком-либо уровне i хотя бы в течение времени т, согласно (4.6.3), есть е‘?'т, где у,- = 2Т/> Тогда веро- i ятность того, что промежуток времени между т и т -j- dx происходит переход с уровня i на уровень /, имеет вид 7/, (e-v*T dr. Следовательно, плотность вероятности того, что реализуется (7.7.5) есть Ущ i. ехр [— T/jd yt„ i, ехр [— ул (т2 — т,)].. . х :< »5_, ехр [— у^_, (т,—ехр [—yis (t —\)]. Отсюда Р: (г, t) = 2 1А7о ехр [— у,,/] ехр [/F,J + /о + 2. 2. JdTjdT2 ... dxsexp[— у;(г — т5)]ехр[(/—Tt)F,]x Xехр [— yls_,(Ts — Ъ-i)] ехр [(rs-—т^) F,-s_,]... х Ху,-, ,„ехр [— y^exp^FJIPJr, 0). (7.7.7) Интегрирование распространяется на все значения тх, т2, ..., т5 с пределами, заданными (7.7.5), и у,-, ,= 0. Это запрещающее выражение можно записать более компактно. Рассматривая P, (r, t) как компоненты вектора Р(г,/), определяем матрицы X(7(/) = y,.>/e-V+'F/, у. у(/) = 6. ;.e-V+ZF7. 192
Тогда (7.7.7.) сводится к t)^ Р(г, со * Т5 _ । ПО + 2 $ dx, J dx,.! J dxs_2 s-1 о о 0 T, . . J dxj X о ХГ(/—x,)X(x,—x,_1)X(x,_1 —x,_2)...X(x1) P(r, 0). (7.7.8) Теперь введем преобразование «А е~иР (г, t) d/ = Р (г, X). о Тогда свертки в (7.7.8) превращаются в произведения: Р(г,Х)=.. Г(Л)+ 2WWI’ Р (г, 0) = Г(Х) {1 - Х(Х)}"1? (г, 0). S = 1 (7.7.9) Решение (7.7.4) имеет вид c + i со = i J е^Г(Л) {1-Хронаг/Чг, 0), (7.7.10) с-i со где с выбирается правее всех сингулярностей подынтегральной функции. Приложение. В качестве модели двухступенчатой диффузии возьмем *= 1, 2 и F,-, как в (7.7.1). Тогда у12 = у2 н у2,1 = Т1-.Для вычисления сечения рас- сеяния нейтронов необходимо знать плотность вероятности Gs (г, t) того, что молекула при t = 0, находившаяся в точке г=Щ, в момент времени / окажется в точке с координатами г. Дифференциальное сеченне рассеяния является ее преобразованием Фурье по пространству и по времени. Удобно применить преобразование Фурье по пространственным переменным непосредственно к (7.7.4), так что оба оператора F; сводятся к множителям F, = — D,£2. Тогда имеем 6/, i Yi' J (X)^X + Y7 + DyA:2 ’ И наконец, в качестве начального состояния берем дельта-функцию при г = 0: Pi (k, 0) = (2n)-3g„ где gj является равновесным распределением уровня I. Подстановка в (7.7.9) дает ;^1(*. A,)^ = fFU 0\ ______j ~ < 1 (2л)-3. ^Р8(*. М/' \0 Y2iJ 1—*12*21 \-£и 1 193
Gs(k, X)=A (k, x)+A(k,x) Поскольку рассеяние нейтронов не отличается для молекул, нахо- дящихся на разных уровнях, то интересно узнать плотность веро- ятности в пространстве G,(r, t)^=Pi(r, t) + P2(r, t). Ее преобразо- вание Фурье —Лапласа . glKll~|-g2^22— gl^ZZ-^l— 81X11^12_ (2л)3 (1-*12X21) = + gl Y2 + g2Yl + (gl£>2 + gZ£>l) ~glYl — g2?2 (7 7 , . V (2л)з{(Х+у1 + Р^2)а + ?2 + р2Л2)_71?2} • Реально наблюдается величина G5(k, ®) = G,(k, iw)4-G5(k, — i®). (7.7.12) Упражнение. Докажите (7.7.12). Упражнение. Покажите, что gi = Y2(Yi + ?2)'1; g2 = Yi (?i + уг)-1- Упражнение, Поведение Gs(r, /) при больших t определяется полюсом выра- жения (7.7.10) с наибольшей действительной частью. В связи с этим по- кажите, что б^(г, t) при больших t удовлетворяет уравнению диффузии с перенормированным коэффициентом диффузии D' — giD} +g2£>2- Насколько' большим должно быть /? Упражнение. Решите таким же способом модель хроматографии, заданную выражением (7.7.3). Покажите, что средняя дрейфовая скоростть есть z/=gio. Упражнение. Формализм настоящего раздела можно также применять для ответа на следующий вопрос. Предположим, имеется простой марковский процесс с постояными вероятностями перехода Р/ = 2 (УиР)— VjiPi')- (7.7.13) i Найдите распределение вероятности времени, которое система проводит в заданном состоянии k (в течение интервала времени от 0 до t). Пока- жите, как характеристическая функция этого распределения получается из (7.7.10), если положить Fft = io>, а все остальные Fy— равными нулю. Как это связано с (5.3.6)? Упражнение. Покажите, как решение задачи в предыдущем упражнении’можно использовать для того, чтобы получить решение хроматографической задачи. Упражнение. Для процесса, определенного в связи с (2.1.8), выведите для /1 > 0 формулу j со G(G)=^ f “^-e^dX. 2ju J 1—ш(к) — i co Покажите также что fn(G, •••> in)— fi (G) fi Hz—ii)-fi(in tn-i)- Упражнение. Решение обычного основного кинетического уравнения для несо- ставных марковских процессов, таких, как (5.1.5), можно также записать как сумму по реализации. По аналогии с (7.7.10) результат имеет вид с + i ® Р(у, t/y0. 0) = 2^ J е^К (Х){1-X (X)}-1 dX. с—ico Получите эту формулу непосредственно и покажите, что полюсы в ней являются собственными значениями W. Это формулировка марковских процессов с помощью интегралов по траекториям. 194
Упражнение. Пусть Y (t)—дискретный марковский процесс со значениями у, и основным кинетическим уравнением (7.7.13). Пусть G ([£])—его произ- водящий функционал (3.4.4). Покажите, что G можно найти, решив урав- нение *1 = 2 ixj~4p >x.') + ik U) У.х< i с соответствующим начальным условием, а затем положив * g d^])=2 х‘ у=°°)- ГЛАВА 8 УРАВНЕНИЯ ФОККЕРА —ПЛАНКА И ЛАНЖЕВЕНА Уравнение Фоккера—Планка является частным случаем основ- ного кинетического уравнения и часто используется как его прибли- женная форма. Уравнение Ланжевена отличается от уравнения Фок- кера— Планка, но математически эквивалентно ему. Оба уравнения оказываются полезными в линейных задачах, хотя для нелинейных систем их использование наталкивается на некоторые трудности. 8.1. ВВЕДЕНИЕ Уравнение Фоккера — Планка является частным случаем основ- ного кинетического уравнения, в котором W представляет собой оператор второго порядка, а именно (у)Р + 4 -£-гВ(у)Р. (8.1.1) dt dy 1 2 ду2 \ ! Область возможных значений переменной у обязательно непре- рывна, и здесь мы будем считать ее бесконечной (—оо, 4 оо). Коэффициенты А (у) и В (у) могут быть любыми действительными дифференцируемыми функциями с единственным ограничением б ((/) > 0- Уравнение (8.1.1) можно разбить на два. Первое пред- ставляет собой уравнение непрерывности для плотности вероятности 0 dJ (у, t) ,g j 2. dt ду ’ ' ’ ’ ‘ где J(у, () — поток вероятности. Второе уравнение является «основным»: J(z/, t) = A(y)P-x/2£-B(y)P. (8.1.3) Уравнение Фоккера — Планка (7.1.1) называют также уравнением Смолуховского, вторым уравнением Колмогорова или обобщенным уравнением диффузии. Первый член в правой части уравнения (8.1.1) называется переносным, конвективным или дрейфовым, а второй — * N G. van Kampen, Phys. Letters, 76A, 104 (1980). 195
диффузионным или флуктуационным. Конечно, эти названия не должны предрешать заранее их физическую интерпретацию. Неко- торые авторы различают уравнение Фоккера — Планка и основное кинетическое уравнение, употребляя последнее название только для дискретных процессов, таких, как одношаговые процессы. Пусть для t~^tY Р(у, t) | уи —такое решение уравнения (8.1.1), что при t = t1 оно сводится к 6(у—yj. В соответствии с (4.2.2) можно построить марковский процесс с вероятностью перехода Р(Уг, ?г\У1, Л), У которого единовременное распределение P1(yl, можно выбрать произвольно в один начальный момент времени Если выбрать для Рг стационарное решение уравнения (7.1.1) РЧу) г у const ехр 2 С А{у,) du' S(i/) Р J в (у') аУ • L о J (8.1.4) то получающийся марковский процесс является стационарным. Для того чтобы функция Ps могла представлять распределение вероят- ности, она должна быть нормирована, однако это возможно только тогда, когда Ps интегрируема. Марковские процессы, у которых основное кинетическое уравне- ние имеет вид (8.1.1), называют непрерывными, поскольку можно доказать, что их выборочные функции непрерывны (с вероятностью 1). Это название иногда приводит к неправильной мысли, что все про- цессы с непрерывной областью возможных значений относятся к этому типу и, следовательно, должны удовлетворять уравнению (8.1.1). По определению, уравнение Фоккера — Планка всегда линейно по Р*. Поэтому прилагательное «линейное» можно использовать в разных смыслах. Мы будем называть уравнение Фоккера — Планке (8.1.1) линейным, если А—линейная функция у и В- const: Если Ai < О, то стационарное решение (8.1.4) гауссово. Действи- тельно, в этом случае с помощью сдвига и изменения масштаба переменной у уравнение (8.1.5) можно свести к (4.3.20) и таким образом прийти к выводу, что стационарный марковский процесс, определяемый линейным уравнением Фоккера — Планка, является про- цессом Орнштейна — Уленбека. При стационарного распреде- ления вероятности не существует. Упражнение. Пусть Р (у, t | у0, /0) —решение уравнения (8.1.1) Возьмем/ = tB + M и вычислим моменты величины у—уп — М при малых А/. Пока- жите, что при А/ -—*•() ^=Л(Ло); ^р = 0, <81-6) где v. .-З. * Уравнение Ландау в теории плазмы является нелинейным вариантом, но там Р представляет собой плотность частиц, а не вероятность. 196
Упражнение. Найдите сингулярное ядро W(y|y')> соответствующее дифферен- циальному оператору в уравнении (8.1.1). Вычислите его моменты перехо- дов (5.8.2) и сравните результаты с (8.1.6). Упражнение. Покажите, что дифференциальный оператор в (8.1.1) обладает свойствами W-матриц: он сохраняет вероятность и положительность. Пока- жите также, что при В (у) > 0 он неприводим и все решения стремятся к стационарному решению (8.1.4) (при условии, что решение нормируемо). Упражнение. Покажите, что любой линейный дифференциальный оператор вто- рого порядка, обладающий этими свойствами, перечисленными в преды- дущем упражнении, должен иметь вид (8.1.1). Упражнение. Решите уравнение (8.1.1) при В (у) = 2, А(у)~ — у+\/у, у>0, а также при В = const # 2 *. Упражнение. Найдите явное решение уравнения (8.1.5). Мы ввели уравнение Фоккера — Планка как частный вид основ- ного кинетического уравнения. Однако в основном его используют для приближенного описания произвольного марковского процесса Y (/), у которого отдельные переходы (скачки) невелики. В этом смысле линейное уравнение Фоккера — Планка использовалось в част- ных случаях Рэлеем**, Эйнштейном***, Смолуховским **** и Фоккером *****. Затем Планк****** из произвольного основного кинетического уравнения вывел общее нелинейное уравнение Фоккера — Планка, предположив только, что скачки малы. И наконец, Колмого- ров ******* дал математически строгий вывод этого уравнения, перейдя к пределу бесконечно малых скачков. В качестве приближенной замены основного кинетического урав- нения общего вида (5.1.5) уравнение Фоккера — Планка обладает двумя привлекательными чертами. Во-первых, оно является диффе- ренциальным, а не дифференциально-интегральным уравнением. Хотя его и не удается решить явно, кроме некоторых частных случаев, оно все равно проще в обращении. Вторая особенност; более важна, она состоит в том, что нам не нужно знать полное ядро W(y\y'), а достаточно знания функций А (у) и В (у). Для любого подлинно стохастического процесса эти функции можно найти зная лишь минимум о механизме, лежащем в основе этого процесса. Сделать это можно следующим образом. Предположим, что физика некоторой системы подсказывает нам, что величина у приближенно должна быть марковским процессом. Время Д/ выбираем настолько * См. [6, § 4.4]. Другие решаемые уравнения Фоккера—Планка даются в работе: R. 1. Cukier, К. Lakatos-Lindenberg and К- Е. Shuler J. Statist. Phys. 9, 137 (1973). ** Lord Rayleigh. Phil. Mag. 32, 424 (1891 )-Scientific Papers III (University Press, Cambridge, 1902), p. 473. *** A. Einstein, Ann. Physik (4), 17, 549 (1905); 19, 371 (1906). **** n. von Smoluchowski, Ann. Physik, (4) 21, 756 (1906); Physik. Zeits., 17, 575 and 585 (1916). ***** д £ Fokker, Thesis (Leiden 1913); Ann. Physik (4) 43, 810 (1914). ****** д Planck, Sitzungsber. Preuss. Akad. Wissens. (1917), p. 324-Physika- lische Abhandlungen und Vortrage, II (Vieweg, Braunschweig, 1958), p. 435. ******* д Kolmogorov, Mathem. Annalen., 104, 415 (1931). 197
малым, что у в течение этого времени существенно не меняется, но все же достаточно большим для того, чтобы выполнялось пред- положение о марковости. Вычислим для этого короткого времени среднее изменение <Ау>у и его средний квадрат <(Af/)2>j, в первом порядке по А/. Согласно уравнению (6.1.6), этого достаточно, чтобы найти А (у) и В (у) и отсюда получить уравнение Фоккера—Планка. При таком рассмотрении пути истинные уравнения движения можно решить только для малого времени А/, например сделать с помощью теории возмущений. Тогда поведение системы на больших временах можно определить с помощью уравнения Фоккера—Планка. Описа- ние системы удается разделить на описание ее поведения на корот- ких и на больших временах, используя предположение о марковости. Существует и другой, более феноменологический путь определения функций А и В. Из (8.1.1) имеем dt <у'> = <А (у)>. (8.1.7) Если пренебречь флуктуациями, то A (<t/>) = <А (г/)> и для диффе- ренциального уравнения, содержащего только величину <у>, полу- чаем dt<y>=A«y>). Это уравнение отождествляется с макроскопическим уравнением дви- жения системы, которое предполагается известным. Таким образом, функция А (у) определяется из наших сведений о макроскопическом поведении. Затем получаем В {у), отождествляя (8.1.4) с равновесным распределением, которое, по крайней мере для замкнутой физической системы, известно из обычной статистической механики. Таким образом, для вывода уравнения Фоккера—Планка и, следовательно, для вычисления флуктуаций достаточно знать макроскопический закон и равновесную статистическую механику. Эйнштейн и другие с большим успехом использовали это феноме- нологическое определение функций А и В (см. § 8.3), но только для линейных уравнений Фоккера — Планка. Если макроскопический закон нелинеен, то, как впервые отметил Макдональд*, возникают трудности. Недостаток аргументов заключается в отождествлении коэффи- циента А (у) с макроскопической зависимостью, хотя они вполне могут отличаться на член, имеющий тот же порядок величины, что и флуктуации: как только мы пренебрегаем флуктуациями, этот член в любом случае пропадает. Вследствие этого разные авторы получали разные, но одинаково правдоподобные выражения для шума в нели- нейных системах. Эта трудность обусловила развитие более фунда- ментального подхода, излагаемого в следующей главе. Однако в настоящей главе мы ограничимся традиционным рассмотрением. * Phil. Mag. 45, 63, and 345 (1954); Phys. Rev. 108, 541 (1957). Подробнее см. в кн.: N. G. van Kampen in: Fluctuatin Phenomena in Solids (R. E. Bur- gess ed., Acad. Press, New York, 1965). <98
Мы будем тщательно следить за тем, чтобы оставаться в пределах применимости, хотя эти пределы станут понятными лишь в следующей главе. Если у читателя возникнут какие-либо сомнения, советуем ему отложить их на потом. В § 8.8 дано приближение Ланжевена. Математически оно экви- валентно приближению Фоккера — Планка, но используется в физике даже более широко, поскольку сформулировано на более привычном языке. Однако в нелинейных случаях оно наталкивается на те же самые и даже на некоторые дополнительные трудности; они состав- ляют предмет § 8.9. Упражнение. Вычислите величины (8.1.6) для случайного блуждания (6.2.1) и постройте уравнение Фоккера—Планка. Покажите, что асимптотическое распределение (6.2.12) удовлетворяет этому уравнению. Упражнение. Тот же самый вопрос для асимметричного случайного блужда- ния (6.2.13). Упражнение. В RC-цепи с неомическим сопротивлением уравнение Фоккера — Планка для напряжения U в соответствии с изложенными выше феномено- логическими аргументами имеет вид dt dV CR(V) ' 2 dV2 { ' Г -V V В = const — 2 J ________ -CV'2/(2fer) _ CR(V') (8.1.8a) (8.1.86) Смотрите, однако, обсуждение в § 8.9. Упражнение. Примените к уравнению (8.1.1) нелинейное преобразование у—ф(у) и покажите, что преобразованная плотность Р (у, t) подчиняется уравнению Фоккера — Планка с коэффициентами В (у) = {Ф' (У)}2 В (у), Л(у) = Ф'(у)Л (у) + 1/2Ф"(у)В(у). (8.1.9) Упражнение. Критерий (5.6.1) детального равновесия нельзя применить к урав- нению (8.1.1), но его эквивалентная формулировка (5.7.5) пригодна для дифференциальных операторов основного кинетического уравнения *. Пока- жите, что (8.1.^-удовлетворяет соотношению детального равновесия тогда и только тогда, когда А (у}==2РЦу)^Ре{у}В{у}’ <8 L1°) В этом случае уравнение можно записать в следующем виде: дР (У> - 1. ± ре (и} В (и) ± Р<У’ 18 1 1 п dt ^dy ду ре{у) <8111> 8.2. ВЫВОД УРАВНЕНИЯ ФОККЕРА — ПЛАНКА Планк вывел уравнение Фоккера — Планка как аппроксимацию основного кинетического уравнения (5.1.5) следующим образом. Сна- чала выразим вероятность перехода W как функцию скачка г и * S. R. de Groot and N. G. van Kampen, Physica, 21, 39 (1954). 199
начальной точки: W(y\y') = W(y', г), г = у-у'. (8.2.1) Тогда общий вид основного кинетического уравнения (5.1.5) таков: Г)Р(У-Г, t)dr-P(y, t)^W(y, -Г) dr. (8-2.2) Основное предположение состоит в том, что имеют место только малые скачки, т. е. W (у'; г) является функцией, имеющей острый пик по переменной г, но медленно меняется с изменением у, или, говоря более точно, существует некоторая величина 6 > 0 такая, что W (у'-, г) а* 0 для | г | > 6, (8.2.3а) W'j' + ^y; r)»W(y'; г) для |Ду| .0. (8.2.36) Второе предположение состоит в том, что интересующее нас реше- ние Р (у, t) также медленно меняется с изменением у (в том же смысле, что и (8.2.36)). Тогда можно выполнить сдвиг из у в у—г в первом интеграле (8.2.2) с помощью разложения Тейлора до вто- рого порядка: ^Г^^у, Г)Р(у, t)dy-^r^{W{y. r)P(y, t)}dr + Г)Р{У’ ^Аг~Р(У’ ^(у, -r)dr. Отметим, что зависимость W (у; г) от своего второго аргумента г полностью сохраняется; разложение по этому аргументу недопустимо,, поскольку W быстро меняется по г. Первый и четвертый члены сокращаются. Другие два члена можно записать с помощью момен- тов перехода «v(y)=; J P’W (у, г) dr, (8.2.4) - оо уже определенных в (5.8.2). Результат имеет вид - + ^{а.Лу)Р}. (8.2.5) Таким образом, мы вывели уравнение Фоккера—Планка (8.1.1) из основного кинетического уравнения и одновременно выразили коэффициенты через вероятности перехода W. Эти выражения с точ- ностью до обозначений совпали с (8.1.6). Примечание. Совсем не трудно включить все члены разложения Тейлора в (8.2.2): <e.2.e> V—1 4 ' 200
Это так называемое разложение Крамерса—Мойала*. Уравнение (8.2.6) формально совпадает с основным кинетическим уравнением и поэтому не дает упрощений; подразумевается, однако, что его можно оборвать, оставив неко- торое подходящее количество членов. Приближение Фоккера—Планка предпо- лагает, что все члены после Х = 2 пренебрежимы. Колмогоровское доказательство основано на предположении, что av = 0 для v > 2. Однако это предположение для физических систем не выполняется**. В следующей главе мы расположим основное кинетическое уравнение систематическим образом по степеням малого параметра и найдем, что ие существует простого соответствия между после- довательными порядками и последовательными членами разложения Кра- мерса—Мойала. Упражнение. Для процесса распада, рассмотренного в § 4.6, постройте уравне- ние Фоккера — Планка, используя (8.1.6). Покажите, что оно правильно дает первый и второй моменты, но не для Ps. Упражнение. Постройте уравнение Фоккера — Планка для симметричного слу- чайного блуждания и выведите из него (6.2.12). Упражнение. Найдите высшие av для случайного блуждания и заметьте, что они не малы. Почему, несмотря на это, уравнение Фоккера — Планка дает правильный результат (6.2.12)? Упражнение. Частица на большой скорости пересекает среду, в которой стал- кивается со случайно расположенными рассеивателями, которые ее слегка отклоняют с дифференциальным сёченнем о(0). Найдите уравнение Фок- кера— Планка для полного отклонения, предполагая его малым. Упражнение. Выведите из (8.2.5) соотношения dt <t/> = <ai (у)>, dt <<У2» = 2<.(у—<уу) аг (у)у -г <а2 (у)>. (8.2.7) Покажите также, что они являются точными следствиями основного кине- тического уравнения. Отметим, что аналогичные соотношения для высших моментов уже не удается правильно воспроизвести с помощью уравнения Фоккера — Планка (ср. с § 5.8). Упражнение. Рассмотрите процесс с независимыми приращениями, определен- ными в (4.4.7). Его основное кинетическое уравнение решено в упражне- нии § 5.1. Исследуйте, как модифицируется общее решение в приближении Фоккера — Планка. Покажите, что для Р (у, 11 у0, /0) это приближение является плохим, когда t — /0 < a4/<j2, из-за того, что второе предположе- ние, приведенное выше, не выполняется. Уравнение Фоккера — Планка станет не приближенным, а точным, если коэффициенты в W будут зависеть от параметра е таким образом, чтобы сделанные предположения были точными в пределе е - О [1, р. 333]. Мы продемонстрируем этот подход на асимметричном случайном блуждании, которое описывается основным кинетическим уравнением (6.2.13) в виде Рп = “ (pn+i—рп) + Р (Рп-i—Рп)- (8.2.8) Сначала выберем масштаб шагов, полагая en = x, рп (t) = гР (х, t). Это приведет к тому, что весь процесс вмещается в малый интер- вал х и, для того чтобы компенсировать малость шагов, нужно * J. Е. Moyal, J. Roy. Statist. Soc. (В), 11, 150 (1949). ** N. G. van Kampen in: Thermodynamics and Kinetics of Biological Systems (A. I. Zotin ed., W. de Gruyter, Berlin, 1981). 201
увеличивать масштаб вероятностей перехода а, 0. Для того чтобы удержать период на естественных масштабах, нужно положить ₽ — а = Л/е с постоянной А, не зависящей от е. Аналогично, для того чтобы диффузионное расплывание не обратилось в нуль, надо положить 04--а = ₽/е2. Тогда (8.2.8) принимает вид В_____£\ ( <?/> 1 , д2Р , ( , dt \ 2е2 2е / | ' 2 дх2 ' ' | . / В , А \ i дР , 1 . д2Р | 1 \ 2е2 2е } ) дх 2 дх2 " ' I AD 1 /)2р = —А-^- + 4-5 4V + 0(ea). (8.2.9) дх 2 дх2 * 1 v ' ' ' Таким образом, мы получили уравнение Фоккера — Планка как точ- ный результат в пределе е 0. Однако этот вывод неудовлетвори- телен, потому что на практике параметр е не стремится к нулю. Возникает вопрос: насколько хорошим приближением является приближение Фоккера — Планка для заданных а, 0 (или в более общем случае для заданной й7)? На этот вопрос дает ответ вывод уравнения, принадлежащий Планку, или более систематический вывод, приведенный в следующей главе. Упражнение. Проверьте, что коэффициенты в уравнении (8.2.9) действительно совпадают с коэффициентами в (8.1.6). Упражнение. Проверьте, что коэффициенты в уравнении (8.2.9) действительно совпадают с коэффициентами в (8.1.6). Упражнение. Покажите, что разные зависимости а и ₽ от « не приводят к уравнению (8.2.9). Упражнение. Основное кинетическое уравнение для мальтузианской популяции имеет вид рп = а (Е — 1) прп+₽ (Е-1— 1) прп. Выведите приближение (8.2.5) непосредственно, а также с помощью соот- ветствующего е-п редела. 8.3. БРОУНОВСКОЕ ДВИЖЕНИЕ Физическое описание броуновской частицы дано в § 4.1. Оно привело нас к заключению, что координату броуновской частицы X можно рассматривать как марковский процесс в огрубленном масштабе времени. Частица при таком движении совершает случай- ные прыжки вперед и назад по оси X. Прыжки могут быть любой длины, но вероятность больших прыжков убывает. Более того, ве- роятность симметрична и не зависит от начальной точки. Тогда <дх>, „ <(ДХ)2>х * а, == .= 0, а, = ., = const. Д/ ’ 2 txt 202
Уравнение Фоккера — Планка для перехода имеет вид dP(X, /)_ а2 й2Р(Х, t) „ „ . di 2 dX2 ’ (8.3.1) Даже не решая это уравнение можно прийти к следующему важному заключению. Оно имеет тот же самый вид, что и уравне- ние диффузии (4.2.8), и на самом деле является уравнением диф- фузии для броуновских частиц в жидкости. Следовательно, 1/2а2 тождественно совпадает с феноменологической константой D. С другой стороны, а2 выражается через микроскопические члены с помощью (8.2.4) или (8.1.6). Это приводит к соотношению Эйнштейна D = <(А9У>л , ’ (8.3.2) 2Л/ ’ ' ' которое связывает макроскопическую константу D с микроскопиче- скими скачками частицы. Рассмотрим ансамбль броуновских частиц, которые при t = О все находятся в точке / = 0. Их координаты при /^0 составляют стохастический процесс X (/), который предполагается марковским, а его вероятности перехода определяются уравнением (8.3.1). Это винеровский процесс, определенный в § 4.2. Их плотность при />0 дается решением уравнения (8.3.1) с начальным условием Р (X, 0) = 6(Х). Эти решения описываются формулой (4.2.5): (’=7Эе,’|-т|' (8ЛЗ) Мы получили гауссиан с максимумом в начале координат и шири- ной, возрастающей со временем по корневому закону: К<Х2(0> = К2О7. Теперь рассмотрим ту же самую броуновскую частицу, подвер- гающуюся действию добавочной постоянной силы, скажем, воздей- ствию гравитационного поля Mg в направлении —X. Если мы те- перь запишем трение частицы об окружающую жидкость как Му, то получим среднюю скорость дрейфа —g/y. Она накладывается на броуновское движение, так что теперь = = a2'-=2D- (8-3-4) Получающееся уравнение Фоккера — Планка имеет вид g дР д2р (8 3 5) Физически очевидно, что это уравнение не имеет стационарного ре- шения, когда X изменяется от —оо до 4-оо. Однако, если пред- ставить отражающее дно при Х = 0, уравнение нужно решать только 203
для области X > 0 с условием исчезновения потока на границе: £P + D^ = O при Х = 0. (8.3.6) Уравнение с этой модификацией уже имеет стационарное реше- ние. Далее, из равновесной статистической механики мы знаем, что это стационарное решение не что иное, как барометрическая фор- мула для плотности Ре (X) = const • ехр — -^rXj. (8.3.7) Легко убедиться, что эта функция действительно удовлетворяет (8.3.5) и (8.3.6) при условии, что ЬТ D-~. (8.3.8) Aly ' ' Мы получили соотношение Эйнштейна, совместно с (8.3.2) оно свя- зывает коэффициент затухания у со средним квадратом флуктуаций: . (8.3.9) St Му ' ' Упражнение. В выражениях (8.3.4) предполагается, что присутствие поля не влияет на аг Для того чтобы оправдать это предположение, сравните сме- щение ДХ в присутствии поля со средним смещением Д0Х в его отсутствие ДХ = Д0Х —(£/у)Д/ и вычислите <ДХ2>/Д/. Упражнение. Решите уравнение (8.3.5) для — оо < X < оо, если Р(Х, 0) зада- но с помощью характеристической функции. Упражнение. Решите то же самое уравнение с помощью подстановки Р(Х, 0-₽<Х. ,)гар[- «8 Упражнение. Решите то же самое уравнение для 0 < X < оо с граничным ’ус- ловием (8.3.6) и произвольным Р(Х, 0). Упражнение. Рассмотрите правую часть уравнения (8.3.5) как линейный опе- ратор W, действующий на пространство функций, определенных для 0 < < X < оо и удовлетворяющих (8.3.6). Проверьте, что оператор обладает свойством симметрии (5.7.5) и является отрицательно полуопределенным, а единственная собственная функция с нулевым собственным значением определяется формулой (8.3.7). Упражнение. Поясните, почему сверхзаторможенная частица, подвергающаяся воздействию внешней силы с потенциалом U (X), описывается уравнением дР(Х, t) 1 Г 3 d2P I ,8 3 10) dt ~ Му [dX^ (x)p + kl dX2 J' (8.3.10) Термин «сверхзаторможенная» относится к предположению, что у столь велико, что скорость можно взять пропорциональной силе (ср. с (8.7.1) и (10.2.4)) Упражнение. Для маятника, находящегося в потенциальном поле U (0) и под- вергающегося действию постоянного вращающего момента т, это уравне- ние имеет вид д±ТГ1-Т^[^и'т-^р+"та-Я-] 204
Поскольку угол ограничен, стационарное решение не обладает нулевым потоком, как это было в случае (8.3.6), но вместо этого мы имеем условие Р (0) = Р (2л). Найдите стационарное решение и соответствующий поток и выведите отсюда среднюю угловую скорость <0>< Упражнение. Пусть Е (Z) = exp [i<o0Z—|- 1Ф (/)] представляет собой волну со слу- чайной фазой Ф, вероятность которой удовлетворяет уравнению дР(Ф, t) д2Р dt ~D дФ2 ’ Для детектора с частотой отклика ф выходной сигнал 00 00 2 gL ( 44<o)dw J e~iat Е (t) dt — 00 — 00 Покажите, что <£/>=j |ф(<о)р — X (8.3.12) Таким образом, случайная фаза приводит к уширению лоренцевой спект- ральной линии. Упражнение. Две частицы диффундируют независимо. Покажите, что расстоя- ние между ними подчиняется уравнению диффузии с постоянной диффузии, равной сумме коэффициентов диффузии отдельных частиц*. 8.4. РЭЛЕЕВСКАЯ ЧАСТИЦА Рэлеевская частица—это то же самое, что и броуновская части- ца, но рассматриваемая в более мелкой временной шкале. Времен- ные промежутки А? предполагаются малыми по сравнению со вре- менем релаксации скорости, но по-прежнему большими по сравне- нию с длительностью отдельных столкновений с молекулами газа. Тогда в качестве стохастической функции следует рассматривать скорость, а не координату частицы. Достаточно ограничиться рас- смотрением одномерного случая, что мы иногда будем подчеркивать, употребляя название поршень Рэлея**. Макроскопический закон, которому подчиняется скорость V, яв- ляется законом линейного затухания V = — yV, если скорость V не слишком велика. Тогда МЮ = ^^ = -уУ. Второй момент перехода должен быть положительным даже при V = 0, и поэтому его можно считать постоянным, когда скорость V * М. V. Smoluchowski, Z. Phys. Chemie, 92, 129 (1917). ** Обзор дан М. R. Ноаге в кн.: Advances in Chemical Physics, 20 (I. Pri- gogine and S. A. Rice eds., Wiley — Interscience, New York, 1971. См. также: J. A. Barker, M. R. Hoare, and S. Ravel, J. of Physics (London) A14, 423 (1981); W. Driessler; J. Statist. Phys., 24, 595 (1981). (8.4.1} 205
не слишком велика: a2(V) = a2,0+O(V2)«a2.0 (8.4.2) Тогда уравнение Фоккера — Планка имеет вид dP(V, t) , d VD , аг.о d2P dt dVV 2 dV* ' (8.4.3) Из равновесной статистической механики мы знаем, что стаци- онарное решение должно иметь вид (8.4.4) где Т—температура газа. Подстановка в уравнение (8.4.3) дает В результате получаем уравнение Рэлея, описывающее плотность вероятности для скорости тяжелой частицы: VP । d*P\ dt '\dV+M dV2 | • (0.4.0J Это линейное уравнение Фоккера — Планка. С точностью до кон- станты, которую можно устранить масштабным преобразованием, оно совпадает с уравнением (4.3.20), описывающим вероятность пе- рехода для процесса Орнштейна — Уленбека. Стационарное решение уравнения (8.4.6) совпадает с Р, заданным (4.3.10). Тогда в состо- янии равновесия V(() —процесс Орнштейна —Уленбека. Упражнение. Выведите непосредственно из уравнения (8.4.6), что для фикси- рованного V(O) = Vo имеют место соотношения <l/(O>v,= Voe-V<, (8.4.7) <V (/)%, = Vo e-2V<+ (1 -e-W). (8-4.8) Следовательно, ьт <<V (^) V (/+ т)»е =-др e-Тт. (8.4.9) Упражнение. Покажите, что решение уравнения (8.4.6) с начальным условием Р(И, 0) = 6(V—Vo) дается выражением PV. (8.4.Ю) Упражнение. Найдите решение, предположив, что оно имеет гауссов вид P(V, Z) = exp[— AV2 — BV—С], и найдите коэффициенты А, В, С как функции времени t. Упражнение. Решите уравнение (8.4.6) систематически преобразовав его в уравнение, описывающее характеристическую функцию G (k, t) вероятно- сти Р. Это уравнение первого порядка и его можно решить с помощью метода, изложенного в § 6.6. 206
Упражнение. Вращение частицы, имеющей форму эллипсоида и взвешенной в жидкости, описывается макроскопическим уравнением движения /,ы( =2 j. k где /,— три главных момента инерции, ы,— компоненты угловой скорости вдоль главных осей, —абсолютно антисимметричный тензор Леви— Чивита, а С, — коэффициенты трения. Соответствующее уравнение Фок- кера— Планка имеет вид* «ЧР £ 77 £I£<“*> i I /. k I Найдите соотношение между С/ и D,. Итак, мы описали поведение частицы в мелкомасштабной вре- менной шкале. Теперь мы должны получить отсюда огрубленное описание, как это было сделано в § 8.3. Рассмотрим ансамбль оди- наковых, но независимых броуновских частиц, которые при / = 0 все находятся в точке Х = 0 со скоростями, распределенными по равновесному закону. Их скорости составляют процесс Орнштейна — Уленбека, и нам нужно изучить случайный процесс X(t), опреде- ленный следующим образом: t X(t) = J V(/')d/'. о Как следует из этой формулы, X (/) является суммой гауссовых переменных и, следовательно, процесс X (t) тоже гауссов. Он имеет среднее значение, равное нулю, потому что t <X(t)',= <У(О> df = 0. о Средние берутся по ансамблю, определенному выше. Теперь нам нужно вычислить среднее <Х (tj X (t2)> = $ d/' J dr <V (/') V (t")> = о о /i t, = <P> J d/' $ dre-vH'-'"l. о 6 Интеграл берется элементарно. Поскольку левая часть, по опреде- лению, симметрична по /х, /2, достаточно вычислить ее для В результате получим <Х (!,) X (/2)> = [Л 4 - J- + Jj- {e-v6 + е-v/, -e-v <^->} ]. _________ (8.4.12) * Р. S. Hubbard, Phys. Rev., A15, 329 (1977); G. W. Ford, J. T. Lewis, and J. McConnel. Phys. Rev., A19, 907 (1979); G. Wyllie, Physics Reports, 61, 327 (1980). 207
Теперь процесс X (t) полностью определен, поскольку он гаус- сов, а его первые два момента известны. Однако он не совпадает с винеровским процессом, определенным (8.3.1), потому что его авто- корреляционная функция сложнее, чем (4.2.7а). Действительно, X(f) даже не марковский процесс, из-за того что он все еще описывается в мелкомасштабной временной шкале, относящейся к рэлеевской частице. В крупномасштабной временной шкале допускаются только разности времен, значительно превышающие время затухания ско- рости 1/у: ^>1/у, /2 —/1>1/у. В этом приближении (8.4.12) сводится к (4.2.7а) и X (t) становится неотличимым от решения (8.3.1). Отметим, что значение константы а2 в (8.3.1) нам удалось найти здесь без привлечения дополнитель- ных сложностей, включая гравитационное поле. Упражнение. Возьмите ансамбль рэлеевских частиц, находящихся в момент / = 0 в начале координат и имеющих максвелловское распределение ско- ростей. Покажите, что lim —(^=2£>. (8.4.13) t —00 * (В кинетической теории это выражение часто используют в качестве оп- ределения коэффициента диффузии, несмотря на очевидный факт, что, строго говоря, для конечного сосуда предел обращается в ноль.) Упражнение. Постройте уравнение для P(V, t) в присутствии постоянной си- лы и выведите из него (8.3.5). Упражнение. Вероятность перехода за единичное время для скорости поршня Рэлея в газе дается выражением W(V'\V) = vA V" — P|F ( 1/'- ‘^~т И (8.4.14) ' 1 ’ \ 2т ) ' \ 2т 2т J где М—масса поршня, А — его сечение, т—масса молекулы газа, v—плрт- ность числа молекул, F— распределение скорости молекул*. Упражнение. Вычислите из (8.4.14) моменты перехода, взяв в качестве F рас- пределение Максвелла. Покажите, что (8.4.1) и (8.4.2) справедливы, когда скорость V мала по сравнению со средней скоростью молекул газа и, сле- довательно, ее можно использовать для описания равновесных флуктуаций, если М т. Упражнение. Сформулируйте процесс, описанный V и X, рэлеевской частицы, как составной марковский процесс в смысле § 8.7. 8.5. ПРИЛОЖЕНИЕ К ОДНОШАГОВЫМ ПРОЦЕССАМ Предположим, что мы столкнулись с задачей, связанной с одно- шаговыми процессами, в которой коэффициенты гп и gn нелинейны, но могут быть представлены гладкими функциями r(n), g(n). Тер- мин «гладкие» означает, что функции г(п) и g(n) не только непре- * Различные аспекты соответствующего основного кинетического уравнения изучены в работах: С. Т. J. Alkemade, N. G. van Kampen, and D. К. C. Mac- Donald, Proc. Roy. Soc. A271, 449 (1963); M. R. Hoare and С. H. Kaplinsky, Physica, 81A, 349 (1975). 208
рывны и достаточное число раз дифференцируемы, но также что они мало меняются между точками п и п + 1. Предположим далее, что мы интересуемся решениями Рп (/), которые также можно представить гладкими функциями Р(п, t). Тогда имеет смысл аппроксимировать задачу с помощью такого описания, в котором п рассматривается как непрерывная переменная. Более того, поскольку изменение п на отдельном шаге мало по сравнению с другими длинами, встречаю- щимися в задаче, можно ожидать, что основное кинетическое урав- нение можно аппроксимировать уравнением Фоккера — Планка. Общая схема, изложенная в § 8.2, дает два коэффициента, но здесь мы будем использовать другой способ вывода, специально приспособленный для одношаговых процессов. Основное кинетическое уравнение, которое нам нужно решить, имеет вид Р(п, t) = (Е — 1) г (п) Р (п, + t). (8.5.1) Поскольку оператор шага Е здесь действует на гладкие функции, его можно заменить рядом Тейлора: Е = 1 +1 д-1 -Д + ±+ ... . (8.5.2) 1 дп ' 2 дп2 1 3! дп3 1 ' ' Тогда, опуская все производные, порядок которых больше двух, получаем £(и, 0 = — g(n)}P+-^^{r(n) + g(n)}P. (8.5.3) Это приближение Фоккера — Планка для одношаговых процессов. В качестве примера возьмем подход Бюргесса к флуктуации в полупроводниках*. Пусть п — число носителей заряда в зоне про- водимости, g (п) и г (п) —соответственно вероятности генерации и реком- бинации за единичное время. Нет необходимости задавать их явно, а достаточно лишь знать, что г(п) монотонно возрастает, a g(n) убывает с изменением п, как это следует из физических соображений. Вообще говоря, получить точное решение уравнения (8.5.3) не пред- ставляется возможным, да, наверное, этого и не следует делать, потому что оно все равно не имело бы большого физического смысла из-за тех приближений, которые мы уже сделали, чтобы получить (8.5.3). Однако следующие ограниченные выводы все же оказываются правильными, что будет показано в § 9.3 и 9.4. Макроскопическое уравнение, связанное с (8.5.3) имеет вид п = — г (n) + g(n). (8.5.4) * R. Е. Burgess, Proc. Phys. Soc. London, B68, 661 (1955); B69, 1020 (1956); A. van der Ziel, Noise (Prentice, Englewood Cliffs, N. Y., 1954). 209
Тогда стационарное значение п определяется соотношением r(ns) = £(ns). (8.5.5) Эго уравнение имеет одно решение (рис. 21). Мы хотим исследовать флуктуации в стационарном состоянии. Для этого положим n = ns4-x г,9 г(п) и подставим его в (8.5.3). Разло- жив коэффициенты по х и оставив только низшие неисчезающие члены, получим ^^T£2 = {r,(ns)-^'(ns)}^xP+ + '(nS)+g("S)^!L (8.5.6) 1 2 dx2 ' ' д(п) л5 п Рис. 21. Стационарное состояние возникает как равновесие между генерацией и рекомбинацией Таким образом, наше дополни- тельное приближение для окрест- ности ns приводит к линейному уравнению Фоккера—Планка, име- ющему такой же вид, как и (4.3.20) и (8.4.6). Следовательно, флук- туации в стационарном состоянии опять оказываются процессом Орнштейна — Уленбека. В § 10.4 будет показано, что приближение (8.5.6) является непротиворечивым*. Упражнение. Выведите из уравнения (8.5.6) соотношения J_ r (nS) + g(nS) <..X2>S (8.5.7) = ^.n2^>s е T;T“, l/T0 = r' (ns)— g' (nJ), S„(<o) = -<n2>^------- Л l+<U2To (8.5.8) (8.5.9) (8.5.10) Упражнение. Покажите, что те же результаты получаются простой линеари- зацией г (п) и g(n) вблизи ns. Упражнение. Покажите, что результаты (8.5.5) и (8.5.7) согласуются с явным выражением (4.3.8) для Ps (п.). Упражнение. Используя (8.5.2), запишите разложение Крамерса—Мойала для одношаговых процессов. Упражнение. Получите уравнение Фоккера — Планка для задачи о популяции (6.10.7) и используйте его для нахождения <n>s и <5i2^>s. Упражнение. Сделайте то же для (6.9.12). До сих пор приближение Фоккера—Планка формулировалось только для случаев, в которых границы отсутствовали или находи- лись так далеко, что не нужно было о них беспокоиться. Теперь поставим вопрос о том, каким образом границы с определенными * Численное сравнение проведено в работе: С. F. Clement and М. N. Wood, Proc. Roy. Soc. London A371, 553 (1980). 210
физическими свойствами преобразуются в граничные условия для дифференциального уравнения. В случае отражающей границы ответ ясен: поток вероятности (8.1.3) должен обращаться в нуль, как в (8.3.6): аЛу)Р(У, Р1—^~(ц(у)Р(у, /) = 0 на границе. (8.5.11) Однако в случае поглощающей границы ответ не очевиден. Его можно найти, используя связь с одношаговыми процессами. Возьмем одношаговый процесс с аналитическими г (n), g(n), но с поглощающей границей при п = 0. Как отмечалось в § 6.7, это еще не позволяет однозначно определять, как г(п) и g(ri) отли- чаются от аналитических выражений г(п) и g(n) вблизи границы. Даже если граница разная, в тех случаях, когда может измениться только rlt требование того, что граница является поглощающей, означает просто > 0. Граница поглощает постольку, поскольку имеется вероятность перехода из крайнего состояния в лимбо-со- стояние. В качестве частного случая можно выбрать г1 = г(1). Это пол- ностью поглощающая граница, относящаяся к задачам первого про- хождения (см. § 6.10). Здесь мы используем условие такого типа и поэтому в качестве отправной точки возьмем основное кинетиче- ское уравнение в виде p„ = r(n + l)/Pn+1+g(« — О/»,,-! — {r(ti)+g(n)} рп (п>1), (8.5.12а) К = {г (IRg(l)} а- (8.5.126) Сразу же ясно, что (8.5.126) можно подставить в (8.5.12а), если определить ра. (Это просто формальный прием, а р0 не совпадает с вероятностью р*, приписываемой лимбо-состоянию.) Используя это определение, мы можем объявить (8.5.12а) справедливым для всех п ^1 с дополнительным условием ро = О. Если теперь аппроксимировать (8.5.12а) дифференциальным урав- нением, в качестве граничного условия для Р(х, t) нужно выбрать Р(0, /) = 0. Хотя мы пришли к этому заключению, использовав поглощающую границу специального вида, можно показать, что оно оказывается общим: в случае непрерывного описания все возмож- ные поглощающие границы приводят к одному и тому же гранич- ному условию* Р(0, /) = 0. Упражнение. Убедитесь в том, что в задаче с граничным условием (8.5.11) пол- ная вероятность сохраняется. Упражнение. Сформулируйте задачу первого прохождения для процесса, опи- сывающегося уравнением Фоккера — Планка, и найдите выражение для рас- пределения вероятности времени первого прохождения, аналогичное (6.10.1). Упражнение. Сформулируйте непрерывный предел (6.10.11). * N. G. van Kampen and 1. Oppenheim, J. Mathem. Phys., 13, 842 (1972). 211
8.6. ЛИНЕЙНОЕ УРАВНЕНИЕ ФОККЕРА — ПЛАНКА В СЛУЧАЕ МНОГИХ ПЕРЕМЕННЫХ Обобщение линейного уравнения Фоккера — Планка на случай, когда существует г переменных yh имеет вид = — +4-У,В,7^-, (8.6.1) at оу,- 2 Л-t IJ oyidyj ' ’ i, i t. i где Ai}- и В,у—матричные коэффициенты; матрица В;/ симметрична, а Л17, вообще говоря, нет. Целью настоящего параграфа является решение этого уравнения с начальным условием Р{У, О) = П6(«/,— г/,0) = бй/—#»)• (8.6.2) I Для того чтобы его можно было использовать и дальше, мы предположим даже, что Л,у и В,у могут зависеть от времени. Сначала обычным путем получим соотношение для средних ве- личин: <«/,> - У (О <*//>, <«Л>о = У io- (8.6.3а) i В матричных обозначениях, когда у—вектор с компонентами у;, имеем <у> = A(t)<y>, <у% = уа- (8.6.36) Вопрос о том, можно ли решить это уравнение явно, имеет поло- жительный или отрицательный ответ в зависимости от вида матрицы А (/), но в любом случае решение имеет вид <y>t = Y (/)«/„, (8.6.4) где Y (I)—матрица эволюции, или пропагатор, определенный мат- ричным уравнением Г(/) = Д (/)У(/), Г(0) = 1. (8.6.5) Далее рассмотрим вторые моменты у/>. Умножая (8.6.1) на у(У], получаем <У,У/> = У Aik <УьУ/> + У Л* <УгУь> + Ви- (8.6.6а) k k С помощью (8.6.3) легко заметить, что это уравнение сохраняет свой вид, если моменты <г/,т/у> заменить на ковариации = <*/,«//> — <«/< > <У/> = S.7- Тогда матрица 3 удовлетворяет уравнению 8 = ЛЗ + ЗЛ+В, (8.6.66) 212
где А—транспонированная матрица А. Покажем, что это уравнение можно решить с помощью Y (/). Преобразуем S в «представление взаимодействия» с помощью соотношения Подставляя это в (8.6.66) и используя прямое и транспонированное соотношение (8.6.5), получаем S' = y~1BY~1. Интегрирование дает S' (0-S' (0) = $ У-1 (/') в (/') У-1 (/') d/'. о Выполняя обратное преобразование, получаем t E(t) = Y (О S (0) У (/) 4 j У (/) У (У)"1 В (/') У (У)*1 У (/) At'. (8.6.7) о С начатьным условием (8.6.2) имеем 3(0) = 0. Очень часто достаточно знать лишь первый и второй моменты. Теперь мы сделаем последний шаг, чтобы получить решение урав- нения (8.6.1) с условием (8.6.2). Мы утверждаем, что решение—это просто распределение Гаусса, определенное только что вычислен- ными моментами: Р(у, 0 = (2л) 2 г ^Det В_1/2ехр —у (]/ —<i/>) B-1(z/—<z/>)j . (8.6.8) Для того чтобы проверить эту догадку *, используем сокращенное, но очевидное обозначение. Подстановка (8.6.8) в правую часть (8.6.1) дает д 1у-Ау±±Вд}р = д{-Ау-±ВВ-Цу~<у>)}р = = тгд _|тг(вз->) }р+ х{ау + ±ВЕ-1(у-<У>)}р. (8.6.9) Левая часть превращается в ( — у ,og Det 3 ) Р —у (i/—<i>) (z/—<z/>) P у (y—<z/>) P + + (£-<£>) 3-i(8.6.10) * Систематическое решение дано в работе: М. Lax, Rev. Mod. Phys., 32, 25 (1960). См. также упражнения в конце параграфа. 213
Используя тождество Вронского и (8.6.66), первый член можно при- вести к виду -^-log Det S = Тг S-13 = Tr 2-1 ЛЕ 4-ТгЛ 4~ Тг S-1B = = 2ТгЛ4 ТгЕ-1В. Во втором числе (8.6.10) используем тот факт, что г!"'1 Н = ____=____я-1 п-1 = п-1Дп-1____D-ion-i d/ dt - о- . Третий член с помощью (8.6.3) записывается в виде (У—<z/>. Собирая все три члена, находим, что они дают (8.6.9), что и тре- бовалось доказать. Упражнение. Найдите решение одномерного, зависящего от времени уравнения Фоккера — Планка = (8-6.11) Упражнение. Броуновская частица в гармоническом потенциале описывается двумерным уравнением (см. следующий параграф) dP(x, и, t) дР , дР , ( д о , deP \ —Нг;----' = — —Ь? (8.6.12) dt dx dv (dv 1 cto2 ) Найдите P(x, v, l) с начальным условием P (x, v, 0) = 6(x—x0) 6 (o — oo). Упражнение. Матрица 5 по определению симметрична и положительно опреде- лена (или по крайней мере полуопределена). Покажите, что 3' обладает такими же свойствами. Покажите также, что уравнение (8.6.7) гарантирует выполнение этих свойств для 3 (/), если известно, что и В (0) обладает ими. Упражнение. Предположим, что А не зависит от времени и обладает тем свойст- вом, что все решения уравнения ;(8.6.3) стремятся к нулю при t, стремя- щемся к бесконечности. Предположим также, что В (i) стремится к пре- делу. Покажите, что 3(оо)=^ У(т) В(оо) У(т) dx. (8.6.13) 0 Упражнение. Когда А и В не зависят от времени, уравнение можно записать в более явном виде. В частности, после замены переменных его можно привести к виду, в котором матрица В диагональна. Получите эти урав- нения и найдите условие существования Е(оо). Упражнение. При условиях, сформулированных в предыдущем упражнении, существует Ps (у). В тепловом равновесии оно совпадает с Ре (у), а корре- ляционная матрица 3(оо) = Ее известна из равновесной статистической механики. Это позволяет выразить матрицу коэффициентов диффузии В через матрицу коэффициентов переноса А: В~-~ ДЕе--ЗеД. Упражнение. Решите уравнение i i, j 214
Упражнение. Наиболее общий вид линейного уравнения Фоккера — Планка — это dP (х, t) v, дР . д D , 1 V' „ &*Р ,ЯЙ1К. dt ” 2-С' dxt dXiX'P+ 2ZLB:J dxjdxj (8’6' 5) с зависящими от времени коэффициентами с(- (/), A,y(Z), Вij(t). Решите это уравнение путем сведения его к (8.6.1) с помощью подстановки Xi-у,- -j- —|- и,-(Z), где и, —решение уравнения и = А (/) и-^с (/). Упражнение. Пусть Р(х, t)— заданное г-мерное, зависящее от времени распре- деление Гаусса 1 Р(х, /)=(2я) 2 r(DetM)1/aexp — у У. Mij (х,—р,) с заданными р; и симметричной положительно определенной MtJ-(t). Пока- жите, что оно удовлетворяет уравнению вида (8.6.15), и определите В,у, Aij, с,. Последние две величины не единственны; действительно, можно взять А;у = 0. Упражнение. Из предыдущего упражнения следует, что условная вероятность Р (х, 11 х0, t0) удовлетворяет уравнению вида (8.6.15) даже Тогда, когда гауссов процесс не является марковским. Однако это уравнение не яв- ляется основным кинетическим уравнением, что подтверждается тем фактом, что его коэффициенты зависят от /0 (сравните с предостережением в § 5.1). Найдите эту зависимость в уравнениях Фоккера — Планка, выведенных в работе: S. A. Adelman, J. Chem. Phys. 64, 124 (1976). Упражнение. Цепочка N ротаторов взаимодействует гармонически посредством потенциала . N U (01, 02, ..., бдО - — . (0/ + t — 0/)2 (0jv+i = ®i)- /=1 Они сильно затухают, подвергаются броуновскому движению и действию внешнего крутящего момента У Г— ( Р + kT^r] (8.6.16) (ср. с (8.3.11)). Найдите стационарное решение и выведите из него сред- нюю скорость, с которой вращается вся цепочка. Найдите также реше- ние, зависящее от времени, с начальным условием Р (0, 0) =6(0). О нели- нейной модификации этой задачи смотрите работу: S. Е. Trullinger et al. Phys. Rev. Letters, 40, 206 (1978). 8.7. УРАВНЕНИЕ KPAMEPCA Рассмотрим броуновскую частицу, подвергающуюся воздействию силы, зависящей от координат F(x). Запишем очевидное обобщение уравнения Фоккера — Планка * (8.3.5): дР (X, t)_____д F(X) , п d2P 7 dt ~ дХ Му dX2 ’ (o./.i; * Примеры мы уже перечислили в (8.3.10) и (8.6.16), см. также (10.2.4). 215
Мы будем называть это уравнение «квазилинейным» уравнением Фоккера — Планка* для того, чтобы подчеркнуть, что оно имеет вид (8.1.1) с постоянным В, но нелинейным А. Понятно, что это уравнение может быть правильным только тогда, когда F(X) изменяется настолько медленно, что его можно считать постоянным на расстояниях, характерных для затухания скорости. С другой стороны, уравнение Рэлея (8.4.6) содержит только скорость и не может содержать пространственные неоднородности. Тогда, если F меняется недостаточно медленно для того, чтобы вы- полнялось (8.7.1), частицу необходимо описывать совместным рас- пределением вероятности Р (X, V, t), для которой мы получим дву- мерное уравнение Фоккера —Планка. Для того чтобы найти коэффициенты при производных первого порядка, заметим, что <AX>x.v = VA/; <AV>x, v = {-^r-----(8-7'2) Имеется три производных второго порядка с коэффициентами _<(ДХ)>Х,_И = у2 0 Л/ ’ (8.7.3а) <(W>x, v kT St 7 М • (8.7.36) (8.7.3b) Последний взят равным коэффициенту в (8.4.6), потому что внеш- няя сила не влияет на столкновения с молекулами газа. Таким образом мы находим уравнение Крамерса'. дР (X, V, Z) у дР , F (X) дР ( д л7п , kT д*Р ( dt + М dV ' 1 dV + М дУ2 | ’ (8-7 А) Это двумерное квазилинейное уравнение Фоккера — Планка. Рис. 22. Потенциал Крамерса для хими- ческой реакции (а); потенциал Бринкмана с двумя ямами (б) рел потенциал с двумя ямами, наподобие Историческая справка. Урав- нение (8.7.4) было получено Клей- ном **. Крамере использовал его для химических реакций (см. §7.5). Для этих целей он ввел си- лу F (X), потенциал которой имел примерно такой же вид, как показан на рис. 22, а. В этом случае возникает вопрос: какие частицы из потенциальной ямы могут преодолеть потенциальный барьер? Бринкман *** для описа- ния химической реакции, которая может идти двумя путями, рассмот- того, что изображен на рис. 22, б. * По аналогии с термином «квазилинейный», который используют для дифференциальных уравнений в частных производных. ** О. Klein, ArKiv Mat. Astr. Fys., 16, no. 5 (1922). *** H. C. Brinkman, Physica, 22, 29 and 149 (1956). 216
К сожалению, такие потенциалы обоих типов, для которых удалось бы решить (8.7.4), неизвестны. Поэтому Крамере исследовал два предельных случая: малые и большие значения у. Здесь мы остановимся на последнем случае*. Естественно, в результате этого приближения получаем (8.7 1). Крамере действительно вывел (8.7.1) из (8.7.4), но его Р (X, V, t) не вполне совпадает с частным распределением, полученным интегрированием Р(Х, V', t) по всем V. Это место критиковал Бринкман, который с помощью другого метода получил (8.7.1) для частного распределения. Мы воспользуемся другим методом, кото- рый приводит к систематическому разложению по степеням. Позднее уравнения Фоккера — Планка в потенциале с двумя ямами стали очень популярными в связи с описанием фазовых переходов. В частности, на этой основе были широко изучены переходы в стационарных неравновесных состояниях открытых систем, например в лазерах и туннельных диодах (см. § 11.6 и 11.9). Теперь мы приближенно решим уравнение Крамерса (8.7.4) для больших у с помощью систематического разложения по степеням у-1. Непосредственное применение теории возмущений в этом случае не- возможно, потому что производная по времени оказывается в числе малых членов. Это обстоятельство приводит нашу задачу к проблеме сингулярной теории возмущений, но в этом случае можно получить решение способом, предложенным Гильбертом, а также Чепменом и Энскогом для уравнения Больцмана**. Чтобы упростить уравнения, исключим коэффициент kT/M мас- штабным преобразователем переменных: ЬаКЙЖ X = xVkT!M, F(X) = f(x)KMkt. Тогда уравнение можно записать в виде v^ + f(x)-L\p. (8.7.5) ди \ dv ] У \ dt дх ' ' ’ dv J ' ’ Его можно решить, полагая Р(х, v, г‘) = Р(») + у-1Р<1’ + у“2Р,2)+ • • и удовлетворяя уравнение для каждого порядка по параметру у-1. Члены порядка имеют вид -L(vP™ 4--^-') =0. (8.7.6) dv \ ' dv J ' ' Это уравнение можно решить, полагая Р‘0)(х, ц, t) = е_,/г!,2ф(х, /) (8.7.7) с произвольной функцией <р(х, t). * Случай малых у исследован в работах: Н. Risken and Н. D. Vollmer, Z. Phys. ВЗЗ, 297 and B35, 177 (1979). Случай произвольного j рассмотрен в работе: Н. Risken, Н. D. Vollmer, and Н. Denk, Phys. Letters, 78A, 22 (1980). ** S. Chapman and T. G. Cowling, The Mathematical Theory of Non-Uni- form Cases (University Press, Cambridge, 1939). Для настоящего приложения см. также: U. М. Titulaer, Physica, 91А, 321 (1978); 100А, 234 and 251 (1980). Другие методы обсуждаются в работе: Das, Physica 98А, 528 (1979). 217
Члены порядка j 1 дают j/- f + Pw = (5г + у-7г— у/ф ) (8.7.8) | dv 1 dv2 ( \ dt дх J ' ' Это уравнение надо решить относительно Р(1). Однако оператор { }, действующий на Р(1>, нельзя обратить, потому что его собст- венное значение равно нулю. Соответствующий левый собственный вектор является константой и действительно, интегрируя (8.7.8) по v, получаем 0 = -^. dt Тогда условие разрешимости (8.7.8) относительно Р(1) равносильно ограничению на оставшуюся до настоящего времени произвольной функцию (р. Это ограничение состоит в том, что ф и, следовательно, Р(в> не должны зависеть от времени. Удовлетворив условие разрешимости, мы можем теперь присту- пить к определению Р(1> из уравнения dv \ dv у \ dx Легко видеть, что оно удовлетворяется, если Pw(x, V, t) = v (7<р — е-‘/’а2 -фф(х, Or1':»1 (8.7.9) с произвольной функцией ф(х, /). Члены порядка у-2 с учетом (8.7.9) дают J А V _1_ I. р<2> = f е - Чг»г _|_ dx dx ) 4(1-V2)H/T—Й)е-'2а2+(7Г + ^--^)е'1/га2- (8-7'10> Интегрирование по v опять приводит к условию разрешимости: J_// <М+.^о. (8.7.11) dx \'v dx J 1 dt ' ' В этом месте мы прервемся и обобщим результат: Р (х, v, I) = j ф (х) 4- у-1ц f /ф — + у-1ф (х, /) + Оу-2j, (8.7.12) где ф удовлетворяет (8.7.11). Мы интересуемся распределением по х и поэтому интегрируем по v: Р(х, t) = У'2л [ф(х)4-у_1ф(х, /) + Оу~2]. (8.7.13) Уравнение (8.7.11) теперь приходит к виду 218
дРм + )-0V-2. (8.7.14) dt 1 \ ax 1 dx2 ] ' ' Возвращаясь к первоначальным переменным, получаем уравнение, тождественно совпадающее с (8.7.1). Упражнение. Решите уравнение Крамерса для случая, когда функция F по- стоянна. Упражнение. Почему условие справедливости (8.7.1) есть | F' | < Л1у2? Объяс- ните это! Упражнение. Выра-кение (8.7.7) не единственное решение уравнения (8.7.6), так же как (8.7.9) не единственное решение уравнения (8.7.8). Найдите остальные решения и покажите, что они недопустимы. Упражнение. Уравнение (8.7.4) можно решить явно для частного случая гар- монического потенциала F(x)~— Л. Результат содержится в (8.6.12), но явный вывод требует некоторого числа элементарных интегрирований Определив Р (х, о, Z), можно найти частное распределение Р (х, t) и убе- диться в том, что оно удовлетворяет уравнению (8.7.1) при больших у. (Есть и более прямой путь, когда сначала из общего выражения (8.6.12) находят частное распределение, а затем приводят его к нужному виду необходимым числом интегрирований.) Упражнение. Покажите, что уравнение (8.7.14) остается справедливым и в сле- дующем порядке. Упражнение. Сведите (8.7.1) к задаче на собственные значения, полагая Р (х, t) — q>n(X)e~Knt. С другой стороны, рассмотрите уравнение Шреди- нгера: <р"(Х)+{£-У(*)}<р(Х) = 0. Если Vo — основное состояние, положите в (8.7.1) PW _on<P°W Му Ф0(Х) ' Обе задачи эквивалентны, поэтому * фп (X) — фо (А) <рп (-^). = (£п — E(I)D. (8.7.15) 8.8. МЕТОД ЛАНЖЕВЕНА Альтернативное рассмотрение броуновского движения было пред- принято Ланжевеном **. Частица подчиняется уравнению движения V = — yV + L(t). (8.8.1) Правая часть представляет собой силу, действующую со стороны жидкости (и для удобства деленную на массу частицы Л4). В связи с этим сделаем три физически различных предположения: 1. Сила состоит из линейного по V члена, представляющего за- тухание плюс член L(t), не зависящий от состояния V частицы. 2. Член, описывающий затухание, является также средней силой, причем <L(Z)> = 0. (8.8.2) * Н. Risken and Н. D. Vollmer, Z. Phys., 204, 240 (1967). ** P. Langevin, Compes Rendus de I’Academie des Sciences (Paris), 146,530 (1908). Вычисление, приведенное здесь, основано на работе: G. Е. Uhlenbeck and L. S. Omstein, Phys. Rev . 36, 823 (1930), reprinted in Wax. 219
Среднее берется по ансамблю многих систем, каждая из которых состоит из частицы, погруженной в окружающую ее жидкость. На практике это означает усреднение по большому числу броуновских частиц, находящихся в одной и той же жидкости, либо усреднение по последовательным наблюдениям одной и той же частицы при условии, что они достаточно отделены, чтобы не влиять друг на друга. 3. Сила /_ считается быстро меняющейся во времени, что описы- вается выражением <L (/) L (/')> = Гб (/ — /'), (8.8.3) где Г = const. Смысл этого выражения состоит в том, что каждое соударение является практически мгновенным и что последователь- ные соударения не коррелируют друг с другом. Член, описывающий силу и обладающий свойствами 1—3, назы- вают силой Ланжевена, а выражение (8.8.1)—уравнением Ланжевена. Мы специально включаем в это название свойства (8.8.2) и (8.8.3), потому что уравнение (8.8.1) без какой-либо конкретизации L(/) информации не содержит. Отметим, что (8.8.2) и (8.8.3) не полностью определяют стохасти- ческий процесс L(t), а задают только первые два его момента. Пол- ную спецификацию мы дадим в ближайшее время, но для следую- щего вычисления она пока не нужна. Уравнение Ланжевена представляет собой простой пример сто- хастического дифференциального уравнения, т. е. дифференциаль- ного уравнения, у которого коэффициенты являются случайными процессами с заданными стохастическими свойствами. Оно опреде- ляет V (/) как стохастический процесс при условии, что задано также начальное условие. Рассмотрим равновесный ансамбль, состоящий из газа, каждая реализация которого содержит один экземпляр броуновской частицы с начальной скоростью V (0) = У„. Для каждой реализации скорость при />0 находят, решая уравнения (8.8.1): t V (t) _= Voe~v' + e-xz J e^’L (f) df. (8.8.4) о Усредняя по ансамблю и используя (8.8.2), получаем <'У(/)>г„=Гое-^. (8.8.5). Далее, возводя в квадрат (8.8.4), получаем t t <{Г(/)}22г„=У§е-27^ + е-2?^ df J dt" e'V(Z' + Z") (f) L (/")/= о 0 = VSe-*v' + -^-(l-e-*v')- (8.8.6) 220
Теперь мы можем определить неизвестную до сих пор константу Г, используя тот факт, что при /5в> l/y влияние начальной скорости исчезает, а среднеквадратичное значение скорости должно быть равно термодинамически равновесному значению: <{V(oo)}»>v. =-Х- = (8.8.7) Это соотношение связывает константу Г, которая является мерой величины флуктуирующего члена в уравнении (8.8.1), с константой -у. Это соотношение является простейшим видом общей флуктуаци- онно-диссипативной теоремы. Так же как и соотношения Эйнштейна, оно получается сопоставлением зависящих от времени флуктуаций, заданных уравнением с равновесным значением, известным из ста- тистической динамики. Физическая же картина такова: случайные скачки, описывающиеся силой Ланжевена в (8.8.1), приводят к тому, что V размывается по всей области своих значений, в то время как член, описывающий затухание, подавляет V и стремится обратить его в нуль. Равновесное распределение V возникает как результат действия этих двух противоположных тенденций. Для того чтобы установить связь с приближением Фоккера — Планка, возьмем в (8.8.5) для t малое время А/<^у-1. Тогда из соотношения (8.8.5) получим <AV>v„= <У (t)>Vo — Va = — 7Г0 А/ + О (А/)2. Аналогично из (8.8.6) получаем <(А1/)2>[/о = ГА/ т О (А/)2. В соответствии с (8.1.6) эти два результата позволяют дописать уравнение Фоккера—Планка для распределения вероятности дР (V, О д ур , Г d2R ,q g q. dt dV VP 2 dV2 ’ (8.8.8) которое с учетом (8.8.7) совпадает с уравнением Рэлея (8.4.6). Упражнение. С помощью (8.8.4) вычислите <Г(/1) Г(/2)>- Упражнение. Покажите, что (V (/)> и <{У(/)}2>, вычисленные из (8.8.8), совпа- дают с (8.8.5) и (8.8.6). Упражнение. Рассмотрите гармонически связанную частицу: Х + уХ + Х =/.(/). (8.8.9> Найдите <Х (/)> и <{Х (/)}2> для заданных X (0), X (0). Покажите, что для значения <{Х (/)}2> совпадают со значениями, дающимися стати- стической механикой, если Г и у связаны соотношением (8.8.7). Упражнение. Допустим, переменные uv удовлетворяют многомерному уравне- нию Ланжевена: Mv = 2 + £-v(0> 221
Рис. 23. Упрощенная мо- дель блуждающего осцил- лятора где Avfl — постоянная матрица, a Lv (t)— случайные силы, обладающие свойствами <LV (Z)> = О, <£v (/) (Г)> = Гур. 6 (t—t')- Постройте соответствующее уравнение Фоккера — Планка. Упражнение. Скорость заряженной частицы в постоянном магнитном и слу- чайном электрическом полях описывается уравнением v = vaB — £ (/), где <£;(/) Ду (/')> = С6,у6(^ — /'). Найдите равновесное значение ее средне- квадратичной скорости и средний квадрат смещения *. Упражнение. Полимер в растворе описывается уравнением ** хп = *п + 1 -{-хп_ 1—2хп-Г-Дп (/), CLn(f)Ln'(f д(/—-Г)- Решите это уравнение и найдите значение \{хп (О—хП' (О)}2^ в равновесии. Упражнение. Рассмотрите следующую упрощен- ную версию модели блуждающего осцилля- тора*** Тело движется в жидкости, а внут- ри него имеется затухающий осциллятор (рис, 23). Уравнения движения имеют вид mx + fl (х-(-А)4-а2 (х— Х) = К (t), MX4-fJ(X-x) + yX + a2(X — х) = — K(t) + L(t). где Л' и L — независимые силы Ланжевена. Постройте уравнение Фоккера — Планка. Найдите константы Г для К и L. Упражнение. Дельта-функции в природе не встречаются. В любых физических приложениях L(t) обладает автокорреляционным временем тс > 0. Для броуновской частицы тс по крайней мере того же порядка, что и длитель- ность отдельного столкновения. Поэтому более физично записать вместо дельта-функции в (8.8.3) некоторую функцию <р(/ — t’), имеющую форму острого пика с шириной тс. Покажите, что это приводит к тем же самым результатам при условии, что утс < 1. Уравнение Фоккера — Планка (8.8.8) дает те же значения для первых двух моментов V, что и уравнение Ланжевена (8.8.1) с ус- ловиями (8.8.2) и (8.8.3). Тем не менее нельзя утверждать, что они эквивалентны, потому что высшие моменты не согласуются. Хотя уравнение Фоккера —Планка дает определенные выражения для них, уравнение Ланжевена — пока нет, потому что высшие моменты L(t) еще не определены. Поэтому обычно три приведенных выше предположения дополняют еще одним. 4. Все нечетные моменты L обращаются в нуль, а четные зада- ются тем же правилом (1.6.11), которое связывает моменты распре- деления Гаусса. Например, <L (tj L (/2) L (t3) L (f4)> = <L (Л) L (/2)> <L (t3) L (f4)> + . . . = ^Г2{Ж-t2) 6 (/3-14) + 6 (/4-13) 8 (t2- f 4) + 6 (Л - f 4) 6 (t2-/3)}• * B. Korsunoglu, Annals Phys., 17, 259 (1962). *• G. Ronca, J. Chem. Phys., 67, 4965 (1977). *** N. E. Hill, Proc. Phys. Soc. (London), 82, 723 (1963); J. H. Calderwood and W. T. Coffey, Proc. Roy. Soc. A356, 269 (1977). 222
Альтернативой этому можно поставить условие, что все высшие кумулянты обращаются в нуль. Это полностью определяет стохасти- ческие свойства L(t) в терминах единственного масштабного пара- метра Г. Процесс L(t), определенный таким образом, называют га- уссовым белым шумом. С математической точки зрения такой сто- хастический процесс в действительности не существует, так же как дельта-функция не является функцией. Но и в физике он в дейст- вительности никогда не встречается, но является моделью быстро флуктуирующей силы. Теперь мы можем показать эквивалентность уравнения Фокке- ра— Планка уравнению Ланжевена, дополненному предположением 4 следующим образом. В соответствии с (8.8.4) значения V(t) явля- ются линейной комбинацией значений, которые L принимает во все предыдущие моменты времени t' (0 t' t). Поскольку совместное распределение величин L(/') является гауссовым, то и V (/) является гауссовым. По этой же причине совместное распределение V (tt), V (/2), . . . является гауссовым. Тогда процесс V (/), определенный уравнением (8.8.1) с начальным значением V (0), является гауссо- вым. С другой стороны, мы знаем, что решение уравнения (8.8.4) с этим начальным значением гауссово. Далее, коэффициенты урав- нения (8.8.8) мы выбрали так, чтобы первый и второй моменты обоих гауссианов совпадали. Следовательно, гауссианы тождественно сов- падают, что и требовалось доказать. Упражнение. Постройте уравнение Фоккера — Планка, эквивалентное (8.8.9). Упражнение. Покажите, что свойство L(t) быть гауссовым белым шумом вы- ражается следующим тождеством для его характеристического функционала: (ехр [1 $ £ (/) Д (/) d(J^ = exp | — 2-Г J {* (Z)}2 d/ j. (8.8.10) Упражнение. Подставьте (8.8.4) в характеристический функционал V (?) и по том используйте (8.8.10). В результате должно получиться явное выра жение для характеристического функционала V (t) и, следовательно, для всех его моментов. Докажите таким способом эквивалентность процессу Орнштейна — Уленбека, следующую из (8.8.8). Упражнение. Докажите, что t F(0= МО Ф' о является винеровским процессом. Тогда уравнение Ланжевена (8.8.1) мож- но также записать в виде (lU. —уUCI/ +Г1.2 d 117(f), где 117 — нормированный винеровскнй процесс. В этой формулировке не- существующий процесс L(t) заменяется на дифференциал процесса, кото- рый существует, но не является дифференцируемым. Упражнение. Рассмотрите стохастический процесс, образованный следующим образом. Пусть У (/) = У+(/) —У_ (/), (8.8.11) где Y + , Y_—две независимые реализации одного и того же процесса Кэмпбелла с гауссовой ф (ср. с (3.1.10)). Покажите, что в соответствующем 223
пределе моменты У (/) стремятся к соответствующим моментам L(t). Тогда L(i) можно представить как плотную последовательность малых положитель- ных и отрицательных импульсов. Упражнение. Стержневидная молекула вращается в плоскости и подвергается воздействию силы Ланжевена со стороны ее окружения: + = £ (О- Найдите величину <cos <р (/0 cos <р (Z2)>s, которая является автокорреляци- онной функцией х-компоненты дипольного момента молекулы. Указание. Используйте (4.3.16)*. Упражнение. Процесс Орнштейна — Уленбека (4.3.10) и (4.3.11) удовлетворяет обобщенному уравнению Ланжевена с ядром, обладающим памятью: t y(t).----(1 —2а) у (t) + 2а (1 -а) J у (f) df + f (/), — X где f (t) — гауссов белый шум. Тогда из такого уравнения нельзя сделать вывод, что у не может быть марковским процессом, несмотря на интег- рал по предыстории. Указание. Найдите с помощью преобразователя Фурье характеристический функционал стохастической функции /(/), оп- ределенной этим уравнением. Теперь рассмотрим уравнение Ланжевена: №= A (y) + L(t). (8.8.12) Будем считать А (у) нелинейной функцией, но уравнение назовем квазилинейным, чтобы подчеркнуть тот факт, что коэффициент L(t) по-прежнему постоянен. Хотя его общее решение нельзя выписать явно, все же можно показать, что оно эквивалентно квазилинейному уравнению Фоккера — Планка: = —. (8.8.13) dt ду 2 ду2 v ' Во-первых, понятно, что для каждой выборочной функции L уравнения (8.8.12) однозначно определяет y(t), когда задано значе- ние z/(0). Поскольку значения L в различные моменты времени стоха- стически независимы, у—марковский процесс. Тогда он описывается основным кинетическим уравнением, которое можно записать в форме уравнения Крамерса— Мойала (8.2.6). Вычислим последовательные коэффициенты (8.2.4). Следующее соотношение является точным следствием уравнения (8.8.12): t + Kt t + M Ьу= J A(y(t'))dt'+ $ L{t')dt'. t t Тогда среднее с фиксированным y(t) имеет вид <\y>^A(y(t))M + O(\t)\ * См. также работу: W. Т. Coffey and A. Moria, J. of Physics (London), D 9, L 17 (1976). 224
Это дает первый коэффициент в (8.8.13). Далее, , t+At .2 t + At t + &t <(Az/)2> == <( J A(y(t’))2dt' ) + 2 $ dt' J dr<A(i/(O)MO> + I t ' t . t + $ dt' $ dt"<L(t’)L (f)>. t t Первая строка имеет порядок (А()2 и поэтому не дает вклада в а2. Последняя строка, как прежде, равна ГА^ и согласуется с (8.8.13). Во второй строке разложим А(у(/')): /4 AZ 2A(i/(/))A/ $ dt" + t t + At е+д« + 2A'(z/(/)) $ dt' J dt"<.{y(t')-y(t)}L{t")>+ ... . (8.8.14) t t Первый член обращается в нуль, а второй есть О (А/), потому что имеется двойной интеграл, a {y(t') — у (/)} не содержит дельта- функций. Аналогичные аргументы позволяют заметить, что высшие члены в (8.8.14) есть О(А/), а также что <(Az/)v> = O(A/) для v>2. Это доказывает эквивалентность уравнений (8.8.12) и (8.8.13). И наконец, можно надеяться показать, что истинно нелинейное уравнение Ланжевена у = А (у) л-С (у) L (t) (8.8.15); эквивалентно уравнению * ^wP+y^cmp. (8.8.16) Однако уравнение (8.8.15) в том виде, в котором оно записано, не имеет смысла. Для того чтобы увидеть это интуитивно, вспом- ним, что L (/) можно представить как случайную последовательность дельта-функций (ср. с (8.8.11)). В соответствии с (8.8.15) каждая дельта-функция в L(Z) приводит к скачку y(t). Тогда значение у в момент времени, когда «срабатывает» дельта-функция, является неопре- деленным, а следовательно, значение С (у) не определено. Из уравнения не видно, какие значения у мы должны представлять: перед скач- ком, после скачка или, быть может, их среднее значение. Ито** построил математическую интерпретацию уравнения (8.8.15), * Поскольку мы ввели функцию С (у), величина Г может быть включена в нее. Тогда без потери общности мы полагаем Г=1 в настоящем обсуждении. ** К. Ио, Proc. Imp. Acad. Tokyo, 20, 519 (1944); Mem. Amer. Mathem. Soc., 4. 51 (1951). В математической литературе уравнение (8.8.15) называют урав- нением Ито. 225
которая эквивалентна требованию, что в С (у) нужно подставлять значения у перед скачком. Это значит, что уравнение (8.8.15) нуж- но понимать следующим образом: t+M y(t + ^t)—y(t) = A(y(t))\t + C(y(t)) $ (8.8.17) t Значит, можно доказать*, что уравнение (8.8.15), дополненное этим правилом интерпретации, эквивалентно уравнению (8.3.16). С другой стороны, Стратонович ** интерпретирует (8.8.15) следующим образом: t+&t y(t + M)—y(t) — A(y(t)) ДгхС^Ш±^1±..А<^ J L(f)df. (8.8.18) t Это делает (8.8.15) эквивалентным следующему уравнению: <8-819> Вывод, который должен сделать физик, таков: если, размышляя, он придет к убеждению, что ситуацию следует описывать уравнением (8.8.15), то обязательно сделает логическую ошибку, исключением окажется лишь случай, когда рассмотрение подскажет ему еще и правильную интерпретацию. И никакой физической проницатель- ности не хватит для того, чтобы оправдать бессмысленную строку символов. Примечание. На первый взгляд (8.8.15) можно свести к (8.8.12) путем де- ления на С (у) и введения новой переменной у— dyC(y). Если затем записать соответствующее уравнение Фоккера —Планка (8.8.13) для у и. вновь пре- образовать его к старой переменной у, то можно прийти к (8.8.19). Однако это нельзя рассматривать как доказательство того, что прав Стратоно- вич, а не Ито, потому что (8.8.15) по-прежнему не имеет смысла без до- полнительного правила интерпретации. Допустимость или недопустимость привычных правил вычислений зависит от этого правила. Ито умышленно запрещает такие нелинейные преобразования у и определяет другие законы преобразований ***. Они приводятся ниже в (8.8.21). Можно сделать еще один вывод. Предположим, L (г) в (8.8.15) заменено на стохастическую функцию |(t), которая не является настоящим белым шумом, не обладает положительным малым автокорреляционным време- * J. L. Doob, Stochastic Processes (Wiley, New York, 1953). ** R. L. Stratonovich, SIAM J. Control, 4, 362 (1966); Stratonovich I. Ch. 4, Section 8. По поводу настоящего обсуждения см. также работы: А. Н. Gray and Т. K-Caughey, J. Math, and Phys., 4, 288 (1965); R. E. Mortensen, J. Statist. Phys., 1, 271 (1969); N. G. van Kampen, J. Statist. Phys., 24, 175 (1981). Та же самая дилемма возникала в квантовой механике: М. Blume, J. Mathem. Phys., 19, 2004 (1978); Н. Gzvl, J. Matliem. Phys., 20, 1714 (1979). *** K. Ito, Nagoya Mathem. J. L., 35 (1950) and 3, 55 (1951); Arnold, Stoc- hastische Differentialgleichupgen (Oldenburg, Munich, 1973). 226
нем тс. Тогда уравнение является хорошо определенным стохастическим дифференциальным уравнением в смысле положений гл. 14. В этом случае можно применять любые нелинейные преобразования с использованием обычных правил вычислений и, в частности, преобразовывать его к величине у, опре- деленной выше, с тем чтобы получить аналог (8.8.12): 7=л(у)+ио- Теперь £ (/) можно изменить таким образом, что тс —* 0, и получить урав- нение Фоккера — Планка (8.8.13) для Р (у, t). Выполняя обратное преобразо- вание, приходим к (8.8.19). Это доказывает, что интерпретация Стратоновича уравнения (8.8.15) дает правильный предел для нулевого времени автокорре- ляции при условии, что предельный переход для g (z) имеет смысл фиксиро- ванных значениях А (у) и С (у). Это утверждение подтверждается явным вы- числением в упражнении к § 14.4. Упражнение. Запишите уравнение Ланжевена, соответствующее уравнению Фоккера — Планка (8.7.1) для диффузии в силовом поле. Упражнение. Запишите уравнение Крамерса (8.7.4) в форме Ланжевена. Упражнение. Запишите (8.4.11) как многомерное уравнение Ланжевена и при- мените флуктуационно-диссипативную теорему для получения матрицы Г,у. Упражнение. Трудность с интерпретацией уравнения (8.8.15) возникает из-за син- гулярной природы L (t). Покажите, что между (8.8.7) и (8.8.18) нет разницы, если функция L(t) ограничена. Однако в этом случае (8.8.3), конечно же, не справедливо, а у (t) не может быть марковским процессом. Упражнение. Ито нашел для последнего члена в (8.8.15), что <С(у) Z. (/) =0, но, согласно Стратоновичу, <С (у) L (t)> - ‘/2 <С(у) С (у)>. Упражнение. При преобразовании у—<р(у) коэффициенты в (8.8.19) преобра- зуются в А(у) = А(у)^, С(у) = С(у)^. (8.8.20) Если формально применить то же самое преобразование к не имеющему смысла уравнению (8.8.15), то получится то же самое. Следовательно, связь между (8.8.15) и (8.8.19) инвариантна относительно нелинейных преобразований. Упражнение. То же самое преобразование, примененное к (8.8.16), дает (ср. с (8.1.9)) r(7) = .4(y)g+±C(y)2g> C(?) = C(y)g. (8.8.21) up £• иу оу Тогда в интерпретации Ито уравнения (8.8.15) именно эти преобразования являются правильными формулами преобразований коэффициентов, а не преобразования (8.8.20), как это можно было бы ожидать при наивном рассмотрении. Упражнение. Любое уравнение вида (8.8.15) с предписанием Ито эквивалентно другому уравнению такого же вида с предписанием Стратоновича. Найдите связь между коэффициентами в обоих уравнениях. Разность между их коэффициентами А иногда называют ложным дрейфом, но он, конечно, не имеет физического смысла. Упражнение. Многомерная версия (8.8.15) yv — Av (у)-[-Су (у) L (t), является объектом такой же критики, если только не выполняется условие И 227
Найдите также соответствующее условие для 0v = Av (y) + 2Cv,/(</)^(0. i где Lj(t)—взаимно независимые процессы Ланжевена. 8.9. КАК ПРИМЕНЯТЬ МЕТОД ЛАНЖЕВЕНА Способ, которым Ланжевен ввел флуктуации в уравнение дви- жения броуновской частицы, оказался очень успешным, но его нельзя распространить на нелинейные системы. В настоящем пара- графе мы проанализируем трудности, к которым приводит такое обобщение. Мы хотим предостеречь читателя от весьма запутанной литературы, которую они породили, и убедить его в необходимости иметь твердо обоснованную отправную точку. Прежде всего необходимо различать внешний и внутренний шумы *. Внешним шумом называют флуктуации, возникающие в детерминисти- ческой системе под воздействием случайной силы, стохастические свойства которой считаются известными. Стохастические задачи, возникающие в технике, относятся к такому типу (например, слу- чайная нагрузка на мост или передача случайного сигнала через нелинейное устройство). Такие случаи описываются стохастическими дифференциальными уравнениями в гл. 14 и представляют задачи скорее математические, чем физические. Так как флуктуирующая сила никогда не бывает настоящим белым шумом, то дилемма Ито—Стратоновича не возникает и тогда можно применять примечание, приведенное в конце § 8.8. В нас- тоящем параграфе мы не будем рассматривать внешний шум. Внутренний шум обусловлен тем, что сама система состоит из дискретных частиц. Он является неотъемлемым свойством самого механизма эволюции состояния системы и не может быть отделен от ее уравнения движения. Все наши примеры, относящиеся к химическим реакциям, испусканию и поглощению излучения, росту популяции и т. д., относятся к такому типу. Именно здесь возни- кают трудности, которые мы попытаемся проанализировать. Броуновская частица вместе с окружающей ее жидкостью яв- ляется замкнутой физической системой с внутренним шумом. Однако Ланжевен рассматривал частицу как механическую систему, под- вергающуюся воздействию силы, действующей со стороны жидкости. Эту силу можно разделить на детерминистическую часть, вызываю- щую затухание, которую можно включить в механическое уравне- ние движения частицы, и случайную силу, которую он рассматривал как внешнюю, в частности это означало, что ее зависимость от вре- мени считалась известной. Из физических соображений понятно, что эти свойства не меняются, если на частицу действуют дополнитель- * Н. Mori, Prog. Theor. Phys., 53, 1617 (1975). 228
ные силы, такие, как гравитация в (8.3.5) или даже нелинейность, как в (8.3.10); для таких случаев можно обосновать (8.3.12)*. Однако в недавние годы для описания флуктуаций в разнооб- разных физических системах использовали точно такие или анало- гичные им уравнения, хотя источник шума в них был внутренним и физических оснований для разделения уравнения на механическую часть и случайный член с известными свойствами не было. В каче- стве примеров можно привести электронные устройства**, процессы релаксации ***, гидродинамику ****, диффузию *****, электромагнит- ное поле в веществе ******, уравнение Больцмана *******, лазеры (см. § 11.9), динамику вблизи критической точки и гравитационное поле во Вселенной ********. Стратегия использования приближения Ланжевена в этих при- мерах такова. Предположим, имеется система, эволюция которой описывается феноменологически следующим детерминистическим диф- ференциальным уравнением: у = Л(//). (8.9.1) Обычно у—это конечный или бесконечный набор макроскопи- ческих переменных. Мы же рассмотрим случай, когда у является одной переменной. Предположим, нам известно, что по некоторым причинам в системе должны быть флуктуации относительно этого макроскопического значения. Тогда (8.9.1) нужно дополнить членом * В частности, ангармонический броуновский асциллятор подробно изучен в работах: J. В. Alorton and S. Corrsin, J. Mathem. Phys., 10,361 (1969); K. S. J. Nordholm and R.Zwanzig, J. Statist. Phys., 11., 143 (1974); R. F. Rodriguez and N. G. van Kampen, Physica, 85A, 347 (1976); M. F. Diment berg, Intern. J. Non- linear Meeh., 11, 83 (1976); R.C. Desai and R. Zwanzig, J. Statist. Phys., 19., 1 (1978). ** A. van der Ziel, Noise (Prentice, Englewood Cliffs, N.Y., 1954); К. M. van Vliet, J. Mathem. Phys., 12, 1981 and 1998 (1971). *** L. Onsager and S. Machlup, Phys. Rev., 91, 1505 and 1512 (1953); R. F. Fox and G. E. Uhlenbeck, Phys. Fluids, 13, 1893 (1970). **** L. D. Landau and E. M. Lifshits, Fluid Mechanics (Pergamon, Oxford, 1959); Mechanics, New Concepts, New Problems, New Application) Proc. 6th IUPAP Conf, on Statistical Mechanics; S. A. Rice et al. eds., University of Chicago Press, Chicago, 1972); E. H. Hauge and H. Martin-Lof, J. Statist. Phys. 7, 259 (1973); V. I. Klyatskin and V. I. Tatarski, Sov. Phys. Usp. 16, 494 (1974); Y. Kuramoto, Prog. Theor. Phys. 53 , 589 (1975). ***** d Bedeaux and P. Mazur, Physica 73, 431 (1974). ****** d. Landau and E. M. Lifshitz, Electrodynamics in Continuous Media (Pergamon, Oxford, 1960). ******* д д Abrikosov and I. M. Khalatnikov, Sov. Phys. JETP 34, 135 (1958); M. Bixon and R.Zwanzig, Phys. Rev. 187, 267 (1969); R. F. Fox and G.E. Uhlenbeck, Phys. Fluids 13, 2881 (1970). ******** g к. Ma, Modern Theory of Critical Phenomena (Benjamin, Reading, Mass, 1976) Ch. XIII; M. H. Ernst in: Fundamental Problems in Statistical Mec- hanics IV (Proc. Intern. Summer School in Jadwisin, Poland; E-G. D. Cohen and W. Fiszdon eds., Ars Polona, Warsawa, 1978). 229
Ланжевена y = A(y) + L{t) (8.9.2) и сделать относительно L(t) соответствующие предположения 1—4 из предыдущего параграфа. Получилось уравнение (8.8.12), которое эквивалентно (8.8.13). Здесь возникает первая трудность. При усреднении уравнения (8.9.2) обнаруживается, что величина <//> не удовлетворяет феноме- нологическому уравнению (8.9.1), которое служило нам отправной точкой, а описывается уравнением <54<//2 = <Л (z/)> + 1/2<(z/—<//»2>Л"«г/»+ .... Отсюда следует, что <//> не удовлетворяет вообще никакому диффе- ренциальному уравнению, а «зацепляется» за высшие моменты. Это наводит на мысль, что следует ввести их равновесные значения: <</> = Л «//» + 1/2<(1/-<1/>е)2>еЛ"«//»+... . (8.9.3) Это предположение в данном случае действительно дает уравнение только для величины <//>, хотя понятно, что оно не справедливо вдали от равновесия. Но даже вблизи равновесия оно не решает трудности, потому что если даже <у> удовлетворяет (8.9.3), то у нас уже нет оснований отождествить А (у) в этом уравнении с А (у) в феноменологическом уравнении (8.9.1). С равной правдоподоб- ностью в (8.9.2) и (8.9.3) можно было бы взять немного другое А (у), выбранное так, чтобы его полная правая часть в (8.9.3) совпадала с феноменологическим значением А (у) в (8.9.1). Это открывает основное направление в приложениях приближения Ланжевена к системам с внутренним шумом, обладающим нелинейным феноменологическим законом. Феноменологическое уравнение (8.9.10) справедливо только в таком приближении, когда флуктуациями можно пренебречь. Это подразумевает, что функция А (у) опреде- ляется феноменологически с некоторой долей неопределенности по- рядка размера флуктуаций. Если бы удалось вывести определенный вид А (у) из теории или из эксперимента, в котором флуктуациями пренебрегалось, то это не могло бы служить достаточным основанием для того, чтобы постулировать, что именно этот вид А (у) следует использовать в (8.9.2). Между ними может быть небольшое расхож- дение, значение которого совпадает с значением флуктуаций. На это можно не обращать внимания в макроскопическом законе, но в урав- нении для самих флуктуаций такой реакцией пренебречь нельзя. Расхождение между (8.9.1) и (8.9.3) относится как раз к такому типу. Возвращаясь к нашему описанию приближения Ланжевена, отме- тим, что оно не всегда приводит к квазилинейному уравнению Лан- жевена. Физическое рассмотрение часто подсказывает, что значения флуктуаций должны зависеть от значения у. Например, если у—анод- ный ток в вакуумной трубке, то можно ожидать, что флуктуации числа электронов, попадающих на анод, окажутся порядка корня •230
квадратного от общего количества, т. е. они будут пропорциональны К"*/. Для того чтобы это было допустимо, умножим L(t) на зави- сящий от у коэффициент: у = А (у)-\-С(у) L(t). (8.9.4) Это уравнение совпадает с (8.8.15) и, следовательно, не является настоящим уравнением, пока мы не добавим правило интерпретации: либо правило Ито, либо Стратоновича. Результаты оказываются разными, а значит, возникает ощущение, что дилемма Ито—Стра- тоновича имеет физический смысл. Однако, согласно последнему упражнению § 8.8, эту разницу можно скомпенсировать измене- нием А (у), которое, естественно, имеет тот же порядок, что и зна- чение флуктуаций. Как мы видим, приближение Ланжевена дает возможность определить А (у) в (8.9.4). Следовательно, с этой доли неопределенности и противоречие Ито—Стратоновича является арте- фактом, связанным с неточностью при идентификации А {у) с фено- менологической функцией, использованной в (8.9.1). И наконец, возникает вопрос: как мы должны находить С (у)? В случае внешнего шума это просто отклик системы на приложенную силу, который определяется механикой системы. Для внутреннего шума общий метод нахождения С (у) отсутствует*. Однако для систем, настолько близких к равновесным, что их можно рассматри- вать как линейные, С является постоянной (равной Кг) и может быть найдена, если известно Ре. Вне этой линейной области тот же прием, что применялся в (8.1.8), позволяет отождествить Ре с (8.1.4). Однако из-за неопределенности в выборе А (у) полученный резуль- тат не заслуживает доверия. Действительно, как будет видно в сле- дующей главе, уравнение (8.1.4) с А (у), взятым из феноменологи- ческого уравнения (8.9.1), неверно, когда выходит за границы приме- нимости приближения Фоккера—Планка. Следовательно, уравнение (8.1.8) также неверно. Это была первичная трудность, подмеченная Макдональдом и продемонстрированная на следующем парадоксе. Вывод состоит в том, что феноменологический подход непригоден при работе с шумом в нелинейных системах. Невозможно посту- лировать нелинейное уравнение Ланжевена или Фоккера—Планка, а затем пытаться однозначно определить его коэффициенты из мак- роскопических данных**. Для того чтобы вывести уравнения для флук- туаций, нужно исходить из более подробного описания порождающего их механизма. С другой стороны, вывод из микроскопических урав- нений с помощью техники проецирования*** является просто алгеб- * Эта трудность продемонстрирована на примере дробового шума в токе, поддерживаемом в вакуумных трубках и полупроводниках. ** Этот вывод был продемонстрирован явно на модели обобщенной рэлеевской частицы в работе: С. Т. J. Alkemade, N. G. van Kampen, D. К- C. Mac- Donald, Proc. Roy. Soc. (London) A271, 449 (1963). *** S. Nakajima, Prog. Theor. Phys. 20, 948 (1958); R. Zwanzig, J. Chem. Phys 33, 1338 (1960); H. Mori, Prog. Theor. Phys. 33, 423 (1965). 231
раическим преобразованием этих уравнений и не дает ответа на вопрос, когда и почему выполняются предположения о стохастич- ности. Наш генеральный план состоит в том, что в следующей главе мы, исходя из мезоскопического описания в рамках основного кинетического уравнения, справедливость которого основывается на физическом описании системы, выведем и макроскопический закон, и описание флуктуаций. Парадокс Бриллюэна*. Вольт-амперная характеристика металлооксидного- выпрямителя или р-п-перехода имеет вид /=л{ехр |^| “*г Простой моделью является диодная цепь на рис. 16 с двумя металлическими пластинами, рабочие функции которых приведены на рисунке. Все устройство- находится в термодинамическом равновесии при температуре t (диод Алке- мейда **). Заряд Q конденсатора описывается феноменологическим уравнением Q=-A^exp Если к этому уравнению добавить член Ланжевена, описывающий шум, возни- кающий в выпрямителе для среднего заряда <Q>, то получим 4<Q> = —Л Кехр I)—1} = Л .. Отсюда следует, что в равновесии 1 е 1 <«>е = -2Ж<^ = ЧС' Тогда диод в термодинамическом равновесии поддерживает заряд и, следова- тельно, напряжение на конденсаторе: выпрямитель выпрямляет свои собствен- ные флуктуации! Как бы ни был мал эффект, он нарушает второй закон термодинамики ***. Массив, состоящий из 1012 диодов, был бы способен питать маяк **** *****. Разре- шение этого парадокса состоит в том, что необходимо учитывать контактную разность потенциалов на металлических пластинах. Даже этот пример пока- зывает, насколько опасно добавлять член Ланжевена в нелинейные феномено- логические уравнения ****". Упражнение. Примените приближение Ланжевена для нахождения флуктуаций тока в линейной RC-цепи. Упражнение. Затухание броуновской частицы в жидкости описывается в терми- нах ее энергии следующим уравнением: Ё = — 2уЕ. Найдите уравнения Ланжевена, которые правильно описывают флуктуа- ции в интерпретациях Стратоновича и Ито соответственно. Упражнение. Покажите, что парадокс Бриллюэна остается в силе, если исполь- зовать приближение Фоккера — Планка. * L. Brillouin, Phys. Rev., 78, 627 (1950). ** С. Т. J. Alkemade, Physica 24, 1029 (1958). *** A. Marek, Physica, 25, 1358 (1959). **** R. McFee, Amer. J. Phys., 39, 814 (1971). ***** Именно эта модель точно решена в работе: J. Mathem, Phys., 2, 592 (1961). 232
Упражнение. Опишите радиоактивный распад уравнением Ланжевена 'n = —n+C(n)L(t). (8.9.5) Покажите, что правильные значения среднего и дисперсии можно полу- чить, полагая Г{С(п)}2=л и придерживаясь интерпретации Ито. Пока- жите также, что высшие моменты получаются йеправильными. Упражнение. Запишите (8 9.5) в виде n + n = f (t), тем самым определив сто- хастический процесс f- Используя результаты параграфа § 4.6 можно найти свойства процесса f. Из формулы t n(t) — noe-t^ е*7(Г) At' о получаем немедленно </(/)> = О, что после возведения в квадрат дает </(<!)/(^)> = Пое-*-6(Н-/2). Если 0 — ступенчатая функция Хевисайда, покажите, что <П^1) f (tt) f (/3)> = — M0e-<>6 (И — ts) 6 (Н — /3) + «ое"(16 (<1—/2) 9 (И —13) 4- + noe~ti6 (ti —t3) 0 (И — ^2)-j- noe~tif> (t3 — t3)Q (t3 — H). Каким образом можно догадаться a priori, что f не может быть гауссовым процессом? ГЛАВА 9 РАЗЛОЖЕНИЕ ОСНОВНОГО КИНЕТИЧЕСКОГО УРАВНЕНИЯ Для основных кинетических уравнений, которые нельзя решить точно, вместо интуитивных приближений Фоккера — Планка и Лан- жевена необходимо иметь систематический приближенный метод. Такой метод—степенное разложение по параметру й—мы рассмот- рим в этой главе. Этот метод позволяет также понять, каким образом макроскопическое уравнение получается из стохастического описания в терминах основного кинетического уравнения. 9.1. ВВОДНЫЕ РАССУЖДЕНИЯ Основное кинетическое уравнение удается решить явно только в исключительных случаях. Например, мы видели, что одношаговое кинетическое уравнение можно решить тогда, когда вероятности шагов гп и gn постоянны или линейны по п, в других же случаях получить решение не удается. Поэтому очень важными оказываются приближенные методы, наиболее хорошо известным из которых является приближение Фоккера-—Планка. В литературе предлага- лись многие другие методы, которые в основном содержали рецепты, предназначенные для частного рассматриваемого случая и касающиеся обрезания высших моментов по флуктуациям. Эти методы зачастую в большей степени определялись не общей логикой, а потребностями и вкусами автора. В результате они приводили к ненадежным и противоречивым результатам, упомянутым в § 8.1. Однако все они 233
имели общее положение, смысл которого состоит в том, что флуктуа- ции малы. Такую ситуацию можно исправить только с помощью системати- ческого приближенного метода в виде разложения по степеням малого параметра. Только в этом случае мы получим объективную меру значимости нескольких членов. Поэтому нашей первой задачей является выбор подходящего параметра разложения. Таким парамет- ром должен быть какой-либо параметр, встречающийся в основном кинетическом уравнении, т. е. содержащийся в вероятности W пере- хода. Далее, этот параметр должен отвечать за значение флуктуаций и, следовательно, за значение скачков. Обозначим этот параметр й и выберем его таким образом, что при больших й скачки срав- нительно малы. Во многих случаях й—это просто размер системы. Перед тем как формулировать метод разложения, его полезно сначала продемонстрировать на простом примере. Рассмотрим объем й, в котором происходит следующая химическая реакция: А—Х, 2хХв. (9.1.1) Концентрация <рл молекул А опять берется константой и счи- тается настолько большой, что обратной реакцией можно пренебречь. Иначе говоря, можно представить себе, что А постоянно попол- няется, а В расходуется. Поэтому схема реакции (9.1.1) описывает открытую систему (см. § 7.4). Уравнение, характеризующее скорость химической реакции для концентрации ср вещества X, записывают в виде Ф = /гср4 — 2/г'ср2. (9.1.2) Рассмотрим теперь реакцию мезоскопически. Основное кинети- ческое уравнение, согласно (7.2.4), запишем-в виде рп = *<рЛЙ (Е-1 - 1) рп + (*'/й) (Е2 — 1) п (п- 1) рп. (9.1.3) Это уравнение нелинейно и его нельзя решить явно методами § 6.6, поэтому мы получим приближенное решение для больших й. Отметим, что степени й в коэффициентах записаны явно с тем, чтобы константы /гсрл и & не зависели от й. Для удобства выберем еди- ницы, в которых k' = 1/2 и /гсрл=1: р„ = Й(Е-1-1)рп + (2Й)-ДЕ2-1)п(п-1)р„. (9.1.4) Можно ожидать, что рп будет иметь острый максимум вблизи макроскопического значения п = . йср(/), заданного (9.1.2), с шириной порядка п1'2 ~ Й1/2. С учетом этой догадки полагаем п = йср (/) + й1/2|, (9.1.5) где <р(/)—решение уравнения (9.1.2), а |—новая переменная, заме- няющая п. Соответственно распределение рп запишем теперь как 234
функцию р„(0 = 1Ш, /). (9.1.6) Оператор Е изменяет п на п+1 и, следовательно, В на l + Q~1/2, так что Е=1+й-1/2^. + 1/2й-1^. (9.1.7) Производная по времени в уравнении (9.1.4) берется при посто" янном п, значит, в плоскости f, t она берется вдоль направления, заданного уравнением d|/d/ = — й1/2 dtp d/, тогда (9.1.8) Следовательно, основное кинетическое уравнение (9.1.4) в новых переменных принимает вид ^2___pi/г d(P Q I_______й-1'2_________________ I п 1 dt “ dt dl I “ dg + 2 “ dtf • • • J 11 + + 1Q-1 [2Й-+ 2Й-^+ . . . | (Й<р + й1.Ч)(йФ + й1/2|_ 1)П. (9.1.9) Теперь нам надо собрать несколько степеней й. Во-первых, имеется несколько больших членов, пропорциональных Й1/2, которые могут свести на нет разложение П по степеням й-1-'2. Однако каж- дый из них содержит П только в виде множителя dll/d|. В резуль- тате они сокращаются, если -^ = -1+Ф2. (9.1.10) Это макроскопическое уравнение (9.1.2), и оно удовлетворяется поскольку с самого начала мы поставили условие, что в качеств функции <р берется макроскопическое решение. Теперь соберем члены порядка й° в (9.1.9): + -2<рД-5П + 4(1+2<Р-)^-. (9.1.11) Это линейное уравнение Фоккера — Планка, коэффициенты которого зависят от t посредством <р(/). Оно было решено в § 8.6, и резуль- тат состоял в том, что П оказалось гауссовым. Следовательно, доста- точно определить первый и второй моменты которые в любом случае содержат наиболее важную информацию. С помощью обыч- ного приема из (9.1.11) получаем <W> = ~2<P<I>, (9.1.12а) <?2> = — 4<р <В2> + 1 + 2<р2. (9.1.126) 235
Таким образом, мы нашли распределение флуктуаций вблизи макроскопического значения. Вычисления были проведены с точ- ностью до порядка й1/2 по отношению к макроскопическому значе- нию п. Это приближение будем называть приближением линейного шума. В этом порядке по й шум является гауссовым даже для зави- сящих от времени состояний вдали от равновесия. Высшие поправки вычисляются в § 9.6. Эти поправки модифицируют гауссов характер шума. Однако они имеют порядок й-1 по отношению к п, что экви- валентно примерно одной молекуле. В частности, давайте возьмем для <р стационарное решение урав- нения (9.1.10): ф = <р5 = 1. Тогда (9.1.11) сводится к не зависящему от времени уравнению Фоккера — Планка, решением которого является процесс Орнштейна — Уленбека. Из (9.1.126) непосредственно находим «n2»s = Й <|2у = 3/4Й = 3/4 <п>\ (9.1.13) Множитель 3/4 показывает, что стационарное распределение является более узким, чем распределение Пуассона с тем же самым средним значением. Этот факт породил некоторую дискуссию*, но может быть объяснен следующим образом. Молекулы X образуются независимо друг от друга, но аннигилируют парами, поэтому они не являются статистически независимыми. Если в некоторый момент времени окажется, что количество вещества X превышает среднее значение, скорость их аннигиляции также увеличится по двум при- чинам. Во-первых, будет больше кандидатов для аннигиляции, что является естественной причиной для возвращения к среднему даже в линейных процессах**. Во-вторых, вероятность аннигиляции для каждой молекулы ока- жется также больше среднего значения, потому что имеется большое число партнеров, которые могут послужить ей парой. Этот дополни- тельный эффект увеличивает тенденцию возвращения к среднему и тем самым уменьшает вероятность больших флуктуаций. Аналогич- ные аргументы применимы также и в тех случаях, когда число молекул меньше среднего значения. Упражнение. Функция П, определенная (9.1.6), не является плотностью веро- ятности g, но отличается от нее на нормировочный множитель. Найдите этот множитель и убедитесь в том, что он не входит в основное кинети- ческое уравнение, поэтому при написании (9.1.12) ошибки допущено не было. Упражнение. Если u = n/Q — полная плотность или концентрация вещества X, покажите, что д/<и>= 1—-<и>2-+-О(й-1), (9.1.14а) dt «и2» = - 4 <ц> «п2» + 1 + <ц> + О (О"1/2). (9.1.146) * G. Nicolis and Р. Prigogine, Proc. Nat’l Acad. Sci. USA 68, 2102 (1971); A. Nitzan and J. Ross, J. Statist. Phys. 10, 379 (1974); G. Nicolis P. Allen and A. Van Nypelseer, Prog. Theor. Phys. 52, 1481 (1974); N. Saito, J. Chem. Phys. 61, 3644 (1974). ** Этот эффект был продемонстрирован на модели урн Эренфеста (4.5.4). 236
Упражнение. Покажите, что для реакции А —> рХ, рХ —» В с произвольными (положительными) целыми р, q имеет место соотношение «п2>У=^-<п>< При p = q результат окажется таким же, как и для распределения Пуас- сона. Проверьте, что в этом случае рп действительно является распреде- лением Пуассона, даже когда процессы рождения и аннигиляции X не являются независимыми. Упражнение. Покажите, что точное стационарное решение (9.1.3) дается выра- жением Рн = С ^/„-Нгу), (9.1.15) где Iп-i обозначена модифицированная функция Бесселя, а ?2 = &плОМ'; C-i= /"2/i(2y >Л2). Упражнение. Выведите (9.1.13) из (9.1.15). Упражнение. Найдите <<п2>У для реакции А -> рХ, 9Х->В + гХ, где p3al, q > Г - и объясните результат качественно. 9.2. ОБЩАЯ ФОРМУЛИРОВКА МЕТОДА РАЗЛОЖЕНИЯ Флуктуации вызываются дискретной природой вещества. Плотность газа флуктуирует потому, что газ состоит из молекул. Флуктуации в химических реакциях возникают потому, что реакция происходит, когда сталкиваются отдельные молекулы. Флуктуации электрического тока обусловлены тем, что ток—это движение электронов, радиоак- тивный распад флуктуирует благодаря тому, что он связан с отдель- ными ядрами. Между прочим, это объясняет, почему формулы для флуктуаций в физических системах всегда содержат атомные кон- станты, такие, как число Авогадро, масса молекулы или заряд электрона. С другой стороны, макроскопическое поведение определяется сразу всеми частицами, поэтому можно ожидать, что в большой системе флуктуации будут сравнительно не важны. Действительно, мы это широко проиллюстрировали на примерах линейных систем, рассмат- ривавшихся ранее. На примере этих систем можно было бы подме- тить качественное соображение, что в наборе из N частиц флуктуа- ции имеют порядок N1/2, а следовательно, их воздействие на макро- скопические свойства имеет порядок N~l/2. Тогда ясно, что размер системы является параметром, характеризующим меру относительной важности флуктуаций й. Поэтому мы введем параметр, характери- зующий размер системы. Точное определение й зависит от конкрет- ной системы, но у него есть общие свойства, которые мы сейчас сформулируем. Наличие параметра Й дает возможность различать два масштаба. Один масштаб определяется размерами скачков (мы его будем обо- значать переменной X). Когда величина Й изменяется, значение скачков, выраженное в единицах X, остается тем же самым. Другой 237
масштаб—это масштаб измерения макроскопических свойств системы. Обозначим его х = Х/Й. Тогда можно ожидать, что вероятность того, что переход произойдет, зависит от х, т. е. при изменении й веро- ятность остается той же самой функцией величины х. Если й— это объем системы, то отличие между X и х как бы характеризуют раз- ницу соответственно между экстенсивной и интенсивной переменными. Сейчас мы выразим эту мысль на формальном языке. В общем виде основного кинетического уравнения (5.1.5) в ка- честве переменной у можно взять X или х, здесь мы выбираем пер- вое. Отметим также явную зависимость от Р{Х ) = ${^а(Х|Х')Р(Х', /) —UZQ(X'|X)xP(X, 0}dX'. (9.2.1) По аналогии (9.2.1) мы запишем W как функцию начальной точки и длины скачка г —X— X': ГЯ(Х|Х') = ГЙ(Х'; Х-Х') = ^о(Х'; г). Зависимость от г описывает относительную вероятность скачков различной длины, в то время как зависимость от X' определяет полную вероятность перехода. Мысль, высказанная выше, выражается равенством Га(Х'; X—Х') = ф(А1; X—Х')=Ф(х'; г). (9.2.2) Эта формула означает, конечно же, что Ф является функцией двух переменных х' = Х'/й и г и не содержит параметра й каким-либо другим образом. Отметим, что Wb (X'| X) = Ф (х; -г). Строгое условие (9.2.2) можно ослабить. Во-первых, понятно, что можно дописать произвольный (положительный) множитель /(й), поскольку его всегда можно включить в масштаб времени. Это озна- чает, что большие системы могут эволюционировать медленнее малых. Во-вторых, поскольку мы собираемся раскладывать по параметру й-1, то появление высших порядков по й-1 в (9.2.2) не принесет никакого вреда. Тогда вместо (9.2.2) наши предположения относительно Wa (X | X') можно записать в следующем виде: U70(X|X') —/ (Й) /ф0 f ; г14-Й-»фД^; г\ +й”Фг+ . . . \ . (9.2.3) Понятно, что это предположение применимо почти ко всем слу- чаям, встречающимся на практике. Поэтому будем ссылаться на него как на каноническую форму. Когда W не имеет такого канониче- ского вида, метод разложения неприменим. Подстановка (9.2.3) 238
в основное кинетическое уравнение дает + й-1ф1/Х_22£; г) + ...},р(Х-Л, Odr- -ri+Q-^/A; r')4-...ldr P(X, /). (9.2.4) V I / \ •“ / J Пример. Для рэлеевской частицы скорость V, описывающаяся основным кинетическим уравнением с W (V | V'), дается (8.4.14). Скачки в V обусловлены столкновениями молекул газа и поэтому имеют порядок (т/Л4)г,, где v— ско- рость, характеризующая распределение скорости F. Эти параметры можно сде- лать малыми, выбирая большое Л4, соответственно берем Q — M/т. Переменная, в единицах которой значения скачков не меняются,—это импульс Р — ЛИЛ Наша переменная — X, тогда как mV можно рассматривать как интенсивную пере- менную х. Вероятность перехода имеет вид W(X\X')=^ f ^L+Г? 2 1—~'О f } , (9.2.5) 17 M . 2m J .44 \ 2mM 2mM J . !'14 2 , „ I X' . M -m \ W (X . r) - vA ( 2mM j | r | F ( ~^-+ 2mM r-. '- Это соотношение имеет вид (9.2.3), если в нем взять / (й) - 1: ф«(х; И т, д. * Упражнение. Для одношагового процесса условие (9.2.3) того, что вероятность порядка имеет канонический вид, выражается соотношениями гп- f (Й) ро -]-Q Jpi ‘‘ J ] ’ (9.2.6а) (9.2.66) где ро. Pi. и у0, у! — функции, зависящие от л/Й и не содержащие па- раметр й никаким другим образом. Упражнение. Убедитесь, что (5.1.7) и (6.9.5) имеют канонический вид (9.2.6). Упражнение. Относительно основного кинетического уравнения (6.9.1) поясните, почему N и Л4 пропорциональны Й, а а, 0 — пропорциональны й-1: р„ = йа(Е—1) f-Jp рп + й&(Е-1- 1) fv-Aj (9.2.7) Проверьте, что это соотношение имеет канонический вид (9.2.6). Упражнение. Покажите тем же самым способом, что примеры 2, 3, 4 из § 6.9 имеют канонический вид. Упражнение. Покажите, что основное кинетическое уравнение, определенное в (6.9.11), обладает канонической формой с Й=С или, более изящно, й = = СкТ/е-. * Эта задача рассмотрена в работах: Can. J. Phys. 39, 551 (1961) и в R. F. Fox and М. Кас, Biosystems 8, 197 (1977). 239
Упражнение. Рассмотрите пример с рэлеевской частицей, выбирая й = =(Л4-{-«)/(2яг). При этом выборе Фр Ф2=...=4). Для того чтобы продвинуться более в систематическом разложе- нии 1/й, надо предугадать, каким образом решение Р(Х, t) будет зависеть от Q. Начальное условие имеет вид Р(Х, О) = 6(Х-Хо), (9.2.8) где, вообще говоря, Х„ имеет порядок Q. Можно ожидать, что с тече- нием времени Р (X, t) будет иметь острый пик, находящийся при- Рис. 24. Эволюция плотности вероятности мерно в том же месте, порядка Q (в масштабе X), в то время как ширина этого пика окажется порядка Q1'2 (рис. 24). Чтобы записать это формально, полагаем Х = ЙФ(/) + Й1'2^_ (9.2.9) Первый член в этом выражении является макроскопическим. Функция <р(0 должна подбираться таким образом, чтобы следо- вать движению пика во времени. Тогда можно ожидать, что Р(Х, t), если его записать как функцию 5, не будет зависеть от Q, а если и будет, то только в высших приближениях. Обоснование этого ана- лиза мы дадим a posteriori, после того как наш прогноз подтвер- дится. Уравнение (9.2.9) представляет собой зависящее от времени пре- образование от переменной X к новой переменной £, включающее пока не определенную функцию <рг. Функция Р (X, t) преобразуется в функцию П(Е, t), зависящую от 1 согласно Р(Х, 0 = -Р(^ф(0 + ^1/21. 0 = П(£, 0- (9.2.10) 240
Производные преобразуются согласно соотношениям (9.1.8): д' п n4-v ^р dXv > dll дР „ d<p дР dP О1/2 d<p <ЭП dt ~~ dt + dt dX dt dt di ’ Основное кинетическое уравнение (9.2.4) выражается через новые переменные следующим образом: дП(£, t) о,;, d<p ап __ dt dt di $Фо(<р(0 + Й~1/2(£—г)П(Е —Q-!/2r, Z)dr-r + Q"7(Q) J Ф1((р(0 + Й-1/2(ё—Й-1/2г); г)П(£ — Q-1/2r, /)dr 4- . ..— _/(й)$Ф0((р(/)Д-Q-V2g; _f)dr.n(£, 0- -Q-y(Q) — r)dr-n(g, t)-... . (9.2.11) Теперь мы готовы повторить разложение, проделанное в § 8.2, но сейчас мы знаем порядок величины всех членов, измеренный в порядке параметра Q~V2. в первых двух членах правой части £ сдвинута на —П~1/2. Используя разложение Тейлора, чтобы учесть эту сдвижку, замечаем, что низшие члены сокращаются с двумя последними строчками и результат принимает вид ап a. t) о d<p ап _ dt u ' dr ag = -Q-V7(Q)ljr0,(q)(O + Q-i4 r)dr-n(l, t) + 44^“7(Й)^р2Фо(ф(0 + Й-1/21, r)dr-n(g, 0~ —4п-«/2/(й)^У^Фо(ф(О + й->и r)dr.n(g, o- • — Й- з/2/(Й)~4Ф1(ф(/) + Й’1/21. г-П(£, /) + O(Q-2). (9.2.12) Чтобы упростить это выражение, по аналогии с (5.8.2) определим «V, xW = 4v<Px(4 r)dr (9.2.13) и изменим масштаб времени, положив Я~7(Я)/ = Т. (9.2.14) 241
Тогда уравнение принимает вид „ __Q„. о (<р (т) + а-,„Е) п + + у «г, о (Ф (т) + Я-1/2£) П - й-а3,0 (<р (Т) + й~1/2^) п - -Q- V21И1 х (<р (Т) + Q-V2g) п + О (й-i). (9.2.15) Разложение моментов перехода дает окончательно: дП (g, т)__О1/2 dtp _дп дт dr dg = -fiV2ai о (<р) о (Ф) Шй-i/2a" 0 (ф)MI + + 4 «2, о (ф) + 4 a - 0 (ф) Щ - 4 й- V2a3 о(ф)-^-- -й-^а1,1(ф)-^ + О(й-1), (9.2.16) где ф обозначено ф (т), а штрихи означают производные. Это систе- матическое разложение основного кинетического уравнения, которое будет служить нам отправной точкой в следующих параграфах. Упражнение. Соотношение между старым моментом перехода av и новым av, X имеет вид av(XW(Q) [av,o(4H4-a^ 44) + --' I- (9.2.17) Упражнение. Альтернативный способ вывода (9.2.16) состоит в том, что можно стартовать с разложения Крамерса — Мойала (8.2.6) и выполнить преобра- зование (9.2.9), (9.2.10). Покажите, что в результате получится то же самое. Упражнение. Используя (9.2.5), найдите для рэлеевской частицы коэффициенты a в уравнении (9.2.16). Упражнение. Зависимость (9.9.12) от £2 можно продемонстрировать, записав р„ = -^-(Е-1)п*р„+М2(Е-1-1)р„. (9.2.18) Покажите, что точное стационарное решение для больших Q имеет вид ч ^n2^ = J.<n>.v=J.Q}C^ (9.2.19) и согласуется со стационарным решением (9.2.16) для этого случая. 9.3. ПРИРОДА МАКРОСКОПИЧЕСКОГО ЗАКОНА На первый взгляд, (9.2.16) — неподходящее разложение для боль- ших й, потому что оно содержит два члена порядка й1/2. Это мо- жет означать, что наш анзац (9.2.9) ошибочен *. * Это также означает, что мы столкнулись с проблемой сингулярного воз- мущения: производная по времени не входит в число наибольших членов. Это объясняет, почему прямое вычисление по теории возмущений неприменимо в данном случае и должно быть заменено более изощренными приемами, опи- санными в этом параграфе. 242
Однако при последующем размышлении можно заметить, что оба эти члена включают П только посредством множителя dll/d£, поэтому можно устроить так, что они сократятся, если выбрать такое <р, что -^ = ai,o(<P). (9-3.1) Поскольку нашей целью является решить основное кинетическое уравнение с начальным условием, в котором Хо порядка й, началь- ное значение ср следует выбрать в виде <р(О) = Хо/Й = хо. (9.3.2) Функцию <р, заданную (9.3.1) и (9.3.2), следует использовать в пре- образовании (9.2.9), как будет показано в следующем параграфе. Она определяет макроскопическую часть X таким образом, что флук- туации относительно нее имеют порядок й’/2. Тогда (9.3.1) является макроскопическим уравнением. Примечание. Уравнение (9.3.1) не полностью совпадает с (5.8.6), которое мы раньше называли макроскопическим уравнением, поскольку оно также со- держит члены порядка Q-1. Возникает вопрос: какое же из этих уравнений правильно, так как члены порядка Я-1 (и даже порядка Q-1^2) могут пере- ходить из макроскопической части (9.3.2) во флуктуационную часть? И если что сформулировать по-другому, положение пика Р(Х, t) нельзя определить точнее его ширины, которая имеет порядок Q1''2. Конечно же, можно догово- риться определять положение как <Х> или по максимуму пика. Однако для этого нет логической необходимости и в случае нелинейных процессов это к тому же и затруднительно. И все же практика дает формуле (9.3.1) некото- рое преимущество перед формулой (5.8.6). Так, например, в случае химической реакции О — объем, а уравнения, описывающие скорость химической реакции, применимы в случае бесконечного объема и не содержат членов порядка Q-1. В случае рэлеевской частицы можно было бы попытаться включить высшие по т/М члены в макроскопический закон затухания, но их физическая значимость сомнительна, поскольку они много меньше всегда присутствующих флуктуаций. Стационарные решения дифференциального уравнения (9.3.1) являются корнями уравнения а1.„(ф) = 0. (9.3.3) Их может быть любое число. Из того факта, что основное кине- тическое уравнение (если только оно не является разложимым или расщепляющимся) имеет единственное стационарное решение Р%, нельзя сделать выводы о том, что макроскопическое уравнение не может иметь более одного стационарного макроскопического состоя- ния, как это было видно в § 11.1. Может существовать несколько типов нулей а10. Лучше всего изобразить их на фазовой плоскости, где по осям откладывают = «! (<р) и гр (рис. 25). Хотя время и не представлено на рисунке, мы знаем, что ср должно увеличиваться в точках выше оси ср и умень- шаться в точках, лежащих ниже ее, как показано стрелками. Из рис. 25, а понятно, что стационарное решение cps, у которого вц (q/) < О, 24а
приближается всеми решениями в его окрестности и поэтому является устойчивым *. Стационарное решение типа изображенного на рис. 25, б является чисто неустойчивым. Кривые другого типа встречаются, когда aj,о(сру) = 0 (см., например, рис. 25, в). Для настоящего обсуждения допустим, что (9.3.1) имеет только одно решение, которое является устойчивым. На самом деле мы Рис. 25. Устойчивое стационарное решение макроскопического уравнения (а); неустойчивое стационарное решение (б); еще один вид неустойчивости (в) делаем более сильное предположение, что имеется положительная крнстанта h такая, что аь о (ф) — Л < 0 для всех ср. (9.3.4) Тогда все решения уравнения (9.3.1) стремятся к cps по крайней мере так же быстро, как с e_ftT (рис. 26). В гл. 10 и 11 будут рас- Рис. 26. Близкие решения стре- мятся к устойчивому (асимптоти- чески) решению смотрены случаи, когда условие (9.3.4) не выполнено. Нам понадобится еще одна кон- цепция из теории дифференциальных уравнений. Предположим,, мы имеем решение ф(т) уравнения (9.3.1), за- данное некоторым начальным значе- нием <р (0). Рассмотрим второе реше- ние с начальным значением ср (0) + +6ф(0), где 6<р (0) мало. Разность 6ф (т) между двумя решениями мо- жет быть описана в первом порядке по ^&р = а;(<р(т))6<р. (9.3.5) Это линейное уравнение для 6ф можно легко решить, когда ф (т) известно. Его называют линеаризованным или уравнением для вариа- ций, связанным с (9.3.1). Когда оказывается, что решение уравнения * До тех пор, пока мы это не оговорим иначе, понятие «устойчивость» будем использовать в значении, которое технически называется «асимптотиче- ская устойчивость» в смысле Ляпунова» (см., например: J. La Salle and S. Lef- shetz, Stability by Liapunov’s Direct Method (Acad. Press, New York, 1961). 244
(9.3.5) стремится к нулю при т —* оо, отсюда следует, что это частное решение <р(т) уравнения (9.3.1) устойчиво относительно малых воз- мущений или «локально устойчиво». Понятно, что (9.3.5) не содер- жит информации относительно глобальной устойчивости, т. е. из него нельзя сделать выводов о воздействии больших возмущений. Из локальной устойчивости можно только вывести тот факт, что ср (т) имеет определенную «притягивающую область» и любое реше- ние, начинающееся внутри этой области, должно стремиться к <р(1) при больших т. Однако в этой главе мы постулируем условие (9.3.4), которое гарантирует глобальную устойчивость. Упражнение. Выведите (5.8.6) из (9.2.16). Упражнение. Найдите оба варианта (9.3.1) и (5.8.6) макроскопического урав- нения, относящегося к основному кинематическому уравнению (6.9.5). Убедитесь в том, что первое из них дает правильное уравнение для ско- рости реакции. Упражнение. Оба варианта (9.3.1) и (5.8.5) макроскопического затухания для рэлеевской частицы в предыдущем параграфе совпадают, если выбрать Я = (Л4Ц-щ)/(2т), и не совпадают, если Q = A4/m. В последнем случае найдите разность между <Xi (V) и ai, 0 (V). Упражнение. Покажите, что (9.3.4) гарантируют глобальную устойчивость всех решений уравнения (9.3.1). Постройте пример, когда все решения глобально устойчивы, а условие (9.3.4) не выполняется. Упражнение. Покажите, что автокаталитическая химическая реакция * А+2Х = ЗХ, Х~?В (9.3.6) обладает по крайней мере одним макроскопическим устойчивым состоянием. Упражнение. Покажите, что (6.9.7) имеет одно неустойчивое решение. Все дру- гие решения локально устойчивы, но не глобально. Упражнение. Определите некоторую «потенциальную функцию» V (х), полагая ®1(ф) = —V" (<₽) Условие (9.3.4) для <р # предполагает V (<р) > V (ф6) и dfV (<р) < 0. Покажите, что V (ф) является функцией Ляпунова **, которую можно исполь- зовать для доказательства глобальной устойчивости. Упражнение. Функция V удовлетворяет даже более сильному условию *** V" (ф) > 0. Эти свойства V совместно означают выполнение (9.3.4). Упражнение. Для однощагового процесса макроскопического уравнения в обо- значениях (9.2.6) имеет вид ф = То(ф)—Ро(ф)- (9.3.7) 9.4. ПРИБЛИЖЕНИЕ ЛИНЕЙНОГО ШУМА Позаботившись о членах порядка Q1/2 в уравнении (9.2.16), мы получим уравнение для П (£, т), являющееся корректным разложе- нием по й-1/2 Члены порядка й° имеют вид' 0П(£, т) , . . д £Гг , 1 / ,п. ., а1, 0 (ф) Ш -|- 2 0-2, О (ф) ^£2 • (9.4.1) * F. Schlogl, Z. Phys. 253, 147 (1972). Н. К. Janssen, Z. Phys. 270, 67(1974); I. Matheson., D. F. Walls and C. W. Gardiner, J. Statist. Phys. 12, 21 (1975). ** La Salle and Lefshetz, Loc. cit. *** F. Schlogl, Z. Phys. 343, 303 (1971). 245
Это линейное уравнение Фоккера — Планка, коэффициенты ко- торого зависят от времени через <р. Это приближение мы назвали в §9.1 «приближением линейного шума». Решение уравнения (9.4.1), как было показано в § 8.6 гауссово*, поэтому достаточно опреде- лить первый и второй моменты S. Умножая (9.4.1) на £ и £2 соот- ветственно, получаем dT<£> = al, в(<р)<£>, (9.4.2а) <?Т <12> = 2а;, о (ф) <£2> + а2, „(ср). (9.4.26) Отметим, что дисперсия удовлетворяет тому же самому уравнению, что и <<£2» = 2а;, о (ср) <<£2» + а2,0 (<р). (9.4.2в) Эти уравнения определяют оба момента при условии, что известны их начальные значения. Мы ставили себе целью решить основное кинетическое уравнение с начальным распределением в виде дельта- функции (9.2.8) и х0 взяли в качестве начального значения макро- скопической части (см. (9.3.2)). Понятно, что начальные флуктуации равны нулю: Ьо = <?2>о = «^»о = 0. (9.4.3) Резюме. Итак, мы достигли поставленной цели — решить основное кинетическое уравнение с начальным условием (9.2.1). Мы получили решение в приближении линейного шума с помощью следующих трех шагов. 1. Решаем макроскопическое уравнение (9.3.1) с начальным усло- вием (9.3.2), обозначаем решение ср(т/х0). 2. Подставляем найденное <р(т/х0) в (9.4.2) и решаем уравне- ния (9.4.2) с начальными условиями (9.4.3). 3. Используем полученные результаты для нахождения среднего и дисперсии первоначальной переменной X: <Х>Т = Qcp (т | х„) 4- й1/2 <£>т, (9.4.4а) «№»Т = Й«^»Т. (9.4.46) Для Р(Х, t) берем гауссово распределение с этими средним и дисперсией. Несколько пояснений позволяют прояснить ситуацию. а. Из (9.4.4а), (9.3.1). (9.4.2а) получаем дх <х> = аъ 0 (<х>) + 0(Й-1). (9.4.5) Таким образом, в приближении линейного шума среднее описы- вается макроскопическим законом. * Приближение линейного шума можно было бы также назвать гауссовым, однако следует понимать, что в Q-разложении гауссов характер выводится, а ие постулируется. 246
б. Уравнения (9.3.1) и (9.4.2) можно решить, т. е. искать их решения с помощью некоторого количества интегрирований, как это уже упоминалось ранее в связи с (5.8.15). (Однако это утвержде- ние уже не справедливо, если имеется большее число переменных.) в. Нет необходимости выбирать начальное значение <р, совпа- дающее с положением начального дельта-пика х0. Допускается рас- хождение порядка й-1/2, поскольку его можно учесть в качестве начального значения Е. Тогда уравнения (9.4.2) нужно решать с этим новым <р и новыми начальными значениями <Е> и <£2>, хотя, ко- нечно же, <<£2» остается равной нулю. г. Эта свобода особенно полезна при вычислении автокорреля- ционной функции флуктуаций в стационарном состоянии, т. е. «x(O)x(/)»s = <{xo — х5} {<х(/)>х0—xs}>s. (9.4.6) Для того чтобы вычислить в этом выражении условное среднее <^(0>л:„, нет необходимости реализовывать общую схему и решать (9.3.1) с начальным условием ф(0) = хо. Вместо этого можно взять Ф = Ф* и решить (9.4.2а) с начальным значением й~1/2 <bo = *O — Xs. Это возможно, потому что значение ха, удовлетворяющее (9.4.6), отличается от х3 на величину порядка й-1/2. Для t^O, согласно (9.4.2), в результате получаем «х (0) х (t)»s = й-1 <Е (0) Е (/)>’ = й“1 <£ (0)2>s ехр [— а'ь 01 (ф5) | т] *= 1 а2, о (ф*) , - q-Qi - 7 |ехр[—|а1,0(ф^)!т]. (9.4.7) u 2 [ «!. 0 (<pJ) J Мы получим общую формулу для автокорреляционной функции флуктуаций (в приближении линейного шума) для устойчивого ста- ционарного состояния. Отсюда следует, что можно выписать спектр флуктуаций для произвольной системы, не решая никаких специаль- ных уравнений. Этот факт является основой обычной теории шума. д. Обоснование a posteriori анзаца (9.2.9) состоит в том, что получающееся в результате уравнение (9.4.1), как нетрудно заме- тить, не содержит й, так что нужные нам флуктуации имеют поря- док, постулированный в (9.2.9). Однако, если флуктуации нарастают во времени, результат будет применим только в течение ограничен- ного времени до тех пор, пока флуктуации будут иметь тот же самый порядок величины, что и макроскопическая часть, несмотря на то что они умножаются на множитель й^2, а не й. Однако наше условие (9.3.4), гарантирующее устойчивость макроскопических решений, обеспечивает также ограниченность решений (9.4.2). е. На рис. 27 дается качественное объяснение того факта, что флуктуации не нарастают, когда макроскопические решения устой- чивы. Макроскопические решения сходятся. Вследствие флуктуации 247
система может перескочить с одной кривой на соседнюю, но с те- чением времени этот эффект сведется на нет, поскольку расстояние между кривыми стремится к нулю. В устойчивом стационарном состоянии, или в равновесии, зна- чения флуктуаций являются результатом конкуренции между скач- ками и макроскопическим возвращением к равновесию. Оба эффекта представлены первым и вторым члена- ми в правой части уравнения (9.4.26) соответственно. Это является основа- нием соотношения Эйнштейна (8.3.9) и флуктуационно-диссипативной теоремы. Уравнение (9.4.2а) для среднего уменьшения начальной флуктуации совпадает с уравнением для вариаций (9.3.5), связанным с макроскопическим уравнением. В линейном приближении вблизи равновесия это означает, что регресс флуктуаций описывается мак- роскопическим законом. Это предпо- ложение использовал Онзагер в своем выводе отношений взаимности*. Тогда Рис. 27. Сходимость макроско- пических решений предотвра- щает нарастание флуктуаций (9.4.2а) является обобщением предположения Онзагера на не за- висящие от времени состояния нелинейных устойчивых систем. ж. Из условия (9.3.4) следует, что имеется одно tps, которое глобально устойчиво, т. е. все другие решения стремятся к нему. Некоторые макроскопические законы обладают локально устойчи- вым <(/, т. е. решение (9.3.3) обладает ограниченной притягивающей областью, так что решения только в этой области стремятся к <ps (рис. 28). Внутри этой области на достаточном удалении от ее гра- ницы по-прежнему можно использовать й разложение для нахож- дения флуктуаций, в частности флуктуаций относительно «р5. Однако имеется малая вероятность того, что флуктуация выведет систему из притягивающей области и система никогда не возвра- тится к состоянию <ps. Вероятность такого события обычно порядка е-й и, следовательно, обычно очень мала, за исключением окрест- ности границы притягивающей области. Понятно, что такой член никогда нельзя найти с помощью разложения по степеням й-1/2, для этого нужны совершенно иные методы (см. гл. 11). Это очевид- ное ограничение послужило причиной чрезмерных опасений отно- сительно справедливости й-разложений ** и даже самого основного кинетического уравнения***. * L. Onsager, Phys. Rev. 37, 405 and 38, 2265 (1931); H. В. G. Casimir, Rev. Mod. Phys. 17 , 343 (1945); De Groot and Mazur. ** W. Horsthemke and L. Brening, Z. Phys. 27 , 341 (1971); W. Horsthemke, M. Malek-Mansour and L. Brening, Z. Phys. B28, 135 (1977). *** M. Malek-Mansour and G. Nicolis, J. Statist. Phys. 13, 197 (1975). 248
з. Корректность макроскопического закона (9.3.1) была доказана строго в следующем смысле*. Выберем временной интервал (О, Т) с допустимой ошибкой 6 > 0. Тогда вероятность того, что для всех t £ (0, Т) истинное значение х отличается от <р(/) не более чем на 6, стремится к 1 при й-^оо. Было также доказано**, что ошибка стремится к распределению Гаусса, как это дается приближением линейного шума. Отметим, однако, что здесь Т фиксируется до того, как й устремляется к бесконечности, а это означает, что ничего Рис. 28. Два локально устойчивых стационарных решения, раз- деленных неустойчивым решением (а). Все решения, за исключе- нием самого решения <рь, стремятся либо к фа,'либо к <рс нельзя сказать о поведении на больших временах. Тогда доказа- тельства в равной степени применимы и к неустойчивым случаям, рассматриваемым в следующих двух главах, но в этом случае они просто описывают начальный переходный период (10.1.3), а не то поведение, которым мы действительно интересуемся. и. В нашу картину не входят ни нелинейное уравнение Фок- кера—Планка в виде (8.1.1), ни нелинейное уравнение Ланжевена (8.8.15), а поэтому не возникает дилеммы Ито—Стратоновича. Не- линейное уравнение Фоккера — Планка появляется в следующей главе, когда условие устойчивости (9.3.4) уже не выполняется. Однако даже в настоящем случае можно было бы записать не- линейное уравнение Фоккера — Планка и соответствующее уравне- ние Ланжевена, которые в части, касающейся приближений линейного шума, привели бы к тем же самым результатам, что и найденные здесь ***. * Т. G. Kurtz, J. Appl. Prob. 7, 49 (1970). ** Т. G. Kurtz, J. Appl. Prob. 8, 344 (1977). T. G. J. Kurtz, J. Chem. Phys. 57, 2976 (1972). *** Z. A. Akcasu, J. Statist Phys. 16, 33 (1977); N. G. van Kampen, Statist. Phys, to be published (1981). 249
И все же любые другие содержащиеся в них черты, выходящие за рамки этого приближения, были бы неправильными. Например, для такого уравнения Фоккера — Планка нельзя было бы сделать вывода о том, что оно обладает стационарным распределением (8.1.4). Упражнение. Запишите приближение линейного шума для решения Р(Х, I) с начальным значением (9.2.8) явно в терминах <р и решение (9.4.2). Упражнение. Убедитесь в том, что в приближение линейного шума в устойчи- вом стационарном состоянии всегда приводит к процессу Орнштейна — Уленбека. Упражнение. Примените к (9.2.18) Й-разложение и выведите соотношения ib аб \ at J «п (0) п = -1 <n>s ехр [— 2 Кabt]. d/ Q Отметим, что а и ft нельзя определить экспериментально, измеряя лишь <п>5 и «п2»4, для этого нужно получить еще спектр флуктуаций. Упражнение. Решите (9.4.2) явно. Упражнение. Покажите, что члены Фх, Ф2 ... в (9.2.4) не дают вклада в при- ближение линейного шума. Тогда различие между (9.3.1) и (5.8.6) в этом приближении несущественно. Упражнение. Для того чтобы решить основное кинетическое уравнение с на- чальным условием (9.2.8), в качестве начального значения возьмите <р(О) = хо—сй-1/2- Покажите, что получающееся в результате значение <x>t будет таким же самым, как если бы мы взяли ф(О) = хо. Упражнение. Распространение эпидемии в популяции из отдельных 0-индиви- дуумов, п из которых инфицированы, a Q — п нет, в простейшем случае можно описать с помощью условий г(п) = 0 (не излеченные) и g (n) = pnx Х(1—n/й). Найдите <п> и <<п2» как функции времени. Упражнение. Докажите, что (5.8.12) и (5.8.9) либо (5.8.15) образуют согласо- ванное приближение. Действительно, y = ai(y) + joX(y) + °(Q-1/2)> (9.4.8а) — Sai (У) Оу аз (у) 4- О (QV2). (9.4.86) Упражнение. Убедитесь в том, что (9.5.6) — это не что иное, как приближение линейного шума для (8.5.1). 9.5. РАЗЛОЖЕНИЕ ОСНОВНОГО КИНЕТИЧЕСКОГО УРАВНЕНИЯ В СЛУЧАЕ МНОГИХ ПЕРЕМЕННЫХ В том случае, когда имеется не одна, а несколько флуктуирую- щих величин, способ, которым можно провести Й-разложение, во многом совпадает с одномерным случаем. Основное различие состоит в том, что макроскопические уравнения в том случае более сложны и обычно их не удается решить явно в квадратурах. Вместо того чтобы дать общую формулировку, мы лучше продемонстрируем мно- гомерное й-разложение на конкретном примере. 250
Рассмотрим следующую химическую реакцию в открытой системе, включающую два реагента X и Y: аЛх, 2Х Д Y, (9.5.1) Y Д В. Первая строка описывает производство атомов X из заданного резервуара А с постоянной скоростью ай. Вторая строка описывает объединение атомов X в молекулы Y за единичное время y/ix/^- Третья строка описывает потерю молекул Y с вероятностью |3/iY вследствие дальнейшей реакции или какого-нибудь другого меха- низма. Макроскопические уравнения имеют вид пх = ай— 2(у/й)пх, (9.5.2а) Пу = (у/Й)пх — |3пу. (9.5.26) Мы интересуемся флуктуациями относительно этих макроскопи- ческих значений и поэтому введем совместное распределение вероят- ностей Р (пх, пу, t), удовлетворяющее основному кинетическому уравнению P = aQ(ExJ- 1)/> + (T/Q)(E’xE-y*- i)n2xP + P(FY-l)nYP, (9.5.3) где Ex и Еу— операторы шага, действующие на пх и nY. Тот факт, что уравнение нелинейно, вынуждает нас применить й-разложение. Преобразование (9.2.9) записывается теперь следующим образом: пх = (f) 4- й1/2£, Пу = йф(/) + й1/2т1> Р(пх, «у, 0 = п(£. П, О- Подстановка в основное кинетическое уравнение в требуемом порядке по теории возмущений дает _ Q1/2 _ Q1/2 := aQ J_ Q-i/2 + 1 Q-1 I п + dt at dg - a/ a-q ( dg 1 2 og2 j + ф-1/2 Д + |й-^{.(йф + й1/2т))П. (9.5.4) И снова мы можем рассмотреть последовательные степени по й отдельно. Все члены порядка й1/2 оказываются пропорциональными либо дП/dt, либо дП/дт]. Условия обращения в нуль для членов каждого 251
Рис. 29. Фазовые кривые систе- мы уравнения (9.5.5) вида запишем следующим образом: — <р = — а + 2у<р2, (9.5.5а) — ф =— УФ2 + 0ф. (9.5.56) Эти уравнения представляют собой макроскопические уравнения (9.5.2). Их можно решить явно, и, как не- трудно заметить, все решения стре- мятся к Ф* = К«/(2у), ф5 = а/(2Р). (9.5.6) Кривые, изображающие решения в (ф, ф)-плоскости, изображены на рис. 29. Очевидно, что решения стре- мятся к стационарной точке, так что они глобально устойчивы. Члены порядка в (9.5.4) дают <Ш о д д \ £П , й д „ . 1 <Э2П dt ~ 2?Ф (2 д% drj Щ] пП ' 2 “ dg2 +1 УФ2 (2 П +1 рф ~ . 2 , г \ <9т] / 1 2 11 дц2 (9.5.7) Это многомерное линейное уравнение Фоккера — Планка типа решен- ного в § 8.6. С его помощью найдем моменты | и ц: dt<£> = —4уф<£>, (9.5.8а) dt <т]> = 2уф <£>—Р <т)>- (9.5.86) Эти уравнения также совпадают с уравнениями для вариаций, связанными с макроскопическими уравнениями (9.5.5). Имеется три момента второй степени. Они удовлетворяют трем связанным уравнениям: dt <£2> = — 8уф <£2> + а + 4уф2, (9.5.9а) dt <Ц2> = 4УФ <£'Ц> — 20 <П2> + УФ2 + (9.5.96) df<^T)>= — 4уф <£?]> — 2уф<12> — Р<^т]> — 2уф2. (9.5.9в) Эти уравнения определяют дисперсии и ковариацию флуктуаций величин пх и nY относительно их макроскопических значений, за- даваемых решением (9.5.5). Однако вместо того, чтобы изучить зави- сящее от времени состояние, в общем случае мы лучше сосредото- чимся на стационарном состоянии. Для того чтобы найти флуктуации в стационарном состоянии, нужно подставить в качестве фи Тих стационарные значения (9.5.6). Для простоты, воспользовавшись свободой в выборе единиц времени, положим К2ау=1. Тогда уравнения (9.5.8) для первых моментов 252
принимают вид dt<|> = —2<|>, df<T]> = <£>—Р<Л>- (9.5.10а) (9.5.106) Уравнения для вторых моментов удобно записать в матричном виде (9.5.11) Первый вывод, в следующем: который можно сделать из этих уравнений, состоит /£2 yS __ А (X <п2>'5 — — а <П>_ 4₽<2+»“- (9512) -4(2 + ₽)- Если переписать эти соотношения в исходных величинах, получим: <<п2х»5 = 4 <пхУ, (9.5.13а) ««2y»5 = 4SI <"*>*> (9.5.136) «пхПу>У = — 4 (2 ~р) <пх>*. (9.5.13b) Первая строка показывает, что флуктуации X те же самые, что в реакции (9.1.1) (ср. с (21.13)). Это можно было предвидеть, потому что в отношении X настоящая схема реакции та же самая. Третья строка указывает на существование отрицательной корре- ляции между X и Y, это является очевидным следствием того факта, что каждый раз, когда объединяются два атома X, вели- чина пх убывает, a nY—нарастает, и, наконец, (9.5.136) показы- вает, что дисперсия nY имеет промежуточное значение, лежащее между значением, принадлежащим распределению Пуассона, и зна- чением, принадлежащим пх. В качестве второго следствия уравнения для моментов получим автокорреляционную матрицу. Используя (9.5.10а) и (9.5.12), нахо- дим сначала <1 (0) I (0У = <£2У е-2? = ае-2', <Т) (0) I (/)У = <Т]Ь* e-2t = - е-2<. Затем запишем решение (9.5.106): с. е — — с~ <т]>1 = <'П>ое“₽/ + <S>o —рТТ2— ’ 253
что приводит к J (34-20) а _р/ « е~2<—е-Р^ 40 (24-0) 4(24-0) р-2 - <иО)п(ОУ = ^е-₽Ч4а^Е^- Эти корреляции содержат два времени релаксации. Первое из них равно 1/2 и связано со скоростью исчезновения молекул X. Второе равно 1/0 и связано со скоростью исчезновения молекул Y. Упражнение. Постройте фазовые кривые (рис. 29) и изобразите в (ср, ф)-плос- кости кривые, на которых <р = 0 и ф = 0, обозначив на них направления решений в четырех частях плоскостей. Упражнение. Найдите аналитическое выражение для фазовых кривых уравнений Упражнение. Для решения уравнений (9.5.11) требуется диагонализация 3 х 3-матрицы (что в этом примере оказалось тривиальным), однако собст- венные значения всегда можно найти из уравнений (9.5.10). Как? Упражнение. Исследуйте частный случай 0 = 2. В частности, найдите спект- ральную плотность флуктуаций величины пу. Упражнение. Проделайте такие же вычисления для химической реакции А--Х, X —> Y, X4-Y—>В. Упражнение. Сделайте это для реакции * А—>Х, XrY---2Y, Y—-В. Упражнение. Популяция поражена эпидемией. Имеется т здоровых индиви- дуумов и п больных. Уравнения, описывающие скорости, имеют вид m = 0Q—ymn/Q, n = ymn/ti— ап. Интерпретируйте эти уравнения. Постройте основное кинетическое уравнение. Найдите дисперсии и ковариации в ста- ционарном состоянии **. Упражнение. Те же самые вопросы для популяции из т самцов и самок, описываемых макроскопическими уравнениями пг = 0п — ат — ym(m + n)/Q, и = 0и—ап—yn(m-]-n)/Q. Упражнение. Для двойной автокаталитической реакции с двумя переменными А-1-X-^X-Y, X-Y-^Y уравнения, зависящие от времени, можно решить явно. 9.6. ВЫСШИЕ ПОРЯДКИ В этом параграфе мы рассмотрим высшие порядки, выходящие за рамки приближения линейного шума. Они добавляют к флуктуа- циям члены порядка Q-1 относительно макроскопических величин, т. е. порядка отдельной частицы. Они также модифицируют макро- скопическое уравнение, добавляя в него члены, имеющие тот же * R. F. Fox, Proc. Nat’l Acad. Sci. USA 76, 2114 (1979). ** Макроскопические решения проанализированы в работах: Н. W. Heth- cote in: Mathematical Problems in Biology (Lecture Notes in Biomathema- tics 2; P. van den Driessche ed., Springer, Berlin, 1974). 254
порядок, как и те, что мы несколько преждевременно использовали в (5.8.12) и (9.4.8). Очевидно, что эти эффекты не важны для большинства практи- ческих задач с шумом, но в двух случаях ими пренебречь нельзя. Во-первых, они дают нам информацию о том, насколько нелинейные члены в макроскопическом уравнении влияют на равновесные флук- туации, в частности они позволяют сделать вывод о том, насколько кривизна вольт-амперных характеристик электронных устройств влияет на имеющийся в них шум. Во-вторых, они оказываются существенными, когда наблюдаются одночастичные события, например ток, связанный с рекомбинацией в фотопроводниках (см. § 8.1). Если читатель не интересуется этой темой, мы рекомендуем ему пропустить настоящий параграф, потому что имеющиеся здесь вы- кладки достаточно сложны. Рассмотрим уравнение (9.2.16) для эволюции П(£, т). О членах порядка й1/2 мы позаботились в § 9.3, потребовав, чтобы <р удовлет- воряло уравнению (9.3.1). Члены порядка П" были учтены в (9.4.1), а сейчас мы добавим высшие порядки, записав явно члены по- рядка Я-1: С/Т t/g [ Z О! -t-Q-1/2ati t ^-t- . . . jit-j- "i" V дн [a2,o “T n_1^a2i о? -г ---1oc2 o?2 + • • + Й 1a2, j .. . ] П — z ug z [Q-1/2“3’o + fi’lc4 o£+ • • ]n+ + (9-6Д) Все коэффициенты являются функциями, зависящими от ср(т), а штрихами обозначены производные от функций по своим аргу- ментам. В то время как приближение линейного шума приводит к ли- нейному уравнению Фоккера—Планка (9.4.1), высшие степени по Я-1/2, как мы сейчас увидим, ведут к следующим трем моди- фикациям. 1. Они добавляют более высокие степени к коэффициентам, так что утверждение о том, что первый коэффициент линеен, а второй постоянен, уже становится несправедливым. 2. В то же время они добавляют старшие производные, поэтому уже нельзя записать уравнения Фоккера — Планка, в котором сохра- нена полная функциональная зависимость от и ос2, но отброшены высшие производные. 3. Высшие порядки в моментах перехода, т. е. аЬ1, 2, ..., а2< 1 . . ., связанные с Ф15 Ф2, . . ., входят последовательно. В част- ности, st], j добавляет к первому коэффициенту член, не зависящий 255
от Н. Этого усложнения можно было бы избежать, если бы мы не раскладывали Ф, а записали повсюду вместо av, 0 полный момент перехода av. Но это было бы равносильно учету более высоких порядков до й-1'2, чем того требует условие совместности с дру- гими приближениями, в частности это означало бы использование (5.8.6) вместо (9.3.1) (ср. с примечанием в § 9.3). Примечание. Исходное основное кинетическое уравнение, которое мы сейчас аппроксимируем, обладает такими свойствами: оно сохраняет положительность и все его решения стремятся к стационарным. Уравнение Фоккера — Планка второго порядка также обладает этими свойствами, однако, добавляя высшие производные, мы их утрачиваем. Предположим, мы удержали в (9.6.1) члены до порядка Й-1 включительно, т. е. опустим все члены, обозначенные точками. Получившееся в результате дифференциальное уравнение четвертого порядка уже не обладает указанными двумя существенными свойствами *. Это озна- чает, что (9.6.1) неверно или бесполезно—просто из этого уравнения мы не должны делать выводов, включающих степени параметра Й-1/2 более высокие, чем то подразумевает правильное использование уравнения (9.6.1)**. Наиболее безопасным способом избежать этих трудностей можно написав уравнение моментов так, как это будет показано ниже. Члейы, записанные явно в (9.6.1), достаточны для вычисления <£> и <£2> с точностью до й-1. С этой целью из (9.6.1) выводим dt z£> — aj, о <=> 4 у Я" о <ёг> 4 ~ й-1а^'о <£*> 4 + Q-V2ai х -f-Q-ia; j <Ь + О (Я-3/2), (9.6.2а) dt <Е3> = 2a;_ „ 44 4 Й~ 1/2а;', 0 <4> Ц о <&> 4 4 2Й~ 1/2aly j <£> + 2Й~ i <?2> 4 а2, „ 4 C2~,/2ai 0 <£> 4 (-1 Q-ia", 0 <£2> 4 й-1а2, t + О (Й~3/2). (9.6.26) Поскольку в правой части появляются третий и четвертый мо- менты, мы должны записать для них уравнения с требуемой точ- ностью: 4 <£3>== За{, 0 44 4 „ <i4> 43й-4а1,! <|2> 4 -г- За2,0 <£> -f- Q-J/,a2t 0 <g2> 4 й-‘/.а3< 0 + О (Й~4), (9.6.2в) dt <&> = 4ai 0 <¥> 46a2,0 <42> 4 О (Й-*Ч (9.6.2г) Отметим, что если опустить члены порядка й-3'2 в <£> и <£2>, то это приведет к автоматическому обрыву иерархической цепочки уравнений для моментов. Стратегия решения этих уравнений ясна. Сначала решаем (9.6.2а) и (9.6.26) в низшем порядке, т. е. опуская * Тот факт, что не существует дифференциального уравнения порядка более высокого порядка, чем уравнение Фоккера—Планка, способного описать эволюцию плотности вероятности, был строго доказан в работе: R. F. Pawula, Phys. Rev. 162, 186 (1967). ** Численно это было показано в работе: Н. Risken and Н. D. Vollmer, Z. Phys. B35, 313 (1979). 256
все члены порядка Q1/2 и выше. Получившееся значение <|2> можно подставить в (9.6.2а), чтобы определить <£4> с точностью до Q-1 и в (9.6.2), чтобы определить <£4> в низшем приближении. Эти два результата позволяют решить уравнение (9.6.2в) и опре- делить <£3> с точностью до й"’/2. Полученная таким образом инфор- мация позволит определить члены в правой части (9.6.2а) и (9.6.26) с точностью до П-1, затем с такой же точностью можно будет найти <g> и <£2>. Для того чтобы определить флуктуации относительно нестацио- нарного состояния, нужно проделать гигантскую работу, однако ее объем становится разумным в случае стационарных флуктуаций, когда все коэффициенты а — константы. В качестве приложения вычислим автокорреляционную функцию флуктуаций в стационарном состоянии полупроводника, описывающегося (9.2.18). Макроскопи- ческое уравнение имеет вид <р = Ь—аср2 и обладает стационарным решением <р-’ = фО>/а. Скачкообразные моменты имеют вид av (ср) = av, о (ср) = b+ (—l)v а<р2. Уравнение (9.6.1) можно легко выписать для ср — ср5. Чтобы запи- сать его в более компактном виде, изменим масштаб переменных: 2/КоЬ = 9; (a/by/^ = ц; (a/b)4'4fi-‘'= = е. (9.6.3) Тогда уравнение (9.6.1) принимает вид дП д ( 1 уг 152 (. 1 2 гг КТ) J n+wr + e’1+'2 ET1J п + + 4-е2 ДпП + ^е2-^. (9.6.4) ! 3 дц3 1 24 <9г]4 ' ' Уравнения для моментов имеют вид <?е <П> = — <Л> — у е <П2> + ° (g3)> (9.6.5а) д0<ц2> = —2<if> —е<т]3>+ 1 +е<ц>4-j е2<ц> + О(е3), (9.6.56) де <т)3> = —3 <ц3>—е <ц4> + 3 <т]> + Зе <т)2> + О (е2), (9.6.5в) де <П4> = —4 <П4> + 6 <П2> + ° (е)- (9.6.5г) Отсюда, полагая левую часть равной нулю, получаем <!]*>'’ = у <П2>,’ = -|- + ° (е). (9.6.6а) <ц3>5 = — -|-е+О(е2), (9.6.66) <Л2>5="4“^е2 + О^е^’ (9.6.6в) <ц>4 =— е+0 (е3). (9.6.6г) 257
Затем для заданного начального значения т)0 такого, что <П>0 = По, <Пг>о = 'По, <П3>0 = По, <'П1>о = 'По, описанным выше способом решаем уравнения, зависящие от времени. Получающееся значение <т)(9)>Яо с точностью до е2 используют совместно с (9.6.6в) для пострсения автокорреляционной функции: «По <Л (9)>ш>>5 = */2(1— 72е2) е-*1-1/^)»-- i/ge2e-<2'£!) е. (9.6.7) Коэффициенты и показатели степеней верны с точностью до порядка е2 — й-1. Выводы. 1. Из (9.6.6г) следует, что в этом порядке средние зна- чения уже не совпадают со своим макроскопическим значением, даже в стационарном состоянии: <n>s = Йф*Н- Й1/2 <|у = й Vb/a —L . Однако разница составляет всего */4 электрона. 2. Из (9.6.7) следует, что члены порядка й-1 понижают скорость распада основного члена, а также модифицируют его коэффициент. Однако и вовсе поразительным оказывается появление другого экспоненциального члена, который распадается примерно вдвое быстрее. Таким образом, нелинейность приводит к дополнительному дебаевскому члену в спектре флуктуаций, который в принципе можно наблюдать. Высшие порядки приводят к последовательности таких членов. 3. Микроскопическое рассмотрение нелинейных флуктуаций при- водит также к другому выводу, а именно что нелинейность совсем не влияет на спектр флуктуаций *. Правда, настоящее мезоскопи- ческое рассмотрение основано на предположении, что применимо основное кинетическое уравнение относительно обоснованности микроскопического рассмотрения **. Поэтому было бы интересно провести experimentum cruets. Упражнение. Покажите, что dfP (х. t)=adixP не стремится к стационарному решению при а > 0 и не сохраняет положительности, когда а < 0. Рас- пространите этот вывод на дифференциальные уравнения с постоянными коэффициентами в общем виде. Упражнение. Пусть P = WP— основное кинетическое уравнение, сохраняющее положительность. Предположим, что W = Wo + eWi + e2W24- ..., Wo, где также сохраняет положительность, a W04-8Wi не сохраняет. Покажите, что это можно было бы исправить, включив в иных отношениях непра- вильные старшие порядки следующим образом***. Положите W=V2 и V = V04-eU], так что (V0 + eUi)2 совпадает с W04-eW! в отношении членов порядка 8. Упражнение. На первый взгляд третья и четвертая производные в (9.6.1) не подходят для вычисления первого и второго моментов g. Тем не менее, * W. Bernard and Н. В. Callen, Rev. Mod; Phys. 31, 1017 (1959); Phys. Rev. 118, 1166 (1960). ** N. G. van Kampen, Physica Norvegica 5, 279 (1971). *** A. Siegel, J. Mathem. Phys. 1, 378 (1960). 258
почему ими нельзя пренебречь при вычислении автокорреляционной функции такой, как (9.6.7)? Упражнение. Для (9.1.4) вычислите <п/=й+|+1й-чо(а-‘), О I/O «rt*»f=|Q+^+O(Q-i). Упражнение. Выведите (9.4.8) с помощью непосредственного разложения до требуемого порядка по Q~1/2, не прибегая к приемам, использованным в § 5.8. ГЛАВА 10 ПРОЦЕССЫ ДИФФУЗИОННОГО ТИПА Нами было показано, что в низшем порядке Q-разложение при- водит к микроскопическому уравнению, а в следующем порядке — к приближению линейного шума при условии, что выполняется условие устойчивости (9.3.4). Мы уже столкнулись с одним случаем, в котором это условие нарушается, когда а11О(ф) = 0. В этом слу- чае Q-разложение принимает совершенно иной вид и в низшем приближении дает нелинейное уравнение Фоккера — Планка. 10.1. ОСНОВНОЕ КИНЕТИЧЕСКОЕ УРАВНЕНИЕ ДИФФУЗИОННОГО ТИПА Важный подкласс основных кинетических уравнений, наруша- ющих условие устойчивости (9.3.4), составляют такие уравнения, для которых (10.1.1) Согласно микроскопическому уравнению (9.4.1), это означает, что Ф (т) = const = ср (0). Небольшие отклонения 6ф(0) от начального значения приводят к таким 6ф(т), которые остаются постоянными, вместо того чтобы стремиться к нулю. Таким образом, макроскопи- ческие уравнения неустойчивы * и можно ожидать нарастания флук- туаций. Действительно, согласно (9.4.2), их дисперсия линейно возрастает, как в броуновском движении: <|2> = а210 (ф) т. (10.1.2) Если начальное распределение представляет собой дельта-пик, флуктуации приобретают тот же порядок величины, что и макро- скопическая часть по прошествии времени порядка т~й/а2,0(ф). (10.1.3) * По классификации Ляпунова такие решения называют «устойчивыми, но не асимптотически устойчивыми». В теории флуктуаций более естественно классифицировать такие случаи как устойчивые в соответствии со сноской в § 9.3. 259
После этого переходного периода й-разложение, которое мы применяли до сих пор, нарушается и выполнить разделение (9.2.9) на макроскопическую часть и малые флуктуации становится невоз- можным. С другой стороны, по истечении переходного периода (10.1.3) можно расчитывать на то, что удастся применить приближенный метод, основанный на том соображении, что Р является медленно меняющейся функцией X с шириной порядка й. Тогда в качестве новой переменной выбирают интенсивную величину х = Х/й и основ- ное кинетическое уравнение (9.2.4) записывают в терминах этой переменной: г)+±Ф1(х-^; г) + + • z) dr“ (Й) у <[ Фо (х; —г) + ± Ф1 (х; - г) } dr • Р (х, t). Раскладывая по й-1 и учитывая (9.2.13) и (10.1.1), получаем = й-7(й) [-1 а1д (х) Р +± а2,0 (х) Р | + + Й-7(Й) |4^га2-1 (Х)Р— 4г-^газ,о WP—а2д(х)р] + 4-/(Й)О(Й-4). (10.1.4) Сравнение с (9.2.16) показывает, что существует коренное раз- личие. Основной член (9.2.16) отсутствует, и поэтому из (10.1.4) нельзя выделить уравнения для макроскопической части X. Другими словами, система уже не подвергается влиянию или смещению, вы- нуждающему ее эволюционировать в данном, а не в каком-либо Дру- гом направлении. Оставшаяся эволюция Р является просто резуль- татом воздействия одних флуктуаций. Соответственно временной масштаб изменений умножается на й-1 и эволюция происходит мед- леннее, чем в предыдущем случае (см. (9.2.14)). Поскольку Р не является флуктуацией, обладающей острым пиком, коэффициенты а (х) нельзя разложить вблизи какого-либо центрального значения ср и в уравнении они остаются нелинейными флуктуациями. Первая строка (10.1.4) содержит основные члены, ее называют диффузным приближением: ^5_Е1 = _|.а111(х)Рф1^-аг,0(х)Р, (10.1.5) где в отличие от (9.2.14) новая временная переменная т = Й-2/(Й)С (10.1.6) Диффузионное приближение (10.1.5) представляет собой нелинейное уравнение Фоккера — Планка (8.2.5). Действительно, теперь мы обо- 260
сновали выводы, приведенные в § 8.2, показав, что оно действи- тельно является первым членом систематического разложения по Й_| для основных кинетических уравнений, обладающих свойством (10.1.1). И оно справедливо только тогда, когда оба коэффициента <Ax>x/A/ и <Ax)2>x/A/ имеют один и тот же порядок величины по й. При обычном выводе уравнения Фоккера — Планка это условие принимается как предел малых скачков и подразумевается либо молчаливо*, либо явно** ***. Оно также подразумевается в условиях, на которых основано дока- зательство Колмогорова. Резюме. Специальный класс основных кинетических уравнений, характеризуемых условием (10.1.1), будем называть основными кине- тическими уравнениями диффузного типа. Для таких основных кине- тических уравнений й-разложение приводит к нелинейному уравне- нию Фоккера — Планка (10.1.5), а не к макроскопическому закону с линейным шумом, как это было в предыдущей главе для основных кинетических уравнений вида (9.3.4). Определение обоих типов зара- нее предполагает, что вероятности перехода имеют канонический вид (10.2.3) и не отличаются для дискретной и непрерывной областей возможных значений стохастической переменной; й-разложение одно- значно приводит к хорошо определенному уравнению (10.1.5) и поэтому избавляет от трудностей интерпретации уравнения Ито, упо- мянутых в § 8.8 и 8.9. Традиционный вывод уравнения Фоккера — Планка (10.1.5) или (8.1.1) основывается на математическом доказательстве Колмогорова, в котором предполагается, что имеется бесконечно много бесконечно малых скачков. Однако в природе все скачки имеют некоторый конеч- ный размер**. Следовательно, W не бывает дифференциальным опе- ратором, а всегда имеет вид типа (5.1.1). Обычно W содержит под- ходящий параметр разложения и имеет канонический вид (9.2.3). Если оказывается, что выполняется равенство (10.1.1), то разложение в нижнем приближении приводит к нелинейному уравнению Фокке- ра— Планка (10.1.5). Уравнениям Фоккера — Планка и Ланжевена нельзя приписать более фундаментального смысла, чем тот, который приписывается ему настоящим приближением. Пример. Рассмотрим симметричное случайное блуждание с непрерывным временем: Рп = Рп + 1+Рп-1— 2рп. Мы хотим учесть возможность уменьшения длины шага и поэтому вводим «макроскопическую» переменную х — n/Si с измененным масштабом. Плот- * Как в § 8.2 или в цитированной выше работе М. Планка. ** См. [I, с. 323]. *** N. G. van Kampen in: Thermodynamics and Kinetics of Biological Proces- ses (A. I. Zotin ed., de Gruyter, Berlin, 1981). 261
ность вероятности Р (х, Г) удовлетворяет уравнению Р(х, t) = P I х + 4-, (х—t}—2P(x, t). (10.1.7} Соответственно Н-«(г-4)+6('+-5-) имеет канонический вид (9.2.2). Далее 2 «1(х) = 0, а2(х) = -^-. Тогда основное кинетическое уравнение относится к диффузионному типу, а низший порядок по 1/Й дается (10.1.5) с t = Q-2/: Неудивительно, что получилось уравнение диффузии, ведь физически диф- фузия—это не что иное, как случайное блуждание с малыми шагами, хотя и не обязательно одинаковой длины, как в этой простой модели. Упражнение. Для одношагового процесса вероятность скачка которого имеет вид (9.2.6), условие (10.1.1) дает Ро^То- (10.1.9} Упражнение. Проверьте, что первая строка уравнения (10.1.4) действительно' совпадает с (8.2.5), убедившись в том, что имеют место соотношения <^ = fi-V(Q)ai,i(x), а2,0 (х). Упражнение. Покажите, что (10.1.8) согласуется с (1.4.8). Упражнение. Асимметричное случайное блуждание (8.2.8) не удовлетворяет ни (9.3.4), ни (10.1.1), но может быть сведено к виду (10.1.1). Покажите, что результат совпадает с тем, что рассмотрено в § 8.2. Упражнение. Такой же способ сведения можно использовать всегда, когда ali0 = const. 10.2. ДИФФУЗИЯ ВО ВНЕШНЕМ ПОЛЕ Предположим, что частица движется в одном направлении в перио- дическом потенциальном поле V (X), минимумы которого разделены острыми максимумами (рис. 30). Минимумы являются участками, на Рис. 30. Периодический потенциал V (х) с острыми максимумами которых частица остается достаточно долго, совершая случайные скачки на соседние участки. Вероятность скачка за единичное время 262
для этого одношагового процесса есть rn = g„ = А, где А включает в себя множитель Аррениуса ехр(—&Еа) (см. § 7.5). Это и есть при- мер из предыдущего параграфа*. Предположим, что теперь вводится дополнительный внешний потен- циал U (х), изменяющийся на макроскопическом масштабе и поэтому являющийся функцией х. Число участников, приходящихся на макро- скопическую единичную длину, является нашим параметром Q. Нали- чие U (х) изменяет высоту потенциальных барьеров (измеренную от дна впадины). Новые вероятности скачков определяются выражениями г, = Лехр[-ф(^^)-4£);]. (10.2.1а) (10.2.16) Матрица вероятностей перехода ^пп’ = АЬп „,+1 1 + + + пч-1 (’д'у (10.2.2) Она имеет канонический вид (9.2.3) с Фо (х; г).= А(бГ11 + 6г, _,) Фх(х; r) = 4Mi7'(x)(- бг, _t) Отсюда получаем ai,o = O, а210 = 2А, а1д =— рА[7'(х). (10.2.3) В этом случае уравнение относится к диффузному типу и в низ- шем приближении имеет вид (10.1.5); где т = рА//П2 и 0 = kT. Это уравнение диффузии во внешнем поле **. В качестве модификации этой модели рассмотрим потенциал V (X) с острым минимумом, разделенным плоскими максимумами (рис. 31). Предположим теперь, что добавляется внешний потенциал И (х), являющийся возрастающей функцией х. Легко видеть, что это остав- ляет гп практически равным А, но изменяет gn на £я^Аехр |=А {1-Й-^(/((х)}. (10.2.5) * Относительно связи с экспериментом см. работу: Р. A. Egelstaff, Advan- ces in Physics 11, 203 (1962). ** Оно применялось к диффузионно контролируемым реакциям и закалке в работе: Е. W. Montroll, J. Ihem. Phys. 14, 202 (1946). 263
Следовательно, (10.2.3) остается справедливым, значит, справед- ливо и окончательное уравнение (10.2.4). Таким образом, результат оказывается нечувствительным к точному виду V при условии, что потенциал обладает ямами, в которых частица остается достаточно V(X) (лллт X Рис. 31. Периодический потенциал V (х) с плоскими максимумами долго, и из-за случайных взаимодействий корреляция между после- довательными скачками успевает исчезнуть. Упражнение. Уравнение (10.2.4) для вероятности одной частицы можно интер- претировать как уравнение диффузии для независимых частиц. Покажите, что равновесное распределение и постоянная диффузии согласуются с выра- жениями, которые можно было бы вывести непосредственно из модели без промежуточных вычислений. Упражнение. Стационарное решение уравнения (10.2.4) имеет вид ps pr) = const-exp [— U (х)/0]. (10.2.6) С помощью этого решения уравнение (10.2.4) можно записать в виде 6Р(х, О о д д Р(х, t) /1П2 71 —dt—{х)д~х-рч5Г (102-7) Упражнение. Определите гильбертово пространство со скалярным произведением • (/’А) =5 Р1Рг<1х/Р*, как в таком же (5.7.4). Покажите, что в этом пространстве (10.2.4) яв- ляется самосопряженным, и выведите, что все решения стремятся к Ps. Упражнение. Обе модели (10.2.1) и (10.2.5) удовлетворяют соотношению деталь- ного равновесия. Какой наиболее общий вид гп и g„ допускается соотно- шением детального равновесия? Упражнение. Маятник, описывающийся уравнением Мх = —slnx, находится в воздухе, который вызывает затухание и флуктуации. Покажите, что эта система описывается двумерным нелинейным уравнением Фоккера—Планка дР(х, v, t) дР , sinx дР ( д kT d2P \ dt dx М dv ' \dv М dv2 j Какая величина может послужить нам в качестве параметра Q? Упражнение. Решите двумерное обобщение (10.2.4) с электростатическим потен- циалом U = —2q log г. Найдите физическую интерпретацию тому факту, что не существует Ре. Примечание. Модель диффузии в настоящем разделе приводит к нелиней- ному «1 (х), но второй коэффициент а2 остается постоянным. Такие уравнения Фоккера — Планка р §8.7 мы называли квазилинейными. Причина, по которой в этом примере уравнения оказались квазилинейными, связана с нелинейностью, обусловленной наличием внешнего потенциала U (х), который изменяет вероят- 264
ности скачков, но сам по себе не является источником флуктуаций. Когда бы в системе ни появилась нелинейность, обусловленная механическими причи- нами, она, как правило, не влияет на коэффициент (в этом приближении). Другими примерами являются (8.3.10), (8.3.11) и (10.2.8). Уравнения «обобщен- ной гидродинамики», т. е. гидродинамики с флуктуациями, также относят к такому типу, хотя обычно их записывают в форме Ланжевена *. Нелиней- ность этих уравнений связана с чисто механическим или даже скорее кинемати- ческим членом (v-v)v. 10.3. ДИФФУЗИЯ в НЕОДНОРОДНОЙ СРЕДЕ В качестве примера, в котором второй коэффициент а2 не яв- ляется постоянным, рассмотрим диффузию в среде, в которой коэф- фициент диффузии зависит от координат. Есть два правдоподобных пути для эвристического обобщения обычного уравнения диффузии. В одномерном случае, когда имеется только координата х, можно записать либо (ю.3.1) либо дР(м (10.3.2) dt дх v ' дх ' ’ Эти уравнения отличаются друг от друга членом j- I 'Х) Р I (10.3.3) дх I dx J ’ v ' который имеет вид переноса (иногда его называют «ложным тече- нием»**). Выражение (10.3.2) кажется все же более привлекатель- ным, потому что его можно записать в виде дР dJ , „ дР /in о -зг = -^—, J = — О-;?-. (10.3.4) dt дх ’ дх ' ' Однако это не является решающим аргументом. Для того чтобы определить, какая из этих записей правильна, мы должны начать с точной модели и произвести разложение по Q. Оно действительно приводит к (10.3.2), но из этого еще нельзя сделать вывода, что такой выбор всегда является правильным. В других случаях (на- пример, при диффузии горячих электронов в пространстве скоро- стей***) правильный выбор сделать заранее нельзя, не прибегая к исследованию механизма, лежащего в основе диффузии. * L. D. Landau and Е.М. Lifshitz, Fluid Mechanics (Pergamon, Oxford, 1959). Ch. 17; R. D. Mountain, Advances in Molecular Relaxation Processes 9, 255 (1977). ** Здесь опять возникает дилемма Ито—Стратоновича из § 8.8. *** Р. J. Price in: Fluctuation Phenomena in Solids (R. E. Burgess ed., Acad. Press, New York 1965); S. V. Gantsevich, V. L. Gurevich, and R. Katilius, Rivisia Nuovo Cimento 2, 1 (1979). 265
В нашей модели мы предполагаем, что диффузия связана со сле- дующим механизмом. Частица с координатой х' считается захвачен- ной до тех пор, пока из-за какого-либо воздействия не начнет дви- гаться вправо или влево. Обозначим соответственно Р(х') иа(/) вероятности того, что такие события произойдут за единичное время. Частица движется до тех пор, пока не попадет в следующую ло- вушку. Пусть вероятность захвата частицы в точке с координатой, лежащей между х и x-j-dx, есть Qv(x)dx. Функции а, 0, у изме- няются на макроскопическом масштабе, но с увеличением Q плотность- ловушек возрастает, так что размер скачков уменьшается. С помощью тех же рассуждений, какие мы проводили в § 6.6 для вероятности того, что частица, стартуя из точки х', окажется захваченной между х и x-j-dx, считая, что х > х', получаем (х)dx-exp В масштабе значений скачка X = Qx для X > X' имеем №(Х|Х') = П|3 (х')у(х)ехр Аналогично, для X < X' получаем IT(X|X') = Qa (х')у(х) ехр (10.3.5а) х' — Q J у (х") dx" X (10.3.56) Значения а.и |3 можно определить, обратившись к соотношению детального равновесия. Подставляя (10.3.5) в (5.6.1), получаем р (х') у (х) Ре (х') = а (х) у (х') Ре (х). Следовательно, величина ре w (х') у(х) v ' у(х') ' > не должна зависеть от х. В отсутствие внешнего поля Ре (х) постоянно и, следовательно, с точностью до множителя, определяющего мас- штаб времени, а(х) = Р(х) = у(х). (10.3.6) Подставляя это тождество в (10.3.5а), для г > 0 получаем W(X'\ г) = йу(х')у (x' + ^-j ехр = П {у (х')}2 е~[ у (х') у' (х') г—у {у (х')}2 X Xy'(x')r2 e-^u') + O(Q-i). (10.3.7) 266
Аналогичное выражение получается для г < 0. Таким образом, при- ходим к выводу, что W имеет канонический вид (9.2.3) с f (Q) = Q и ф0(х; r) = {y(x)}2e=F'-v«, (10.3.8а) Ф1(х; г) = у (х)(х) г =F {у (х)}2 -у' (х) г2 J <-*>. (10.3.86) Два знака относятся к г > 0 и г < 0 соответственно. Теперь легко получить а110(х) = 0; Ч1(х) = -2-1|-; a2i0(x) = _£y. (Ю.3.9) Отсюда следует, что основное кинетическое уравнение относится к диффузионному типу, так что выполняется приближение Фоккера — Планка (10.1.5): дР(х, /) 2 Г<? у'(х) р , д2 Р 1 /10 3 10) dt ~Q I дх {у (х)}2 дх2 у(х) ]’ (w.o.iu; Таким образом, мы получили нелинейное уравнение Фоккера — Планка. Далее уравнение (10.3.10) можно записать в виде (10.3.11) dt дх Йу (х) дх ' ' Это уравнение имеет вид (10.3.2) с D (х) = 2/(Qy (х)). В уравне- нии, записанном в таком виде, переносной член отдельно не выписан, однако перенос по-прежнему есть, о чем свидетельствует 2 у' (х) \t ~ Й {у (х)}2’ Упражнение. Запишите (10.3.11), (10.3.2), (10.3.3) в трех измерениях и учтите анизотропную диффузию, взяв D в тензорном виде. Упражнение. Покажите, что любое уравнение Фоккера — Планка, обладающее постоянным равновесным распределением, можно записать в виде (10.3.2). Упражнение. Если в приведенной выше модели не постулировать никакого частного вида Ре, то вместо (10.3.11) получится дР(Х, t) 2 д Р*(х) д Р(Х, t) НО 3 191 dt Й дх у (х) дх Ре(х) ' 1 1 Упражнение. Включите в настоящую модель внешнее поле, как в (10.2.4). Упражнение. Найдите следующий порядок после (10.3.10). Упражнение. Запишите явное выражение для основного кинетического уравне- ния, согласующегося с (10.3.7). Выведите из него точное уравнение (103 13) dt Й dx у дх Й2 dx у dx у dt ' ’ Используйте это соотношение для нахождения следующего порядка после (10.3.10) и проверьте таким путем результат, полученный в предыдущем упражнении. 267
10.4. УРАВНЕНИЕ ДИФФУЗИИ В СЛУЧАЕ МНОГИХ ПЕРЕМЕННЫХ Наиболее общий вид нелинейного уравнения Фоккера — Планка в случае г переменных xt- (i= 1, 2, . . г) таков: (10.4.1) Здесь х обозначен набор {х,}, а суммирование подразумевается по всем повторяющимся индексам. Матрица В,7(х) симметрична и поло- жительно определена*. По-другому это можно записать следующим образом: <1042» где J;(х, t)—поток вероятности в r-мерном пространстве. Стационарное решение найдем из уравнения 0 = — + (10.4.3) дх, ' 1 2 дх, dxj lJ dxi v ' Физически очевидно, что, для того чтобы Р было стационарно, дивергенция J должна обращаться в нуль. Однако отсюда нельзя сделать вывод, что стационарное состояние содержит замкнутое те- чение с ненулевым ротором. Тогда в отличие от одномерного случая не всегда удается найти даже стационарное решение уравне- ния (10.4.1) **. Подобной трудности не возникает в случае замкнутых изолиро- ванных физических систем, потому что из обычной статистической механики известно, что для таких систем существуют стационарные решения, соответствующие термодинамически равновесному распре- делению Ре(х). Это предполагает наличие некоторых сведений отно- сительно А,- и В,у, однако информация будет еще более полной, если известно, что выполняют соотношения детального равновесия (5.6.1) или расширенного детального развития (5.6.14). Поэтому в даль- нейшем будем исходить из следующих предположений. 1. Физическая система является замкнутой и изолированной, и ее равновесное распределение известно. 2. Такая система допускает марковское описание в терминах r-переменных х,-, которые, следовательно, удовлетворяют основному кинетическому уравнению. 3. Это уравнение содержит подходящий параметр разложения Q и относится к диффузионному типу, так что при Q -->оо выполня- емся (10.4.1). 4. Внешнее магнитное поле и глобальное вращение отсутствуют, и каждая х,- является либо четной, либо нечетной. * Это значит, что все ее собственные значения положительны. Далее нам встретятся примеры, в которых В,у будет полуопределенной, т. е. ее собствен- ные значения будут положительны или равны нулю. ** К. Tomita and Н. Tomita, Prog. Theor. Phys. 51, 1731 (1974); 53, 1546 (1975). 268
Примеры. Броуновская частица совместно с окружающей ее жидкостью является замкнутой изолированной системой. Переменными х,- являются три ее координаты, а параметром Q — ее масса; Ре (х) постоянно. Уравнение (10.4.1) в этом случае является трехмерным аналогом (8.3.1): Л/-0 и В,/ постоянна. Рэлеевская частица имеет три нечетные переменные, а именно компоненты скорости V, и Pe(V) = Cexp[—MV2/(kT)]. Уравнение (10.4.1) является трех- мерным аналогом (8 4.6). Уравнение Крамерса (8.7.4) имеет вид (10.4.1) с двумя переменными, нели- нейной Л; (х) и постоянной, полуопределенной матрицей В,у, а распределение Ре имеет вид Ре(Х, V) =С ехр [{--1/2 Л1У2 — ф(Х)}/(йТ)], (10.4.4) где Ф (X) — потенциал силы F (X). Частица диффундирует в трехмерной неоднородной анизотропной среде с внешней силой с потенциалом U (г). Такая частица описывается обобщением уравнения (10.3.2): dPdt Z- = T-{Mv£/)P}+v-g vP. (10.4.5) где ц (г) — тензор подвижности, D (г) — тензор диффузии. Соотношения Онзаге- ра [7] утверждают, что D симметричен и определяется выражением Ре = С ехр [— U,/(kT)]. Для того чтобы применить (5.6.14) к (10.4.1), сначала запишем его в более подходящем виде*. Для каждого х,- определим ej = ±l соответственно для четных и нечетных х,-, а ех обозначим набор {е,х,}. Тогда Ре (ех) = Ре (х), а (5.6.14) принимает вид W (х | х) Ре (х') = W (ex' | ex) Ре (х). По аналогии с (5.7.5) это можно записать в виде тождества J^gwP1(x)dx.-j^g1WP2(x)dx (10.4.6) для всех функций Ръ Р2. Далее, для того чтобы упростить выкладки, запишем (10.4.1) в альтернативном виде, уже встречающемся в (8.1.11): ^ = — -Lf,-P + ±- —PeBi.-—-^, (10.4.7) dt дх, ‘ 2 dxi 'JdxjPe' ' 7 где = (10.4.8) В левую часть (10.4.6) подставляем оператор W, определенный в (10.4.7): — f йтт Т- Fi W (*)dx+V f 4W А ре w ви w А 4Я dx JPe(x) dxt ' 1V ' 2 J Pe (x) d^[ v ' lJX ,dxJP^(x) = С F,- (ex) Px (ex)) ,d f dx -L J '' ’ v ” дг,х, Pe(x) + ~ f pe (x) B;. (ex) dx. 1 2 J pe (x) dtjXj ' 7 v 7 de; X[ Pe (x) * S. R. de Groot and N. G. van Kampen, Physica 21, 39 (1954). 269
Для того чтобы это соотношение было равно правой части (10.4.6) для любого надо потребовать e-F-(ex') — —4- — — Ре <х} В (сх) д — 11 1 Х> дх, Ре (х) 2Ре (х) дх, Г W a‘J '£Х' дх} Ре (х) ” = — F7I) дх, Р'2 + 2Ре (X) дх; ре дх) ’ Для того чтобы это было справедливо для любого Р2, прежде всего необходимо, чтобы члены, включающие вторые производные от Р2, были одинаковы в обеих частях: zfijBu (ex) = Bjj (х). (10.4.9) Остается уравнение e,F • (ex) Р2 = — F,- (х) ~Р^- ' ' ' ’ дх, ре дх, 2 ' ' ’ дх, 2 дх, Отсюда следует, что e,-F;(ex) = —F,(x), (10.4.10) v i ..dlogPe dF , л е,В,(гх)-^- = ^. (10.4.11) Из этих двух уравнений, в частности, получаем Дг,.(х)РЧх) = 0. (10.4.12) Полученные результаты приводят к следующей физической ин- терпретации двух членов в (10.4.7). Первый член является операто- ром Лиувилля, относящимся к детерминистическому уравнению х = F,(x). (10.4.13) Согласно (10.4.10), это уравнение инвариантно относительно обращения времени: — ^(еЛ) = ^(ех)- Согласно (10.4.12), оно само по себе сохраняет равновесное распре- деление Ре. Второй член в (10.4.7) также сохраняет Ре, но меняет знак при обращении времени: 1 д ре( }В ( } д ПЦ. (Ю.4.14) dt 2 de/x,- v ' l}' ’ de.jXj Pe (ex) ' ’ Таким образом, из двух членов в (10.4.7) один является обратимым, а другой —чисто необратимым. Другими словами, можно сказать, что (10.4.7) разделяет полный дифференциальный оператор W на антисимметричную и симметричную части в смысле скалярного произведения (5.7.4). Вследствие этого пер- 270
вый член не дает вклада в следующее выражение: <,0-415) Поскольку Ви положительно определена, это выражение отрица- тельно, если только Р не равно Р*. Следовательно, за приближение к равновесию отвечает только лишь необратимый член. В таком случае наше разделение членов в (10.4.7) на соответственно меха- нический и диссипативный оправдано. Упражнение. Покажите, что (10.4.5) имеет вид (10.4.1) с dy d£>,,- В,7 = 2О17, Л,- = -р,73—+ — Как модифицируются эти уравнения, когда D несимметричен в смысле (10.4.9) (например, в магнитном поле)? Упражнение. Покажите, что справедливо обратное, а именно (10.4.9), (10.4.10) и (10.4.12) совместно гарантируют выполнение (10.4.6). Упражнение. Разделение W на обратимый и чисто необратимый члены, конечно же, однозначно. Покажите, что тот же самый результат можно получить, начиная непосредственно с (10.4.1) и не выписывая заранее окончательный вид (10.4.7). Упражнение. Докажите, что первый член в (10.4.7) не дает вклада в (10.4.15). Упражнение. Покажите, что вместо квадратичной формы в (10.4.15) можно использовать Р log(P/Pe) dx. Упражнение. Согласно (10.4.7), поток вероятности (10.4.2) разделяется на ме- ханическую и диссипативную части, которые являются соответственно нечетной н четной по отношению к обращению времени. В равновесии же диссипативная часть равна нулю. Упражнение. Запишите уравнение Крамерса (8.7.4) в виде (10.4.7). То же самое сделайте и для уравнения (8.4.11). Упражнение. Запишите уравнение диффузии (10.4.5) в виде (10.4.7) и выведите соотношение D,j [х)-=1гТр..] (х). Упражнение. Во всех Уравнение (10.4.7) этих примерах Ре(х)--Сехр|—U (х)/0], где можно записать в двух эквивалентных видах: dr ;dxz \ ' 20 11 dx/f 2 dx,- ,J dx/ _£/₽._!«.. dt/ : 1 dB,A o, 1 d2 D P dt - dx,- I ' 20 dx/ 2 dxj f ' 2 dx,- dxj (10.4.16) Q = kT. (10.4.17) (10.4.18) Упражнение. Преобразуйте (10.4.1) к новым переменным х^ -ср^(х). Новое уравнение имеет тот же самый вид с новыми коэффициентами в,у-А,. вЛг==в,7^^. * дх,- 2 1 dxtdxj к' 1 dxidxj Указание. Во избежание лишних вычислений используйте сопряжен- ное уравнение. Упражнение. Если В,7 положительно определена, то имеется симметричная матрица Л,-„, такая, что Если Л,-п удовлетворяет условию 271
интегрируемости ^h,n_^irn Axm dx„ то можно ввести новые переменные с помощью соотношения dxA = h*n dx„, такие, что — Для интегрируемости необходимо и достаточно, чтобы существовала функция Ф (х), така» что * А|г1-. с12Ф/(с!х,- dxzi). Упражнение. Условие того, что это преобразование делает Ак линейным, есть (/i-1)n; = постоянной матрице. Это необходимое и достаточное условие того, что (10.4.1) можно преобра- зовать в линейное уравнение Фоккера — Планка. 10.5. ПРЕДЕЛ НУЛЕВЫХ ФЛУКТУАЦИЙ Основные кинетические уравнения, относящиеся к диффузионному типу, характеризуются свойством, состоящим в том, что низкий неисчезающий член в их Q-разложении является не детерминистичес- ким макроскопическим уравнением, а уравнением Фоккера — План- ка. Можно задаться вопросом: можно ли получить приближенное детерминистическое уравнение, несмотря на то что Q уже не может служить параметром разложения? Наивный прием, состоящий в выбрасывании из уравнения Фоккера —Планка члена, содержащего вторые производные, конечно же, оказывается ошибочным: результат зависит от того, какой из эквивалентных видов (10.4.1), (10.4.7), (10.4.17), (10.4.18) мы выберем для того, чтобы изуродовать урав- нение таким образом. Единственный путь для получения хорошо определенного и фи- зически значимого приближения вновь состоит в том, что нужно выполнить разложение по степеням физического параметра. Если мы хотим, чтобы низший порядок был детерминистическим, то параметр разложения должен быть таким, чтобы распределение сводилось к узкому пику при малых его значениях. Понятно, что параметр 0kT для этого подходит, потому что при низких температурах флуктуации малы. Мы покажем, что метод получения Q-разложения, использованный в гл. 9, можно приспособить для получения разло- жения уравнения Фоккера — Планка по степеням 01/г. Сперва мы продемонстрируем этот метод на одномерном квазилинейном урав- нении (10.2.4). Сначала возьмем 0 — 0; тогда (10.2.4) сводится к d/ЦхЛ) д , (10.5.1) dt дх ' ' ' ' Это уравнение Лиувилля для х== —1/’(х). (10.5.2} * М. San Miguel, Z. Phys. ВЗЗ, 307 (1979). 272
Мы получили детерминистическое уравнение, справедливое в пределе низ- ких температур. Его не надо путать с макроскопическим уравне- нием, которое является детерминистическим уравнением, возникаю- щим в пределе Q^oo для систем недиффузионного типа. Далее, пусть х(/) —решение уравнения (10.5.2). Определим новую переменную x=-x(/)+91/2t Р(х, 0 = П(|,0- (10.5.3) Преобразование (10.2.4) к новым переменным дает Члены порядка О-1/2 сокращаются и у нас остается дП ,... д f.TT д2П ,. „ г ., ~qI U (х (0) dgT, (10.5.4) не считая членов порядка 91/2 и выше. Мы опять получили линей- ное уравнение Фоккера — Планка с зависящим от времени коэффи- циентом для флуктуаций относительно детерминистического решения при условии, что они малы. Условие состоит в том, что температура должна быть низкой, а детерминистическое решение — устойчивым; (7"(х(/))>0. (10.5.5) Можно также получить последующие, более высокие порядки*. Примечание. Свойства уравнения (10.2.4) для малых 0и для общего основ- ного кинетического уравнения при больших Q оказываются очень схожими. К обоим случаям применимы многие схожие идеи и методы. На разницу же между этими двумя случаями зачастую не обращают внимания. А- ведь кроме разного физического значения между ними существует важное математическое различие. В случае квазилинейного уравнения Фоккера —Планка (10.2.4) свободная энергия U, определенная в терминах стационарного решения в (10.2.6), сов- падает с потенциалом в детерминистическом уравнении (10.5.2). В гех случаях, когда нужно построить зависящее от времени решение для систем, в которых известны лишь равновесные распределения, это тождество используют в качестве доказательства. Однако мы сейчас покажем, что оно выполняется только для систем диффузионного типа, обладающих квазилинейным (т. е. в виде (10.2.4)), уравнением Фоккера — Планка. Сначала грубое приближение. Возьмем одношаговый процесс с коэффици- ентами генерации g (я) и рекомбинации г (я) такой же, как в (6.5.1). Его мак- роскопическое уравнение n = g(n) —г(п) можно записать как п — —V' (п) с Е(л)= 2 {r(v)~g(v)}+const. (10.5.6) v= 1 * R. F. Rodriguez and N. G. van Kampen, Physica 85A. 347 (1976). Другой путь получения эквивалентных результатов описан в работе: D. Ludwig, SIAM Review 17, 605 (1975). 273
С другой стороны, его стационарное распределение (6.3.8) можно записать как Pjj = exp[—U (п)/0| с произвольной константой 0 и и (п)/0= 2 {logr(v) — loggfv — l)} + const. (10.5.7) v— 1 Понятно, что потенциал V для движения не совпадает со свободной энергией U. Для того чтобы сделать это приближение более точным, подставляем вместо g и г их П-разложение (9.2.6). Тогда (10.5.6) дает. ч> И (ф) - 5 Гро (ф')~То (ф')+п-1 {pi (ф') — Т1 (ф')} + • • •] п dq>'. (10.5.8)- С другой стороны, (10.5.7) дает <р U (ф)/0= J {log [ро (ф') + (ф')1 —log [уо(ф')4-й~1У1 (ф')1) Й dtp'. (10.5.9) Основные кинетические уравнения диффузионного типа характеризуются со- отношением у0 —р0. В этом случае (10.5.8) и (10.5.9) сводятся к Ф Уф = J {pi (ф') —У1 (ф')} dq>'. Если вдобавок р0—-const, то можно выбрать 0 = ро = и оба потенциала со- впадут. Это дополнительное требование означает, что в (10.1.5) коэффициент «2, о (х) 1/г {Ро (*) + Уо (*)} = 0 постоянен, что свидетельствует о том. что уравнение Фоккера—Планка имеет квазилинейный вид (10.2.4). Упражнение. Детерминистическое уравнение, полученное путем примитивного отбрасывания второго члена из уравнения Фоккера — Планка, неинвари- антно относительно нелинейных преобразований х. Упражнение. Любое нелинейное уравнение Фоккера — Планка (10.1.5) можно преобразовать в квазилинейное при помощи подходящего преобразованиях. Упражнение. Вращательное броуновское движение диполя во внешнем, зави- сящем от времени поле описывается уравнением * где 0 -S. О < л. Преобразуйте это уравнение в квазилинейное уравнение Фоккера —Планка. Упражнение. Покажите, что минимумы и максимумы функций U и V совпадают. Упражнение. Выведите (в низшем порядке по Q) для одношагового процесса. выражения ехр 1 dt/ 0 dn 1 dV г (n) dn ’ (10.5 Па) 1 dV g(«) dn ' (10.5.116) Каково соотношение между U и V в случае уравнения типа (10.1.5)? * Р. Debye, Polar Molecules (Dover Publ., New York, 1945), p. 83; [7, p. 234]; W. T. Coffey and В. V. Paranjape, Proc. Roy. Irish Acad. A. 78, 17 (1978). 274
Упражнение. Идентификация U и V неинвариантна относительно нелинейных преобразований х. Теперь мы применим температурное разложение к многомерному уравнению Фоккера — Планка (10.4.1) и (10.4.7)*. Сначала темпе- ратурную зависимость надо задать явно. В принципе для этого нужно уточнить определение нашей системы. Но во всех наших примерах Г,- не зависит от 6, а В,у — пропорционально ему: B:J (х) = 0617 (х). Тогда удобно начать с (10.4.17): dP д [ с 1 . dU 1 п 6 д , дР /1 л к 1 — = — — JF, — 7гЬц-^—\Р±-^-^—Ьц^—. (10.5.12) dt dxi [ ' 2 о dXj ) 1 2 дх, lJ дх, ' ' Предел 0-^0 дает детерминистическое уравнение < = Г.(х)_|&,7(х)^. (10.5.13) Первый член представляет собой обратимую механическую силу, а второй— затухание. Эта сила, вызывающая затухание, является частью необратимого члена в (10.4.7), которая выживает в пределе 0 = 0. Другая часть, представленная последним членом в (10.5.12), приводит к флуктуациям. Как следствие этой общей причины и зату- хания, флуктуации описываются одними и теми же коэффициентами Ь,7 (х). Этот факт составляет обобщение флуктуационно-диссипа- тивной теоремы на нелинейные системы диффузионного типа. Тот факт, что матрица Ьи- (х) симметрична, является обобщением соот- ношений взаимности Онзагера на такие системы. Предостережение. Мысль об использовании нелинейного уравнения Фок- кера— Планка в качестве общего подхода для описания флуктуирующих систем привлекала многих авторов **. Соотношение детального равновесия в своей рас- ширенной форме сослужило полезную службу, но связь с детерминистическим уравнением приводила к затруднениям Поэтому полезно еще раз подчеркнуть следующие три предостережения. 1. Нелинейное уравнение Фоккера — Планка применимо к системам диф- фузионного типа, определенным (10.1.1). Для систем, подобных тем, что рас- смотрены в гл. 9, оно обычно неприменимо, в лучшем случае его удается по- строить в качестве приближения с ограниченной применимостью (см. коммен- тарий 10 из § 9.4). 2. Даже для систем диффузионного типа уравнение Фоккера—Планка является просто низшим членом разложения по Q. 3. Это уравнение можно связать с детерминистическим уравнением только посредством разложения некоторых других параметров, что позволяет выделить флуктуации путем разделения масштабов. Наш выбор 0 = йТ выглядит естест- венно, однако он не является единственным, возможны и другие пути. Недавно было предложено разложение по постоянной Больцмана *** k. Формально оно * Я благодарю Гардинера за полезное обсуждение этого вопроса. ** M.S. Green, J. Chem. Phys. 20, 1281 (1952); N.C. van Kampen, Physica 23, 707 and 816 (1957); U. Uhlhorn, Arkiv for Fysik 17, 361 (1960); R. Graham, in: Ergebn. exakten Naturw. 66 (Springer, Berlin, 1973); H. Hasegawa, Prog. Theor. Phys. 55, 90 (1976). *** H. Grabert and M. S. Green, Phys. Rev. A19, 1747 (1979); H. Grabert, R. Graham, and M. S. Green. Phys. Rev. A21, 2136 (1980). 275
должно привести к тем же результатам, что и разложение по Т, при условии, что в коэффициентах, где встречается постоянная k, она нигде не образует комбинации с Т. Упражнение. Покажите, что затухание в (10.5.3) приводит к убыванию свобод- ной энергии. Упражнение. Покажите, что (10.5.3) дает верные детерминистические законы, относящиеся к (8.7.4) и (8.4.11). Упражнение. Убедитесь в том, что (10.4.5) в детерминистическом пределе дает х‘/ = — ц,у(х) {di//dx7} с симметричной матрицей р.(у (ср. с (10.4.16)). Упражнение. Найдите следующий порядок в разложении (10.5.12), полагая x; = xi-(Z) + 01^2gi-, и получите по аналогии с (10.5.4) уравнение dll JdFz (х) .1 d . . . dU (х)\ д , rr , 1 . t dm /ln _ 1 -"5--Нт X— Ьц (x) > тгг- gbH +-Я- Ь. j (x) —rz- . ( 10.5.14) dt ( dxk >2 dxk '' ’ dxj j dg, я 1 2 1' ' d^,- dg7 Согласно § 8.6, решением является гауссиан. Упражнение. Сформулируйте соотношения Онзагера для нелинейных систем. Упражнение. Иногда Ре (х) содержит дополнительный множитель w(x), связан- ный с фазовым пространством, так что его зависимость от 0 дается выра- жением Ре (х) = w (х) ехр (— U (х)/0). Покажите, что это не влияет на результат (10.5.13). ГЛАВА 11 НЕУСТОЙЧИВЫЕ СИСТЕМЫ В предыдущей главе рассматривался один частный случай, в ко- тором не выполнялось основное условие устойчивости (9.3.4). Теперь мы посмотрим, что бывает в тех случаях, когда это условие грубо нарушается. Приведенные здесь примеры —это только выборка из большого числа возможностей, подобранная так, чтобы выделить то новое, что возникает в таких случаях. Исчерпывающего рассмотре- ния всех типов неустойчивости до настоящего времени не сделано. 11.1. БИСТАБИЛЬНЫЕ СИСТЕМЫ Для того чтобы облегчить обсуждение, сузим понятие «состояние», определив следующие три значения этого слова. Будем называть участком любое значение стохастической переменной X или п. Мак- росостоянием назовем любое значение макроскопической переменной <р. Зависящее от времени макросостояние является решением уравнения (9.3.1), а стационарное макросостояние — решением (9.3.3). И наконец, мезосостоянием будем называть любое распределение вероятности Р. Зависящее от времени мезосостояние является решением основного кинетического уравнения, стационарное мезосостояние—это не зави- сящее от времени решение Ps (X). Вначале предположим, что выполняются условия устойчивости (9.3.4). Тогда существует только одно макросостояние <р*. Оно свя- 276
зано со стационарным мезосостоянием Ps (X) в том смысле, что по- следнее является острым пиком относительно Qq/ и в пределе Q —оо стремится к дельта-функции от QqA Далее, благодаря (9.3.4) любое зависящее от времени макросостояние <р(/) удается связать с зави- сящим от времени мезостатическим состоянием Р (X, t), составля- ющим острый пик вблизи Ф (/) и движущимся вме- сте с ним. Эта связь не- однозначна и точно не определена: каждому ф(/) соответствуют много Р (х, t), обладающих такими свойствами, и мы не можем точно определить, насколь- ко острым должен быть этот пик. Мы только мо- жем сказать, что его ши- рина не должна превы- шать величины порядка й1/г. До сих пор мы рас- сматривали только такие мезосостояния. Однако существует и много дру- Рис. 32. Уравнение для макроскопической скорости в бистабильных системах. На ри- сунке показаны также области притяжения гих, например таких, ко- торые не состоят из единственного острого пика и которые поэтому нельзя связать ни с одним макросостоянием <р. Скорее они описы- вают распределение вероятности по набору макросостояний. Возьмем, например, макросостояние Р(Х) = л1б(Х-Х1) + л2б(Х-Х2) (11.1.1) с двумя постоянными Xj#=X2 и двумя положительными коэффици- ентами Л! + л2 = 1. Это макросостояние связано с двумя макросо- стояниями = Хг/Й и <р2 — Х2/й таким образом, что система имеет вероятность Л) находиться в макросостоянии ф1 и л2 находиться в состоянии ф2. Аналогичным путем любое плоское распределение Р (X) можно представить как сумму острых пиков, каждый из кото- рых представляет собой мезосостояние, связанное с макросостоянием. И опять это разложение не единственно, потому что форма и ширина отдельных пиков могут изменяться в некоторых пределах. Все это контролируется условием (9.3.4), которое гарантирует, что острая функция Р(Х, t) остается острым пиком. Рассмотрим случай, когда а110(ф) имеет вид, изображенный на рис. 32. Имеется три стационарных макросостояния фв, фь, фс, из которых ц>а и фс локально устойчивы, а фь неустойчиво. Даже с точки зре- ния чистой макроскопики состояние фь нельзя рассматривать как реализуемое, потому что система, находясь в фь, из-за малейшего 277
внешнего возмущения скатится либо в <рв, либо в фг. Системы, обла- дающие макроскопическими характеристиками, подобными тем, что показаны на рис. 32, называют бистабильными. Примеров таких систем много. В литературе чаще всего упоминают пример с лазером (см. § 11.9), туннельным диодом Исаки * и химической реакцией Шлегла (9.3.6). Макроскопическое уравнение для скорости реакции имеет вид Ф = МлФ2—^Ф3 —^ф + ^Фа. (11.1.2) где <рл, фв —постоянные концентрации Л и В. Правая часть этого уравнения есть О110(ф), при определенных значениях констант она имеет вид, изображенный на рис. 32**. Теперь рассмотрим бистабильный случай на мезоскопическом уровне. Вначале рассмотрим локально устойчивое решение <ра на рис. 32. Поскольку <Хьо(фа)<О. имеется область Да вблизи фв, в которой выполняется (9.3.4). Любое макросостояние <р (£), начина- ющееся в <р(0), будет стремиться к <рв внутри области До. Мезосо- стояние Р (X, t), связанное с ним соотношением Р (X, 0) = б [X — — Пф(0)], будет оставаться острым пиком при условии, что Q доста- точно велико. Тогда эволюцию Р (X, /) по-прежнему можно прибли- женно описать с помощью Q-разложения, при этом сохраняется тес- ная связь между макро- и мезосостояниями. Действительно, из рис. 32 видно, что имеется большая область притяжения Da, такая, что каждое решение ф(/) с принадлежащим Ф (0) стремится к фа. Два макросостояния, начинающихся в двух соседних точках Da и Да, сначала удаляются друг от друга, а затем начинают приближаться до тех пор, пока оба не окажутся в фа. Это видно из рис. 28, б, а также из уравнения для вариаций (9.3.5). Соответственно флуктуации относительно такого ф (/) сначала нара- стают ***, а затем снова убывают. В таком случае их все чаще можно описать с помощью Q-разложения, а это значит, что связь между макросостояниями и соответствующим образом выбранными мезосо- стояниями сохраняется. По-прежнему это описание не совсем корректно, потому что даже тогда, когда система находится на участке внутри Да, все же суще- ствует вероятность (хотя и малая) гигантской флуктуации, которая перебросит систему через фь в область Dc. В этом случае она начнет движение к соседнему фс и будет двигаться до тех пор, пока ана- * L. Esaki, Science 183, 1149 (1974); A. van der Ziel, Solid State Physical Electronics (Erd Ed., Prentice Hall, Englewood Cliffs, N. Y., 1976). ** Другие химические неустойчивости рассмотрены в кн.: A. Nitzan, Р. Ог- toleva, J. Deutch, and J. Ross, J. Chem. Phys. 61, 1056 (1974); R. M. Noyes, J. Chem. Phys. 64, 1266 (1976). Advances in Chemical Physics 43 (I Prigogine and S. A. Rice eds., Wiley, New York, 1980) and F. Schlogl, Physics Reports 62, 267 (1980). *** Это так называемая теорема об усилении флуктуаций, доказанная Су- зуки, М. Suzuki, Prog. Theor. Phys. 56, 77 (1976). 278
существует потому, что оно является логичная гигантская флуктуация не перебросит ее обратно в Da. Мезосостояние, представленное пиком вероятности До, не может существовать вечно: его вероятность медленно убывает в пользу пика вблизи <рс. Хотя фа является устойчивым решением макроскопиче- ского уравнения, связанное с ним мезосостояние, строго говоря, оказывается неустойчивым, а просто долгоживущим, и поэтому его следует называть метастабильным. Действительно, в термодинамике метастабильное состояние (на- пример, пересыщенный пар) устойчивым по отношению к малым флуктуациям, но срав- нительно маловероятная ги- гантская флуктуация может перевести его в другое макро- скопическое состояние. Пока мы молчаливо под- разумевали, что на самом деле гигантские флуктуации через фь редки. Это дает возможность различать два масштаба времени. Мелкомасштабное время определяется скоростью, при которой внут- ри Да устанавливается равновесие (см. рис. 28, б). Крупномасштабное время — это время, в течение которого проис- ходит гигантская флуктуация. Оба масштаба четко разделяются, когда метастабильное стационарное распределение вблизи фа является узким *1,0® — \ ? 9>ь Ъ 33. Бистабильная система вблизи критической точки Рис. по сравнению с расстоянием до ф(,. Грубой мерой вероятности гигантской флуктуации является высота настоящего стационарного распределения Ps в q>b. Точная формула для нее выводится в следующем параграфе. Для систем макроско- пического размера это «время перехода» запросто может оказаться в несколько раз превышающим возраст Вселенной. Однако для отдель- ных молекул оно определяется множителем Аррениуса. Для систем, в которых области устойчивости и неустойчивости смазаны, как на рис. 33, трудно провести различие между двумя масштабами времени и такое разделение теряет свое значение. Это критическая область, ее мы обсудим в § 11.5. Примечание. Подобную картину можно представить себе как случайное блуждание или диффузию в потенциале V (х), определенном соотношением V (ф)=--—а110(ф). Потенциалы, соответствующие устойчивой, бистабильной или критической ситуа- ции, изображены на рис. 34. Гигантскую флуктуацию можно представить себе как диффузию через потенциальный барьер. Однако эта наглядная картина не позволяет учесть разницу между V и U, о которых упоминалось в § 10.5 (см., в частности, (10.5.11)). Такая картина, например, наводит на мысль, что Ps = = ехр (— V/0), а это приводит к ошибочной идее, что <ра и фс равновероятны, если V (фа) —И (фе), но не тогда, когда U (фв) = U (фс). В действительности картина справедлива только тогда, когда мы имеем дело с настоящей диффузией во внешнем поле с постоянным коэффициентом диффузии 0, описываемой (10.2.4). 279
Рис. 34. Потенциал, при котором система имеет глобальную устой- чивость (а); потенциал, при котором система бистабильна (6); потен- циал для случая, изображенного на рис. 33, (в) Вернемся к бистабильному случаю с хорошо разделяющимися масштабами времени и предположим, что система в начальный мо- мент времени находится на участке вблизи границы Da, т. е. вблизи макроскопически неустойчивой точки фь. Тогда на начальной стадии флуктуации через <рь не являются невероятными. Это значит, что имеется непренебрежимая вероятность того, что система не будет придерживаться макроскопической траектории, ведущей в <рв, а ока- жется вместо этого в <р, . Тогда вблизи точки макроскопической не- устойчивости флуктуации приводят к макроскопическому эффекту. Следовательно, уже нельзя разделить макроскопическую часть и флуктуирующий член, как мы это делали в (9.2.9), и флуктуации нельзя рассматривать как малое возмущение. Но все же, несмотря на это, можно вычислить «вероятность разделения», как показано в § 11.3. Из всего сказанного можно сделать вывод, что мезосостояния, связанного со стационарным макросостоянием фь, не существует. Любое распределение вероятности в начальный момент времени, имеющее острый пик вблизи фь, эволюционирует во времени и не остается локализованным. Эволюция происходит в три стадии. СТАДИЯ I. Распределение быстро расширяется, но флуктуации через ф(, еще невозможны. СТАДИЯ II. Формируются два пика, разделенные впадиной вблизи фь. Обмена вероятностями через фь практически не происхо- дит, и сосредоточенная в обоих пиках полная вероятность b оо ла = j Р (х, 1)йх, лс = ^Р(х, /) dx (11.1.3) — оо b практически не зависит от времени. Эти вероятности, конечно, опре- деляются начальным распределением. Пики эволюционируют неза- висимо, сначала расширяясь, а потом снова сужаясь по мере при- ближения к области, где кривые, изображенные на рис. 28, б, снова сходятся. СТАДИЯ Ш. Пики обрели свою локальную равновесную форму вблизи фа и фс. Мезосостояние соответствует не одному макросостоя- 280
нию, а является суперпозицией двух, подобно (11.1.1). Это мезосо- стояние метастабильно, потому что на очень большом масштабе вре- мени флуктуации через q>b переносят вероятность между обоими пиками. Тогда па и лс медленно изменяются в соответствии с урав- нением яо = -лс = -^-+?. (11.1.4) ьса 1ас Константа 1/тяс является вероятностью того, что за единичное время система, находясь вблизи фс, в результате флуктуаций через <pfr попадает в область Да в окрестности фа. В конце концов ла и лс достигнут своих стационарных значений, определяемых соотношением между Лд и л®: Ла/Тсв = Л^/Тас. (11.1.5) Пример. Рассмотрим набор N диполей, каждый из которых может быть направлен либо вверх, либо вниз. Намагниченность пропорциональна 2п, т. е. числу спинов, направленных вверх, минус число спинов, направленных вниз. Теория среднего поля Вейса дает (для четного числа А’) Рп = const (11.1.6) где K/N — постоянная ферромагнитного взаимодействия. Предполагается *, что п может совершить скачок на одну единицу с вероятностями за единичное время в(л)=(|лГ- n'j ехр (п—>л+1), (11.1.7а) A'+n jexp |--ул| (л——1). (11.1.76) Число N служит параметром Q, а макроскопическое уравнение для n//V = cp имеет вид Ф=И1(ф)= ( ~ — <р) е2Хф — (у+ф) е“2Хф. Ниже температуры Кюри, К > 1, имеется два устойчивых макросостояния ± фа и одно неустойчивое ф = 0. Если система при Z--0 находится в состоянии ф = 0, то с течением времени она под влиянием либо внешних возмущений, либо внутренних флуктуаций начинает двигаться к фв либо к —фа. Это называется нарушением симметрии: хотя и уравнение, и начальные данные симметричны, а несимметрично конечное макросостояние. С другой стороны, мезосостояние Pn(t), определяемое начальным условием Рп(0) = 6п0, симмет- рично при всех t > 0. Примечание. Неустойчивость и бистабильность определяются как свойства макроскопического уравнения. Влияние флуктуаций сводится просто к тому, что они заставляют систему сделать выбор между той или иной макроско- пически устойчивой точкой. Аналогично, неустойчивости Тейлора и ячейки Бенара являются следствиями макроскопических уравнений гидродинамики **. * R. J. Glauber, J. Mathem. Phys. 4, 294 (1963); Th. W. Ruijgrok and J. A. Tjon, Physika 65, 539 (1973). ** S. Chandrasekhar, Hydrodynamic and Hydromagnetic Stability (Clarendon, Oxford, 1961); C. Normand, Y. Pomeau, and M. G. Velarde, Rev. Mod. Phys. 49, 281
Флуктуации просто делают выбор между двумя разными, но равновероятными макросостояниямн н в наших примерах определяют положение вихрей или ячеек в пространстве (на практике над ними часто одерживают верх посторон- ние факторы, такие, как присутствие границ). Утверждения, что флуктуации сдвигают или разрушают бистабильность, неверны, потому что в любом случае на мезоскопическом уровне нет четкой границы между устойчивыми и неустой- чивыми системами. Вся информация, описывающая эволюцию системы, содержится, конечно, в основном кинетическом уравнении, но его редко удается решить явно *. Для бистабильных систем не существует удовлетворительной приближенной схемы, потому что макроскопическое поведение и флуктуации тесно переплетаются. Однако для поведения одношаговых систем, даже не решая основного кинети- ческого уравнения, можно установить следующие три характерные черты. 1. Окончательное стационарное распределение можно найти явно из (6.3.8) **, и поэтому ответить на все вопросы, касающиеся стационарного мезо- состояния. В частности, можно найти вероятности nJ, л? обнаружить систему вблизи <ра или <рг, если ее возраст достаточен для установления равновесия между ними, т. е. это можно сделать по прошествии времени достаточно боль- шого по сравнению с тса и тас. 2. Времена переходов тса, тас мы найдем в следующем параграфе. 3. Вероятности разделения ла, л(., встречающиеся на второй стадии, мы найдем в § 11.3 как функции начального положения системы. Вообще говоря, явные выражения удается найти только для одношаговых процессов, и то только в одномерном случае. Для получения таких приближе- ний предлагались разные методы ***. В следующей главе эти методы будут при- менены a fortiori к системам, которые непрерывно распределены в пространстве, так что стохастические переменные являются функциями координат. Неустой- чивости в таких системах изучались в связи с фазовыми переходами в химических реакциях и популяциях, но здесь мы их рассматривать не будем ****. Упражнение. Покажите, что произвольное, медленно меняющееся распределе- ние Р можно записать как суперпозицию гауссианов с одинаковыми диспер- сиями. Упражнение. С помощью (6.3.8) убедитесь в том, что для одношагового про- цесса (9.1.3) Рг имеет максимумы вблизи <ра и <рс и минимумы вблизи <рь. Получите формулу для относительной величины максимумов. Упражнение. При известном Р отношение хса/хас фиксировано. Почему это не является примером детального равновесия? Значения хса и хас нельзя получить из Ps, потому что они имеют размерность времени. Упражнение. Предположим aj,o (<р) обладает А устойчивыми нулями, которые разделены А—1 неустойчивыми. Запишите уравнения, соответствующие (11.1.4) и (11.1.5). 581 (1977); Е. L. Koschmieder in: Advances in Chemical Physics 26 (I. Prigogine and S. A. Rice eds., Wiley, New York, 1974) and in: Order and Fluctuations in Equilibrium and Nonequilibrium Statistical Mechanics (17th Intern. Solvay Conf.; G. Nicolis et. al. eds., Wiley, New York, 1981). * Числовые вычисления приведены в работах: S. Grossman and R. Schran- ner, Z. Phys. B30, 325 (1978); W. Ebeling and L. Schimansky-Geier, Physica 98A, 587 (1979). ** Относительно приложений см. работы: К. J. McNeil and D. F. Walls, J. Statist. Phys. 10, 439 (1974); G. Nicolis and J. Turner, Physica 89 A, 326 (1977). *** M. Mangel and D. Ludwig, SIAM J. Appl. Math. 33, 256(1979); M. Mangel, idem 36, 544 (1979). **** Stochastic Nonlinear Systems in Physics, Chemistry and Biology (L. Arnold and R. Lefever eds., Springer, Berlin, 1981). 282
Упражнение. Запишите точное стационарное решение для реакции Шлегла (9.3.6) и аппроксимируйте его для больших й с помощью интеграла, как в (10.5.9). Сравните результат с ошибочным выражением етр [— У/0]. Упражнение. Для бистабильной системы «относительная устойчивость» * обоих метастабильных мезосостояний при <ра и при <рс дается выражением Ла [ U (фг) 1 Г г i j i \ ii < 1 |Д"(<ра) J ехр I — Вычислите это выражение для} реакции Шлегла, опуская члены поряд- ка Q-1. 11.2. ВРЕМЯ ПЕРЕХОДА Рассмотрим бистабильный одношаговый процесс, у которого а1,о(ф) имеет вид, изображенный на рис. 32. Предположим, что система в начальном состоянии находится на одном из участков вблизи сра. Какова вероятность того, что за единичное время система попадает на один из участков в окрестности ср^? Ответ не зависит от точного выбора начального участка, потому что система пробегает все участки в окрестности q>a за время, намного меньшее того, которое мы хотим определить. В равной мере ответ не зависит и от точного выбора конечного участка. Однако с точностью до этой небольшой неопределенности мы имеем хорошо определенное время перехода тса. Для удобства выберем начальный участок в точке сра, а конеч- ный— в срс. Задача, таким образом, сведена к проблеме первого прохождения или равносильной ей задаче с начальными данными с поглощающей границей в точке сре. Эта задача была решена в § 6.10 в том смысле, что распределение времени первого прохождения было выражено через решения основного кинетического уравнения с помощью соот- ношения (4.10.14). Однако настоящая задача имеет дополнительные особенности, связанные с тем, что основное кинетическое уравнение обладает нормированным стационарным решением ps. Это означает, что время первого прохождения конечно. Такой вывод можно легко пояснить. Действительно, все участки посещаются за время, необхо- димое p(t) для того, чтобы приобрести свой предельный вид р5. Поскольку наша система является бистабильной, среднее время первого прохождения из точки сра в совпадает с тса. Для того чтобы показать это, рассмотрим уравнение (11.1.4), с помощью кото- рого определяются хса и хас. Первый член в правой части описывает убывание лв, обусловленное переходами из а в с. Второй член описывает переходы из св й. Последние теперь исключены с помощью поглощающей границы в точке срс. В присутствии этой границы (11.1.4) сводится к па = ' ^а/^са- Следовательно, среднее время жизни, предшествующее поглощению, * I. Procaccia and J. Ross, J. Chem. Phys. 67, 5558 and 5565 (1977). 283
дается выражением tna(t) At — xca. о Сейчас мы выведем явное выражение для хса, используя резуль- таты § 6.10. Наша система бистабильна, как в § 11.1, и мы допол- нительно предположим, что она обладает нормированным стационар- ным решением р„, так что каждое решение рп, т (t) стремится к р*п. Тогда преобразование Лапласа можно записать в виде <30 3», т (8) = 5 [fin. т tf)—Pn} e~St & + ^Рп- о При t — оо значение {} обращается в нуль; следовательно, при s, стремящемся к нулю, интеграл остается конечным или по крайней мере стремится к бесконечности медленнее, чем 1/$. Тогда Л,т(8) = т-/’п+4’и, «(s), (11.2.1) где фЯ1 т(s) = О(s-1). Далее, из (6.10.14) следует, что распределение первого времени прохождения из точки сра в точку срс, которое мы обозначаем /(/), обладает свойством <х Cf(Od/ = f(O) = lim^4T~7T=1- <1L2-2> Согласно (6.10.5), это означает, что система обладает единичной вероятностью рано или поздно достичь состояния с, как это уже упоминалось выше. В качестве побочного результата из (11.2:1) следует соотношение 2к т(8)=0, (11.2.3) п что мы сейчас используем. Уравнение (11.2.2) утверждает, что f действительно является плотностью вероятности времени первого прохождения. Его среднее значение <30 ъса = pf (0 dz = - f (S) I s=0 = - r (0). (11.2.4) о Оно может быть бесконечным, но если гр имеет конечную производ- ную при s = 0, то оно конечно. В этом случае, подставляя (11.2.1) в (6.10.14), дифференцируя по s и переходя к пределу s —0, по- лучаем 284
Сейчас мы покажем, что это выражение можно вычислить явно, не решая полного основного кинетического уравнения. Для того чтобы найти m(s), подставим (11.2.1) в преобразование Лапласа от основного кинетического уравнения (6.10.15): — + Рп + sip„, т (s) = т (s) = (Е — 1) rn i|>„, т (s) Теперь, приравняв s = 0, получим -Snm + ^ = Wip„,m(0). (11.2.6) Однако нам нужно знать величину с (0)—4'п. а (0) == хп, которая удовлетворяет соотношению -Srt,c + 6„.a = WZrt. (11.2.7) Теперь задача сведена к обращению оператора W вместо его диаго- нализации. Для того чтобы решить это уравнение, распишем его подробно: 0 = (E-l)r„Zrt + (E-1-l)^Zrt (п^а, с), (11.2.8а) l=re+lXe+l+ge-lXe-l—+ (Н.2.86) — 1 =^+1Хс+1 + ^-1Хс-1—(гс+яе)хс. (11.2.8b) Первая строка, как обычно, дает пХп £п —17. п — 1 = • Это соотношение должно удовлетворяться для — оо < п а, для а + 1 п b и для b4- 1 < оо, но константы J в каждом из этих трех интервалов могут быть разными. Ясно, однако, что в обоих наружных интервалах должно выполняться условие 7 = 0, потому что Zn обращается в нуль на бесконечности. Тогда 7n = Apsn для ns^a, (11.2.9а) Xn = Bpsn для п>с. (11.2.96) Отметим, что эти значения Zrt должны существовать при п = а и п = с для того, чтобы удовлетворялось уравнение (11.2.8а). Однако для внутренней области константа J не обязана обращаться в нуль. Далее, (11.2.86) дает 1 =(/'а + 1Ха + 1—^аХД —(''аХа —Яа-1Ха-1) = —^ + 0; следовательно, оно удовлетворяется, если взять J = — 1. То же самое значение J удовлетворяет (11.1,8в). Тогда Zri для определяется выражениями (6.3.13) и и (11.2.9): V = ) 1 I Sn-l I Sn-lgn-2 > г 5 * 1 - 'г г “t- • • • •п ( 'n-1 'n-l'rt-2 । fg«-i ga + 1 I I gn-lg»-2 ga y|ps (’ll 2 101 ГП-1 ... Га + 1 f * rnrn_t ... Га + 1 ° ' ’ ' 285
Для п = с это выражение связывается со значением, определяемым (11.2.96), что приводит к связи между А и В: bpsc=±{1 +т^+ • • • + г-1''' fa+1 У + ЛРс- ' с I 'с -1 'с~1 га + 1 ) Собирая результаты, получаем ( Apsn (n < a), rn I • ga+l I Xrt r n-1 rn-l • • rH + l I ^Pn + -~ J1 1 gc-1 . ' Pc-l ‘ +fe ga + 11 Pn • ra + i 1 pc (а + 1 sC п +4 с), (с 4-1 ^н). Используя (6.3.8), это выражение можно переписать как О X» = Apsn + (« < а), (а+ 1 sCn ^с), (с + 1 -С п). (11.2.11а) (11.2.116) (И.2.11в) ’“ = Л + £ 77;= £ P" £ 77; + £ Pi £ v=a+l n—-» v=u +1 n=a+l v=n + Окончательно константа А определяется требованием (11.2.3): А = - £ Й £ 7^- £ л £ -А- (11.2.12) ГV^v 'угу п=а+ I v=cc+1 n=c+l у—ал-1 Для среднего времени прохождения нужно знать только значения хп при п = с: 1 ] rvPSv ' (11.2.13) Это и есть искомое явное выражение для времени перехода*. Упражнение. Выведите из (11.2.13) иное выражение: т-= Е (11.2.14) V=a+1 v v -оо Упражнение. Покажите, что (11.2.13) практически совпадает с f с л ( & । А с 1 Tce='l3P"j(^,7xj="“?'7^’ (ll,2,l5) и выведите отсюда, что (11.1.5) удовлетворяется. * G. Н. Weiss, J. Statist. Phys. 24, 587 (1981)- 286
Упражнение, Для того чтобы вывести (11.2.5), нет необходимости требовать существования фп. m(0). Каково должно быть точное требование? Упражнение. Выведите (11.2.6) непосредственно, т. е. не прибегая к использо- ванию преобразования Лапласа, но интегрируя основное кинетическое уравнение по /. Упражнение. Решение уравнения (11.2.7) равносильно нахождению W-1. Поскольку, однако, W имеет нулевое собственное значение, левая часть (11.2.7) должна удовлетворять дополнительному условию. Покажите, что это условие действительно удовлетворяется, а если нет, то какое место в наших вычислениях становится ошибочным? Упражнение. Рассмотрите диффузионно контролируемую химическую реакцию (6.7.7). При 1=0 молекула находится в связанном состоянии. Каково сред- нее время, в течение которого она достигает заданного участка N > О? Упражнение. Второй множитель в (11.2.15) определяется в основном членами вблизи v = b. Они содержат величину (pl)'1, которая является множителем Аррениуса, упомянутым в § 7.5. В теории одномолекулярных реакций этот множитель подсказал идею «переходных комплексов», т. е. воображаемых промежуточных молекул, соответствующих неустойчивому состоянию Ь. При таком подходе считается, что реакция перехода из а в с происходит в две стадии. На первом шаге а —► Ь, а затем Ь —> с. Первый шаг целиком определяет скорость. Это привело некоторых авторов к созданию погло- щающего барьера в Ь. Покажите, однако, что Т|,а составляет примерно половину Tfa. Упражнение. Найдите формулу для дисперсии времени первого прохождения *. Упражнение. Рассмотрите одношаговый процесс с естественными границами при л —О и n-=N. Найдите выражение для среднего времени возвращения в состояние п~0. Это значит, что система стартует из л=0 и мы хотим дать среднее время, за которое произойдет первый переход из п~ 1 вл -0. Получите результат для аналога (4.5.4), но с непрерывным временем: Pn = (E— 1) (л/А)/^-' (Е*1— 1)(1— n!N)pn. Отметим, что это задача, обратная нахождению pjj**. 11.3. ВЕРОЯТНОСТЬ РАСЩЕПЛЕНИЯ Вновь рассмотрим бистабильный одношаговый процесс, показан- ный на рис. 32. Предположим, что система в начальном состоянии находится на участке т между а и с; в основном мы будем инте- ресоваться случаем, когда участок т расположен вблизи Ь. Какова вероятность того, что она будет захвачена Da или Dc соответственно? Этот вопрос, естественно, относится к быстрой эволюции, по- скольку на больших масштабах времени между обеими областями существует обмен, который описывается формулой (11.1.4). На постав- ленный вопрос можно ответить, поместив в точках <ра и срс погло- щающие границы. Уравнение для вероятности qn (t) обнаружить систему на участке п имеет вид ? = (Е-Пг^-НЕ-1-V)gnqn (a + 2<n<c-2), (11.3.1а) qa+i = '’a+2qa+i — (ra+1+ga+l)qa+u (11.3.16) ?c-i=^-2<7c-2 —(гс-1+^-1)?г-1- (11.3.1b) * В работе: D. Т. Gillespie, Physica 101 A, 535 (1980),— приведены также числовые вычисления для реакции Шлегла. ** М. Кас, loc. cit. 287
Начальное условие есть qn (0) = 6П т. Сюда можно добавить а и с, как лимбо-состояния с вероятностями qa = ra + 1qa^, q^r^q^,. (11.3.2) Тогда вероятность а первого достижения для исходного одношаго- вого процесса дается выражением ---- Ча (°0) = Га + 1 J Ч^ + 1 (0 d/. (11 .3.3) а Обозначим V оператор в правой части (11.3.1). Тогда формаль- ное решение (11.3.1) с начальным условием <7п(О)==6п,и имеет' вид <?„(/) = (е^)„,и. (11.3.4) Из-за наличия поглощающих границ все собственные значения V отрицательны, а </„(/) экспоненциально стремится к нулю при t, стремящемся к бесконечности. Тогда интеграл в (11.3.3) дает х Г х \ $ <7^(0= H e^d/ ==-(V-l)e+1,M. (И.3.5) 0 ’ 0 ' а +1, т Вероятность разделения можно найти теперь не решая основ- ного кинетического уравнения', нужно просто вычислить оператор, обратный * к V, т. е. нужно определить вектор qf из уравнения 2 (и.3.6) п'-а + 1 Это решение можно интерпретировать как стационарное состоя- ние, в котором постоянный единичный источник, находящийся на участке т, порождает стационарное течение в направлении поглоща- ющих границ. Для того чтобы решить (11.3.6), рассмотрим области по обе стороны т отдельно. При п=£т из уравнения (11.3.6) следует, что должно удовлетворять (11.3.1а) с нулем в левой части урав- нения. Тогда •ГЛ(—gn-i4Li = — Ja (а + Ъ^п^т), (11.3.7а) rnqfn— = — < (m+l<n<c—1). (11.3.76) Поскольку Ja и Jc — постоянные потоки вероятности в каждой области, можно ожидать, что Ja < 0, Jc > 0. Подставляя n = a-)-2 в (11.3.7а), комбинируя результат с (11.3.16) и используя (11.3.3) и (11.3.5), получаем ' Ах = ^a + l^a+i ~ п<г * Этот прием уже использовался ранее, см.: L. Onsager, Phys. Rev. 54, 554 (1938). 288
Аналогично находим Jc = jic,. Для того чтобы найти решим (3.7) последовательными шагами. Для а + 1 п т в результате получаем qie=-Ja\- + -^ L ' п • п'.п - gll- igtl- 2 r п? n-l^n ~ 2 gn-lgn-2 ga+i rnrn-l Га. + 1 Для m n <1 c— 1 (11.3.8a) I. sn rn+l gngn+1 ГП + 1ГП + 2 g.ngn + lgn+2 rti + lrn + 2 • • ^c-l gngn *-!••• gc-L (II.3.86) И наконец, эти отдельные решения нужно сшить в: точке т. Для того чтобы (11.3.8а) и (11.3.86) имели одно и то же значение, для qfm должно выполняться условие gm — lgm — 2 • gv rmrm - 1 • • • A- V4 Гяг + 1гm + г - r v “ SmSm + l • • • gv m 2 Pm/(rvPv) v-a-t 1 2 Pm^v+lpUl) v = m (II..3.9) Кроме того, при n = m должно выполняться (11.3.6): ''m + l^+l + gm-lgfm-l — (r,n + g,n) q„i =- —1. Из (11.3.7) видно, что это соотношение означает просто Хс — = т. е. лс -р ла - - 1. (11.3.10) Это подтверждает, что частица должна попасть либо в а, либо в с. Следовательно, вероятность того, что она не окажется ни в: одном из этих состояний, равна нулю. Поэтому окончательный результат таков: С с £ £ -А (п.з.н) v=m^l rvPv ' V = a+D rvPv Примечание. Метод, использованный здесь, несколько отличается от при- мененного в предыдущем параграфе. Отличие связано< с тем, что в предыдущем параграфе можно было применять формулу (6.10.14), описывающую время первого прохождения. Однако аналогичную формулу можно вывести и для настоящего случая. По аналогии с (6.10.11) запишем уравнение обновления: Рп, т (s) = т (s) + 1а (») Рп, a (s) + fa (s) Рп, с (s). где fa и fc — преобразования Лапласа от распределений времен первого про- хождения через а и с. Отсюда следует, что Pa,m(s) = fa(s)~Pa, в (S) + Fc (s) Ра, с («), (11.3.12а) Pc, т (s) = la (S) Ре, а («) + fc (s) Ре, с («)- (11.3.126) Эти два уравнения оказываются аналогом (6.10.14). Переходя к пределу s—> 0, получим /а (0)4~/с (0) = 1, что совпадает с (11.3.10). Следующий порядок по s 289
дает отдельно fa (0) и fc (0). Мы предоставляем читателю провести эти выкладки и получить те же самые результаты, что и в тексте. Упражнение. Убедитесь в том, что матрица (11.3.1) совместно с (11.3.2) яв- ляется расщепляющейся W-матрицей. Упражнение. В качестве модификации диффузионно контролируемой реакции (6.7.7) рассмотрите случайное блуждание на участках /1 = 1, 2, ..., N—1 со связанным состоянием на каждом из концов n = 0, М. Если частица в начальном состоянии находится на участке т, то какова вероятность попасть в связанное состояние на каждом из концов? Эта задача совпадает с задачей о вероятности выигрыша одного из двух игроков, подбрасы- вающих монету, когда каждый из них имеет ограниченный капитал, но неограниченное время. Упражнение. Третий метод получения (11.3.11) аналогичен (5.9.8). Рассмотрите па и лс как функции начального положения т и покажите *, что Лс(т)=-«Н_Лс(т+1)+-^-Яг(я-1). (11.3.13) ьтп~\"гт бт^чп Это уравнение содержи-i транспонированную матрицу W и его следует решить с условием л,. (т)=-1, л,. (0)==0. Упражнение. Покажите, что для времен t, малых по сравнению со временем перехода, выполняется следующее тождество: Лс (т) =~ 2 m (0 л<- п Продифференцируйте его по времени и выведите таким путем (11.3.13). Упражнение. Среднее время жизни тех частиц, которые попадают в а, состав- ляет fa (0). Покажите, что эту величину также можно найти не решая основного кинетического уравнения. Упражнение. Частица описывается одношаговым процессом на —оо < п < оо с начальным положением п = 0. Будем интересоваться вероятностью Z обнаружить частицу внутри интервала 0 < N < п < М, но нас также интересуют вероятности последнего прохода частицы через границы N или М, обозначенные Z~ и Z+ соответственно. Такие задачи возникают при изучении воздействий флуктуаций тока на устройство с гистерезисом. Покажите, что эта ситуация описывается следующей системой уравнений: м-I М - 1 2 ~ 2 р~^ N + 1 А' + I р^ = (Е — 1) гпрл + (Е-1— l)gnPn+^nMgM-iPM-i (п > AQ-1), PN+l ~ fN+ 2PN+2— (rN+l4 gN-t-l) PN+1- pn = (E — l)r„p„+(E-1— V)gnPn +6njV^v+lPA41 (« < M—1), РЛ1-1 -- SM-2PM-1 — (/M-l-^gM-1) PM-1- 11.4. ПРОБЛЕМА МАЛЬТУСА — ФЕРХЮЛЬСТА Эта модель роста популяции уже упоминалась в § 6.9. Она слу- жит еще одним примером того, что может случиться, когда нарушено условие (9.3.4). Сначала перепишем основное кинетическое уравне- ние (6.9.9) таким образом, чтобы выделить зависимость от полной * I. Oppenheim, К- Е. Shuler and G. Н. Weiss, Physica 88 A, 191 (1977). 290
территории, занимаемой популяцией, или от полного количества Q: р„ = а(Е— 1)пд,4-₽(Е-1— + — l)n(n—l)/>„. (11.4.1) Это отдельная система уравнений для п 1. После ее решения получаем из соотношения Po^a-Pi- (11.4.2) Макроскопическое уравнение для плотности <р, как легко видеть, имеет вид (ср. с (6.9.7)) Ф = (0— а)ф—уф2. (11.4.3) Оно обладает одним устойчивым стационарным решением <р„ ~ (0—а)/у, соответствующим популяции макроскопического размера n* = QTa = Q^. (11.4.4) Кроме того, имеется неустойчивое стационарное решение фь = 0. Все остальные решения стремятся к <ря. Однако фа не является гло- бально устойчивым, потому что имеется одно решение ф = фь, которое не стремится к <ра. Действительно, условие (9.3.4) не выполняется. Мезоскопически нужно решить (11.4.1) с начальным условием рп (0) = би т. Если начальная популяция m-го порядка, можно ис- пользовать Q-разложение. В результате, конечно, получается, что pn(t) представляет собой пик шириной порядка Q1^2, положение которого определяется уравнением (11.4.3). Для больших t распре- деление рп превращается в стационарное распределение Гаусса относительно (11.4.4). С другой стороны, из (11.4.2) следует, что п = 0 является погло- щающим участком, поэтому уравнение (11.4.1) может иметь только одно стационарное решение ffn = &n, п. Все другие решения основного кинетического уравнения стремятся к нему. Это означает, что с ве- роятностью единица популяции в конце концов вымрет! Симметрия моментов разрешает этот парадокс. Мезосостояние, связанное со стационарным микросостоянием (11.4.4), не является устойчивым, но оно метастабильно. В то время как численность популяции колеблется относительно значения (4.4), всегда существует вероятность, хотя и малая, того, что произойдет флуктуация, которая приведет по- пуляцию к состоянию п = 0, в котором она останется навсегда. На очень большом масштабе времени эта вероятность возрастает до единицы, так что действительно pn(t) —- 6И, 0, хотя и очень медленно; Q-разложение описывает эволюцию на меньших временных масшта- бах, потому что в нем пренебрегается малой вероятностью этой большой флуктуации, поскольку члены типа е~са не появляются в разложении. Первый вопрос: как долго может просуществовать метастабильное мезосостояние? Или, формулируя это по-другому, можно поставить 291
задачу о вычислении вероятности за единичное время 1/тЬа того, что стационарная популяция вымрет в результате флуктуации. Метод аналогичен изложенному в § 11.2, однако имеется разница, связанная с тем фактом, что в данном случае основное кинетическое уравнение имеет поглощающую границу. Поэтому помещать такую границу в <рь нет необходимости, поскольку она уже существует. Достаточно взять начальную популяцию ns и вычислить среднее время первого прохождения к границе п = 0: ОС х сс Ча-2 $ Pn(t)&- (11.4.5) о «=' о С другой стороны, результат (11.2.13) нельзя использовать без модификации, потому что psn обращается в нуль при п > 0. Поэтому вычисления необходимо проделать заново. Интегралы по времени в (11.4.5) — мы обозначим их рп—суще- ствуют для каждого п > 1. Чтобы найти их, проинтегрируем (11.4.1) от t = 0 до t = оо: -6я,й = п(Е-1)лр„+ф(Е-1-\)прп +^-(Е —1)п(п— \)~рп. (11.4.6) Таким образом, задача снова сводится к нахождению оператора, обратного к W, а не его полного спектрального разрешения. Для того чтобы решить (11.4.6), введём удобные обозначения Тогда для п > а J-П («—!), c„- pi. " glg2 • • • gn (11.4.7) (H.4.8) имеем ГпРп — gn-lPn-l = 0 (H.4.9) = g»-ig»-2--.ga = gaPa (П > а). Г П г г г / U ff Л ! и \ г / •пгп-1 ••• 'а-ы ёпсп и, следовательно Для 1 п а имеем ГпРп~ gn-iPn-t^ — J, тогда уравнение (11.4.6) для п-— а дает —J =1. Далее для п=1 имеем р1=\/г1, потому что go = 0. Следовательно, Р = 1 Г 1 I gn-i I gn-lgn-2 1 | gre-lgn-2 • gl I . n'~rn\ rn-l Гп-гГп-ъ ' ' ’ j ГП_1ГЯ_2 Г1 J ’ ' = k.-i + <4-2+- •• + <1 (!<«<«). (11.4.10) 292
Подстановка (11.4.9) и (11.4.10) в (11.4.5) дает окончательный ре- зультат: а ч — 1 оо а - 1 = Е (11.4.11) п=1«Г»С% = 0 n=a+lg»C»v=0 Второй вопрос состоит в том, какова вероятность выживания для малой популяции. Как уже упоминалось, й-разложение можно использовать в тех случаях, когда начальная популяция порядка й. В этом разложении пренебрегается возможность флуктуации, приво- дящей к значению п = 0, что является очень хорошим приближением для популяции макроскопического размера. Предположим, однако, что начальная популяция состоит из малого числа индивидуумов. Тогда й-разложение бесполезно и вероятность вымирания на началь- ной стадии не является пренебрежимой. Чтобы вычислить 1 ее, сформулируем нашу задачу как задачу о вероятности разделения: либо популяция вымрет в течение на- чальной стадии, либо она выживет и достигнет макроскопического размера. Тогда мы поместим границу при некотором макроскопи- ческом значении п~-а, для которого можно взять йср5, и будем искать вероятности ла и того, что п достигнет в первый раз а или 0. Ответ дается (11.3.11), или в наших теперешних обозначениях т а-1 ^-Ecv-г/ V Cv. (Ц.4.12) v=1 v=m Упражнение. Покажите, что вероятность того, что единственная бактерия породит макроскопическую популяцию, есть л« (1) = I—H р Ьг р — а Упражнение. Подставьте (11.4.7) в (11.4.12) и покажите, что (11.4.12) нечувст- вительно к точному выбору а при условии, что а — порядка Q н не должно быть намного больше, чем Q<p< Упражнение. Найдите стационарное решение (11.4.1) (в котором постоянный поток вероятности из бесконечности компенсирует потери в р0). Упражнение. Если в течение одного поколения случится так, что будут рож- даться только мужские особи, вид прекратит свое существование. Оцените вероятности того, что это случится с homo sapiens в течение ближайших 6000 лет. Сравните результат с вероятностью того, что вид не переживет своей начальной стадии, как, например, в случае, если бы Адам и Ева имели только сыновей. 11.5. КРИТИЧЕСКИЕ ФЛУКТУАЦИИ Пусть —стационарное макросостояние, cq. 0 (срс) = 0. Мы видели, что <рс по крайней мере локально устойчиво, если 0 (срс) < 0, и неустойчиво, если а(, о (фс) > 0. Если a(,o(<Pc) = O, то, вообще го- воря, оно может быть неустойчиво, но может быть и устойчиво. Напри- 293
мер, если в <р, “1,0 = “1,о = “1,о = О, то <"о<0. (11.5,1) Рис. 35. Макроскопическая скорость в критической точке Тот факт, что такое <рс устойчиво, сразу виден из рис. 35, Это ясно также из сравнения с рис. 32, если понимать, что данную ситуацию можно рассматривать как предельный случай, в котором все три стационар- ных состояния срд, срь, срс совпадают. Таким образом, название критиче- ская точка подходит к макросостоя- нию, обладающему свойствами (11.5.1). Многие его особенности имеют общие черты с критическими точками в рав- новесной статистической механике. Устойчивость критической точки намног о слабее, чем у обычных устой- чивых ‘••ск и <рс, показанных на рис. Зе Этого нельзя обнаружить из уравнения для вариации (9.3.5), a hwkho включить высшие поряд- ки 6ф. Действительно, для ср — фе~5ф, согласно (11.5.1), имеем =—41 “i-’° । +° (ёф4)- Когда начальное значение 6<р достаточно мало и равно 6ф0 при t = /0, а последним членом можно пренебречь, имеем решение бср =------- — б<Ро -------------- - V 14-^5-1 а'1', 0 (фс) | G—/о) Т О (11.5.2) Отсюда следует, что 6<р действительно стремится к нулю, но только не экспоненциально, а как Это критическое замедление макро- Рис. 36. Макроскопическая скорость в метастабильной критической точке скопического приближения к равнове- сию. Мы хотим вычислить флуктуации относительно <рс, т. е. мы хотим вычис- лить мезосостояние, связанное с макро- состоянием срс. В ситуации, изображен- ной на рис. 35, это мезосостояние сов- падает со стационарным решением Ps основного кинетического уравнения, по- тому что фс является единственным стационарным макросостоянием (если бы были другие, как на рис. 36, то Фс было бы метастабильным и Ps име- ло бы другой максимум или, возможно, всюду было бы равно нулю, как в задаче с популяцией из предыдущего параграфа). И все же, несмотря на это, мы применим й-разложение, которое не от- личается для устойчивого и метастабильного мезосостояний. 294
Разложение (9.2.6) больше не проходит в качестве отправной точки, потому чю, согласно (11.5.1), члены, записанные в первой строке слагаемого в правой части, все равны нулю. И только член ccj о, не вписанный и имеющий порядок Й-1, не равен нулю. Но этот член несет ответственность за ограничение флуктуации, которые вызываются членами, выписанными во второй строке. Наш вывод состоит в том, что флуктуации будут пропорциональны высшим степеням <2, что отличается от предсказания (9.2.9). Это и есть эффект усиления флуктуаций вблизи критической точки, как в кри- тической опалесценции. Мы тоже теперь попробуем вместо (9.2.9) записать х = й<р₽ + й^. (11.5.3) Константа р пока не определена и является варьируемым парамет- ром, однако она ограничена условием р < 1. Преобразованное основ- ное кинетическое уравнение имеет вид ^ = __QI--U^aiio((fc+Qg-1^n+|Q1-2U_Ja2io((Pf + Qu-^)n+...^ = - i 2<« k ?3П + 4 - 2ца2,0 Ы п + .. . . (11.5.4) Понятно, что, для того чтобы член, порождающий флуктуацию, вы- писанный во второй строке, и ограничивающий член, выписанный в первой строке, имели одинаковый порядок величины *, нужно взять ц = 3/4. В результате опять получается уравнение Фоккера — Планка, но теперь уже нелинейное: -S’ = */! [ I I <'» I 4^ЗП + I ° 1F ] ( 1 1 -5-5) Таким образом, мы получили, что вблизи критической точки флук- туации имеют порядок Q3/4, а не П1/2. Кроме того, множитель Q-1'2 показывает, что их время релакса- ции увеличивается на величину по- рядка Й1/2. Далее, их распределение П не является гауссовым. Это разложение по степеням П~3М справедливо только в самой крити- ческой точке. Если изменить пара- метр так, чтобы получилась ситуа- ция, изображенная на рис. 37, т. е. оказаться слегка «выше критической Рис. 37. Макроскопическая ско- рость в области немного выше критической точки точки», то исходное разложение по параметру Й-1/2 нужно использовать независимо от того, насколь- ко близко мы подходим к критической точке. * R. Kubo, К- Matsuo and К. Kitahara, J. Statist. Phys. 9,51 (1973); [8]. 295
По мере приближения к критической точке разложение по пара- метру Q-1/2 становится менее полезным, поскольку, для того что- бы обеспечить малость высших членов, нужны все большие и боль- шие значения, но формально оно является правильным асимптоти- ческим разложением. Тот факт, что асимптотическое разложение в критической точке меняется скачком, называют явлением Стокса*. Для получения раз- ложения, пригодного как в самой критической точке, так и в ее окрестности, необходимы другие методы**. Упражнение. Покажите, что стационарное решение с ai,o(<p) = O, ai,i(<p)-O. a’l.o (ф) 0 неустойчиво. Упражнение. Проверьте, что члены, опущенные в (11.5.4), имеют более высо- кий порядок, чем удержанные. Упражнение. Найдите стационарное решение (11.5.5) и убедитесь, что оно не гауссово. Упражнение. Повторите рассуждение для случая, когда все производные от ах> 0 вплоть до а^>0 (<рс) обращаются в нуль. Упражнение. Найдите равновесные флуктуации в критической точке для реак- ции Шлегла (9.3.6). vV а b ! I Х0 Рис. 38. Симметричный биста- бильный потенциал 11.6. ДИФФУЗИЯ В ПОТЕНЦИАЛЕ С ДВУМЯ ЯМАМИ В этом разделе мы рассмотрим другой вид бистабильности, ана- логичный, но не тождественный тому, который рассматривался до сих пор в связи с одношаговыми процессами. Возьмем квазилиней- ное уравнение Фоккера — Планка (10.2.4) для диффузии во внешнем по- тенциале U (х): дР (х, I) _ П д_ Д ^Р /11 с i \ ——(И-6-1) Предположим, что U (х)— бистабиль- ный потенциал, имеющий вид, изобра- женный на рис. 38. Для некоторых частных видов U (х) это уравнение бы- ло решено явно***. Однако в общем случае явные решения, за исключени- ем стационарного, неизвестны. Для начала можно применить такое же разложение, как в гл. 9, но параметром разложения, как в § 10.5, будет служить 0, а не SJ-1. Вместо макроскопического уравнения мы получим теперь низко- температурное детерминистическое уравнение: х = — (11.6.2) * Р. М. Morse and Н. Feshbach, Methods of Theoretical Physics I (McGraw- Hill, New York, 1953), p. 609. ** H. Dekker, Physica 103A, 55 and 80 (1980). *** N. G. van Kampen, J. Statist. Phys. 17, 71 (1977); H. Brand and A. Schenzle, Phys. Lett. 68A, 427 (1978); M. Morsch, H. Risken and H. D. Vollmer, Z. Phys. B32, 245 (1979); M. Razavy, Phys. Lett. 72A, 89 (1979). 296
Это приближение является хорошим, когда выполняется условие устойчивости U" (х) >0, но в окрестности неустойчивой точки b на рис. 38 это уже не так. Вблизи этой точйи решения уравнения (11.6.2) теряют физический смысл, потому что их уже нельзя отли- чить от флуктуации, как мы это видели в § 11.1. В этом случае решения уравнения (11.6.1) с начальным условием 6(х—х0) при х0, близких к Ь, нельзя получить как решения (11.6.2) плюс малые флуктуации. Однако явные выражения для времен перехода тса и тас, а также для вероятностей разделения ла(х0) и лс(х0)* можно получить с помощью того же примера, что использован в § 11.2 и 11.3. И опять тса можно отождествить со средним временем первого прохождения частицы, первоначально находящейся в а, а затем диффундирующей в с. Соответственно мы ставим поглощающую гра- ницу в с и записываем преобразование Лапласа от уравнения (11.6.1): — 6(х—х0)4- sP(x, s|xe)=-^-^t/'(x) + 0-^-| Р(х, s|x0). (11.6.3) Полагаем Р(х, s|x0) = s~lP's(x)-t-i|’(x, s|x0) и используем уравнение обновления для того, чтобы получить аналог (6.10.14). В резуль- тате получаем ъ. —f(O)-’|,,C-O|$~YC,O'“)- (4.6.4) г Vе/ При s = 0 уравнение (11.6.3) можно решить явно. Подставив резуль- тат в (11.6.4), по аналогии с (11.2.14) получим с х = У pi(x')dx'' (И.6.5) а — оо Точно так же, повторив вычисления § 11.3, по аналогии с (11.3.11) для вероятности разделения в уравнении диффузии (11.6.1) получим с с х„ с =У / У =eU w/edx / УeL'(x)/e dx- (11 -6-6) x„ a b b Упражнение. Получите (11.6.5), не применяя преобразования Лапласа, а путем непосредств'енного интегрирования основного кинетического уравнения no t от нуля до бесконечности, как при вычислении вероятности разделе- ния в § 11.3. Упражнение. Покажите, что (11.6.5) практически дает .. с С dx (1L6-7> а и, следовательно, (11.1.5) удовлетворяется. * Аналогичные задачи в случае большего числа измерений изучены в ра- боте: Z. Schuss, Theory and Applications of Stochastic Differential Equations (Wiley, New York, 1980). 297
Упражнение. Предположим, что U (х) имеет последовательность минимумов* а, Ь, с, но U (± оо) = + оо, что обеспечивает нормировку Ps (х) Время перехода тс(, нельзя отождествить со средним временем первого прохож- дения из b в с. Однако можно найти все времена переходов с помощью (11.1.5): jrS 1 е dx 0 J P'W b (11.6.8) Упражнение. В потенциале из предыдущего упражнения можно также вычис- лить тСб, поместив отражающую границу между а и Ь, а затем вычислив время первого прохождения из & в с. Покажите, что в результате снова получится (11.6.8). Упражнение. Пусть U имеет три минимума: а, Ь, с. Предположим также, что барьер между бис намного выше барьера между а и Ь. Тогда ^с । ла Tbe ' Т Упражнение. Молекула А диффундирует в растворе, содержащем одну задан- ную молекулу В. Когда А попадает на сферу радиуса б вокруг В, проис- ходит реакция, в результате которой молекула исчезает. Покажите, что, когда А в начальном положении находится на расстоянии г0, вероятность того, что она прореагирует, а не уйдет в бесконечность, есть Ь/г0. Другой путь анализа (11.6.1) состоит в сведении его к задаче на собственные значения, как в § 5.7. Положим Р (х, () = Ф(х)е~и, 0 <и-6-9> Собственными значениями являются такие значения —X, для кото- рых соответствующее значение обладает конечной нормой в смысле скалярного произведения (5.7.4): Ф (х)2 Ps(x) dx < оо. Одно собственное значение есть /.о = О с Фо (х) = Ps (х). Все другие собственные значения —Х„(л=1, 2, 3, ...) действительно отрица- тельны и невырождены, а соответствующим образом нормированные собственные функции Фи (х) удовлетворяют условию (Ф„, Ф„) = 6„.и(п, m = 0, 1, 2, ...). §|Фи(х)е-^. (11.6.10) Решение уравнения (11.6.1) имеет вид Р(х, /|х„ 0)=Р-(х) + £ __________ п= 1 * Такие потенциалы изучались в связи с переходами спираль — клубок в гетерополимерах: De Gennes Р. G., J. Statist. Phys. 12, 463 (1975). 298
Эти утверждения справедливы для любого U (х), достаточно быстро стремящегося к бесконечности при |х|—>оо. Для симметричного бистабильного потенциала U, изображенного на рис. 38, из квантовой механики хорошо известна следующая дополнительная информация. Основное состояние Фо симметрично, имеет два горба вблизи а и с, очень близко к нулю в Ь. Следую- щая собственная функция Фх антисимметрична, равна нулю в точке Ь, имеет практически те же самые горбы, что и Фо, но только один из них с отрицательным знаком, скажем, горб вблизи а. Ее собст- венное значение очень близко к основному уровню Zo = O. Вто- рая собственная функция Ф2 симметрична и имеет два нуля; л2 много больше, чем Следовательно, для точная формула (11.6.10) приближенно может быть записана в виде Р(х, t |х0, 0)«Р’И + кЙФ1Ме-1’'. Из этой формулы, во-первых, следует, что 00 n+(x0) = jP(x, /|х0, 0)dx=:y+ у , ь а во-вторых, что тас = 1/?ч. К сожалению, имеется несколько услож- нений в связи с тем, что (11.6.9) немного отличается от уравнения Шредингера. Его можно преобразовать в него, полагая, как в (8.7.15), что Ф (х) = <р (х) ехр [— U (х)/(20)]. Тогда (11.6.9) превращается в + V(x)}<p = 0, V( , 1 __1 dat/ V W “ 40 \ dx J 2 dx2 ' Отсюда видно, что связь между V и потенциалом V в уравне- нии Шредингера не является простой, в частности оказывается, что бистабильный U может привести к потенциалу V с тремя миниму- мами. Утверждения относительно собственных значений остаются в силе, однако не столь очевидны, как это предполагалось выше. Тем не менее таким путем можно получить явные значения для Х+ (х0) и для тае. Несимметричные потенциалы также можно иссле- довать с помощью разложения по собственным функциям *. * Н. Tomita, A. Ito and Н. Kidachi, Prog. Theor. Phys. 56, 786 (1976); К- Matsuo, J. Statist. Phys. 16, 169 (1977); R. S. Larson and M. D. Kostin, J. Chem. Phys. 69, 4821 (1978); B. Caroli, C. Caroli and B. Roulet, J. Statist. Phys. 21, 415 (1979). 29»
Упражнение. Покажите, что спектр собственных значений для уравнения (11.6.9) действительно является дискретным, если Ux ~ | х |“ при |х|—> оо, где а > 1. Упражнение. Обоснуйте утверждение, что тас=1Д1. Упражнение. Потенциал U (х) =—у ах2х* является бистабильным, когда а > 0. Покажите, что соответствующий потенциал V (х) также бистабилен, когда а2 < 60, но имеет три минимума, когда а2 > 60. Упражнение. Время, за которое частица достигает точки с, стартуя из х0, предлагалось в качестве соответствующего параметра для изучения диффу- зии в бистабильном потенциале *. Покажите, что его среднее значение и дис- персию можно найти точно, выразив их через интегралы от Ps. 11.7. ПАРАБОЛИЧЕСКОЕ ПРИБЛИЖЕНИЕ Вычисления, проделанные в предыдущем параграфе, и даже сами определения времени перехода и вероятности разделения предпола- гают, что высота потенциального барьера достаточно велика, так что Ps очень мала в неустойчивой точке. Точнее, время перехода хса должно быть значительно больше времени, необходимого для уста- новления локального равновесия в каждой отдельной яме. Так ли это в действительности, зависит от функции U и от значения 0. Для любого фиксированного бистабильного U этого можно добиться всегда, выбирая малое 0. Однако в этом пределе возможны и дру- тие упрощения. Рассмотрим выражение (11.6.7) для тса. Оно представляет собой интеграл от положительной функции с пиком при х = Ь, который становится очень острым при малых 0. В окрестности этого пика имеем ns 1 nfrvfl 1 Г U(b) , ,ч,1 ps = — е- и W/e = — ехр [---~ 4- 2ек (х— 6)2] с нормирующим множителем Z = J e-t'W/Odx. (11.7.1) - 00 Тогда для (11.6.7) получаем {1 + 0(0)}. (П.7.2) Подынтегральное выражение в (11.7.1) имеет два пика в точках а и с; следовательно, Z = e-^«)/e j/Z^ + e-^]/. (11.7.3) Если U (с) > U (а), второй член экспоненциально мал по срав- нению с первым и по сравнению с поправками, имеющими относи- тельный порядок 0. Этими поправками мы пренебрегли в первом * F. Т. Arecchi and A. Politi, Phys. Letters 77A, 312 (1980). 300
члене. Значит, "удерживая оба члена, мы нарушаем условие сов- местности, если только U (а) не равно U (с). Поэтому мы предполо- жим, что выполняется условие U (a) = U (с), и для удобства возьмем симметричную функцию U (х), чтобы оба члена в (11.7.3) оказались равными, тогда (11.7.2) дает т 2л (117 4) Мы видим, что получился множитель Аррениуса, но множитель, стоящий перед ним, также получен явно и выражается через потенциал. Аналогичные приближения можно применить к (11.6.6) и в ре- зультате получить ь Если | х01 мало, то это сводится к Мхв)=4-}/ exp[--±|t/"(&)|(x-b)2]dx = ЧЧЧ |ЛЖШ(Хо-/,)1. (11.7.6) Упражнение. Два члена в (11.7.3) представляют собой Znsa и Ziisc соответст- венно. Найдите физическую интерпретацию их отношения Лд/л| для слу- чая, когда U (а) U (с). Упражнение. Для симметричного потенциала при х0 > Ь имеем lira lim Р(х, 11 х0, 0) = б (х—с), t -* ® 0 -> о lim lim Р (х, t1 х0, 0) = 4-б(х—а) + 4- б (х—с). 0 о t «. 2 2 Запишите аналогичные формулы для асимметричного U. Упражнение. Примените приближенный метод изложенный в тексте непосред- ственно к (11.6.5), а не к (11.6.7), и получите таким способом результат (11.7.4). Упражнение. При определении хса, с самого начала предполагается, что оно значительно превосходит время, необходимое для установления локаль- * ного равновесия в каждой яме, которое можно взять равным [{/"(а)]-1. Тогда (11.7.4) предполагаете настолько малым, что l(/(Z>)-t/(a)l r|t/’(*)l|V2 ехр|~—§--------• Таким образом, множитель Аррениуса имеет смысл только тогда, когда он велик. Эти вычисления применимы в пределе 0 —> 0, когда U (х) фикси- ровано. Чтобы понять, дают ли эти вычисления достаточно хорошее приближение при любом заданном значении 0, не равном нулю, нужно глубже разобраться в этом вопросе. 301
Рассмотрим приближение (11.7.4) для времени перехода. В это выражение входят только некоторые характеристики функции U (х), такие, как высота потенциального барьера и вторые производные в точках минимума и максимума. Это означает, что вблизи этих точек потенциал аппроксимируется параболой, что равносильно лине- аризации функции U' (х) в (11.6.1). Мы будем называть это парабо- лическим приближением (а не линеаризацией, потому что это больше соответствует сути дела). Пусть 1а—характерный размер области вблизи точки а, в которой функцию U (а) можно заменить параболой. В большинстве случаев можно взять меньшее из значений la^\U"(a)/U’*(a)\ или /а ~ (t/"(a)/t/,v (а) |1/2. ' J Тогда выражение (11.7.3) справедливо, если выполняется условие U”(a)l2a>Q. (11.7.8) Пусть 1Ь — аналогичный характерный размер окрестности ft; тогда условие справедливости (11.7.4) требует выполнения неравенства \U”(b)\H>Q. (11.7.9) Итак, мы выписали два условия, выполнение которых необходимо для того, чтобы выражение (11.6.7) аппроксимировать формулой (11.7.4). Выражение (11.7.5) также включает приближение, основанное на условии (11.7.9). В (11.7.6) интеграл, встретившийся в (11.7.5), вновь преобразуется с использованием параболического приближения для U. Это оправдано, когда х0—Ь<1ь. (11.7.10) Однако (11.7.6) можно использовать даже тогда, когда все х0>-Ь, потому что для х0—b > 1Ь это то же самое условие. Неравенство (11.7.9) показывает, что ла(х0) все равно оказывается практически равным нулю независимо от того, используется ли выражение (11.7.5) или (11.7.6). Итак, мы приходим к выводу, что параболическое приближение для U можно применять для вероятности разделения, когда выпол- няется (11.7.9), и для вероятности перехода, когда выполняются условия (11.7.8) и (11.7.9). Сузуки * предложил более формальный путь для введения пара- болического приближения. Мы даем упрощенную версию. Сделаем замену переменной в (11.6.1), подставив в нее t/ = 0-1/2(x—Ь): dJL&dl = 0-1/2 (J> (ft + Qi/ty) р + ™ dt ду v v ду2 ^ия(Ь)^уР + ~ + ~Ви'ЦЬ)^у-Р... . (11.7.11) * М. Suzuki, J. Statist. Phys. 16, 11 and 477 (1977); F. Haake, Phys. Rev. Letters 41, 1685 (1978); B. Caroli and B. Roulet, Physica 101A, 581 (1980). 302
В нулевом порядке получается линейное уравнение Фоккера — Планка, решение которого имеет вид Р(У, t\y., 0) = [2л (е2"(—I)]-1'2 ехр С11-712) z(е 1) j где и == 11/'(6) |. Это распределение Гаусса, центральная точка i/oe“f которого быстро удаляется от неустойчивой точки, а ширина (e2“f —1)1/2 быстро возрастает. Это приближение остается справед- ливым до тех пор, пока распределение не достигнет нелинейной области t/oe“< + (e3af —1)1/г < (11.7.13) Так как 6 предполагается малым, то это довольно слабое ограничение на время t, в течение которого (11.7.12) остается справедливым. Причина, по которой оказалось возможным простое разложение по 0, состоит в том, что мы неявно положили х0 — fo = 0i/2i/o, отсюда, следует, что эта величина меняется как 01/2, а не остается фикси- рованной. Как мы видели, предел 9 -- -0 для (11.6.1) с фиксирован- ным значением х0 приводит просто к детерминистическому уравне- нию без флуктуаций, способных перебросить систему через потен- циальный максимум. В пределе Сузуки этой трудности удается избежать, если позволить х„ двигаться по направлению к этому максимуму с одновременным уменьшением флуктуаций. В этом смысле (11.7.12) является систематическим нулевым приближением решения (11.6.1) для начального периода, определяемого (11.7.13). Причина, по которой этот период возрастает с убыванием 0, состоит в том, что начальная точка х„ оказывается ближе к неустойчивости так что, для того чтобы выйти за пределы 1Ь и попасть нелиней- ную область, требуется большее время. Для того чтобы полностью определить, как эволюционирует плотность вероятности для начального периода, можно использовать параболическое приближение, а затем применить П-разложение отдельно для каждой ямы. Для того чтобы это было возможно, должно существовать время ts достаточно малое для того, чтобы при t < tSf выполнялось (11.7.12), но достаточно большое, чтобы поток вероятности через потенциальный барьер был пренебрежимо мал при t > ts. Первое условие выражается соотношением (11.7.13), или огруб- ление (t/0+l)e“^< Z60-V2. (11.7.14) Второе условие дает 1^-1 «~^=е~г“^е —г^/2<<1. (11.7.15) I <^Ь=о К 2л v Однако мы не хотим, чтобы у9 оказалось настолько большим, чтобы этот поток вероятности обратился в нуль даже при / = 0, и поэтому 303
полагаем у0~1. Тогда условие (11.7.15) равносильно требованию е-"^<^1. Это согласуется с (11.7.14) при условии, что 01/2<^/ь. В пределе 9-0, когда у0 фиксировано, это условие, естественно, удовлетворяется. Упражнение. Когда выражения (11.7.7) дают плохую оценку для 1а? Упражнение. При х(|—b > 1Ь выведите приближенное выражение , 1 1/~в । ,,'пл. Г U(b) — U(x№)\ ЛаМ=\(ГМ1 V (д),еХР1------------------§----J ' 11.8. ПРЕДЕЛЬНЫЕ ЦИКЛЫ И ФЛУКТУАЦИИ В § 9.5 было показано, что Q-разложение в равной степени применимо к основным кинетическим уравнениям и в случае многих переменных при условии, что макроскопические уравнения имеют единственное глобально устойчивое стационарное решение. Единст- венное отличие от случая, когда имеется одна переменная, состоит Рис. 39. Предельный цикл, окружающий неустойчивую точку в том, что общего метода решения макроскопических уравнений не существует. Однако в неустойчивых ситуациях возникает дополнительное от- личие, состоящее в том, что может быть гораздо больше неустойчивостей, чем в слу- чае одной переменной. Возникает и новое явление: система двух нелинейных ма- кроскопических уравнений может обла- дать предельным циклом (рис. 39). Когда кривая, изображающая реше- ние на фазовой плоскости, замкнута, она представляет периодическое решение или, скорее, семейство периодических решений с различными фазами. Такая замкнутая кривая решения является предельным циклом, если все другие кривые решения (по крайней мере внутри некоторой притя- гивающей области) стремятся к ней. Это означает, что все решения дифференциальных уравнений (внутри этой области) в конце концов становятся периодическими, причем период и амплитуда, опреде- ляемые уравнением, у них одинаковы, в то время как фаза зависит от начальных условий частного решения. Другими словами, пре- дельный цикл представляет собой асимптотически устойчивую орбиту в фазовом пространстве, соответствующие ему периодические реше- ния называют орбитально устойчивыми. Они не являются асимпто- тически устойчивыми в обычном смысле, поскольку разность фаз между ними никогда не исчезает. Ван-дер-Поль построил классический пример дифференциального уравнения, обладающего предельным циклом, как модель, описываю- щую колебания, производимые генератором частот. Наиболее извест- 304
ним примером из химии является реакция Жаботинского*. Многие периодические явления, известные в биологии, вероятно, также можно описать аналогичным способом**. Еще одним примером вымышленной химической реакции с двумя компонентами X и V, обладающей предельным циклом, является «Б рюсселятор» * * *: А-Х, B + X-^Y + D, 2XH-Y-3X, X —>-Е. (11-8.1) «Брюсселятор» описывает открытую систему с переносом из А в Е и из В в D. Эта модель отчасти нереалистична, поскольку она включает в себя реакцию, которая происходит только тогда, когда сталкиваются три молекулы. Другой моделью, лишенной этого недо- статка, является «Орегонатор»****, который, однако, сложнее, по- скольку в реакции участвуют три вещества: X, Y, Z. Однако это неизбежно, поскольку можно доказать, что в системах, включающих лишь два реагента, способных вступать только в бимолекулярные реакции, предельных циклов не существует *****. Основное кинетическое уравнение с двумя переменными, описы- вающее реакцию (11.8.1) в соответствующих единицах, записывается в виде = Йа (Е^1 — 1) рпт + ₽ (Е^1 — 1) прП1Я + + й~2 (Е-1ЕИ -1) п2трпт + (Е„ —1) прпт. (11.8.2) Полагая, как в § 9.5, п = йср (/) 4- й1/2?, т — йф (/) + 521/2т], получаем макроскопические уравнения для скоростей реакции в тер- минах концентраций <р, ф: Ф = а + ф2ф— 0<р—ср, (11.8.3а) ф = р<р—ф2ф. (11.8.36) Должны существовать также две переменные интегрирования, но одна из них просто является сдвигом по t и определяет фазу. Кри- вые решения в (ф, ф)-плоскости представляют собой однопараметри- * J. J. Tyson, The Belousov-Zhabotinskii Reaction (Lecture Notes in Bio- mathematics 10; Springer, Berlin, 1976). ** G. Nicolis and I. Prigogine, Self-Organization in Non-Equilibrium Systems (Wiley-lnterscience, New York, 1977). *** Glansdorf and I. Prigigine, Structure, Stability and Fluctuations (Wiley- lnterscience, London, 1971). **** R. J. Field and R. M. Noyes, J. Chem. Phys. 60, 1877 (1974); J. J. Tyson, loc. cit. ***** p. Hanusse, Comptes Rendus Paris. C274, 1245 (1972); J. Tyson and J. Light, J. Chem. Phys. 59, 4164 (1973). 305
ческое семейство. Тщательное изучение* показало, что в определен- ной области значений аир имеется одна замкнутая кривая, являющаяся предельным циклом. Эти свойства макроскопических уравнений влияют на флуктуации относительно периодических решений. Такое влияние можно вычис- лить более подробно**, дело затрудняет лишь отсутствие явных решений (11.8.3). Здесь мы просто наметим качественное описание. Рассмотрим решение основного кинетического уравнения, которое при / = 0 представляет собой дельта-пик, расположенный в некото- рой точке (ф0, фо) на макроскопическом предельном цикле. Форма распределения вероятности (в приближении линейного шума) описы- вается уравнением ^Н^Л^==(-2фф + р+1)^Ш-Ф2^-пП + + (_р + 2фф)Д?П + ф^^т1П4- + + (11.8.4) 2 dg2 ' 2 дт)/ ’ ' ' где (ф, ф— зависящее от времени периодическое решение с началь- ными значениями ф„, ф0. Члены в последней строке определяют тенденцию к уширению П. Если бы уравнения (11.8.3) были асимпто- тически устойчивы, эта тенденция сдерживалась бы первыми произ- водными, потому что асимптотическая устойчивость означает, что все отклонения стремятся к нулю. В этом случае флуктуации остава- лись бы малыми, как в § 9.5. В случае же предельного цикла, с которым мы сейчас столкнулись, это сдерживание будет работать только против флуктуаций, перпендикулярных ему, поскольку все макроскопические решения возвращаются на предельный цикл. Однако флуктуация в направлении вдоль предельного цикла .не имеет тенденции к возвращению. Она только меняет фазу, а система не обладает противодействующим механизмом, который возвращал бы фазу к начальному значению. Следующая флуктуация может умень- шить это отклонение, но с таким же успехом может и увеличить его. В результате П расширяется в направлении предельного цикла, так же как расширяется плотность вероятности броуновской частицы в одномерном случае. Следовательно, ширина вдоль предельного цикла возрастает пропорционально К t. В результате этого приближение линейного шума и даже само й разложение нарушаются при t ~ й. Теперь интуиция подсказывает нам дальнейший ход событий. Плотность вероятности будет продол- жать расширяться, пока не покроет весь предельный цикл, в то же время она останется узкой в перпендикулярном направлении. Полу- чившееся в результате распределение Р (п, т, oo) = Ps(n, tri) будет иметь вид кратера с горным хребтом на месте макроскопического * R. Lefever and G. Nicolis, J. Theor. Biol. 30, 267 (1971); ** K. Tomita, T. Ohta and H. Tomita, Prog. Theor. Phys. 52, 1744 (1974); [8J. 306
предельного цикла. Это означает полную потерю информации о на- чальной фазе. В генераторах частот этот фазовый сдвиг приводит к уширению диапазона генерируемых частот. Все это следует из отсутствия асимптотической устойчивости для возмущений, парал- лельных предельному циклу. Упражнение. Проверьте вышеупомянутую оценку для времени, по про- шествии которого флуктуации перестают быть малыми. Упражнение. Найдите стационарное решение (11.8.3) и покажите, что оно не- устойчиво, когда р > а2+1. Упражнение. Докажите, что внутри предельного цикла должна быть устойчи- вая стационарная точка. Упражнение. Возьмем в (11.8.3) частные значения а—1, р=3. Докажите, что имеется предельный цикл. Для доказательства воспользуйтесь следующим методом *. Имеется одно неустойчивое стационарное решение. Оно окру- жено контуром, через который все решения попадают во внутреннюю область. Этот контур образован осью и прямыми y = 5,84-J-x, у=7,84—х. Упражнение. Из (11.8.4) найдите <g2>, <£п>, <т]2>. Они удовлетворяют (8.6.6). Как отражается на уравнении тот факт, что моменты не ограничены? 11.9. ЛАЗЕР КАК ДИФФУЗИОННАЯ СИСТЕМА Квантовая механика играет важную роль в микроскопическом описании большинства физических систем. При мезоскопическом описании мы также много раз обращались к ней. В большинстве случаев квантовая механика была нужна для определения множества состояний. В качестве примера можно указать теорию одномолеку- лярных реакций, обсуждавшихся в § 7.5, или лазеры из § 6.4. Кроме того, квантовая механика оказывается полезной, если мы интересуемся истинными значениями вероятностей перехода (напри- мер, гармонический осциллятор из § 6.4). Квантовая механика оказывается на вторых ролях в связи с тем, что мезоскопическое описание является огрубленным. Каждое мезо- скопическое состояние состоит из такого большого количества кван- тово-механических состояний, что перекрестные корреляции между амплитудами вероятностей этих состояний разрушаются и остаются только сами вероятности. Естественно, это оказывается правильным только в специфическом представлении. До сих пор правильное представление, в котором перекрестные корреляции являются дейст- вительно пренебрежимыми, было довольно очевидным и выбиралось неявно. В упомянутых примерах эти представления определялись числом фотонов, колебательными состояниями молекулы или гармо- нического осциллятора. Теория лазеров не является исключением из общей схемы, но выбор соответствующего представления требует более тонкого под- хода. Нельзя описывать лазер как полость, содержащую фотоны, которые испускаются и поглощаются с определенной вероятностью. Акты испускания и поглощения фотонов не являются случайными событиями, потому что нельзя пренебречь фазовыми соотношениями * J. J. Tyson, loc. cit. 307
с полем. Следовательно, задача состоит в том, чтобы найти такое представление, в котором фазовыми корреляциями между квантово- механическими состояниями можно пренебречь. Это представление может служить основой для мезоскопического описания. Подробное рассмотрение этого вопроса выходит за пределы данной книги, и поэтому мы просто воспроизведем окончательный вид стохасти- ческого уравнения *, известный из литературы. Рассмотрим электромагнитное поле в среде, состоящей из двух- уровневых атомов, которые вследствие внешнего воздействия пере- водятся в возбужденное состояние, или, как говорят в таких слу- чаях, накачиваются. Будем исходить из классических уравнений для поля Е в среде с плотностью поляризации Р. Это позволит учесть фазовые соотношения между атомами и полями. В некотором приближении для комплексной амплитуды Еа каждой моды** имеем л р _ р — 2 1 Если бы атомы были гармоническими осцилляторами, то Ра было бы пропорционально Еы, как в теории Максвелла—Лоренца. Однако, для двухуровневых атомов это соотношение нелинейно: = №2ЕЬ>+ .... Здесь Е2— полное поле, но мы пока ограничимся рассмотрением единственной моды, так что Е2--|£ы|2. Тогда получим уравнение движения для единственной неизвестной величины Еы: dtEb> = ab>Eb> — bb>\Eb>\2Eb>. (11.9.1) В общем случае аы— комплексная величина, но если со попадает в резонанс с расстоянием между уровнями, она действительна. Мы ограничимся этим случаем и поэтому опустим индекс со. Тогда- а пропорциональна скорости накачки, а коэффициент b является по- ложительной постоянной величиной***. До сих пор вывод из микроскопических уравнений был доста- точно прямолинейным. Однако теперь следует учесть, что имеются потери вследствие утечки излучения через концевые зеркала, а также вследствие спонтанного излучения атомов в другие моды. Кроме того, существует шум, обусловленный случайностью излуче- ния. Эти эффекты в данном случае учитывают, добавляя член, * М. Lax in: Statistical Physics. Phase Transitions and Superfluids (1966 Brandeis University Summer Institute in Theoretical Physics; M. Chretien, E. P. Gross and S. Deser eds., Gordon and Breach, New York, 1968); H. Haken in: Encyclopaedia of Physics 25/2c (Springer, Berlin, 1970); M. Sargent, M. O. Scully and W. E. Lamb, Laser Physics (Addison-Wesley, Reading, Mass., 1974); H. Haken, Synergetics (Springer, Berlin, 1976 and 1978). ** Sargent, Scully and Lamb. loc. cit., p. 100, equation (11). *** В присутствии поглотителя ft может стать отрицательным в соответст- вии с результатами работы: М. Sargent and С. Cantrell, Optics Comm. 15, 13 (1975). 308
описывающий затухание, и случайную силу: dtE = (а—с) Е — b | Е |2 Е + L (t). (11.9.2) Здесь L(t) — комплексный процесс Ланжевена: <£(0> = О, = <Л(/)А(О*> = W —О- Следует подчеркнуть, что этот способ подключения флуктуаций, хотя является удобным и позволяет заменить точное описание ис- точников шума (ср. с § 8.8), не имеет серьезного обоснования. Та- кой подход может дать качественное понимание влияния шума на уравнения, описывающие лазер, но не позволяет списать его на- стоящего механизма. Например, флуктуации в накачке должны привести к случайности в коэффициенте а, но не описываются ад- дитивным членом. Однако, поскольку уравнение (11.9.2) широко изучено, оно с успехом может служить примером стохастического процесса *. В приближении детерминированного процесса, полученном пре- небрежением L (/), можно показать, что при а < с (скорость накач- ки меньше потерь) поле стремится к нулю. В стационарном состоя- нии имеется только поле, вызванное флуктуирующим членом. При больших скоростях накачки (а > с) поле возрастает до стационар- ного значения (11.9.3) Это решение устойчиво относительно амплитуды: любые малые от- клонения от (11.9.3) экспоненциально малы. Однако оно не может быть глобально устойчивым, потому что имеется другое стационар- ное, хотя и неустойчивое решение, а именно £ = 0. Однако (11.9.3) неустойчиво по отношению к фазе (см. упражнение ниже). Согласно § 8.8, для (11.9.2) можно записать уравнения Фок- кера— Планка. Поскольку (11.9.2) на самом деле является систе- мой двух уравнений для действительной и мнимой частей Е', Е" поля Е, мы получили уравнение для распределения вероятности, зависящего от Р (Е', Е", t)dE'dE". Однако Р (Е', £", /) удобнее записать как функцию, зависящую от Е, Е*. Но это та же самая плотность вероятности в плоскости Е', Е”, хотя часто пишут dE dE* для d£' dE”. Тогда уравнение Фоккера^—Планка, соответ- ствующее (11.9.3), имеет вид** —~t------- - - (и—С~~Ь\Е\2) ЕР — д г№Р + (11.9.4) * Более сложное рассмотрение дается в работе: К- Heep and Е. Н. Lieb, Annals Phys. 76, 360 (1973); см. также: Р. A. Martin, Modeles en mecanique statistique des processus irreversibles (lecture Notes in Physics 103; Springer, Berlin, 1979). Ch. IV. ** H. Risken, Z. Phys. 186, 85 (1965) and 191, 302 (1966). 309
Упражнение. Тот факт, что при а > с напряженность поля принимает конеч- ное значение (11.9.3), называют насыщением. Почему в линейных уравне- ниях насыщение невозможно? Упражнение. Выведите из (11.9.2) детерминистическое уравнение для напря- женности поля s = | £ |2 и покажите, что для а < с стационарное решение х = 0 глобально устойчиво. Для а > с это решение неустойчиво, но тогда (11.9.3) локально устойчиво. Упражнение. Выведите (11.9.4), показав, что первые два момента распределе- ния согласуются с полученными из (11.9.2). Упражнение. Найдите стационарное решение уравнения (11.9.4). Почему нельзя найти Г с помощью одной из разновидностей флуктуационно-диссипатив- ной теоремы? Упражнение. Докажите, что все решения (11.9.4) приближаются к стационар- ному решению. Упражнение. Введите полярные координаты в (£', £")-плоскости, полагая £=)' se1'<f, и преобразуйте (11.9.4) к виду ^^ = -24-(a_c_fts)sP+r.(4-s-^+^^|. (И.9.5)’ dt ds J ds ds 1 4s Af2 ( Упражнение. Из (11.9.5) выведите детерминистическое уравнение для s. Согла- суется ли оно с уравнением, выведенным выше? Это пример трудностей, возникающих при бездумном использовании уравнений Ланжевена (см. § 8.9). Нелинейное уравнение Фоккера — Планка (11.9.4) или (11.9.5} содержит всю информацию относительно одночастотного лазера и флуктуаций в рамках настоящей модели. К сожалению, его нельзя решить явно, но можно сделать некоторые выводы, изучая различ- ные предельные случаи. При этом, однако, следует помнить, что настоящая модель не была выведена как систематическое прибли- жение для настоящих уравнений движения, описывающих лазер, и поэтому некоторые детали могут оказаться неточными. Флуктуации не связаны с тепловым движением, а вызываются случайным характером процесса излучения. Поэтому температура не подходит в качестве параметра разложения в отличие от случая, рассмотренного в § 10.5. Тогда, чтобы получить детерминистическое уравнение, положим Г = 0 и будем считать, что Г может изменяться независимо от а, Ь, с. Детерминистическое уравнение, которое мы получим в результате, будет таким же, как и полученное из (11.9.2) при L = 0: i = 2(a—c)s—2te2 = —(11.9.6) V(s) = — (a—c)s2 + -|-fe3. (11.9.7) Это уравнение описывает движение заторможенной частицы в потенциале V (рис. 40). Мы видим, что имеется одно стационарное состояние ниже по- рога накачки, которое становится неустойчивым выше порога, когда появляется другое устойчивое состояние, а именно s = = (о—с)/Ь, согласно (11.9.3). 310
Теперь возьмем Г > 0. Стационарное решение (11.9.5) можно найти явно: Ps(s) = const-ехр —c)s—y&saj-]. (11.9.8) При а<с его максимум расположен при s = 0. Значения Ps(0) яв- ляются устойчивым стационарным решением (11.9.1) и (11.9.6.) При а > с его максимум расположен при d = (a—c)/b*. На самом деле Ps представляет собой распределение в (£', £")-плоскости, которое оказывает- ся независимым от угла ср. Его мак- симум является горным кольцом, име- ющим вид кратера, что означает, что фаза полностью не определе- на. Рис. 40. Схематический вид Скорость, С которой S прибли- потенциала (11.9.7) жается к d, можно найти из (11.9.6), она приблизительно равна Ух2(а—с). Время, необходи- мое для того чтобы решение <р распространилось по всему гор- ному хребту, приблизительно равно тф— л2(2^/Г). При малых Г это время значительно превосходит т5, тогда поле Е сначала достигает своей стационарной амплитуды, а затем уже фаза решения распро- страняется по всему горному хребту. Эта неопределенность фазы линии испускаемого излучения лазера увеличивает ширину (ср. с (8.3.12)): л 1 Г Дсо ---------, д . тф | Е |2 (11.9.9) Хотя в этом случае предельный цикл отсутствует, распространение фазы во многом сходно с процессом, описанным в предыдущем па- раграфе. Упражнение. Почему свободная энергия в (11.9.8) не является той же самой функцией, что и потенциал V (11.9.7)? (Ср. с § 10.5.) Упражнение. В стационарном распределении (11.9.8) среднее <s> отличается от наиболее вероятного значения d на очень малую величину порядка Г1/2ехр[—М2/Г]. Но средняя амплитуда меньше, чем Уd , на величину [Г/(16£>)] d~ Сравните это с дискуссией по поводу парадокса Бриллюэна в § 8.9. Упражнение. В области намного ниже порога можно пренебречь нелинейны- ми членами в (11.9.2) и (11.9.4). В этом случае Е является процессом Орнштейна —Уленбека <£ (Н)£*(/2)У _ Г е-(с-а) | G-G | 2(с-а) * Это то же самое d, которое использовал Рискин в цитированной выше работе. Его W, г, 0, q, а соответствуют нашим Р, Уs , b, Г/4, 2 (с—а)/У bf соответственно. См. также более позднюю работу: Н. Risken and Н. D. Vol- lmer, Z, Phys. B39, 89 (1980). ЗН
(11.9.10) при условии, что с — а > 6Г. Автокорреляция напряженности дается квадратом этого выражения: «I Е (И) I2 I Е (/2) |2>у == — g-- е - 2 । ' - ।. 4 (С Q) Упражнение. В области намного выше порога (а—с> У ЬГ), для того чтобы приближенно описать флуктуации относительно стационарного решения для лазера, уравнение (11.9.5) можно линеаризовать, полагая s = d-|-a: дР(а, <р, t) ... д _ , д2Р . Г д2Р dt да да2 1 4d ду2 Покажите, что в этом случае <£(Z1)£*(Z2)>s=e-tr/(4i/)1l | оЬа «| Е (/j) |2 | Е (/2) j2»s = X е-2М ' I. Ло Проверьте оценку (11.9.9). Упражнение. В одночастотном лазере для числа фотонов п можно вывести основное кинетическое уравнение: р„ =- (Е ~1 - 1) - j +2 р„ + С (Б -1) пр„. 1 -Н D [П -|~ 1) Если пренебречь рассуждениями гл. 9 и использовать некоторые упро- щения, это уравнение можно заменить на р„- - -^[Ап ( \ — Вп)—Сп} Рп + кЛ—{Ап{\ — Вп)->гСп}рп. (11.9.11) Покажите, что в этом случае результаты выше и ниже порога аналогич- ны найденным выше, но теперь Г может иметь два различных значения. Упражнение. Если Q — размер лазера, то коэффициент в (11.9.11) оказывается пропорциональным 1/Q. Получите те же самые результаты, что и в пре- дыдущем упражнении, но только систематическим образом с помощью . Q—разложения. ГЛАВА 12 ФЛУКТУАЦИИ В НЕПРЕРЫВНЫХ СИСТЕМАХ До сих пор случайные переменные представляли собой полное число молекул, электронов, индивидумов и т. д., имеющихся в некоторой системе. Для того чтобы описать локальные флуктуации, необходимо ввести пространственную плотность как случайный объект. Вместо того чтобы иметь дело с одной или несколькими случайными переменными, мы сталкиваемся с необходимостью ввести бесконечное множество переменных. 12.1. ВВЕДЕНИЕ При изучении химических реакций мы пока что всегда описы- вали состояние смеси с помощью полного числа молекул различ- ных типов. Это предполагает, что смесь однородна и остается од- 312
нородной даже тогда, когда полные числа молекул каждого сорта флуктуируют. Любая флуктуация полного числа должна иметь время, для того чтобы распространиться по объему Q,-перед тем как она исчезнет. Это значит, что имеется некоторое среднее время, в течение которого возникшая в каком-либо месте молекула дви- жется через объем, перед тем как снова аннигилирует вследствие другой реакции. Если только реакции не происходят слишком быстро, такая картина получается в результате перемешивания, при благоприятных же обстоятельствах бывает достаточно одной диффузии. Аналогичное рассуждение оказывается применимым и к полупроводникам, популяциям и т. д. Предположим, однако, что в некоторой системе отсутствует пе- ремешивание и диффузия оказывается недостаточной. Тогда флук- туация, возникнув в одной точке, исчезнет до того, как она смо- жет достигнуть отдаленных областей данного объема. В этом случае мы имеем дело с локальным явлением, для его описания требуется большее число переменных, а именно плотности каждой компонен- ты в различных точках пространства. Это можно сделать следую- щим образом. Для простоты предположим, что имеется только один сорт частиц, как, например, в реакции (см. § 9.1) и в примерах §6.9. Разобьем полный объем Q на ячейки А и обозначим п-,, коли- чество частиц в ячейке л. Ячейки должны быть такими малыми, чтобы внутри каждой из них выполнялось упомянутое выше усло- вие однородности. Пусть Р ({пл}, t) — совместное распределение ве- роятности всех «х- В момент времени /н-d/ оно может измениться под действием двух разных процессов. Во-первых, п>, внутри каж- дой отдельной ячейки Z может измениться из-за случайного рожде- ния или аннигиляции частицы. В основном кинетическом уравнении для Р({щ.}, t) это дает со- ответствующий член. Для каждой отдельной ячейки (например, в частном случае реакции (9.1.1)) в соответствии с (9.1.4) получаем Р({М, 0 = А2(Ел-1)Р + (2А)-12(Е1-1)пНпх-1)/3- (12.1.1) л л Во-вторых, Р изменяется потому, что в течение времени d/ частица может переместиться из ячейки X в ячейку ц (не обязательно со- седнюю). Вероятность того, что частица из ячейки X переместится в ячейку р, пропорциональна А и d/, поэтому мы обозначим ее ay^Ad/. Соответствующий вклад в основное кинетическое уравне- ние составит Р({/гх}, /) = А 2^л(Ем1Ех 1)лцР. (12.1.2) А, |Х Полное изменение Р является суммой обоих вкладов. Получающе- еся в результате основное кинетическое уравнение содержит всю информацию, необходимую для вычисления локальных флуктуаций 313
в химически реагирующих системах, оно действительно было ис- пользовано для этой цели *. Искусственное разбиение пространства на дискретные области является, однако, довольно неуклюжей процедурой. В частности, вследствие этого разбиения появляется большое число констант Шцх, которые проявляются в качестве коэффициента диффузии D Эта трудность усугубляется, если возникает необходимость учиты- вать свободный разлет частиц в пространстве, как это имеет место для нейтронов в реакторе (см. § 12.4). Тогда возникает желание переписать (12.1.1) и (12.1.2) в таком виде, в котором пространст- венные координаты встречаются в качестве непрерывно изменяю- щихся параметров, а не дискретных индексов X. С этой целью мы заменим множество чисел п-,. функцией и (г), выражающей плотность частиц. Таким образом, и(г) = пх/Д, (12.1.3) где г—координаты ячейки X в пространстве (например координаты ее центра **). Тогда совместное распределение Р ({«4 t) превращается в вероятность в пространстве функций P([u(r)], /) и является функ- ционалом, зависящим от и (г), а суммирование по всем n-t, превра- щается в интегрирование по пространству функций и (г). Действительно, формально это можно сделать и получить пра- вильные результаты для моментов и корреляционных функций. Однако более прямой и математически более безопасный путь состоит в том, чтобы из дискретной формулировки сначала вывести уравнения для моментов основного кинетического уравнения, а уже затем записать их как непрерывные функции пространственных координат. Этот так называемый метод составных моментов описывается в следующих двух параграфах. Примечание. Плотность вероятности в функциональном пространстве и ин- тегрирование по всем функциям математически не определены. Это связано с тем, что мы небрежно ввели огромное количество очень быстро меняющихся функций и (г). Они не имеют физического смысла, потому что (12.1.3) опре- деляет и (г) как интерполяцию чисел на решетке. Следовательно, задача состоит в том, чтобы найти математически согласованный и физически удовлетвори- тельный метод ограничения функционального пространства на достаточно глад- кие функции. Однако эту задачу решать не нужно, потому что получающиеся в результате уравнения для моментов приводят к правильным результатам. Упражнение. Запишите основное кинетическое уравнение для локального рас- пределения носителей зарядов в полупроводнике из § 6.9, предполагая, что они переносятся в результате процесса диффузии. * G. Nicolis and I. Prigogine, Proc. Nat’l Acad. Sci. USA 68, 2102 (1971); C. W. Gardiner. K. J. McNeil, D. F. Walls and J. S. Matheson, J. Statist. Phys. 14, 307 (1976); C. van den Broeck. W. Horsthemke and M. Malek-Man- sour, Physica 89 A, 339 (1977); M. DelleDonne and P. Ortoleva, J. Statist. Phys. 18, 319 (1978). ** Из-за бедности алфавита для обозначения плотности я вынужден исполь- зовать непривычный символ и. 314
Упражнение. Критерием достаточности диффузии для поддержания однородно- сти служит соотношение DT>/2, (12.1.4) где т — среднее время жизни частицы, а /—диаметр сосуда. 12.2. ДИФФУЗИОННЫЙ ШУМ Сначала рассмотрим диффузионную часть (12.2) основного кине- тического уравнения для Р({пк}, t). В предыдущей главе были полу- чены различные диффузионные уравнения для одночастичной вероят- ности Р(г, t). Уравнение (12.2) описывает набор независимых частиц. Переход от одночастичного к многочастичному описанию представ- лен в § 7.6. Сопоставление (12.1.2) и (12.6.4) для среднего значения дает dt <па> = A S {“W <пк> — &ка <»а>} = A S waX <Пх>. (12.2.1) X к Флуктуации описываются выражением (7.6.8) в терминах факториаль- ных кумулянтов: dt = A S waX [мап₽] + А [папк]. (12.2.2) К к Напомним, что в соответствии с определением (1.3.12) [маПр] =• <naMp> —<na> <Пр> —6ap</ia>. (12.2.3) Перепишем эти уравнения в непрерывных обозначениях. Исполь- зуем (12.1.3) и заменим на w(r/r'). Суммирование вместе с мно- жителем А становится интегрированием, тогда (12.2.1) принимает вид dt <u(r)>= J w (r/r') <u (r')> dr'. (12.2.4) Чтобы переписать (12.2.2) таким же способом, мы должны сначала определить факториальный кумулянт в непрерывном случае. Раз- делим (12.2.3) на А2 и заменим а, 0 на гх, г2: [и (rj и (г2)] = <и (rj и (г2)> — <и (rj> <и (г2)> — 6 (П — г2) <м (rt)>. (12.2.5) Здесь мы использовали тот факт, что |е^б(Г1_Г2), (12.2.6) Для факториального кумулянта плотности (12.2.5) из (12.2.2) полу- чаем уравнение dt [и (и) и (r2)] = w (ri/r') [и (г') и (r2)] dr' + + $ w(r2/r')[u(r1)«(r')]dr'. (12.2.7) Все это справедливо независимо от того, какой вид имеют вероят- ности перехода w^. или w(r/r'). Если они изотропны, а скачки малы 315
по сравнению с характерным масштабом :i (г), оператор w можно заменить его диффузионным приближением: w £>V2. В результате (12.2.4) превращается в уравнение диффузии dt <и (r)> = £>V2 <и (r)>. (12.2.8) Это уравнение описывает среднюю плотность. Флуктуации описы- ваются уравнением dt [и (fl) и (r2)] = D (V2 -i- V2) [и (г,) и (г2)], (12.2.9) которое легко получить из (12.2.7). Упражнение. Выведите (12.2.1) и (12.2.2) непосредственно из (12.1.2). Упражнение. Обоснуйте (12.2.6), показав, что для произвольных гладко меняю щихся наборов {па), {та} имеет место соотношение X па (6ар/Л) тр = и (г) 6 (г —г') v (г') dr dr', ар где и и v—плотности, соответствующие пит. Упражнение. Выведите из (12.2.9) соотношение для ковариации плотности: {д,—©V? —«и (rt) и (r2)>> =2DVi • V2 {6 (г,—г2) <и (гг)>}. (12.2.10) Упражнение. Для электронов в полупроводнике, помещенном в постоянном поле F, в соответствующих единицах имеем д(<и(г)>= — Fx V (и (r)> + £>v2 <и (г)>, (12.2.11а) {б/ + Fx(Vi + V2) — O( Vi+ V2)} «« (И) и (г2)» = = 2DVJX V2 {6 (r, —г2) <и (г,))}. (12.2.116) Упражнение. Флуктуации плотности прн диффузии впервые были вычислены Ван Влиетом * с использованием следующего подхода, похожего на при- ближение Ланжевена. Предполагается, что плотность и и ток J удовлетво- ряют уравнениям фи=—VXJ, J = Fu—Dv« + L(r, t); <L(r. /)>=0, <L,(r, /')>==2D6,7S(r—r')S(/ —/')<u(r, /)>. (12.2.12) Покажите, что формально это приводит к тому же самому результату (12.2.11). Отметим, однако, что L не является настоящей силой Ланже- вена, потому что ее стохастические свойства зависят от частного решения (12.2.11а). Упражнение. Для одномерной диффузии в неоднородной среде, описывающейся (10.3.2), покажите, что (х,) Vi — У£>(х2) у2) «и (х,)и (x2)» = 2viV2D(x1) <и (х,)> 6(х,—х2). Соответствующий член Ланжевена получается заменой (12.2.12) на <£(х, t)L(x', t')y=2D(x)$(x—x')b(t—t')<ji(x, t)y. * К. М. van Vliet, J. Mathem. Phys. 12, 1981 en 1998 (1971). 316
12.3. МЕТОД СОСТАВНЫХ МОМЕНТОВ Теперь рассмотрим флуктуации, возникающие в химических реак- циях. Возьмем пример более простой, чем (12.1.1), а именно реак- цию (6.4.7). Описывающее ее основное кинетическое уравнение (6.4.8), применимое к отдельным ячейкам, немного изменив обозначения, можно записать в виде Р({пк}, O^ZfEx-OzuP + hASCEx1-!)?. (12.3.1) Л Л Если читатель выполнил упражнение, то ему не составит труда вы- вести соотношения: dt<n^> = b\ — a<nay, (12.3.2а) dt (пап$) = —- 2а [мамр]. (12.3.26) Разделив эти соотношения Д и использовав непрерывные обозна- чения, получим dt<u(r)y = Ь — а<и(г)у, (12.3.3а) dt [и (п) и (г2)] = — 2а [м (п) и (г2)]. (12.3.36) Воздействие реакции диффузии можно объединить, если заметить, что моменты изменяются со временем за счет обоих механизмов. Тогда для реакции в присутствии диффузии из (12.3.3а) и (12.2.8} получаем dt <и (г)> = 6—о <u (r)> + DV2 <и (r)>, (12.3.4а} а из (12.3.36) и (12.2.9) следует dt [и (г,) и (r2)] = {О (VI + V!)—2й} [и (п) и (г2)]. (12.3.46} Используемый метод называют методом составных моментов. В таком подходе удается избежать явного использования вероятно- сти в функциональном пространстве. Аналогичные уравнения можно записать для высших моментов. В качестве приложения этих уравнений изучим флуктуации в равно- весии. Из (12.3.4а) получаем равновесное решение: <и>е = Ь/а. (12.3.5) Из (12.3.4) для [и (rj и (r2)]e = g (| г,— г21) получаем {2DV2 — 2a}g(r) = 0. Поскольку флуктуации не могут возрастать экспоненциально, для больших г решение имеет вид „ Р“ХГ g(r) = A—— , v? = a/D. Для ковариации флуктуаций имеем «и (п) и (га)»е = 6 (п—г2) <и (гг>е 4- g (| п—г21). 317
Интеграл от нее по переменной rt или г2 должен обращаться в нуль. Из этого условия находим значение А. Результат имеет вид «и(г1)ц(г2)»е' = |]б(Г1-г2) —к (12.3.6) 0 < ™ I • 1—' 2| f Теперь рассмотрим корреляцию равновесных флуктуаций в двух разных точках пространства и в два различные момента времени: «и(Г1, ti)u(r2, /2)>Z = G (г2 —гь /2-/х). (12.3.7) Возьмем t2 > tr и вычислим из (12.3.4а) среднюю плотность <и(г2, /2) при условии, что и и (г,, задано: <u(r2, G)>cond = ^u?e + e-aU>-^ [4nD(f2 —/JJ-^x xJexp [-4^3;)]!“^ ^)-<«>е}^г'. Умножим на u(rb /j) — <u>e и усредним произведение по значениям и (Fl, t), считая их равновесными и используя (12.3.6). В резуль- тате для t > 0 получим (j (г, t)~ e~at (4nDt)~-j е- Е<'<«о'П — __.g. Je-E(r-na/(4D/)]12Ld3r^. (12.3.8) Упражнение. Проверьте (12.3.26). Упражнение. Пусть Vi и V2 —две области пространства, которые могут пере- крываться. Пусть N (Vi), N (V2)—количество частиц в каждой из ннх. Вычислите «.V (KJ Л’ (Г2)>>е. Упражнение. Для эксперимента с рассеянием нужно знать преобразование Фурье от (12.3.8): о .г ,__2 ООе_____Dk?_____ /19 Т Q1 )“ (2л)2 (a + D*2)2 + c02 ‘ ' ’9) Упражнение. Таким же способом изучите реакцию В—>2Х, X—>Д. Упражнение. Решите (12.3.4) в зависящем от времени случае, определив на- чальное условие и (г, 0) = 0. Упражнение. Решите (12.3.4) с и (г, 0) —-= 6 (г) и получите е- 2d^ Г г2 -Р г/2 | «и (п) и (r2)»t = S (п—r3) <и (Fi)>f+ ехр------. Выведите отсюда результат для любого заданного и (г, 0). Упражнение. Рассмотрите флуктуации плотности радиоактивного вещества, растворенного в жидкости и подвергающегося воздействию диффузии. Если при t =0 плотность в точности равна, то 4 < ' Q-2at Г —Г)2 | | «" (гг) и (r2)»f = и0 J 6 (П-Г2) е-«С- n —ехр I--. Тот факт, что часть основного кинетического уравнения (12.3.1) оказалась линейной, существенно упростил рассмотрение вышепри- 318
веденного примера. Теперь снова рассмотрим реакцию, изучавшуюся в § 9.1 для случая полного перемешивания. Чтобы получить урав- нение для первого и второго моментов, нужно применить й-разло- жение к каждой отдельной ячейке, т. е. нужно разложить основное кинетическое уравнение (12.1.1) для случая многих переменных по степеням Д-1^. Это накладывает дополнительное условие на размер ячейки, состоящее в том, что Д должно быть достаточно большим, чтобы содержать много частиц. Мы предлагаем читателям самостоя- тельно провести вычисления и приведем лишь результат: д(<па>=-Д—Д-1<па>2, (12.3.10а) <<папр» =-- — 2Д"1 (<па> + <Пр» <<мам₽» -г -t 6ар{Д + 2Д-1<ма>2}. (12.3.106) Проделав эту подготовительную работу, перейдем к непрерыв- ному описанию, разделив уравнения на Д и Д2 соответственно. За- пишем их в терминах плотности и (г): <?t<u(r)> = 1 —<и(г)>2, (12.3.11а) dt «и (п) и (г2)>> = — 2 {<« (rj> + <и (г2)>} «и (п) и (г2)>> + Ч-6(Г1 —г2){1+2<«(г)>2}. (12.3.116) Для факториального кумулянта последнее уравнение дает dt [и (п) и (г2)] = — 2 {<и (гг)> -г <и (г2)>). [и (rj и (г2) — 6 (п - г2) <« (rt)>2. (12.3.11в) Теперь можно добавить воздействие диффузии: dt 'и (r)> = 1 —<и (г)>24- £>V2 <u (г)>, (12.3.12а) dt [«(г,) и (г2)] = — 2 {<и (rj> + <и (ге)>} [и (г,) и (г2)] — - 6 (Г1 - г2) <« (Г1)>2 4- D (V? + VD и (г,) и (r2)]. (12.3.126) Эти уравнения описывают локальные флуктуации в химической реакции. Давайте воспользуемся этими уравнениями для того, чтобы найти флуктуации в равновесии, считая полный объем бесконечным. В соот- ветствии с (12.3.12а) макросостояние соответствует (в наших едини- цах) <ц(г)>е=1. Тогда (12.3.126) сводится к D (V2 4- Т|) [и (rt) и (г2)]е = 4 [и (п) и (г2)е 4- 6 (rt — г2). (12.3.13) Поскольку величина [и (rj и (г2)]е должна быть функцией, зависящей только от |ri—г21, и не может экспоненциально возрастать, един- ственно возможным решением является , -(2/О)>/2 |Г,-Г2| [и (г,) и (г2)1е =-3—=-----:------i----. L ' 17 ' 8лО |п—r2| 319
Для ковариации это дает в первоначальных единицах (9.1.3) сле- дующее выражение: I -z2 е-х 1 Г|~Гг I 1 «и (rj и (г2)> >е = <и>е [ 6 (гх — г2) —- |- _Г2| j-, (12.3.14} где <w>e == Vk<fA/(2k') и х2 = 2 V2kk'ifA/D. В соответствии с (9.1.3) вероятность того, что за единичное время молекула X исчезнет (в равновесии), есть 2й'<п>е й = К2/г/г'(рл, а ее среднее время жизни является обратной к этому величиной. Понятно, что х-1 является мерой расстояния, на которое диффундирует моле- кула за свое время жизни. Выделим в бесконечном объеме область V, линейные размеры которой велики по сравнению с х”1. Дисперсия числа Nv молекул X в объеме V получается путем интегрирования (12.3.14). Результат имеет вид* «^г;>>е = <Л^>ф (12.3.15) Этот результат совпадает с (9.1.3), полученным для случая с тща- тельным перемешиванием. Причина состоит в том, что объем V слишком велик для того, чтобы диффузия могла установить мате- риальный обмен с окружающей объем средой. С другой стороны, когда объем V мал по сравнению с х-1, диф- фузия оказывается существенной, но ее воздействие зависит, конечно,, от формы объема V. И все’же можно оценить интеграл (12.3.14): <<лгр»е = <и>е (12.3.16) I 1 v I I где I — размер порядка диаметра области V. В пределе малого объема V это выражение стремится к <Л'г>е, как в распределении Пуассона. Причина состоит в том, что влияние флуктуаций, вызван- ных диффузией, превосходит воздействие химической реакции**. Окончательно, если реакция происходит в конечном объеме й, нужно решать уравнение (12.3.13) -в этом объеме с граничным усло- вием, состоящим в том, что нормальные производные от и обра- щаются в нуль на стенках. Если диаметр й мал по сравнению с х'1, то решение имеет вид [ц (Г1Ы (г2)]е = - 16 (П - г2). (12.3.17) Отсюда снова получаем (9.1.13). * Y. Kuramoto, Prog. Theor. Phys. 49, 1782 (1973); A. Nitzan and J. Ross, J. Statist. Phys. 10, 379 (1974). ** Эта разница между большим и малым объемами была отмечена в работе: Y. Kuramoto, Prog. Theor. Phys. 52, 711 (1974). Я предлагаю называть х-1 радиусом Курамото. См. также: L. Brenig and С. van den Broeck, Phys. Rev. A21, 1039 (1980). 320
Упражнение. Выведите (12.3.10). Упражнение. Для Фурье —преобразования (11.3.14) получите выражение Р 3., /и2 \ -..Си (г,) и (га)>>₽е,к <Г1 r=’ d (Г1— гг) = <»>е 4 + 4fe2', которое является формулой, выведенной Курамото. Отсюда легко получить оба предельных случая. Упражнение. Решите (12.3.13) в конечном кубе и получите (12.3.7) в пределе D - 0. 12.4. ФЛУКТУАЦИИ ПЛОТНОСТИ В ФАЗОВОМ ПРОСТРАНСТВЕ До сих пор мы рассматриваем перенос частиц только за счет диффузии. Как упоминалось в § 12.1, непрерывное описание не является строго необходимым, потому что процесс диффузии можно описать как скачки между ячейками и таким образом включить ее в основное кинетическое уравнение для многих переменных. Теперь рассмотрим частицы, которые свободно движутся и которые в этом случае можно описывать не только координатами г, но и скоро- стями V. Ячейки Л являются шестимерными ячейками в одночастич- ном фазовом пространстве. До тех пор, пока не происходит реак- ции, скорость v постоянна, а координата г непрерывно изменяется. В результате распределение вероятности изменяется таким образом, что его нельзя описать последовательностью скачков, а нужно использовать дифференциальный оператор. Таким образом, мы при- ходим к необходимости непрерывного описания. Но и в этом случае можно воспользоваться методом составных моментов. Мы продемонстрируем метод на следующем конкретном, быть может в чем-то тривиальном, примере. Сгусток частиц свободно движется в пространстве, но каждая частица может исчезнуть с вероятностью а. Это может произойти вследствие спонтанного распада или столкновения, в результате которого произойдет реак- ция. Для того чтобы учесть последнюю возможность, предположим, что а может зависеть от v. Разделим (г, у)-пространство на ячейки Л и обозначим /г, чщло частиц в ячейке X. Совместное распределение вероятности Р ({«>,', !) может изменяться вследствие распада и вслед- ствие движения частиц. Распад описывается формулой Р (12.4.1) А Из нее следуют соотношения для моментов: 3, п,Л,> и„ па>, (12 4.2а) д, - п^ПрУу -- - (а.Л--Ор) и,лПрУ,.-~дг^а„ па', (12.4.26) (У, <4(>.) I//,/7(11. (12.4.2b) При непрерывном описании dt си (г, v)z -• - u(v) си (г, v)>, (12.4.3а) d, |н (Г), V]) и (Г2, v2)]-—-- {tz(Vj) +-fi(u2)} iz(r,, Vj/zfr,. V,)]. (12.4.36) Отметим, что в этом случае - 6 (г, — г2) 6 (v, - v.,). 321
Теперь легко добавить члены следующим образом: dt <u(r, v)> = — a(v)u(r, v)> — v V <и(г, v)>, (12.4.4а) dt [и (г1я Vj) и (г2, v2)] = — {а («О + а (и2) + + v1-V1 + v2V2} [и (п, Vx)w(r2, v2)]. (12.4.46) В случае диффузии, для того чтобы учесть случайный характер диффузии, было существенным добавить адеквативные члены к фак- ториальному кумулянту, а не к дисперсии, но в настоящем случае это не имеет значения. Мы используем факториальные кумулянты только потому, что с ними уравнения получаются проще. Эти урав- нения легко решить. Предположим, что начальная плотность задана и имеет вид u0(r, v). Тогда (12.4.4) дает <u(r, v)>t = е~а (и) ‘и,, (г—W, v), (12.4.5а) [u(rlt vjufo, v2)]f = e_<a(u>)+a(U2,H х X[u(rt —Vj/, v2/, v2)]0 = = —— r2)6(v! — v.,)^^! — vxt, yj. (12.4.56) Соответственно ««(G, v1)w(r2, v2)»t = 6(rI — r2)6(v!—v2){l— e-^-H}<u(rb vjx (12.4.6) и по аналогии c (12.3.8) для находим «u(rb vn ^)u(r2, v2, Z2)» = 6{r1—r2 + V!G2—4)} 6(V! — v2)x xe-a(«,)/2 j}—e_a(Ui) z‘} u0 (r, — Vj/j, Vi). (12.4.7) Естественно, не существует никакого равновесного состояния, кроме тождественного нулю. Следующий пример менее тривиален, но, к сожалению, урав- нения для флуктуаций слишком сложны, чтобы их можно было вычислить детально. Рассмотрим полупроводник, в котором носители заряда находятся в состояниях, описывающихся в псевдомоментах к, которые в данном случае совпадают со скоростью. Они производятся в единичном объеме со скоростью bk или рекомбинируют со ско- ростью akw, где w — пространственная плотность вакантных доноров. Разделим координатное пространство на ячейки Л, пронумерован- ные числами X. Импульсное пространство состоит из дискретных уравнений к. Совместное распределение вероятности числа ва- кантных доноров и числа носителей заряда описывается урав- нением Р ({«лк}, {"М, 0==Л2*к (EmxEn^— 1) Р + Лк + А-*2 ак (Е“* ЕПк — 1) тК пКкР. (12.4.8) 322
.Для первых моментов отсюда можно вывести соотношение dt <та> = — Л s Ьк + Л"1 <"ia> 2 ак <Пак> + о (Л0), к к df {ПакУ — Д^к & 1^к '(fleck? ~|~ О (Л°). Координатное пространство можно сделать непрерывным, если ввести плотности ау(г) и ик(г): dt<w(r)> = — 2fck + <ьУ(ф2«к<Нк(г)>, (12.4.9а) к к <3t<Wk(r)> = 6k — ак <и»(г)> <«к(г)>. (12.4.96) Для того чтобы перейти к непрерывному описанию и, в к-прост- ранстве предположим, что в ячейке фазового пространства d3k имеется p(k)d3k уровней. Число носителей заряда в такой ячейке есть и (г, k)d3k. Тогда (12.4.9) принимает вид dt <w (r)> = — dk P (k) d3k + <&y (r)> ak <u (r, k)> d3k, (12.4.10a) df<u(r, k)> = fc>k P (&)—aftO(r)><w(r, k)>. (12.4.106) Теперь легко добавить члены, описывающие движение в пространстве под влиянием приближенной силы F. Естественно, (12.4.10а) не меняется, потому что доноры фиксированы, а (12.4.106) принимает вид dt<u (г, k)> = bkp(/i) — ak<w(r)> <u(r, k)> — —(k-V)<«(r, k)> — (F-Vk)<w(r, k)>. (12.4.11) Это и есть макроскопические уравнения, которые можно было бы вывести непосредственно из макроскопической картины. Для того чтобы определить также и флуктуации, нужно (12.4.8) системати- чески разложить по параметру Д-’G, найти уравнения для вторых моментов в приближении линейного шума и дополнить их потоко- выми членами. Однако, поскольку в нашем случае имеется два случайных поля и (г, к) и й>(г), уравнения усложняются, и поэтому мы здесь их подробно не рассматриваем. Упражнение. Упростите модель полупроводника, полагая для вероятности рекомбинации akw = ck независимо от доноров. Найдите для этой минера- лизованной модели функцию G (г, Z), определенную в (12.3.7). Упражнение. Найдите стационарное решение уравнений (12.4.10а) и (12.4.11) в одномерном случае: <w (x)>s = w = const, k <и(х, 6)>s = у J bk’fi (k') dk' exp k ^ak„dk" k' (12.4.12) (предполагается, что bkp(k) стремится к нулю при больших | k |, но для ак это уже не так). Как найти ш? Упражнение. Найдите также стационарное решение уравнения (12.4.11) в трех- мерном случае. 323
Упражнение. Из (12.4.12) для малых F выверите соотношение <« {х. k)y _ _р_ * dk Получите из этого выражения формулу для линейной части проводимости: a=e2 С ‘ е J ак \dka(k)j ' J ак — X — X Упражнение. Нейтроны в ядерном реакторе ведут себя как свободные частицы до тех пор, пока они не поглощаются, не рассеиваются или не вызывают деления и, следовательно, воспроизводства большего числа нейтронов. Основное кинетическое уравнение для совместного распределения вероят- ности чисел заполнения ячеек фазового пространства А. имеет вид Р({п}- 0-2 2 ...I М {Е-’Е-1 ... Е-^ЕЛ—1}пЛР. К т--0 {|А} Функция <?(,(/.) описывает поглощение, (jx | А) — рассеяние, qm(rn > 1) — деление. Выведите уравнения для первого и второго моментов, преобра- зуйте нх к непрерывным обозначениям и добавьте члены, описывающие перенос. В результате получится уравнение переноса нейтронов, вклю- чающее флуктуации *. 12.5. ФЛУКТУАЦИИ И УРАВНЕНИЕ БОЛЬЦМАНА В этом параграфе содержится уже достаточно сложное прило- жение метода составных моментов. Этот метод применяется к зна- менитому уравнению Больцмана** Pi) Pi df „ , df —Ji-------~ ^Г Ь (Г1) = - $ w(ръ р21 р3, р4) Ь(Гк Рз) / (гъ Рг) d3p3 d3p4 d3p2 — —Ж, Pi) $ ay(p8, p4|Pn р2)Ж, p2)d3p2d3p3d3p4. (12.5.1) Здесь )(r, p)d3rd3p обычно определяется как число молекул в ячейке d3r d3p одночастичного фазового пространства (ц-пространства) при условии, что ячейка достаточно велика, чтобы в ней содержалось много молекул, F — внешняя сила, зависящая от пространственных координат и действующая на все частицы. Это уравнение основы- вается на столкновительном члене специального вида Stosszahlansatz, что соответствует следующему предположению. Число столкновений в единичном объеме за единичное время, в течение которого две молекулы с импульсами plt р2 (в пределах d’p,. d3p2) сталкиваются * Относительно различных подходов и литератеры см.: J Lewins, Proc. Roy. Soc. A 362, 537 (1978). ** L. Boltzmann, Vorlesungen uber Gastheorie I (J. A. Barth. Leipzig, 1896): S. Chapman and T. G. Cowling. The Mathematical Theory of Non-Uniform Gases (University Press, Cambridge, 1939); C. Cercignani, Theorx and Application ol the Boltzman Equation (Scottish Acad. Press. Edinburgh. 1975г. P. Resibois and M. de Leener. Classical Kinetic Theory of Fluids (Wiley. New York, 1977i, 324
и разлетаются с импульсами р3, р4 (в пределах d3p3, d3p4), пропор- ционально произведению Ж, РгЖргЖ, p2)d3p2 чисел подходящих молекул. Коэффициент пропорциональности w сохраняет импульс и энергию: (, 2 2 2 \ р\ т* Pi ~ Р-i Р^ ’ ------------}' где о—дифференциальное сечение рассеяния, которое зависит только от |Pi — pJ-IPb--Pil и от (р4 — р2) (р3 — р4). Точное значение числа молекул в ячейке не может быть равным f (г, p)d3rd3p, потому что оно целое. Это число флуктуирует отно- сительно значения, дающегося уравнением Больцмана вследствие случайного характера столкновений, и только их вероятность опи- сывается использованным столкновительным членом. Наша цель вычислить эти флуктуации. Если / слабо отличается от равновесного распределения, уравнение Больцмана можно заменить его линеа- ризованной версией. Тогда становится возможным подключить флук- туации, добавив член Ланжевена, значение которого определяется с помощью флуктуационно-диссипативной теоремы*. Однако, как показано в § 8.9, приближения Ланжевена неприменимо вне линей- ной области. Поэтому мы стартуем с основного кинетического урав- нения и используем Й-разложение. Вся процедура состоит из че- тырех шагов. На первом шаге построим основное кинетическое уравнение, опи- сывающее воздействие случайных столкновений. Разобьем коорди- натное пространство на ячейки Д', пометив их числами л', р' и т. д.. а импульсное пространство — на ячейки А" с лотками 1", р", . ... Тем самым мы разбили одночастичное фазовое пространство на ячейки \ \' \" с метками /.(/.',/."). Пусть п-,. обозначает число молекул в ячейке X и Р ({л}, Z)—совместное распределение вероят- ности всех чисел заполнения. Столкновение переводит две молекулы из ячеек р, ст в ячейки X, р, где, конечно, р' = о' = л' — р'. Выбранная нами гипотеза о столкновительном члене означает,, что вероятность таких столкновений, отнесенная к единице времени, есть Тогда основное кинетическое уравнение имеет вид** /)2 ^.цро(Ej/E^EpEo — l)nf>naP. (12.5.2> /.р ра * A. A. Abrikosov and I. М. Khalatnikov, Sov. Phys. JETP 34, 135 (1958): M. Bixon and R. Zwanzig, Phys. Rev. 187, 267 (1969); R. F. Fox and G. E. Uhlen- beck, Phys. Fluids 13. 1893 and 2881 (1970). “ A. J. F. Siegert. Phys. Pev. 76, 1708 (1949); H. K- Janssen. Z. Phvs. 258. 243 (1973). / 325
Чтобы найти связь между ш^ра и ш(рп р21 Рэ, р4), из (12.5.2) вы- делим макроскопическое уравнение ^а — 2 ^Хцра (баХ 4" бац бар баст) /1р/1ст = Хцра = 2 2 МУарраПрПд 2«а2 ^Хцсат^а- цра Хца С другой стороны, первый член в столкновительной части уравне- ния Больцмана можно записать в виде J и' (Р1. Ра I Рз, р4) б (г, — г2) б (п — г3) б (г4 — г4) х X / (г3, р3) / (г4, р4) dr2 dp2 dr3 dp3 dr4 dp4. Поскольку n = /A'A", можно сравнить оба первых члена; с помощью (12.2.6) находим: о л 2 / \ 6Х'ц' 6Х'р' 6Х'о' 2wXpPa = A2ay (pv, Рц„|рр", Р<г)-^--дт-----— • Второй шаг состоит в разложении основного кинетического урав- нения по параметру* A~'G. Как обычно, полагаем nx = A<px 4-А 1/21х, тогда наибольшие члены дает макроскопическое уравнение фа = 2 ^Хцр<т (баХ "Г бац бар баа) фрфр, (12.5.3) Хцра которое является нелинейным уравнением Больцмана. Удобно ввести следующие обозначения: ^-’/.цра (баХ Н- бац бац бар ба<т) = IF (<Х | 7-Цро). В следующем порядке по параметру А-1/» для распределения П ({?;.}, 0 получаем линейное уравнение Фоккера — Планка в слу- чае многих переменных: дП л * V ( д д . д , д \ <. т-т , Л Хцро WKW° Ф₽5’П + А 2. ^Хцрафрфр^ Н -fit Ь ) П- (12.5.4) Хцра V S0 S° / Отсюда для первых моментов получаем д,<Ла>=2А 2 1Г(а|кИро)фр<^>. (12.5.5) Хцра Это уравнение Больцмана (12.5.3), линеаризованное вблизи макро- скопического решения ф. Отсюда видно, что среднее <па> = Асра 4- * N. G. van Kampen, Phys. Letters 50A, 237 (1974); J. Logan and M. Kac, Phys. Rev. A13, 458 (1976); M. Kac and J. Logan in: Studies in Statistical Me- chanics VII. Fluctuation Phenomena (E. W. Montroll and J. L. Lebowitz eds., North-Holland, Amsterdam, 1979). 326
+ AVs <|a> удовлетворяет нелинейному уравнению Больцмана не только в приближении, соответствующем параметру А, но и А1/2. Для вторых моментов из (12.5.4) получаем dt = 2А 2 W (а | лрра) <рр. <Sog₽> + г 2А У] W (0 | Хрра) фр <Ва|ст> + 2А 2 W (а | Лира) ф(,фр (б₽Л — бЭР) + + 2А v w (0 | 2.цра) фрфо (бах —бар). Последние две строки содержат много членов, но их можно упрос- тить, если ввести факториальные кумулянты: ~ 4“ барАфа. После достаточно длинных вычислений приходим к выражению dt [«а«р] = 2А 2 (а | Фр [«»«₽] + 2Д 2 w (01 ^Фст) Фр [«а«а] + Хцра /.рра + 2А2 2 (“»а₽рафрфа — О’роарфафр)• (12.5.6) Р° На третьем шаге запишем эти уравнения в непрерывных обо- значениях. Каждый индекс заменяется шестью параметрами г, р, тогда ^.р.р0 -* А2ш (р,, р21 р3, р4) б (г4 — г2) б (г4 — г3) б (и — г4), W (а|лцра)^Л3^(р,, р2 |р3, р4)б(г„ — г4)б(г0 — г2)б(г0 — г3) х X б (г0—г4) х {6 (р0—р1) 4- 6 (р0 — р2) — 6 (р0 — р3) — б (р0 — р4)}, теперь (12.5.3) совместно с (12.5.5) дает at<u(r4, р1)> = 2$ш(Р1, р2|р3, р4)<ы(Г1, P,)><u(r1( p4)>dp2dp3dp4— — 2 оу(Рз p4|Pi, РО<«(Г1, Pi)> <«(ri, p2)>dp2dp3dp4. (12.5.7) На последнем четвертом шаге дополним правую часть потоко- выми членами, включая внешнюю силу F (г), а именно Р)> ~ F •(г, Р)>- (12.5.8) Таким образом, мы получили полное уравнение Больцмана для величины <w(r, р)>. Аналогично, из (12.5.6) получаем (1»[ы(Г1. Pi)«(r2, р2)] = = 4 $ ш(р4, р4|р5, pe)<w(r4, ps>[u(rt, p6)w(r2, p2)]dp4dp5dp6 — — 2jw(p3, p4|Pl, p6)<w(rj, p1)>[w(r1, p„)w(r2, p2)]dp3dp4dp6 — —2 $ Мрз, p4|p6, Р1К«(Г1, Р5)? dps dp4 dpB [u (r4, pi)u(r2, p2)] + + 4 $ Мрг, P4|Ps, pe)<«(r8, p5)>[u(r1( pi)w(r2, p,)] dp4 dp6dp, — 327
— 2 $ w (p3, p41 p5, p„) «(r2, p2)> [u(r4, pj и (r2, p„)] d'p3 dp4 dp„ - — 2$ay(p3, p4)|p5, Рг) СНП, p5)> dp3 dp4 dp5 [u (r4, p4)u(r2, p2)]T H-26(ri—r2) ay(Pi, р2|Рз, p4)<«(r1, p3)><u(r1( p4)>dp3dp4 — — 26(п —r2) $ny(p3, p4| p4, p2)dp3dp4x<u(rlt p1)><n(r1, р2)>ф I 21. ±__ P£ x " .. . . F (r4) x - F (r2) ' x 1 | m dvi m dr2 17 dpi v 2 dp2 | < [«(n, Pi)u(r2, p2)]. (12.5.9) Это уравнение определяет (в приближении линейного шума) флук- туации относительно решения уравнения Больцмана <п(г, р)>. Уравнение не так страшно, как кажется на первый взгляд. Пер- вые три строки представляют собой линеаризованный оператор Больц- мана, действующий на множитель и(г4, р4) в факториальном куму- лянте. Следующие три строки — это тот же оператор, только дейст- вующий на множитель и (г2, р2). Седьмая и восьмая строки пред- ставляют собой источники флуктуаций, а записанные в восьмой строке потоковые члены добавлены к обоим множителям. Это уравнение имеет общий вид (8.6.66), когда А совпадает с линеаризованным оператором Больцмана, включая токовый член. Теперь мы используем уравнение (12.5.9) для того, чтобы вычис- лить флуктуации в равновесии*. Соответственно полагаем F -0 и <и (г, р)>е - (2nmkT)-‘^ехр | - Фо (р)- В этом случае седьмая и восьмая строки обращаются в нуль (см. упражнение ниже). Кроме того, факториальные кумулянты не зави- сят от времени, и мы запишем их как матрицу 0: |_«(П, Pi)и (г2, р2)] Pi|6|r2, р2). Тогда (12.5.9) сводится к матричному уравнению (Ь=Д0 + 0Л, (12.5.10) где А— линеаризованный оператор Больцмана Л плюс токовый член: (г4. р, | А |г2, р2)-6(г. — г2)(р1|Л|р2)-+-6(г1 — г2)6(р4, р2)^- <Pt|A|p2) -4 Jte-(Pi, р'|р". p2)<w(p")>cdp'dp"- - 2$w(p', p"|Pi, p2) dp'dp" <u (p4)>e. * Флуктуации в неравновесном электронном газе изучались в работе: S. V. Gantsevich, V. L. Gurevich and R. Katilius, Rivista Nuovo Cimento 2, 1 (1979). а флуктуации в неравновесных жидкостях в работах: D. Ronis, I. Ргос- <ia and 1. Oppenheim, Phys. Rev. А19, 1324 (1979); T. Kirkpatrick. E. G. D. Cohen and J. R. Dorfman, Phys. Rev. Letters 44, 472 (1980). 328
Оператор Л действует только на зависимость от р, имеет нулевое собственное значение и пять собственных функций рфо(р). р2фо(р). (12.5.11) которые мы будем обозначать соответственно ~ Q/(P)’MP) (/ 0. . . . 4). Все другие собственные значения отрицательны. Можно показать, что эти также являются единственными собственными флуктуа- циями А с нулевым собственным значением; все другие собственные значения А имеют отрицательную действительную часть (см. упраж- нение). Из (12.5.10) следует, что матрица (н) должна иметь вид 5 (П. р, |(->|г2, р2) УО/ДИрифДРЛ (12.5.12) < / Чтобы определить коэффициенты 0,7, воспользуемся законами со- хранения полного числа частиц, полного импульса и полной энер- гии. Они дают пять тождеств {k - 0, . .., 4); \[«(г,, р,)«(г.2. р2)|е (р2) dr2 dp2 -- - Qfe(p,) и(г,, р,) е. Подставляя (12.5.12) и выполняя интегрирование, получаем 2 (Pi) Bik - ч где \ Qy (p2)QHP2)'MP2>dp2 матрица, имеющая вид 1 0 0 0 BmkT 0 mkT 0 0 0 । 0 0 mkT 0 0 i. 0 0 0 mkT 0 ' 4mkt 0 0 0 15 (mkT)2-' Тогда 0,/ - (M Q2) (B ‘').-, и после некоторых преобразований для матрицы ковариаций плотности получаем выражение <и (Г,, Р|)«(Г,, р.2)> ' Д | б (г, г,)6(р(- р.2) (Р1) - Выводы. 1. В литературе функцию /, описываемую уравнением Больцмана, определяют по-разному: как число, среднее число, ве- роятное число или наиболее вероятное число молекул в единичной фазовой ячейке всего пространства. В нашем рассмотрении, бази- 329
рующемся на основном кинетическом уравнении, она возникает как макроскопическое значение такого числа, полученного в пределе нулевых флуктуаций. Более того, вплоть до порядка А-1 флуктуа- ции симметричны, так что / совпадает со средним значением. Но его нельзя назвать «наиболее вероятным числом», потому что оно не целое. 2. Хотя основное кинетическое уравнение более информативно, чем уравнение Больцмана, его физические предпосылки те же самые. Основным моментом является предположение о характере столкно- вений (stosszahlansatz), которое также ответственно за свойство марковости. 3. Первый член в (12.5.3) — пуассоновский. Второй член попросту означает, что если происходят флуктуации в одной точке простран- ства, то избыток молекул, импульса или энергии должен выйти из остающегося объема Q. Для больших Q, несмотря на то что молекулы взаимодействуют, эта поправка обращается в нуль и корреляция является чисто пуас- соновской. Упражнение. Покажите, что для твердых сфер массой т и диаметром d “’(Pi- Рг I Рз- Р<) = -^2-6 (Pi + Pa—Рз—р4)Ц Р1 + Р2^-Рз—р4 J (12.5.141- Указание. Начните с выражения Рзт р4- d2 ^6 [рз + n {пх(р4-Рз)} — Р1] 6 [р4 —п{пх(р4 —р3)}-р2И2п. где п —единичный вектор, направленный из центра сферы 2 в точку кон- такта, а интегрирование ведется по полусфере (р4— рз)-п > 0. Упражнение. Для более общего взаимодействия между молекулами константа d^lm2 в (12.5.14) становится функцией, зависящей от р4, р2. р3, р4, а именно дифференциальным сечением рассеяния *. Упражнение. Покажите, что в равновесии последние три строки в (12.5.9) обращаются в нуль при условии, что ш(р4, р2/р.з- Р1)~К'(Рз- Р4/Р1- Рг)- Это соотношение означает, что каждому столкновению соответствует об- ратное или восстанавливающее столкновение с равным сечением рас- сеяния **. Упражнение. Докажите следующую лемму: если Н — положительно полуопре- деленная симметричная матрица, a F— антисимметричная матрица, если собственные значения матрицы A обладают неотрицательной дей- ствительной частью. Более того, если действительная часть равна нулю, соответствующий собственный вектор является собственным вектором матриц Н и F по отдельности. Используйте эту лемму, чтобы показать, что (12.5.12) является решением уравнения (12.5.10). Упражнение. Как вычислить функцию G, определенную в (12.3.7) для больц- мановского случая? Упражнение. Примените такой же метод к газу Лоренца (хотя в данном слу- чае a priori ясно, что, согласно § 7.6, флуктуации являются пуассонов- скими). * Р. Resibois and М. de Leener loc. cit., p. 89. ** H. Huang, Statistical Mechanics (Wiley, New York, 1963). Подробное, но недостаточно удовлетворительное обсуждение случая, когда такая симметрия не имеет места, приведено в кн.: R. С. Tolman, Statistical Mechanics (Claren- don, Oxford, 1938). 330
Упражнение. Рассмотрите идеальный Ферми-газ, частицы которого могут со- вершать переходы между уровнями вследствие взаимодействия с некото- рым тепловым резервуаром. Подразделите уровни в ячейках, обозначен- ных метками ц, v, ..., каждая из которых содержит N уровней, и обо- значьте nu(= 0, 1, ..., N) соответствующие числа заполнения. Частица в ячейке р, обладает вероятностью отнесенной к единичному времени, совершить переход в v, когда ячейка v пуста. Тогда распределение веро- ятности описывается уравнением Р({п)} - 2 (ЕЦЕ-- 1) Р. ц. V Положите Яд= Л'<Рц + Л,1'2Вд и разложите по В результате полу чится макроскопическое уравнение ч V 2 {Ми (1 ~*₽г) - “'nvTv (1 -<Рц)|. И Поскольку <рц = {ехр [ец/(£Л]—соотношение детального равновесия принимает вид ехР [- 8ц/(*Г)] = wvu. ехР [- ev/• Найдите уравнение для корреляции в равновесии и проверьте, что оно удовлетворяется при eev/(iT) л «ПП nv»' = ‘Wv (eev7(*rj"+ i)3 =- kT <nvy- Примечание. В последние годы большое внимание привлекли неравновес- ные стационарные процессы, которые являются неустойчивыми и протяжен- ными в пространстве. Они могут приводить к существованию разных фаз, так что нарушается трансляционная симметрия. Они получили название «дисси- пативных структур», а первыми примерами явились ячейки Бенара и реакция Жаботинского, но они также встречаются в биологии и метеорологии. Существование таких структур является свойством макроскопических уравнений. Однако они возникают только в теории флуктуаций, поскольку в точке неустойчивости флуктуация дорастает до очень большого значения. В момент написания этих строк не существует достаточно удовлетвори- ельной математической теории таких явлений. ГЛАВА 13 СТАТИСТИКА СКАЧКООБРАЗНЫХ СОБЫТИЙ Многие из рассмотренных нами примеров были связаны со ста- тистикой величин, изменяющихся вследствие случайно приходящих- ся скачков. В этой главе мы исследуем статистику моментов време- ни, в которые происходят эти скачки. 13.1. ОСНОВНЫЕ ФОРМУЛЫ И ПРОСТОЙ ПРИМЕР Рассмотрим одношаговый процесс, в котором за единичное вре- мя частицы могут рождаться и рекомбинировать с вероятностями g (п) и г(п). Каждое рождение или рекомбинация является событием во времени, и мы будем интересоваться их статистикой. В качестве 331
примера можно привести фотопроводник, где рекомбинация проис- ходит при испускании фотона, который можно зарегистрировать. Мы сосредоточимся на событиях рекомбинации, но акты рождения можно рассмотреть таким же образом. Чтобы описать статистику этих событий, применим функции f, введенные в § 2.3. Предположим, что имеется одношаговый процесс и решение урав- нения (6.1.2) известно. Это решение мы обозначим * р(п, Z). Какова вероятность того, что произойдет событие рекомбинации в течение интервала времени между tx и /, 6/,? В случае и, частиц, подходящих в момент времени tit вероятность рекомбинации есть r(ni)d/1. Полная вероятность события получается умножением этой величины на вероятность /?(«,, ZJ иметь пх частиц в момент времени t. и суммированием по всем пр. А (А) - 2 r(nx)p(nx, (13.1.1) п,= I Рассмотрим теперь вероятность /2, (/,, Z2)dZ, dZ.2 получить одно со- бытие в течение промежутка времени tx + d?! и другое — в тече- ние Z2, /2 т dZ2. Без потери общности можно положить Z2y>Z). Вероятность первого события есть (13.1.1). После этого события у нас остается пх—1 подходящих частиц. Следовательно, вероятность иметь п.2 частиц в момент времени Z2 дается вероятностью перехода р(п„, t.21 п, — 1, Z/), определяемой уравнениями - Z1)- = V Wn,nP(n, t, - 1. Z,), (13.1.2a) /?(n.2, Zj I nx — 1, /,) 6 (n.2, nx — 1). (13.1.26) Тогда вероятность получить оба события составляет /2(Z,. ZJ 2 r(n2)p(n.2, Z2|«i - 1. 1х)г(прр(пх, ZJ. (13.1.3) rt|. n2 Простейшим примером является процесс распада, рассмотренный в § 4.6, но в этом случае результат тривиален, поскольку события распада по определению независимы. Подобное замечание справед- ливо для всех линейных процессов (см. § 7.6). Во избежание слож- ностей, присущих нелинейным процессам, мы рассмотрим здесь при мер, который является линейным, но не одношаговым процессом Однако рекомбинация происходит в один шаг, так что формулы (13.1.1) и (13.1.3) остаются справедливыми Рассмотрим химическую реакцию В> 2Х. X -А. (13.1.4) основное кинетическое уравнение для которой есть р(п, Z) --- се (Е - Г) пр - Р£2(Е"2— 1) р. (13.1.5) * В этой главе мы чаписываем индекс п в круглых скобках — исключите.!ь но для того, чтобы сделать более удобным набор текста в типографии. 332
Вероятность рекомбинации г(п)--ащ тогда, согласно (13.1.1), отсюда •следует, что ft (Л) = а<п (/,)?. (13.1.6) Далее (13.1.3) сводится к выражению, которое мы запишем в сокра- щенных обозначениях: А (6, /2) = а2 << п (/2) | пг (^i)— 1 >«1(Л)/, (13.1.7) где <п\т> обозначает условное среднее от п. Эти величины мы вы- числим для стационарного состояния. Упрощающей особенностью такого линейного примера является тот факт, что /1 и /2 включают в себя только низкие моменты п, которые можно получить не решая (13.1.2) явно. Если начальное условие имеет вид р(п, 0) = 6(п, п0), легко находим <п (/)_> • пое-а' 4 2 (f)Q/a) (1 — е~'Л'), (13.1.8а) <n>s=-2(PQ/a), (13.1.86) <п2У 3 (PQ/a) 4 (pQ а)а. (13.1.8в) Тогда в стационарном состоянии имеем соотношение Л(6) = 2рЯ, (13.1.9) которое просто означает, что плотность событий рекомбинации яв- ляется постоянной величиной, равной скорости образования молекул Далее из (13.1.8а) получаем <n(Z2)|n(<,)—l> = {n(/3)—1}е-'х<'»-'->4-2(рЯ/а) {1 — Умножая это выражение на п(/г) и усредняя по стационарному рас- пределению, получаем /2(Л, t-z) --- 4 (PQ/a)2-J-(pQ/a)e"a(Z'~fi;. Значение этого результата легче понять, если выразить его через корреляционную функцию: ёг (6, АЛ’ Е'а <п >se-a(Z’-Zi). (13.1.10) Примечание. Схема реакции (13.1.4) соответствует реакции перехода В — 2А. (13.1.11) с одним промежуточным продуктом реакции. Полная скорость в соответствии с (13.1.9) равна 2f)Q Возникает вопрос: зависят ли флуктуации в этой сум- мерной реакции от того факта, что она проходит через промежуточное состоя ние? Для того чтобы ответить на этот вопрос, нужно различать короткие вре мена порядка времени жизни а-1 вещества X и большие времена, на которых адекватно описывается реакция (13.1.11). На коротких временах флуктуации в реакции (13.1.11) рассматривать нельзя, потому что исчезновение одной молекулы В не совпадает с появлением двух молекул А. Действительно, ис чезновение молекул В является процессом Пуассона, в то время как появле- ние двух молекул А —нет в соответствии с (13.1.10). На больших временах корреляция (13.1.10) не видна, и тогда (13.1.11) практически является проце< 333-
сом Пуассона, как это было бы, если бы реакция проходила без промежуточ- ного состояния X. Упражнение. Вычисление (13.1.6) и (13.1.7) для процесса радиоактивного распада. Упражнение. Найдите статистику события рекомбинаций для химической реакции В—->-<?Х, Х-, Л (q = 2, 3, 4, . ..). Как можно понять, что корреляция становится все более положительной с увеличением q? Упражнение. Пусть R—диагональная матрица с диагональными элементами г(п). Тогда (13.1.3) можно записать как скалярное произведение, типа (5.7.4): МЧ, /2) = (рЛ Re(<’-z‘>WERp(n)). Упражнение. Запишите общую формулу для функций fn, справедливую для процессов рекомбинации и генерации, выразив ее через одношаговый процесс. Упражнение. Вычислите /3(Л, /2, t3) для событий рекомбинации в реакции (13.1.4). 13.2. СКАЧКООБРАЗНЫЕ СОБЫТИЯ В НЕЛИНЕЙНЫХ СИСТЕМАХ Хотя в примере, рассмотренном в предыдущем параграфе, основ- ное кинетическое уравнение получилось линейным, тождества (13.1.1) и (13.1.3) являются общими и их можно получить решив уравне- ние (13.1.2). Для нелинейных систем это можно сделать с помощью Q-разложения. Оказывается, однако, что, для того чтобы найти корреляцию между скачкообразными событиями, нужно выйти за пределы линейного шума. К сожалению, это сильно усложняет вы- числения*. Здесь мы рассмотрим пример, который построен макси- мально простым способом. Рассмотрим следующую схему химической реакции: В - X, Х-^А, 2Х—*С. Основное кинетическое уравнение в этом случае нелинейно: р(п, /) = а(Е — 1)пр4 PQ(E-1—l)p4-(1/2y/Q)(E2—l)n(n —1)/?. (13.2.1) Как и раньше, будем интересоваться статистикой событий X —* А во времени, так что (13.1.6) и (13.1.7) применимы. Чтобы упростить запись, выберем единицы, в которых а = у = 1, и снова рассмотрим только стационарное состояние; Q-разложение для (13.1.6) имеет вид f1(4) = Qq>4-Q1/2<B>s, где <р обозначено стационарное значение. Уравнение (13.1.7) при- нимает вид /2(^, /a)-Q2<p2 -Up/4p<bs ( Q3/2 11 (М-Q-*M>S + + Q U4)>s- Корреляция выражается с помощью следующего выражения (в уп- * См. пример в (8, гл. XII]. 334
рощенных обозначениях): (Z1; /2) = Я’/* {<«?211, -Q~‘4>)>s- <$>s} + 4 Q {«Ц Q-1 -4 Ei>s~(<bs)2}- (13.2.2) Понятно, что в порядке Q3'2 вклада не возникает, поэтому множи- тель {} в первой строке необходимо вычислить до порядка Q-1/2- Мы только наметим вычисления. Стандартный метод разложения дает макроскопическое уравне- ние, из которого для стационарного ф находим Р-Ф т Ф2. (13.2.3) Теперь надо записать уравнение для П, включающее члены порядка Из него находим dt <ь = - (1 4- 2ф) <Ь +- Й'1/2ф — Q-1/2 <Е2>- + О (Й-1), (13.2.4а) <5/<В2> = —-2 (1 --2ф) <Е2_>-г Р ( ф -4 2<р2-гО(Я-‘ 2). (13.2.46) Из последнего уравнения с начальным значением с() получаем <Л24 = Е|е“2Т + о2 (1 —е-2т) 4 О (й-’/*), где использованы обозначения т = (1 4 2ф)С „ Р4ф4-2ср2 2ф4 Зф2 2(14-2ф) ~ 2 + 4ф • После того как <£2>г найдено с точностью до требуемого поряд- ка, для (13.2.4а) получаем <Ь(==10е"т + р^(1—е-т)|ф —о2-г (о2 —?о)е-г}. (13.2.5) Отсюда следует, в частности, что bs^Q->'2^ 0(Q-4. Теперь в (13.2.5) положим — О"1'* и усреднением по Е, <«|2|E1-Q-1,2»>s = Q-1'2(^g-e-UO(Q-1), где т = (142ф)(/2 — /J. Таким же способом получаем «Е21 Si—Q” 1/2> Si>s = <J2e~T 4- О (Й-»/2). Подстановка в (13.2.2) дает gi (/х, /2) = Q (о2 — 1) е~т = Q е-d + 2<р> IG -GI. * ~г^ф Упражнение. Для одношагового процесса с постоянной скоростью генерации g, 335
но произвольным^ (л) уравнение (13.1.3) в стационарном режиме сводится к щ. пг Покажите, что такое сведение применимо также к высшим поэтому в этом случае события рекомбинации являются пуассоновскими, так же как и события генерации *. Упражнение. Покажите, что для реакции В qX. qX — А события рекомбинации являются пуассоновскими. 13.3 ФОТОЭФФЕКТ: ФЛУКТУАЦИИ ЧИСЛА ПАДАЮЩИХ ФОТОНОВ Следующая задача в некотором смысле является обратной щ> отношению к тем, что рассмотрены в предыдущих шух парагра- фах. Возьмем фотопроводник, в котором электроны возбуждены в проводящую область с помощью пучка фотонов. Моменты времени, в которые падающие фотоны попадают в фотопроводник, образуют множество случайных событий, описывающееся функциями распределе- ния fn или корреляционными функциями gm. Если они независимы (про- цесс Пуассона или дробовой шум), вероятность возбуждения электронов :а единичное время получается постоянной и тогда применима форму- ла (6.9.1). Для любого другого стохастического распределения собы- тий, состоящих в попадании фотонов, последовательные возбужде- ния уже не являются независимыми и, следовательно, число воз- бужденных электронов не является марковским процессом и не опи- сывается основным кинетическим уравнением. Задача состоит в том, чтобы определить, каким образом статистика падающего потока (ротонов влияет на статистику числа носителей заряда. Статистичес- кие свойства потока фотонов предполагаются известными, и мы будем считать, что они обладают свойством кластеризации, т. е. их кор- реляционныефункции gm описываются (2.5.8). После первой попытки ** задача была решена Убинком *** в виде систематического разложе- ния. В соответствии с нашей общей стратегией продемонстрируем этот метод на простом примере. Рассмотрим набор N независимых атомов, каждый из которых может находиться в своем основном состоянии или на одном из возбужденных уровней. Возбужденные атомы за единичное время могут совершить обратный переход с вероятностью а, но возбужде- ние может произойти только вследствие попадания фотона. Каждый фотон обладает вероятностью (5 возбудить атом. Мы предполагаем, что число п возбужденных атомов много меньше, чем N, тогда эту вероятность можно считать не зависящей от п. * Этот ответ на вопрос, поставленный в |8|, сообщил мне Гардинер |С. \V. Gardiner). *’ J.G. Cook. J. Blok and N. G. van Kampcn. Phv-iea 35. 211 (1967). ’•» J. T. Ubbink. Physica 52. 253 (1971). 336
Пусть фотоны попадают в моменты времени тъ т2, ... .В тече- ние времени между двумя событиями распределение вероятности p(t) описывается формулой р — а (Е — I) пр Wp. (13.3.1) В каждый момент времени т, когда происходит попадание фотона, вероятность изменяется скачком: Р (т т = Р (т —<f) - (ЧЕ ’’ — 1) Р (т — 0) г (1 В) /7(т -0), (13.3.2) Предположим, прерыватель пучка открыт при t - 0 и пропускает фотоны. Предположим, также, что /7(0) известно; мы хотим вычис- лить /?(/). Если s фотонов попадают в интервал между 0 и t в мо- менты времени 0 т, т2 ... т, . t, (13.3.3) то распределение, подобное (7.7.6), имеет вид p(/)]cond- el'-,',wi1 - В) w (1 - В). . .(1 B)eT'w р(0). (13.3.4) Введем разновидность представления взаимодействия, полагая e-TWBerw В(т). (13.3.5) Тогда условная вероятность, зависящая от истории фотонов (13 .3.3), \р (HUd - e'w {1 - В (т,)} {1 t- В (т,_,)}. . . ({1 - В (т,)| /7(0). Усреднив это выражение по истории фотонов, получим окончатель- ное распределение: /7(7) e'w .{1 г В(т,)){1 -г- В(т,_,)}.. .{1 +В(т,)П /7(0). (13.3.6) Среднее значение, которое встречается в этой формуле, имеет тот же вид, что и среднее в (2.3.6), но В являются операторами, которые не коммутируют. Чтобы обойти эту трудность, введем сим- вол временного упорядочения Г ... 1 , который ставит условие, что все операторы внутри этих символов должны браться в хронологи- ческом порядке, т. е. в соответствии с убыванием временных аргу- ментов. Поскольку это требование мы сформулировали в виде усло- вия, можно свободно обращаться с операторами, так как, если бы они коммутировали, только в окончательной формуле их нужно снова расположить в хронологическом порядке. Тогда (13.3 6) можно преобразовать в соответствии с (2.5.7): -е'^ГП (1 -В(т0)|-| /7(0) e'wrz П ! 1 + B(T,f)z ~| р (0) •• 0-1 0~ I I •' e'w Г ехр \ (/,) В (/J d/, ’ о "4 f J£2(Л. С) В(Ч) В (Л.) d/, d/2 4- . . .} 1/7(0). (13.3.7) о о 337
Эта формула является точной, но не такой простой, какой кажется с виду. Временное упорядочение подразумевает, что экспоненты должны быть разложены в ряды и что в каждом члене такого ряда операторы В должны быть записаны в хронологическом порядке. Это означает, что многократные интегралы должны быть разбиты на многочисленные члены для различных частей области интегриро- вания. Однако, перед тем как выполнить эти действия, некоторые свойства временного упорядочения мы перечислим в виде упраж- нений *. Упражнение. Пусть А (/)— зависящая от времени матрица. Запишите явно пер- вые пять членов выражения t Г ехр 4 (Г) dt' “I. (13.3.8) о Упражнение. Пусть у (t)— вектор, описывающийся уравнением У (О A (t)y(t). (13.3.9а) Покажите, что решения этого уравнения можно записать в виде t y(t) = Гехр J A (Г) dr'ly(0). (13.3.96) о Указание. Решите (13.3.9а) итерациями. Тогда (13.3.96) является фор- мальным выражением для эволюционной матрицы, определенной в (8.6.4). Упражнение. Докажите, для 0 < < t следующее тождество: t ехр \ А (/') d/' о t ехр А (/') d/' О О ехр 4 (/') dt’ о Указание. Либо используйте результат (13.3.9), либо разложите в ряд. Упражнение. Докажите, что t ехр \ 4 (/') dt' о где символом [_ . . . J обозначено чающее, что операторы в более Упражнение. Докажите**, что антихронологическое упорядочение, озна- поздние моменты времени стоят справа. t ехр {4 (/')н-В (/')} dt' о t ехр \ 4 (/’) d/' о t ехр В (/') dt' о (13.3.10) где В (/)— представление взаимодействия для оператора В (/): В(/) = ехр 4 (/') dt' В (/) ехр t 4 (Г) dt' о * Общее рассмотрение таких тождеств см. в работе: R. Kubo, J. Phys. Soc. Japan 17, 1100 (1962). ** R. P. Feynman, Phys. Rev. 84, 108 (1951). 338
Начнем с того, что возьмем в показателе степени (13.3 7) только первый член, Эго равносильно тому, что мы отбросим в показателе экспоненты все члены, содержащие р и более высокие степени по |3. В то же время опустим все корреляционные функции g2, g3, ... и будем рассматривать падающие фотоны так, если бы они не были скоррелированными. Изувеченное таким образом выражение (13.3.7) принимает вид /?(/) = e'w ехр ? gi(/i)B(/i)d/! /ДО). ! О В соответствии с (13.3.9) приходим к 4e-/w^(0 = g!(0B(0e-/wp(/). Тогда, имея в виду (13.3.5), запишем Р (0 - {W + gl (О В} р (t) = а (Е-1) пр + gl (0 р (Е-1 —1) р. (13.3.11) Тот факт, что р удовлетворяет этому основному кинетическому урав- нению, не является удивительным, потому что в этом порядке фо- тоны рассматривались как некоррелированные и, следовательно, просто порождали вероятность генерации gr (t) Р за единичное время. Упражнение. Найдите <л>/ и <n2>t из (13.3.11) с заданным начальным значением п (0). В частности, для at > 1 «w2»t = p $ e~aT£i (/ — т) dr. о Упражнение. Из (13.3.11) найдите автокорреляционную функцию «л (/j) л (/2)>>, если задано начальное условие п (0). Упражнение. Решите (13.3.11) явно с помощью производящей функции р. 13.4. ФОТОЭФФЕКТ (ПРОДОЛЖЕНИЕ) Следующее приближение включает зависимость от корреляцион- ной функции g2. Для простоты предположим, что пучок фотонов стационарен, так что не зависит от t. Член gtB в (13.3.11) нельзя рассматривать как малое возмущение, потому что он ответствен за поддержание стационарного состояния. Поэтому в качестве невоз- мущенного уравнения надо взять p(/) = {W + glB}p(0 = W*y7(/). (13.4.1) Возникает вопрос: как перегруппировать члены в (13.3.7) таким образом, чтобы член, содержащий g2, появился как поправка к (13.4.1)? Это можно сделать, используя (13.2.10), но более прямой метод состоит в следующем. Начнем с уравнения (13.3.4), в которое, однако, еще не введено представление взаимодействия (13.3.5). Это уравнение также можно ЗЗЭ
записать в сжатой форме, если использовать временное упорядоче- ние. Это можно сделать с помощью следующего приема. Хотя W не зависит от времени, запишем W (/), где аргумент служит просто для обозначения положения в хронологическом порядке. Аналогично запишем В(/) для постоянного оператора В. Тогда (13.3.4) совпа- дет с l>(0]t.ond ( ' ) s ехр {J П ji В(т„)} Vo J""1 /НО). Временное упорядочение относится и к и к т„. Усреднение по истории (13.3.3) можно выполнить так, как если бы операторы коммутировали: /?(/) ехр К W (М d/Д Г \о I п- П {1 -^В(тст)} р(0) у- I ( ‘ ехр { [W (Л) -г giB (/,)] d/, - (б Оператор [] равен заданному в (13.4.1), и может быть получен с помощью тождества (13.3.10): р№ etw* ехр ) /,) В* ((,) В* (/2) d), d/„} I p(0). (13.4.3) Здесь В* (О—другое представление взаимодействия, основанное- на W* вместо W: B*(/) = e‘<w’Bezw*. (13.4.4) В показателе степени (13.4.3) опущены члены с теми степенями Д. которые выше, чем р2. Другие приближения не делались, но опять из-за временного упорядочения, однако, формула (13.4.3) не так проста, как выглядит. Временное упорядочение будет частично выполнено, если заме- нить (13.4.3) на с I Р(П- ezw’ехр | \ d^ \ d(2g2(/l, (2) В* (ZJ В* (/2)) р (0). (13.4.5) (о о ) Ниже мы покажем, что остающаяся ошибка имеет более высокий порядок, но сначала исследуем (13.4.5). Эта формула представляет собой выражение для p(t), которое в нашем случае можно вычис- лить явно, потому что (13.4.1) можно решить и найти e'w* . 340
По-другому результат (13.4.5) можно выразить в виде диффе- ренциального уравнения. Дифференцируя e_'w*₽<0, получаем Г ' 1 р (/) = { W* -т- \ d/'g2 (t, t') Be»-'') w* Be»' w’} p (t) = 1 о ) ( ‘ ) = }W*+ g2 (t) BeTW* BeTW* d/} p (/). (13.4.6) к о ) Здесь оператор { } еще содержит время t, истекшее с начального момента. Это отражает особую роль начального момента времени, потому что вероятность в начальный момент времени задана. Однако, поскольку мы предположили, что выполняется свойство кластериза- ции, £2(т) обращается в нуль при большем т; предположим, в част- ности, что существует некоторое тс такое, что §2(т)«0 для т > т,. Далее, понятно, что, поскольку t > тс в (13.4.6), верхний предел ин- тегрирования можно заменить на оо. Вследствие этогоp(t) подчиняется дифференциальному уравнению с постоянными коэффициентами: p(t)^Kp(t), (13.4.7а) где К — перенормированная матрица перехода: к W* + J g2 (т) BexW" Be-TW‘ dr. о (13.4.76) Это окончательный результат. Высшие приближения, включающие g3, gt, , не меняют (13.4.7а), а просто добавляют новые члены к (13.4.76). Упражнение. Выведите (13.4.6) из (13.4.5). Упражнение. Докажите, что (13.4.6) сохраняет полную вероятность. Упражнение. В настоящем примере интеграл в (13.4.76) оказался очень про- стым. Сначала докажите коммутационное тождество [В. W*|=aB и затем выведите из него B*(Z)-=e“'B. В результате получится Г. ) K -W* J ) е-“т£2(т) dr} Вг И J Упражнение. Решите уравнение (13.4.7а) с таким К. Упражнение. Поскольку в этой модели операторы В*(() при различных t ком- мутируют. временное упорядочение в (13.4.3) можно опустить. Тогда так же можно использовать высшие члены и построить соответствующее урав- нение (13,4.7а) для всех порядков. Оказывается, что его даже можно решить Покажите таким способом: если р(0) —6 (п. п0). то /г-й момент yn-'Ct не зависит от корреляционных функций gm с т > k. Нам необходимо еще исследовать приближения, которые мы сде- лали в процессе вывода (13.4.7). 341
а. Типичный интеграл, изображенный точками в (13.4.2) и опу- щенный в (13.4.3), имеет вид t t $ • • • $ (/1, h, • •, В (ZJ В (Z2) ... В (ZJ dZ, dZ2 . . . dz,„. (13.4.8) о Интегрирование проводится по m-мерному кубу объемом но бла- годаря свойству кластеризации подынтегральная функция обращается в дуль, если только все переменные Z не отстоят друг от друга дальше, чем на расстояние порядка тс. Область, где это свойство выполняется, представляет собой окрестность диагонали куба, и ее объем примерно равен Zt™'1. Тогда (13.4.8) имеет порядок P»Zt?-1 = (PZ)(Ptc)'»-1. (13.4.9) На самом деле в хронологически упорядоченных экспонентах (13.4.2) интеграл (13.4.8) в таком виде не встречается, а разбивается на части и входит в комбинации с множителем В, возникающим в дру- гом месте, но все равно его вклад не превышает порядка (13.4.9). Следовательно, члены, опущенные в (13.4.3), являются поправками к коэффициенту при Z в показателе степени, которые имеют более высокий порядок по ртс. б. При замене (13.4.3) на (13.4.5) были совершены ошибки в упо- рядочении, простейшая из которых состоит в пренебрежении вре- менным упорядочением в члене t ц t (1 Jp J dz, J dz2 f dz; f dz2g2 (z„ z2) g2 (t[, q г в* (M в* (z2) в* (Q в (z') q. 0 0 0 0 Разница возникает из той части четырехмерной области интегриро- вания, где пары t\, Z2 переплетаются с парами t[, Z2 и где ни один из множителей g2 не обращается в нуль. Объем этой части есть Zt®, и, следовательно, ошибка имеет порядок величины (PZ) (Ртс)3. По- скольку эта величина линейна по Z, ее можно сравнить с вкладом от t 5 dZi J dZ2 g2 (Zj, Z2) B* (Zj) B* (Z2), о о который имеет порядок (PZ) (Ртс). Следовательно, ошибка имеет отно- сительный порядок величины (PtJ2. Этот вывод остается справед- ливым для высших членов в разложении экспоненты в (13.4.3). в. Уравнение (13.4.7) выведено при произвольном р(0), но при этом предполагалось, что затвор был открыт при Z = 0. Начальный момент времени играет особую роль, потому что это единственный момент времени, в который переменная п и падающие фотоны ста- тистически независимы. При любом Zo > 0 это уже не так: большое значение п показывает, что много фотонов попали в образец за 342
последнее время и через корреляции фотонов. Это влияет на веро- ятность попадания фотонов в момент времени tQ. Это также влияет на вероятность попадания фотонов в ближайшем будущем после /0, что и становится причиной, по которой п не является марковским процессом. Отсюда ясно, почему мы должны взять в качестве на- чального момента времени момент, в который затвор был открыт. В уравнении (13.4.7) начальный момент времени уже не упоми- нается, и поэтому оно применимо ко всем распределениям независимо от времени открытия затвора при условии, что с этого момента прошло больше времени, чем тс. Эта оговорка означает, что (13.4.7) не является основным кинетическим уравнением (см. предостереже- ние в § 5.1). Однако его можно приближенно рассматривать как основное кинетическое уравнение, если р слабо меняется за время тс. Это ограничение можно смягчить с помощью следующего рассмот- рения. Запишем оператор К в (14.4.76) как K = W*-(-Ki. Тогда (13.4.7а) является представлением взаимодействия (13.4.10) где p* = e-zw* и К; — представление взаимодействия (13.4.4) опера- тора Ki- Это приближенно является основным кинетическим урав- нением, если изменение р* за время тс невелико. Это ослабленное ограничение можно сформулировать количест- венно. Величина Ki, заданная интегралом (13.4.76), определяется множителем Р2, умноженным на интеграл от g2, что дает те. Тогда К1~Р2тс и изменение р* за время ге—порядка (Ртс)2. В таком слу- чае (13.4.10) и, следовательно, (13.4.7а) представляет собой прибли- женное основное кинетическое уравнение при условии, что Ртс<<1. (13.4.11) Но приближения а и б, сделанные выше, также основываются на этом условии, и, следовательно, это есть полное условие справед- ливости (13.4.7) как основного кинетического уравнения. Параметр Ртс является мерой воздействия внешнего влияния в течение одного корреляционного времени. Этот параметр называют числом Кубо. ГЛАВА 14 СТОХАСТИЧЕСКИЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ Когда система подвергается воздействию флуктуирующих внеш- них сил, описывающие ее уравнения движения представляют собой дифференциальные уравнения со случайными коэффициентами. В не- которых случаях эти уравнения можно решить точно или прибли- женно. В частности, когда флуктуации являются слабыми и быст- рыми, можно получить явные уравнения. В пределе это приводит к соответствующим дельта-коррелированным случайным членам. 343
14.1. ОПРЕДЕЛЕНИЯ Стохастическое дифференциальное уравнение — это дифференциаль- ное уравнение, коэффициенты которого являются случайными чис- лами или случайными функциями независимых переменных. Так же как и у обычных дифференциальных уравнений, коэффициенты счи- таются заданными, т. е. их стохастические свойства определены заранее и не зависят от решения, которое нужно найти. Следова- тельно, стохастические дифференциальные уравнения описывают си- стемы с флуктуациями, вызванными внешним воздействием. Примеры: броуновская частица и описывающее ее уравнение Ланжевена; любая небольшая система, взаимодействующая с большим резервуаром (при условии, что малая система существенно не влияет на резервуар); электромагнитные волны в турбулентной атмосфере; рост популя- ции в флуктуирующем климате. В противоположность этому почти во всех примерах из предыдущих глав источник шума был внут- ренним, т. е. присущим самой природе системы. Общий вид стохастического дифференциального уравнения и F[u, t\ Y (/)); (14.1.1) где и и F могут быть векторами, a Y (/) обозначает одну или не- сколько случайных функций, стохастические свойства которых из- вестны. Это уравнение совместно с начальным условием u(t0) а для каждой частной реализации у (f) определяет функцию U (/; [(/], а], которая является функционалом y(t), т. е. она зависит от всех зна- чений у (Г) при О <у./' sy F Ансамбль решений U (/; [у], а] для всех возможных у (Г) составляет стохастический процесс. Решить урав- нение (14.1.1) означает найти стохастические свойства этого про- цесса * Иногда начальное значение а также является случайной величи- ной (или вектором). Получающийся в результате стохастический процесс U (/; [у], а\ тогда является функцией случайной перемен- ной а, функционалом, зависящим от функции у. Поскольку это является тривиальным обобщением задачи с фиксированным началь- ным значением а, нет необходимости рассматривать случайные на- чальные значения отдельно. Уравнение Ланжевена (8.8.1) и более общее уравнение Ито (8.8.15) представляют собой примеры стоха- стических дифференциальных уравнений. Действительно, в большей части математической литературы название «стохастическое диффе- ренциальное уравнение» ограничивается именно этими случаями**. * Н. Bunke, Gewohnliche DifferentiaIgleichungen mit zufalligen Parametern f Akademie-Verlag, Berlin. 1972). ** 1. 1. Gikhman and A. V. Skorohod, Stochastic Differential Equations (Springer. Berlin. 1972); L. Arnold, Stochastische Differentialgleichungen (Olben- bourg. Munich. 1973); T. T. Soong, Random Differential Equations in Science and Engenieering (Acad. Press. New York, 1973); A. Friedman, Stochastic Differential Equations and Applications, volumes (Acad. Press. New York, 1975 and 1976). 344
Это подчеркивание роли уравнения Ито может увести нас в невер- ном направлении, поскольку гауссов белый шум L(t) нельзя рас- сматривать как настоящий случайный процесс—возникают труд- ности, упомянутые в гл. 8. Эти трудности имеют искусственную природу, они исчезают, если принять во внимание, что случайная сила в физике никогда не является настоящим белым шумом, а в лучшем случае имеет очень малое автокорреляционное время *. Следовательно, лучше начать с изучения более широкого класса стохастически дифференциальных уравнений (14.1.1), а затем перейти к рассмотрению приближений, справедливых для малых времен автокорреляции в качестве частного случая. Мы это сделаем в § 14.2—14.5, но случай больших времен автокорреляций также представляет интерес и будет рассмотрен в § 14.6. Другим приме- ром стохастического дифференциального уравнения (14.1.1) является : и = —iw(/) и, (14.1.2) где и — комплексная величина, а со (/)—случайная функция от вре- мени. Этот пример удается решить явно, и его используют для иллюстрации парамагнитного резонанса** и уширения линий ***. Отметим, что (14.1.2) отличается от уравнения Ланжевена именно тем, что случайный коэффициент умножается на и. Важным при- мером того, что уравнение не может быть решено явно, является соотношение х-|-а2(/)х-0. (14.1.3) Это уравнение описывает гармонический осциллятор, частота кото- рого является случайной функцией времени. Мы пришли к следующей классификации по трем категориям. I. Линейные дифференциальные уравнения, в которых только неоднородный член является случайной функцией, как в уравнении Ланжевена. ч'акие уравнения были названы аддитивными, и в прин- ципе их можно решить. ’ II. Линейные дифференциальные уравнения, в которых один или несколько коэффициентов при и являются случайными функциями. Они получили название мультипликативных **** и могут быть реше- ны только в частных случаях, однако в § 14.2 и 14.3 мы приведем до- вольно общий приближенный метод их решения ***** III. Нелинейные уравнения; различия между аддитивными или мультипликативными уравнениями становятся спорными, но в § 14.4 мы их преобразуем к линейным мультипликативным уравнениям. * Более подробное обсуждение см: N. G. van Kampen, J. Statist. Phys. 24, 175 (1981). ** P. W. Anderson and P. R. Weiss, Rev. Mod. Phys. 25, 269 (1953). *** R. Kubo in: Fluctuation, Relaxation and Resonance in Magnetic Systems (D. ter Haar ed., Oliver and Boyd, Edinburgh, 1961). **** R. F. Fox, J. Mathem. Phys. 13, 1196 (1972). ***** Обсуждение и литературу см. в работах: A. Brissaud and U. Frisch, J. Mathem. Phys. 15, 524 (1974); V. I. Klyatskin and V. I. Tatarskii, Sov. Phys. Usp. 16, 494 (1974); N. G. van Kampen, Physics Reports 24C, 171 (1976). 345
Имеются и другие категории, такие, как стохастические диффе- ренциальные уравнения в частных производных, задачи на собст- венные значения * и со случайными границами **, но эти случаи мы здесь рассматривать не будем. Примечание. Подчеркнем следующее отличие от обычных нестохастических дифференциальных уравнений. Все решения нестохастического уравнения полу- чаются наложением начального условия u(t0) — a в произвольный момент вре- мени t0, а затем рассмотрением всех возможных значений а. Однако для сто- хастического дифференциального уравнения таким способом можно получить только подкласс всех решений, а именно те решения, для которых оказы- вается, что они не имеют дисперсий в этот частный момент времени /0. Чтобы быть более точными, рассмотрим множество S всех стохастических функций U (/), удовлетворяющих (14.1.1). Подмножество S0(a)cS состоит из таких функций, которые также удовлетворяют соотношению U ( tt, ) — a. Пусть —объединение всех So (а), получающихся при всех возможных значениях а. Тогда SDcS—множество всех стохастических функций, удовлетворяющих (14.1.1) и имеющих нулевую дисперсию при t0. Теперь возьмем ta и пост- роим соответствующее Sv Для нестохастических уравнений S, но в стохастическом случае Sj So. В общем случае So и S’, даже не пересе- каются, £оГ)51 = О. Отметим, что мы говорим о стохастических процессах U, а не об их от- дельных реализациях. Каждая отдельная реализация и процесса U яв- ляется решением уравнения u — F (и, /; у (/)) при некотором у (/) и, следова- тельно, также является некоторой реализацией одного из процессов U в Sj. Упражнение. Решите (8.8.1), когда L (/)— произвольная случайная функция, стохастические свойства которой задаются ее производящим функционалом. Упражнение. Рассмотрим аддитивное уравнение ii-Fu — F (F), где F (?) — случайная сила, заданная своим производящим функционалом. Найдите производящий функционал решения и (/), определяющийся началь- ными значениями п(0) —а, и(О) — Ь. Упражнение. Решите то же самое уравнение с начальными условиями и (/0)~--а, (;('„) - (), где ^0. Покажите, что ни одно из этих решений не совпа- дает с каким-либо решением, найденным в предыдущем упражнении, если только F не является нестохастической функцией. Упражнение, Решите мультипликативное уравнение (14.1.2). Упражнение. Выведите для магнитного дипольного момента S в магнитном поле В уравнение S~=— gB л S. Если направление В фиксировано, но напряженность является случайной величиной, то это уравнение можно записать в виде (14.1.2). Упражнение. Покажите, что плоская монохроматическая электромагнитная волна, распространяющаяся в направлении х в среде, диэлектрическая проницаемость которой зависит от х, описывается уравнением вида (14.1.3). Упражнение. Все решения в S получаются из начального значения а при f0, если предположить, что а — случайная величина. * W. Е. Воусе in: Probabilistic Methods in Applied Mathematics 1 (A. T. Bharucha-Reid ed., Acad. Press, New York, 1968); W. Puckert and J. vom Scheldt, Reports Mathem. Phys. 15, 206 (1979). ** F. G. Bass and I. M. Fuks, Wave Scattering from Statistically Rough Surfaces (Pergamon, Oxford, 1979). 346
14.2. ЭВРИСТИЧЕСКИЙ АНАЛИЗ МУЛЬТИПЛИКАТИВНЫХ УРАВНЕНИЙ Рассмотрим линейное уравнение вида и — A (t)u = {До + аЛД/)} и, (14.2.1) где и—вектор, До— постоянная матрица, ДД/)—случайная матрица, а—параметр, измеряющий значение флуктуаций в коэффициентах. Далее будем считать, что ДД/) обладает конечным временем авто- корреляции тс, если для любых двух моментов времени Д, Д, свя- занных между собой соотношением |Д—Д|>тг, все матричные элементы ДДД) можно рассматривать как стохастически не зави- сящие от соответствующих A1(i2). Величина атс является числом Кибо, введенным (13.4.11), и опять считается малой. В результате мы получим приближенное решение уравнения (14.2.1) в виде раз- ложения в ряд по степеням параметра атс. Соответствующий вывод будет проделан в следующем параграфе. В настоящем разделе мы используем более простой метод, который, однако, проще в обра- щении и который можно применять и к более сложным случаям *. ^Удобно, хотя, строго говоря, в этом и нет необходимости, предпо- ложить, что ДДД является стационарным матричным процессом. Тогда <ДДД> не зависит от времени и его можно включить в До, положив Ао = До + <х <Д ДД>, ад; (Д-а {ДДД —<Д1 (/)>}, (14.2.2) так что <ДДД> = 0. Предположим, что это проделано, и в даль- нейшем штрихи будем опускать. Получающееся в результате разло- жение по а относится только к а, стоящему перед A'(t). Таким образом, мы рассмотрим (14.2.1) только в том случае, когда <ДДД> = о. Переходя в представление взаимодействия, исключим А„: u(t) = efA«v(t), (14.2.3а) v = ae~tA«A1(t)etA«v^= a,V (t)v. (14.2.36) Решение с точностью до второго порядка по v (0) = и (0) = а имеет вид t t t, v(t) = a+ a d/1V(/1)a + a2 d/j $ d^2 V (Д) V(t.2)a+ • • • (14.2.4) о oo Теперь возьмем среднее с фиксированным а. t н <u(/)>=a + a2$ d/J d/2 <У(Д) Р(Д)> a. (14.2.5) _________ о о * В частности, в квантовой механике, см.: A. G. Pedfield', IBM J. Research Devel. 1, 19 (1957), Advances in Magnetic Resonance 1 (J. S. Waugh ed., Acad. Press, New York, 1965); С. P. Slichter, Principles of Magnetic Resonance (Harper and Row, New York, 1963). 347
Приближение второго порядка можно использовать до тех пор, пока члены более высоких порядков малы. Поскольку каждый по- следний член включает на одно интегрирование по времени больше, это ограничение равносильно at 1. С другой стороны, мы хотим использовать его на временах, значительно превосходящих атс; следовательно, мы должны предположить ате<<$ 1. Тогда для находим t ti <v (t)> = аа2 d^ J dr<V (/J V (^— r)>a. о о Когда /j > ic, верхний предел интегрирования lt в интеграле по т можно заменить на оо, поскольку в любом случае подынтегральная функция в этой области обращается в нуль. Хотя пробегает зна- чения от 0 до t, в большей части интервала /1>тс. Тогда для ^<5$ / ос"1 приближенно имеем / оо <п(/)> = Н®2 $ 5 dt <У (/j.) V (ti — т)>е. о о Это выражение, однако, также является решением с точностью до порядка а2 линейного дифференциального уравнения dt <v (/)> = а2 <У(/)У(/ — т)> dx <и(0>- (14.2.6) Таким образом, приходим к выводу, что это уравнение описывает эволюцию величины <и(/)>. В первоначальном представлении его можно записать в виде <и(0>- (14.2.7) Следует помнить, однако, что наш вывод справедлив только в течение времени А^<^а-1 после начального момента времени /0 = 0. Начальный момент времени выделен потому, что в это время значение и было равно нестохастическому вектору а. Легко видеть, что результат равным образом справедлив и тогда, когда начальное значение стохастично при условии, что оно статистически не зави- сит от Этот факт позволяет нам применить то же самое урав- нение (14.2.7) и для следующего интервала А/, потому что значе- ния Д1 в следующем интервале не скоррелированы со значениями в предыдущем интервале в силу малости тг. Даже если допустить, что имеется некоторое перекрытие на границе между этими интер- валами, это может привести лишь к небольшой ошибке, поскольку такое перекрытие не может превышать величину порядка те, что составляет лишь малую часть полного интервала А/. Тогда (14.2.7) приближенно справедливо при всех временах при условии, что 348
ar^^l. Таким образом, среднее u(t) само подчиняется нестохасти- ческому дифференциальному уравнению (14.2.7). Предположим теперь, что не только ax^^l, но и тс|Дй|<1. (14.2.8) Это дополнительное является медленным (14.2.7) сводится к dt<«(/)> = условие означает, что свободное • движение и по сравнению с флуктуациями в Аг. Тогда X А,4-а2 § <А1 (/) Aj (t — т)> dx о <и(0>. (14.2.9) Поскольку Аг предполагается стационарным, интеграл не зависит от времени. Следовательно, воздействие флуктуаций сводится к пере- нормировке А№ путем добавления к нему постоянного члена поряд- ка а2. Добавочный член представляет собой проинтегрированную iкорреляционную функцию процесса В частности, если имеется |бездиссипативная система, описывающаяся величиной До, этот доба- вочный член, обусловленный флуктуациями, обычно является дис- сипативным. Эта связь диссипации и автокорреляционной функции флуктуаций является аналогом соотношения Грина — Кубо в много- частичных системах *, но не идентично ему, потому что там флук- туации являются внутренними, а не добавляются в виде отдельного члена, как в (14.2.1). Упражнение. Примените результат к гармоническому осциллятору (14.1.3) с частотой со'^ (/) {l -j-ag (/)}, где | (/)— стационарный случайный про- цесс с нулевым средним значением и временем автокорреляции тс. Ответ имеет вид 6 йУ +4 а2(°”С2 АтА +“o A~4“2“°C1) <х>=0’ (14.2.10) СО ~ <g (/) £ (/ — т) sin 2(оот dx, о со с2= (О В (/ —т)> (1—cos 2ыот) йт. о Упражнение. Постоянные и с3 в (14.2.10) зависят от случайного члена при удвоенной частоте свободного осциллятора. Выразите их через спектраль- ную плотность £. Упражнение. Примените результат (14.2.1Q) к плоской электромагнитной волне в среде, в которой диэлектрическая проницаемость является случайной функцией х. Каким образом волна может, затухать, если среда не полу- чает энергии? * М. S. Green, J. Chem. Phys. 20, 1281 (1952); R. Kubo, Can. J. Phys. 34, 1274 (1956) апй in: Statistical Mechanics of Equilibrium апй Non-Equilibrium (Proc. Intern. Symp. on Statistical Mechanics апй Thermoriynamics Ье1й at Achen; J. Meixner ей., North-НоПапй, Amsterriam, 1965). 349
Упражнение. Когда Ао также является функцией t (хотя и не стохастической), можно использовать тот же самый метод, если по-другому определить пред- ставление взаимодействия. Упражнение. При выводе (14.2.7) мы предполагаем, что <А!(/)> = 0. Если это не так, то вместо (14.2.7) получим dt <и (0> = £л0-*-а <Д1 (/)>-г-а2 «Ах (Oe^o/h (1 — т)» е~тА, drj <u (/)>. (14.2.11) Упражнение. Удерживая тот же порядок по атс. можно улучшить (14.2.9), если учесть следующий порядок тс | Ао |. Добавочный член включает в себя коммута юр >35 а2 <Л1(О[Л„, А£ (/—т)]> т dr. (14.2.12) о Упражнение. Найдите уравнение для <«(/);. если и (t) удовлетворяет уравне- нию й = А (14.2.13) где f—случайный вектор, статистически не зависящий от А (/). 14.3 РАЗЛОЖЕНИЕ ПО КУМУЛЯНТАМ Для читателей, неудовлетворенных недостаточной общностью приближений, использованных в предыдущем параграфе, мы дадим более систематический вывод тех же самых результатов. Этот под- ход также открывает путь к высшим приближениям, хотя мы и не воспользуемся им*. Вновь рассмотрим линейное стохастическое дифференциальное уравнение (14.2.1). Теперь нет необходимости предполагать ни ста- ционарности Аг (/), ни исключать его среднего значения, как это делалось в (14.2.2). Преобразуем (14.2.1) к представлению взаимо- действия (14.2.3). Согласно (13.3.9), формальное решение можно записать с помощью упорядоченной по времени экспоненты: и(0= ехр (14.3.1) Это просто сокращенная запись того же самого разложения, пер- вые два члена которого выписаны в (14.2.4). Теперь снова возьмем среднее при фиксированном а. Среднее, конечно же, коммутирует с упорядочением по времени, так что <о(/)> = (ехр * Высшие порядки рассматриваются в работах: R. С. Bourret, Can. J. Phys. 40, 782 (1962); J. В. Keller, Proc. Symp. Appl. Math. 16 (Amer. Mathem. Soc., Providence 1964) p. 84; N. G. van Kampen, Physica 74, 215 and 239 (1974); R. H. Terwiel, Physica 74, 248 (1974). 350
Поскольку операторы внутри ~| можно рассматривать как ком- мутирующие, можно использовать тождество (3.4.6) для кумулянтов: ( 1 * I С п2 с ехр]а \ d/1<V(/1)>-T-у \ V о 2 о d/x d/2 <<У(^г) V(/2)»4-.. t ... d/M«V(/I)V(/2) ... V(/J»+... о (14.3.2) Разница с рядом (14.2.4) состоит в том, что теперь в экспоненте появилось разложение по а. Естественно, нужно помнить, что это не является настоящей экспонентой, потому что упорядочение по времени можно выполнить только после разложения экспоненты, что приведет нас обратно к (2.4.1). Однако следующая оценка остается справедливой. Предположение, что (t) и, следовательно, V(/) обладают временем корреляции хс, подразумевает, что каждый кумулянт обращается в нуль, если только временные точки в нем не попадают внутрь области порядка хс. Тогда полный вклад в т- кратный интеграл в (14.3.2) возникает из области порядка Соответственно т-й член в экспоненте имеет порядок (а/) (ахс)т~'. Тогда (14.3.2) представляет собой разложение по степеням (атД каждый член которого приблизительно линеен по t. В этом состоит преимущество разложения по кумулянтам по сравнению с рядом (14.2.4), который является разложением по последовательным сте- пеням а/, и, следовательно, ограничен малыми временами. Упорядочение по времени в (14.3.2) можно частично учесть, если переписать интегралы в следующем виде: d^«V(A)V(M ••• И(/,„)» (14.3.3) Если оборвать этот ряд после члена т=1, получим <и(/)> = ехр Это низшее приближение; все члены порядка ате или выше в экспо- ненте опущены. Оно эквивалентно дифференциальному уравнению dt <и(0> = а<Е (/)> <п(0>. (14.3.4) 351
Теперь оборвем разложение члена после ш = 2: <о(0> = ( t t -V ехр {а <У (/i)d^> + а2 dL <<V(/X) V'(^)>> } ко о ) _ (14.3.5) Здесь включены члены порядка (а/)(атс) в экспоненте и опущены члены порядка (а^)(атс)2. Если положить i, \ dt «V (С)’/(С)>.;==/((/,), О то уравнение принимает вид <и(/)> = t ехр J {а <V ((')> (/')} d/' о а. (14.3.6) Это выражение является решением дифференциального уравнения = {а<У (/)>4-а2/((/)} (14.3.7) Хотя (14.3.6) не является вполне правильным, мы сейчас докажем, что ошибка имеет более высокий порядок по атс. Тогда мы можем предположить, что (14.3.7) справедливо в требуемом порядке. В пер- воначальном представлении это означает, что <«(/)> = Ло + а <ЛХ (/)>-}- <<ЛХ (/) ехА<>А1 (t — т)>.> е-т'4»бт + О (а3т2) (14.3.8) о J Верхний предел интегрирования все еще напоминает о выделенной роли начального времени, но его можно заменить бесконечностью, поскольку t >тс. Таким образом, мы подтвердили результаты (14.2.7) и (14.2.11). Причина, по которой уравнение (4.3.6) не является вполне пра- вильным, состоит в следующем. Символ временного упорядочения в (14.3.5) указывает на то, что после разложения экспоненты все множители V должны быть перегруппированы в хронологическом порядке. Однако временное упорядочение в (14.3.6) просто расстав- ляет множители <Ё> и /С, при этом Д' рассматривается как недели- мая величина. (Иначе это выражение было бы не эквивалентно (14.3.7).) Это приводит к неправильному представлению тех чле- нов в (14.3.5), в которых встречаются оба множителя <V-(/')> и <<И (/х) И (4)» и. кроме того, /' > /2. Простейшим примером 352
такого члена в (14.3.5) является - t ttt dt' <V (/')> J d/t $ d/2 «V (/t) V (/2)>> _o oo t t, (t = a3 $ d/j $ d/J $ df <V (t')> «V (tj V (t2)> > + о о k/, h h 4 + $ dt' «ViQ V (/2)>> <V(f)> + $ dt' «V (Q <V (/')> V (/,)»}. (14.3.9) 0 <2 / (Естественно, множитель <<V(/')> не участвует в усреднении < < >>.) Но соответствующий член в (14.3.6) имеет вид t h п а3 d/t $ d/2 К df <V (/')> «V (Л) V (/2)>> 4- о о Vi A A + $dr«V(MV(/2)»<V(/')>! • (14.3.10) о ) Разность между (14.3.9) и (14.3.10) составляет t h h a3Jd/1$d/2$df«V(/1)[<V(f)>, V(/2)]», (14.3.11) о о t2 где символ [,] служит для обозначения коммутатора. Вся область интегрирования имеет порядок t3, но ненулевой вклад дает только подобласть порядка tx3. Следовательно, ошибка имеет порядок вели- чины (a/)(arc)2, т. е. она того же порядка, что и уже опущенные члены в (14.3.5). Такие же аргументы применимы и к другим членам в разложении (14.3.5): ошибка, сделанная при записи (14.3.6), всегда ограничена долей (xc/t) полной области и, следовательно, на один порядок по параметру ат,, выше, чем другие члены, содержа- щие ту же степень t. Это доказывает, что (14.3.7) справедливо в том порядке, который мы предположили раньше. Предел белого шума. В (14.2.7) второй член в [] — порядка а2тс, если Ai порядка единицы. Мы сейчас показали, что высшие поправки порядка a2xf(arJOT, m=l,2. Тогда (14.2.7) становится точным в формальном пределе тс—*, а --оо (а2тс фиксировано). (14.3.12) Естественно, это одновременно сводится к (14.2.9). Для того чтобы реализовать этот предел, нужно рассмотреть последовательность случайных матричных функций Дг(/) порядка единицы, но с убы- вающим хс. Такую последовательность мы построим для скалярных функций способом, указанным в (8.8.11). 353
Возьмем большой временной интервал (О, Т) и предположим, что точки времени тст распределены в нем по Пуассону с плотностью v, предположим также, что имеется набор независимых случайных коэффициентов са с одинаковым распределением. Рассмотрим процесс S У(0 = а£ мС—г-2)’ а-1 с где ф^О— заданная функция с конечным носителем (или, по край- ней мере, быстро убывающая функция). Мы вычислим производящий функционал: s = 0 т о \ —?е-\ехр кх о где < > означает среднее по с,Л. Поскольку они независимы, среднее факторизуется на s отдельных средних и можно выполнить сумми- рование по s: G ([£]) = ехр v j dr < (ехр iac k (t) ф -о = ехр Е гп = 1 (ia)*” т\ т <cm> С dr Г Лг(/Х) . . . k (tm) Ф ( ) J V \ тс / О фГ£-_E')dZi ... d^’ J Пусть теперь те стремится к нулю, так что множители ф((/ — т)/тс) сжимаются в дельта-пики. Пусть а в то же время стремится к бес- конечности и плотность v тоже стремится к бесконечности, как v='pTc-1 с фиксированным р. В результате получим ® т logG([fe]) = ^- У Jfe(T)radT ф(0)б0^'”. с гп- 1 0 Полагая, что <с> = 0, в пределе (14.3.12) получаем logG([A]) = -4rJfe(T)MT. В. этом пределе уравнение (14.2.9) является точным. Согласно (8.8.10), это также является пределом, в котором J становится гауссовым белым шумом. 354
Упражнение. Предположим, что матрицы Аг (t) при всех t коммутируют друг с другом и с Ап. Тогда временное упорядочение можно опустить и (14.3.3) можно вычислить. Покажите, что результат будет таким же, как и тот, что найден более непосредственно путем диагонализации матрицы А (/) в (14.2.1). Упражнение. Частым, ноне необычным видом Aj(t) является |(/)В с постоян- ной матрицей В иХкалярной случайной функцией Если, кроме того, выполняется (14<2.8), то снова можно записать (14.2.3) без упорядочения по времени. Запишите получающееся в результате дифференциальное урав- нение для <ц (/)> во всех порядках по атс. Упражнение. Выведите выражение для G ([£]) с помощью (2.5.7), тем самым избежав введения Т. Указание. Ср. с (2.3.8). Упражнение. Для скалярной функции Aj (?) выразите автокорреляционный интеграл, встречающийся в (14.2.9), через параметры, использованные выше для построения J (/). Упражнение. Сформулируйте предел белого шума для случайного матричного процесса aA^(t}. Упражнение. Рассмотрите процесс, полученный в пределе хс —>0, ахс фиксиро- ван. v фиксирована *. Упражнение. Когда А и В—две случайные статистически зависимые матрицы, имеет место тождество е^В _.<е,г ,|<Вч + <<лй»+Д. «Л2В»+-1«Дзв>>... j. Следствием этой формулы является следующее соотношение для случайного вектора /: <ел/> = <ел> {</>}-!-«Af»+ -1-«А2/» ~ - Г (14.3.13) Этот же метод можно использовать для нахождения высших моментов компонентов и. Пусть и = {uv}—действительный компо- нентный вектор, описывающийся уравнением (14.2.1): dtuv- 2 AvK{t)u\ (Х = 1, 2, . . . п). Х = 1 Тогда произведения uvuu также описываются линейным стохасти- ческим дифференциальным уравнением Of (uvUp) = 2 ^vx(OVZp) -I- 2 ^цХ (ИуПх) = 2 ; Хр («Х«р) । --^vp; Хр(0 6цр + Дцр(/) 6vx- (14.3.14а) Тогда их средние удовлетворяют уравнению, аналогичному (14.2.11). Чтобы записать его явно, рассмотрим г12п(п-[- l) = Af произведений uvu^ как компоненты одного вектора (11а, так что (14.3.14а) прини- мает вид .V (« 1, 2, ..., .V). (14.3.146) ь= I * В. J. West, К- Lindenberg and V. Seshadri, Physica I02A, 470 (1980); N. G. van Kampen, Idem p. 489. 355
Тогда Л(0 = ЛоН-cu/MO и CD "1 Л0 + а<Л, (0> + а2 <<Л1(/)ех-4»^1((— т)>> е-хЛ» dx |<ЭДа>. о J Если и — комплексный вектор, можно, конечно, сначала свести его к предыдущему случаю, записав 2п уравнений для его действитель- ной и мнимой частей. Однако обычно представляют интерес только величины uvu^', они удовлетворяют системе п2 линейных уравнений, из которых можно найти п2 приближенных уравнений для <uvu*v.'>. Результат называют уравнением Рэдфильда. Упражнение. Гармонический осциллятор (14.1.3) с частотой ы2(/) = ы2{1-|-ag(/)}. Найдите уравнение для <х2>, <х2>, <хх>. Покажите, что средняя энергия возрастает экспоненциально. Тогда случайным образом возмущенный осцил- лятор является энергетически неустойчивым, хотя его средняя амплитуда, вообще говоря, стремится к нулю согласно (14.2.10). Упражнение. Двухуровневый атом находится в случайном поле, действующим на его дипольный момент, так что его гамильтониан имеет вид М»‘ i)- ,|4'3'15’ Найдите уравнение для его средней матрицы плотности и покажите, что при t —> оо оба уровня равно заполнены. Таким образом, температура стремится к бесконечности из-за того, что в (14.3.15) не было включено затухание, обусловленное спонтанным излучением. Упражнение. Для такого же двухуровневого атома покажите, что автокорре- ляционная функция дипольного момента р (вторая из двух матриц в (14.3.15)) имеет вид <Тг p(t) р(0) ps> —-i- e~2at f cos wt—3 ~ , где CD a + ib~ a2 (/) g (/ — r)> e*1 tE*-Edt о w = V (Е2 — Ег—2Ь)2 — 4(а2 + Ь2). Упражнение. Критерий того, что энергия осциллятора, описывающегося урав- нением х Н-2ухcoo {1- otg (/)} х--0, (14.3.16) стремится к нулю, есть CD <Y>y a2f0® <£(z) — cos 2t°oT b с точностью до порядка a2. 14.4. ТРИ КРИТИЧЕСКИХ ЗАМЕЧАНИЯ В этом параграфе мы тщательно изучим некоторые методы, встре- чающиеся в литературе, и сравним их с работой, проделанной в пре- дыдущих параграфах. Первое замечание касается небольшого изме- 356
нения аргумента в § 14.2, что привело нас к (14.2.7). Из (14.2.36) для v(t) с и(0) = а легко находим t t v (/) = а + а d/iV (^i) а + а2 $ d/i d/,V (ZJ V (t.,) v (t.,). о оо В отличие от (14.2.4)’ это соотношение точное, но оно не решает 14.2.36), поскольку содержит неизвестную величину v(t) в правой (части. Если взять среднее, то получим выражение <u(Z)> через другую неизвестную величину <V (ZJ Vv(t2)y. Однако если теперь предположить, что это среднее можно разбить на 'V (ZJ V (Z2)> <о (/2)>, то в результате получим уравнение, содержащее только* <v(t)>: t ' t t, = a-r a d/i <V (ZJ> a-\- a2 \ d/t d/2 <V (/г) V (Z2)> <u (Z2)>. о об Для простоты опять положим <У(/)> = 0. Тогда, дифференцируя, получаем интегродифференциальное уравнение, в котором начальное значение а уже не возникает: t dt = а2 d/' <!/(/) V(/')> <с (/') . . (14.4.1) о Этот результат отличается от (14.2.6) тем, что скорость измене- ния <v(t)> выражается не через мгновенное значение <u(Z)>, но через интеграл по предшествующим значениям <и(/')>. И только если мы делаем дополнительное приближение, предполагая, что <v{ty> изменяется настолько медленно, что интеграл от <u(Z')> можно заменить на <u(Z)>, выражение (14.4.1) сводится к (14.2.6). Однако это различие только кажущееся. Сначала можно показать, что све- дение среднего <Wu> к <УЕ><и> справедливо только тогда, когда можно пренебречь членами относительного порядка атс. С другой стороны, поскольку интеграл по С в (14.4.1) фактически распростра- няется только на интервал (Z—тс, Z), уравнение дает dt<u>~ ~а2тг,<и>. Тогда, меняя <y(Z')> на заменяем интеграл вели- чиной порядка 1/2T2|dt<u>| ~а2т?<и>, т. е. величиной, имеющей относительный порядок (ат£.)2. Эта разница пренебрежима по сравнению с уже допущенными ошибками. Следо- вательно, интегральное уравнение (14.4.1) не точнее дифференциаль- ного уравнения (14.2.6). Упражнение. Для случая, когда <At (/)> не обращается в нуль, выведите dt 'и (/)> = {А„ + а'А1 (/)>}<« (/)> + t 1 а2 dr«Ai (/) етЛ»А1 (/ —т)» <«(/ —т)>. (14.4.2) ___________ о * R. С. Bourret, Nuovo Cimento 26, 1 (1962). 357
Покажите, что это выражение точнее, чем (14.2.11), Упражнение. Уравнение для монохроматической волны в трехмерной среде со случайным показателем преломления имеет вид * V2<p (r)4-{fe2+5(r)}<p(r) = 0. Выведите для (г)> интегральное уравнение ? ei*|r-r'| (V2 --*2)<<p(r)- — | । г-_г; । (г) g (г')> «р (г') dr'. (14.4.3) При каких условиях оно справедливо? Упражнение. Покажите, что при определенных условиях это интегральное уравнение сводится к волновому уравнению с перенормированным волно- вым числом V 2 <ф> <&2 + ₽ + iY) <<Р> = О, где у > 0, и оно вызывает затухание, когда переходит диссипируемая энергия. Второе замечание мы сформулируем как предостережение, касаю- щееся обманчиво простого вывода уравнения, описывающего только среднюю величину <«(/)> из линейного стохастического уравнения (14.2.1). Пусть задано начальное значение и((„). Тогда для каждой отдельной реализации A (t) имеется решение и (/), которое можно записать в виде н (/)= У (/|/„)«(/„). (14.4.4) Мы знаем, что оператор эволюции можно записать в виде t Y (t | /„)==---- ехр A (t')dt' , о но такое представление здесь не нужно. Принимая во внимание все реализации А (7), легко понять, что Y (I | /0)—стохастическая мат- рица. Из (14.4.4) получаем (/); -- zr (t | /0)> и (ta), <u (ty> = <Y (t\ tn)> и (/„). Здесь точка означает дифференцирование по переменной t. Исключая u(t„), получаем <«(/)> = </ [t 110)> <Y (/|Q>_’ (u (/)> — /?(( | /0)<u(/)>. (14.4.5) Видно, что <u (/)> удовлетворяет обычному дифференциальному урав- нению, математически точному с неслучайным матричным коэффи- циентом R. Возникает вопрос: не было ли наше усердие § 14.2 и 14.3 излишним? - * Из обширной литературы на отд. тему мы выбрали: V. I. Tatarski, Wave Propagation in a Turbulent Medium (McGraw-Hill, New York, 1961); U. Frish in: Probalistic Methods in Applied Mathematics 1 (A. T. Bharucha-Reid ed., Acad. Press, New York, 1968); D. Dence and J. E. Spence in: Idem, Vol. 3 (1973); V. I. Klyatskin and V. I. Tatarski: Sov. Phys. Usp. 16, 494 (1974). 358
Нет, поскольку имеется фундаментальное различие между (14.4.5) и (14.2.11), которое проявляется в присутствии t0 в (14.4.5). Даже если исключить начальное значение и (/0), начальное время t„ по- прежнему играет особую роль, потому что это тот момент времени, в который и статистически не зависит от А. Вспоминая примечание в § 14.1, можно сказать что (14.4.5) применима к множеству So, в то время как (14.2.11) — ко всему S. Результат § 14.3 состоит в том, что уравнение для всех U£S действительно существует при условии, что cct^JI. Оно описывает режим, в котором флуктуации определяются лишь флуктуациями А (/) и уже не зависят от начальных условий. В этом режиме и движется в окружении облака флуктуаций примерно как элементарная частица, окруженная шубой виртуальных частиц. В результате и по-прежнему удовлетворяет уравнению движения, не содержащему начальных данных, но с модифицированными или перенормированными из-за присутствия флуктуаций коэффициентами. Конечно же, это справед- ливо только приближенно и лишь по прошествии определенного вре- мени, по крайней мере не меньшего, чем тс от начального момента времени /0. Иначе говоря, вывод § 14.3 состоит в том, что, если атс<1, то оператор /?(/|/0) в (14.4.5) перестает зависеть от /„ при t —10 > тс и в этом случае дается величиной, заключенной в [] в (14.2.11). Можно добавить, что, после того как этот факт уста- новлен, задним числом можно утверждать, что (14.4.5) можно исполь- зовать для нахождения высших членов. Упражнение. Пусть и—единственная комплексная переменная, удовлетворяю- щая уравнению и ——i (to0+<za>i) и, где со0 — константа, a o>i— случайная величина, не зависящая от времени. (Тогда тс = оо, см. § 14.6.) Найдите R (t |/0) явно, предполагая, что ор гауссово. Покажите, что оно никогда не становится не зависящей от /0 и что не существует дифференциального уравнения движения, содержащего только <и>. Третье замечание касается проекционной техники* получения уравнения для среднего. Пусть и — стохастический процесс, опреде- ленный соотношением (14.2.1) совместно с начальным условием ц(/0) = а. Чтобы облегчить обсуждение, будем считать, что а может быть случайным. Пусть 9*— проекционный оператор, определенный в примечании к параграфу 1.4. Этот оператор проектирует стоха- стические величины на их средние. Пусть J? = 1—9, так что = ^и = и — <и>. (14.4.6) Тогда (14.2.1) можно записать как два связанных уравнения для 9и и di9iu — 9A9iuA-9iA^u, (14.4.7а) dt&u = & АЭ^иА-& А&и. (14.4.76 * S. Nakajima, Prog. Theor. Phys. 20 , 948 (1958); R. Zwanzig, J. Chem. Phys. 33. 1338 (1960). 359
Решая уравнение (14.4.76), можно выразить Хи через /Ри: t Хи (t) = е«-<»)ХАх Хи (/0) + $ ХАХ ХА?и (/') dr. to Подстановка в (14.4.7а) дает интегральное уравнение для ^и: t dt<u(ty> = ?А? <и (t)> + $ ?АХе<‘-‘"> JSAJS ХА? <и (Г)> d/' + to + ?AX^t~^JeAJS Ха. (14.4.8) Опять-таки это уравнение является точным, но не отражает сути дела. Оно содержит начальное время t0 и начальное значение а. Если выбрать а нестохастическим, последний член обращается в нуль, но тогда уравнение применимо только к So. Считая, что а может быть случайной величиной, (14.4.8) можно делать применимым к лю- бой частной функции u^Slt если для а взять правильное распре- деление и в момент /0, однако это распределение нельзя определить не решив исходного уравнения (по крайней мере между Г и t0). Действительно, (14.4.8)—это просто алгебраическое преобразование (14.2.1), поэтому оно содержит в точности ту же-самую информацию и решить его отнюдь не проще. Эю не есть желаемое уравнение только для <и>, справедливое при всех начальных условиях. Однако работа, проделанная в § 14.3, дает основание сделать вывод, что если ат^-^1, то последний член в (14.4.8) практически равен нулю при t—так что остается интегральное уравнение,.содержа- щее только <и;. Но в соответствии с первым замечанием (см. выше) интегрирование по предшествующему времени является фиктивным и это уравнение можно заменить дифференциальным уравнением (14.2.11). Упражнение. Предположим, что А =Д0-4-а<41. Тогда для любого стохасти- ческого вектора и имеют место соотношения: ?А?и ={Д0Н-а<Д1>}<м>, ?АХи =а <{Д1 — <Л!>} и>, ХА?и =а{Л1—<Л1>}<«>, ХА Хи = А„ {и — <и» + О (а). С помощью этих тождеств покажите, что (11.4.8) совпадает с уравнением (14.4.2). Упражнение. Те же самые приемы проектирования можно применить к несто- ' .хаотическому уравнению и-Аи, когда ? — проекционный оператор в про- странстве векторов и. (Этот прием часто используют для того, чтобы исключить некоторые нежелательные компоненты и, которые мы считаем не относящимися к сути дела, хотя их начальные значения не равны нулю, как в последнем члене (14.4.8).) Постройте таким образом уравне- ние для координат гармонического . осциллятора после исключения его импульса с помощью проецирования. 360
14.5. НЕЛИНЕЙНЫЕ СТОХАСТИЧЕСКИЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ Рассмотрев в предыдущих двух параграфах линейные стохасти ческие дифференциальные уравнения, вернемся теперь к общему случаю (14.1.1). Его, так же как и обычные дифференциальные урав- нения, можно преобразовать в линейное уравнение, если перейти к связанному с ним уравнению Лиувилля. Для того чтобы сделать это, мы временно возьмем одну реализацию y(t) процесса Y (0 и рас- смотрим нестохастическое уравнение hv = Fv(u, t; y(t)). (14.5.1) Оно описывает поток в «-пространстве, плотность которого изме- няется в соответствии с уравнением У0)р}- (14.5.2) Это обычное гидродинамическое уравнение непрерывности р=— div pv, записанное для произвольного числа измерений. Хорошо знакомое уравнение Лиувилля в статистической механике является частным случаем, в котором поток является несжимаемым, т. е. дивергенция 2^Ev/d«v обращается в нуль и тогда множитель Fv в уравнении (14-5.2) можно записать перед d/dUy,. Однако Лиувилль не вводил такого ограничения в своей работе. Если теперь предположить, что y(t) пробегает по всем реализа- циям процесса Y (I) с соответствующими вероятностями, уравнение 04.5.2) становится линейным стохастическим дифференциальным урав- нением для р («, 0. Общий вид уравнения (14.5.2) совпадаете (14.2.11), если рассматривать р как аналог и в (14.2.1) и представить век- тор и как аналог ненаписанной метки v в (14.2.1). Линейный опе- ратор 2(d/d«<v)Fv . • является аналогом матрицы А. Следовательно, для того чтобы получить приближенное уравнение для среднего zp(«, 0> при заданном р(«, 0), формально можно применить тот же самый метод. Предположим, что это сделано, тогда возникает вопрос: что нам скажет результат о решении исходного уравнения (14.5.1)? Ответ на этот вопрос дает следующая лемма. Предположим, мы решили (14.5.1) с начальным условием uv (0)=av„ где а—заданный вектор. Пусть Р(и, t) — получающееся в резуль- тате распределение вероятности и при /2^0. С другой стороны, пусть. (14.5.2) решено с начальным условием р(«, 0) = 6(ы—a) = H6(«v — av). V Тогда имеем 'р(«, 0> = Р(ы, t). (14.5.3), Для того чтобы доказать эту лемму, заметим, что (14.5.1) для каждого y(t) определяет преобразование начального значения а 361
в значение и в момент времени t, которое мы обозначим а1. Если теперь допустимы все значения y(t), то, согласно (1.5.2), имеем Р(и, = (14.5.4) С другой стороны, для каждого y(t) плотность потока в ^-простран- стве удовлетворяет соотношению p(af, t)daf = p(a, 0) da. (14.5.5) Отсюда следует р(«, t) р(и~У (14.5.6) Здесь d(u_,)/d(a) — якобиан преобразования. Согласно свойству пре- образования дельта функций, (14.5.6) равно 6(и— а*). Теперь возь- мем среднее по всем y(t)\ в результате получится (14.5.3), что и тре- бовалось доказать. Итак, сформулируем стратегию решения нелинейного стохасти- ческого дифференциального уравнения (14.5.1). Сначала приводим его к эквивалентному линейному виду (14.5.2). Затем применяем метод, сформулированный в предыдущих параграфах, для того чтобы найти приближенное дифференциальное уравнение для среднего <р(и, 0> при условии, что число Кубо мало. В результате полу- чается уравнение для распределения вероятности Р(и, t) в виде Р(и, t) VJ>(u, t) (14.5.7) с оператором К, действующим на зависимость от и. Таким образом, в этом приближении Р описывается основным кинетическим требо- ванием, К. получается как разложение в степенной ряд по числу Кубо, но члена порядка а2т{. обычно оказывается достаточно. Тот же самый метод можно применять, если F само оказалось линей- ным, как в (14.2.1), когда мы хотим узнать полное распределение вероятности и, а не его среднее значение. Приложение. Рассмотрим следующую задачу, связанную с нагре- вом плазмы*. Заряженная частица движется в одном измерении в электрическом поле Е: x = v, v — aE(x, Е (х, /) является случайным процессом, стационарным в простран- стве и времени с нулевым средним временем автокорреляции т₽. Плотность ансамбля таких частиц удовлетворяет уравнению (14.5.2): dp (XV, t) /)р== {Ло + аЛ1(О}р. * Р. A. Sturrock, Phys. Rev. 114, 186 (1966); D. E. Hall and P. A. Sturrock Phys. Fluids 10, 2620 (1967); M. B. Silevitch and К. I. Golden, J. Statist. Phys., 65 (1973). -362
Для того чтобы применить (14.2.7), мы должны определить опера- тор етЛ». Пусть f(x, v) — произвольная функция, тогда етА "f(x, 0 — ехр | — tv ~ ] f (х, v) —- f (х—tv, v). Следовательно, величина е~тЛ» <« (/)>, встречающаяся в (14.2.7), пре- вращается в P(x + tv, v). Нужно подействовать на нее оператором А (7 — т): — т)Р(хн-тщ v)=--- — E[x,t — T)^-^+T-^(x+TV, v). Затем етЛ» сдвигает аргумент х обратно: етА"А j (/ — т) е~хА°Р (х, v) -- — Е (х— tv, t — т) j -J- т J (х, v). После этого нужно подействовать оператором еще раз, и тогда (14.2.7) в нашем случае приобретает окончательный вид С / АР дР \ X \ <£ (х, t) Е (х—tv, t — т)> -д—р т —т—j (1т, J ' ’ ' ' \ dv дх / О или дР , дР 2 д . . дР , , д , , dP -37- + Р “Г- - • а 3“ Со (и -3 F а 3- С1 (V) ~Г~, dt дх dv °х ' dv dv 1 v ' дх X г0 (и) = J <£ (%, t)E(x—w, t — r)> dr, о X ti (0 -- T <E (x, f)E(x—tv, t — t)> dx. (14.5.8) о Неудивительно, что автокорреляционная функция включает в себя поле, возмущенное частицей, в то время как частица движется с не- возмущенной скоростью V. Упражнение. Выведите (14.5.2) из (14.5.5). Упражнение. Выведите из (14.5.8) уравнение для распределения скорости, кото- рое соответствовало бы нагреву плазмы. Упражнение. Популяция растет со скоростью, описывающейся флуктуирующим коэффициентом и {1 i-ас (/)}«• Примените тот же метод, для того чтобы получить распределение вероят- ности в момент времени t с точностью до второго порядка по а. Сравните результат с точным решением. Можно вывести общие формулы для более общих случаев, но они достаточно сложны*. Поэтому мы ограничиваемся случаями, в кото- * N. G. van Kampen. Physics Reports 24, С, 171 (1976). Приложение к броу- новскому движению спинов рассматривается в работе: R. Kubo and N. Hashi- tsume, Suppl. Prog. Theor. Phys. 46, 210 (1970). 362
рых не только атс мало, но и тс мало по сравнению с характерным временем невозмущенного движения. Точнее говоря, положим F(u, t) — Fa(u')Jra.F-L(u, t) co случайным Fi и по аналогии с (14.2.8) предположим, что tJF0(u)|<1. Тогда можно использовать (14.2.9) с (14.2.7). Приложение. Частица движется в одном измерении под воздействием силы К (х), силы трения —fix и случайной силы al(t): х + fix = К (х) + al (/) Если бы I было белым шумом, то это была бы модель Крамерса (см. § 8.7). но мы только предполагаем, что £ имеет малое время корреляции тс. Уравнение Лиувилля имеет вид ^^ = -^-~ИМ-^ + ^(/)}р=={До4аЛ1(О}Р. Теперь уравнение (14.2.9) принимает вид dP (х, v, t) дР „ , . дР , о д D 2 С Е ,i Ч\ j <РР —Чп------------------F^(x)-r- -г fi-^-vP + а2 \ <?(/)£(/ —т)> dr— dt дх ' ’ dv 1 dv J х ’ dv2 о Таким образом, мы вывели уравнение Крамерса (8.7.4) как прибли- жение для малого времени корреляции тс, которое становится точным в пределе (14.3.12). Из нашего вывода видно, что коэффициент при флуктуационном члене является интегралом от автокорреляционной функции случайной силы. Упражнение. Покажите, что в этом случае поправка (14.2.12) имеет вид 2Й . 2 д2Р — a2pct -e-v + “ Ci 5—5- > dt)2 ' dx dt' ci — <6(0 £ (t—t)> rdr. о Упражнение. Для следующего уравнения Мальтуса — Верхюльста со случайным коэффициентом и = и — {1 -jag (/)} и2, получите основное кинетическое уравнение для Р (и, t) и покажите *, что Ps (и) ехр Г —f-----------------------у «И ] • и2 г | а2с0 \ и 2 / J Получите тот же самый результат с помощью преобразования уравнения к линейному для и-1. * О. J. Heilman and N. G. van Kampen, Physico 93A, 476 (1978). 364
Упражнение. Исследуйте таким же способом уравнение V И Рис. 41. Нелинейная цепь с генератором случайного потенциала «={1 + “Н0}и — {1 + Рп (0} «2 с двумя случайными членами, не обязатель- но некоррелированными. Упражнение. Рассмотрите однокомпонентное уравнение Его вид совпадает с нелинейным уравне- нием Ланжевена или уравнением Ито (8.8.15), но считается, что £ обладает малым, но не нулевым временем корреляции тс. Покажите, что соответствующее основное кинетическое уравнение (14.5.7) в пределе хс —0 переходит в уравнение Стратоновича (8.8.19), а не в уравнение Ито (8.8.16). Это подтверждается явным вычислением в примечании в конце § 8.8, но наше утверждение применимо только к внеш- нему шуму *. Упражнение. В цепи, изображенной на рис. 41, поток в сердечнике является нелинейной функцией Ф (J) тока J. Генератор производит э. д. с. + (/), где V, (г) — случайная величина с нулевым средним. В пределе (11.3.12) плотность вероятности тока описывается уравнением Фоккера — Планка дР(1, t) д f Rl~V(t) ; Ф"(/) ) п . Р dt ~dJ \ Ф'(/) ф 0 Ф'(/)2/ Р^аС°д/2Ф'(.')2' где 00 св~(О V (t — т)> dx. о 14.6. БОЛЬШИЕ ВРЕМЕНА КОРРЕЛЯЦИИ В предшествующих параграфах мы рассматривали малые времена корреляции или, точнее говоря, случаи, в которых атс<|1. В этом случае существует общий приближенный метод, дающий определен- ные и физически полезные результаты. В пределе (14.3.12) выживают только первый член разложения и результат получается таким же, как и при обычных вычислениях в случае белого шума. В § 14.2 мы выяснили причину существования такого общего метода: воздей- ствие флуктурирующего члена в течение времени тс мало, и его можно вычислить с пом,ощыо теории возмущений, затем описать поведение на больших временах, складывая все эти независимые вклады. Этот метод становится непременимым, когда автокорреляционное время случайных коэффициентов в F(u, t\ Y) велико, т. е. когда атс^1. В этом случае не существует общего метода, но для опре- деленных классов уравнений можно разработать частные методы. * Различные выводы даются в [6, Section IV.8]. 365
Они позволяют изучить поведение системы при больших временах автокорреляции. Первый класс обладает бесконечным гс: коэффициенты в (14.1.1) являются случайными постоянными X, а не случайными функциями Y (/). В этом случае может оказаться, что уравнение можно решить для каждого частного значения х из множества возможных значе- ний X. Допустим, что такое решение U (t; х, а) с начальным зна- чением а известно. Тогда плотность вероятности и в момент вре- мени t Ри (и, t) = Ь\и--U (/; х, a)]Px(x)dx. Известная и только частично решенная задача такого типа — это линейная цепочка гармонически ограниченных частиц, у которых массы и упругость пружинок —случайные величины*. Тесно примы- кает к этой задаче проблема нахождения распределения собственных значений случайной матрицы**. Как будет показано в упражнении, начальный момент времени / = 0 из результата не исчезает. Это связано с тем, что система обладает бесконечной памятью и никогда не забывает, что в этот частный момент времени величина и была фиксирована и не зависела от значений коэффициентов. Поэтому нет никакой надежды на то, что и хотя бы приближенно будет марков- ским процессом, не говоря уже о том, что <н> удовлетворяет такому не зависящему от времени дифференциальному уравнению, как (14.2.7). Второй класс можно проиллюстрировать уравнением для одной переменной: и =— A(t)u = — {До(/)} н, н(0) = а, где Ло — положительная константа, | (Л — случайный процесс с боль- шим временем корреляции тг, а — малый параметр. Положим и = •— и0 + аи± -ф а2н2 4- ... и применим теорию возмущений. С точностью до второго порядка получим и (t) -- е t t tl 1 — а I (/J сК + a2 dG $ d/21 (/J g (/2) 0 0 0 Возьмем среднее и предположим для удобства <g (Z)> = 0: <и (/)> — е-л«* t о + а2 d/j d^2<|(/i)g(Z2)> о о a. (14.6.1) * См. работы: F. J. Dyson and others reprinted in: E. H. Lieb and D. C. Mat- tis, Mathematical Physics in One Dimension (Acad. Press, New York, 1966); более позднее развитие дано в работе: J. L. van Hammen and R. G. Palmer, J. Phys. (London) A12, 563 (1979). ** С. E. Porter, Statistical Theory of Spectra: Fluctuations (Acad. Press, New York. 1965); M. L. Mehta, Random Matrices (Acad. Press, New York, 1967); M. Carmeli, J. Statist. Phys. 10, 259 (1974). 366
Эта формула совпадает с (14.2.4), но из-за того, что время корре- ляции хс велико, мы не можем продвинуться дальше старым спосо- бом. Однако если А„ велико, то все решение быстро стремится к нулю и этого достаточно, чтобы полученное по теории возмущений реше- ние было применимо в течение времени, большого по сравнению с Ао1- Тогда условие справедливости (14.6.1) имеет вид а/А0<< 1. Упражнение. Рассмотрите уравнение и — — io>u, в котором случайная константа ы распределена вблизи своего среднего значения ы0 согласно: 1) распределению Лоренца, 2) распределению Гаусса, 3) экспоненциально. Найдите распределение Р (и, 11 а, 0) величины и в момент времени I при фиксированном начальном значении а. Упражнение. Найдите распределение Р (х, х, I | а. Ь, 0) для уравнения x-f о>2х —О с таким же о>, как и в предыдущем упражнении. Упражнение. Вычислите (14.6.1), когда g (Г)—процесс Орнштейна — Уленбека. Упражнение. Запишите обобщение формулы (14.6.1) для многокомпонентного уравнения (14.2.1). Каковы условия его-справедливости? Упражнение. Сформулируйте аналогичный метод и условие его справедливости для нелинейных уравнений. Третий класс уравнений, в котором можно исследовать влияние произвольных времен корреляции, представляет больший интерес. Этот класс состоит из уравнений (14.1.1), в которых У (/) является марковским процессом. Пусть П (г/, t\y0, /„)-—плотность вероятности перехода для этого марковского процесса, а основное кинетическое уравнение для него имеет вид П = \¥П (14.6.2) Сделаем одно важное замечание: процесс, описывающийся совместными переменными (и, у), снова является марковским. Пусть У'[и, у, t) — плотность вероятности этого совместного про- цесса. За короткое время А/ она изменяется наУ(ц, у, /-|-А/), при- чем это изменение связано с двумя отдельными причинами, которые в первом порядке по А/ являются аддитивными. Во-первых, и изме- няется согласно (14.5.2) из-за того, что меняется согласно (14.1.1). Во-вторых, у может совершить скачок за время А/, что приведет к изменению 3* согласно (14.6.2). Тогда t, у)3>^3>. (14.6.3) V Это основное кинетическое уравнение объединенного процесса*. * Это уравнение под названием «стохастическое уравнение Лиувилля» было введено Кибо в работе: R. Kubo. J. Mathem. Phys. 4, 174 (1963). Прилагатель- ное «стохастическое» в данном контексте используется в смысле «связанное со стохастическими уравнениями» в противоположность нашему пониманию этого слова как синонима «случайный», что отражено в названии этой главы. 367
Решение уравнения (14.6.3) с начальными значениями и0, уо при to дает вероятность перехода У* (и, t, у\и0, t0, у0) объединенно- го марковского процесса. Если его проинтегрировать по у, то полу- чим плотность вероятности для одного и при условии, что началь- ные значения и0, у0 в момент времени to заданы. В большинстве случаев представляет интерес не частное значение уо, а среднее по всем возможным уо: Р(и, t\u0, 0)= di/5 Z0)di/053(w, у, t\u6, у0, t0), где П. — распределение у в момент времени /, т. е, функция Р-. (у, t)r если использовать стандартные обозначения § 3.4. Согласно этому уравнению нужно только решить (14.6.3) с начальным условием у, С)-6(ц — «„IFE (у„, С)- Обычно Y (/) является стационарным процессом, так что ГЕ является IF(t/). К сожалению, уравнение (14.6.3) удается решить только в редких случаях. Но ситуация является более благоприятной, если Fv линейно по и и не зависит явно от времени, в этом случае уравнение (14.1.1) имеет вид йу = 2А-ц(П0)«ц- (14.6.4) И Тогда (14.6.3) превращается в ° - X (у) + w^. (14.6.5) V, и Теперь определим частное среднее: mv(y, t) = uv!P (и, у, t)du. (14.6.6) Умножая (14.6.5) на uv и выполняя интегрирование, получаем dmv{dyt' ° = X Лц (У) т» + Wmv. (14.6.7) и, Эти связаннее уравнения нужно решить с начальными значениями mv(y, O) = wOvII1(z/, 0). (14.6.8) Эга задача проще, чем исходная (14.6.5), но ее решение, конечно, может дать только среднее: <mv (/)> = $ mv {у, t)dy. Пример. Кибо построил следующий пример, для того чтобы про- демонстрировать сужения и расширения линии вследствие случайных 368
возмущений *. В уравнении (14.1.2) предположим, что <о = <о0 + (/), где <о0 и а — константы, а £,(1) — дихотомический марковский процесс (4.2.3). Поскольку Е может принимать только два значения, введем сокращенное обозначение 5s (X, ±1, /) = ^-1 (х, О и запишем (14.6.6) как два связанных уравнения: dS>. д —й~ = — Д’ ®о -)- «) х5}, — у S' + -+- у S’ _, dt дх ' ' ' 1 ' ~ («о — a) x'S. —yS _ -t у S',. dt дх ' ' 'ft Уравнение (14.6.7) для частных средних получают умножением любого из уравнений на х и последующем интегрированием: т — (о»2--- а) т¥ —ут. у /и_ —(а>о—а)т_—ym_Sytn^- (14.6.9) Начальное условие (14.6.8) сводится к т± (0) = 1/2а, а соответству- ющее решение для <«(/)>=-/и,. (7)4-/и_ (/) имеет вид <м (/)> ae”(i®»+v> * J cos (t V (а2 — у2) Н—sin (t К а2— у2) I. ( } а2 — у2 I (14.6.10) Этот результат показывает, что средние значения медленных воз- мущений, т. е. таких, у которых y<<ja, ведут себя как суперпози- ции двух гармонических осцилляторов с частотами, близкими к и„ + а, каждый из которых слегка затухает. В терминах Фурье-образов это равносильно двум отдельным «лоренцианам». Когда у возрастает, оба пика уширяются и сливаются в одну широкую линию. С другой стороны, для быстрых возмущений, когда yJs>a, из (14.6.9) в первом порядке по у-1 получаем Г сс^ 1 <« (/)> = а ехр j io».,/ —— t J. Это выражение представляет собой единственный лоренцевский пик вблизи соо. Этот пример показывает, как более быстрые возмущения могут приводить к сужению линии**. Упражнение. Выразите иерархию распределений Р„ процесса и и через реше- ние У*(м> У’ Н цо, Уо< to) уравнения (14.6.3), доказав тем самым, что про- цесс полностью определяется (14.6.3). * R. Kubo in: Stochastic Processes in Chemical Physics (Advances in Chemical Physics 15; К. E. Shuler ed., Interscience, New York, 1969). Also P. W. Anderson, J. Phys. Soc. Japan 9, 316 (1954); R. Kubo, J. Phys. Soc. Japan 9, 935 (1954). ** Дальнейшую литературу о влиянии стохастических возмущений на ши- рину линий можно найти в работе: G. S. Agarwal, Z. Phys. ВЗЗ, 111 (1979). 369
Упражнение. В примере Кубо ширина линии выражается через нормированную «функцию ширины линии» *: 1, . 1 С <U'(0)M(0>S (W—К’о)—2^- J <ц* (0) и (0)>s' е At- - ® Вычислите эту величину и подтвердите приведенные выше утверждения. Упражнение. Как и в (14.1.2), возьмите Ь) ag, но предположите теперь, что £—процесс Орнштейна — Уленбека. Покажите, что в соответствующих единицах ,7*(0) и (/)>-.ехр f--(e-<— 1 + /)]. Упражнение. В случайном осцилляторе (14.8.3) возьмите co(Z)2 — coo (1 — ag), где g(/) — дихотомический марковский процесс**. В этом случае будет четыре уравнения (14.6.7) для <х> + , <х>_, <х> + , <х>_. Четыре собствен- ных значения дают частоты в усредненном процессе <х (/)>. Для малых у получите два малых распределения Лоренца вблизи частот со0 V1 ± а, а для больших у — одно распределение Лоренца вблизи а>(). Упражнение. Уравнения выживания дефектного гена*** можно преобразовать к виду и ~ (а + б£) и 4 с с постоянными а, Ь, с и дихотомическим марковским процессом £. Поскольку настоящее число выживающих генов есть и/(1-фи), нам незачем знать <«>. Найдите распределение вероятности как функцию времени I в частном случае с = 0. Упражнение. Для дихотомического марковского процесса У (/) производящая функция его интеграла есть t a j У (/') dt' у о J G (a, t)— (ехр Покажите, что она удовлетворяет уравнениям (14.6.9) с <оо — 0, а ее явное значение можно получить (из (14.6.10)****. Упражнение. Жгутиковая бактерия передвигается в химическом градиенте с постоянной скоростью*вдоль оси х. В случайные моменты времени она останавливается и с равной вероятностью продолжает движение либо в направлении ф х, либо в направлении —х. Однако вероятность оста- новки за единичное время зависит от направления движения, так что она в конечном счете влияет на результирующее смещение X (/). Найдите характеристическую функцию величины X (/), а также ее среднее значение и дисперсию *****. * Р. С. Martin, Measurements and Cerrelation (Gordon and Breach, New York, 1968). ** R.C. Bourret, U. Frisch and A. Pouquet, Physica 65, 303 (1973); N. G. van Kampen, Physica 70, 222.(1973). *** H. Falk and W. J. Ventevogel, Physica 95A, 191 (1979). **** Это неявно использовалось в работе: Р. Hu and S. R. Hartmann, Phys. Rev. B9, 1 (1974), для изучения воздействия магнитного поля на систему спинов. ***** Н. С. Berg, Scientific American 233, 2—36 (August. 1975); Nossal R. J. and G. H. Weiss, J. Statist. Phys. 10, 245 (1974). 370
Упражнение. Запишите и решите уравнение Фоккера — Планка, связанное е -st-—- atanhx------— У (/), dt cosh х — где У (/)— процесс Орнштейна — Уленбека*. Упражнение. Возьмите в (14.3.16) £ (/) в виде дихотомического марковского процесса и найдите точное условие того, что энергия стремится к нулю**. 14.7. НЕОДНОРОДНОЕ ЛИНЕЙНОЕ УРАВНЕНИЕ В этом последнем параграфе мы рассмотрим систему линейных уравнений и = A (t) и г f (О, (14.7.1) где А (/) — заданная случайная /г-матрица, а /(/)— заданный слу- чайный «-компонентный вектор. Будем считать, что времена корре- ляции A (t) и /(/) малы. Если к тому же А (/) и f (() статистически независимы друг от друга, уравнение (14.7.1) можно исследовать с помощью методов, развитых в § 14.2 и § 14.3 (ср. с (14.2.13)). Если они не являются независимыми, то (14.7.1) можно рассматри- вать как частный случай нелинейного уравнения общего вида, изученного в § 14.5. Однако в следующем подходе используется линейность (14.7.1) при непосредственном выводе уравнения для среднего <«(/)> в случае, когда А (7) и f{t) коррелируют друг с другом. Явное решение (14.7.1) с начальным условием н(0) = а имеет вид t ехр) A (t')dt' о «(0 = J exp$4(f)d/" /(f)d('. (14.7.2) о t' Множитель f(t') можно записать внутри символов упорядочения по времени, поскольку t' < f. Тогда можно выполнить усреднение по обоим случайным процессам Ди/: <и (f)> = t ( ехр J A (t')dt') о t о В первом члене можно использовать обычное разложение по куму- лянтам, а во втором—тождество (14.3.13): <и (/)> = (t { п ехр j d/t <А (7г)> 4- ~ У d/j J d/2<<(/J А (/2)>> т • • ^0 оо t о (1 ) ехр | d/i <А (/j> + ... } х \о / / t х </(/')> + S «А (f)»df -г.. v t' (14.7.3) * М. О. Hongler, Helv. Phys. Acta 52, 280 (1979). ** Bourret, Frisch and Pouquet, loc. cit. 371
Для того чтобы превратить это в систематическое разложение, нужно ввести параметр разложения. Предположим снова, что A (t) можно представить в виде Ао + A-aAi(t), и перейдем к представлению взаимодействия (14.2.3). Нет необходимости оценивать величину f, но для удобства мы будем считать, что она имеет тот же порядок величины а. Соответственно для ее представления взаимодействия полагаем е-м»/(/) = «£(/). Обе величины ЛД/) и f(t) будем считать стационарными, а их вре- мена корреляции — конечными, большее из них обозначим т^. В окон- чательных выражениях для простоты положим <Л1(/)/--0 и </(/)>=0. Тогда (14.7.3) принимает вид < v (ty> = ехр < у J <V (/J V (/2)> d/j d/2 > l о । ‘‘ Г I + dt' exp ! о I v <V Д1) v (Л)> d/Jx 1 1 В том выражении мы уже опустили высшие кумулянты V, поскольку очевидно, что они дают вклад и более высокие порядки по пара- метру а-тс. < Если теперь преобразовать двойные интегралы в экспонентах, как это мы сделали в (14.3.3), и пренебречь оставшимся упорядо- чением по времени, то можно взять производную по времени. Пола- гая /^>тс, в результате получаем а2J <V (Z) V Д—с)> dr О t f t » 1 + d/'exp ja3 § d/j § <V (Д) V (t — t)> dx} {a3<V (/)g(f)>+ • •}• о V t- о J Первая строка представляет собой знакомый результат для однород- ного случая. Вторая строка, очевидно, имеет порядок a2xt., а в этом порядке экспоненту можно опустить. Тогда ^<v(/)> = a2 f <У (/) V (t— т)> dr О <хо> + оо -г a2 $ <У (0g(*—т)> dx4~O(a3T2). О 372
В первоначальном представлении это выражение имеет вид ^ <«(/)> = X + а2 у <4j (/)етЛ»Д1(/— т)> е-хЛ»с1т о <н (/)> 00 4-а § <Д1(/)етЛ»/(/— т)> dx. (14.7.4) о В этом случае*, как и в § 14.3, можно убедиться в том, что упо- рядочение по времени просто добавляет поправки более высокой степени по параметру атс. Упражнение. Пусть и — комплексная скалярная функция, удовлетворяющая уравнению и = — щ>0 {1 (Z)} « + f (t), где £ и f обладают свойствами, перечисленными в тексте. Найдите урав- нение для <« (/)>. Упражнение. Если не делать упрощающего предположения о равенстве нулю средних <Л1 (/)>== <7(z)> = 0, то результат должен иметь вид dt <и (/)> X </(/)>+» «Л1(/)етЛ°/:(^ — т)» dx. (14.7.5) о Упражнение. Покажите, что в пределе белого шума (14.3.2) этот результат сводится к точной формуле <?/<«(/)>= Л0 + а <Л1 (1)/ — 1? «Л! (/) Ai (t — т)>> dx <«(/)> + о X 4“ а 44^41 (О f (z т)» 4т. о * Более общий случай и члены более высокого порядка рассмотрены в работе: J. В. Т. М. Roerdink, Physica. 373
ОГЛАВЛЕНИЕ Предисловие редактора ............................................ Предисловие автора................................................ Глава 1. Стохастические переменные ................................. 1.1. Определения ................................................. 1.2. Средние...................................................... 1.3. Распределения для многих переменных ........................... 1.4. Сложение стохастических переменных . ........................ 1.5. Преобразование переменных.................................... 1.6. Распределение Гаусса......................................... 1.7. Центральная предельная теорема............................... Глава 2. Случайные события........................................ 2.1. Определения ................................................. 2.2 Распределение Пуассона....................................... 2.3. Еще один способ описания случайных событий................... 2.4. Формула обращения............................................ 2.5. Корреляционная функция....................................... 2.6. Время ожидания............................................... Глава 3. Стохастические процессы.................................. 3 1. Определения................................................ 3.2. Стохастические процессы в физике............................. 3.3. Преобразование Фурье стационарных процессов.................. 3.4. Иерархия функций распределения............................... 3.5. Колебания струны и случайные поля............................ 3.6. Ветвящиеся процессы'......................................... Глава 4. Марковские процессы ..................................... 4.1. Свойство марковости.......................................... 4.2. Уравнение Чепмена — Колмогорова ............................. 4.3. Стационарные марковские процессы............................. 4.4. Выделение подансамбля........................................ 4.5. Марковские цепи . ........................................... 4.6, Процессы распада............................................. Глава 5. Основное кинетическое уравнение.......................... 5.1. Вывод основного кинетического уравнения ,.................... 5.2. Класс W-матриц ........................................ . . 5.3. Предел больших времен ....................................... 5.4. Замкнутые изолированные физические системы............... . . 5.5. Возрастание энтропии......................................... 5.6. Доказательство соотношения детального равновесия ............ 5.7. Разложение по собственным функциям .......................... 5.8. Макроскопическое уравнение................................... 5 9. Сопряженное уравнение...................................... 374
Глава 6. Одношаговые процессы ................................... 134 6.1. Определения; процесс Пуассона............................ . 134 6.2. Случайное блуждание с непрерывным временем.................. 136 6.3. Общие свойства одношаговых процессов........................ 139 6.4. Примеры линейных одношаговых процессов...................... 143 6,5. Естественные граничные условия.............................. 147 6.6. Линейный одношаговый процесс с естественными граничными усло- виями ............................................................ 149 6.7. Искусственные граничные условия ............................ 153 6.8. Искусственные граничные условия и нормальные моды ...... 157 6.9. Нелинейные одношаговые процессы............................. 161 6.10. Проблема первого прохождения............................... 164 Глава 7. Химические реакции..................................... 169 7.1. Кинематика химических реакций .............................. 170 7.2. Динамика химических реакций ............................... 174 7.3. Стационарное решение........................................ 176 7.4. Открытые системы ......................................... 179 7.5. Одномолекулярные реакции.................................... 181 7.6. Коллективные системы...................................... 186 7.7. Составные марковские процессы............................... 190 Глава 8. Уравнения Фоккера — Планка и Ланжевена.................. 195 8.1. Введение................................................... 195 8.2. Вывод уравнения Фоккера — Планка ........................... 199 8.3. Броуновское движение........................................ 202 8,4. Рэлеевская частица.......................................... 205 8.5. Приложение к одношаговым процессам.......................... 208 8.6. Линейное уравнение Фоккера —- Планка в случае многих переменных 212 8.7. Уравнение Крамерса.......................................... 215 8.8. Метод Ланжевена .............’............................. 219 8.9. Как применять метод Ланжевена.............................. 228 Глава 9. Разложение основного кинетического уравнения............ 233 9.1. Вводные рассуждения....................................... 233 9.2. Общая формулировка метода разложения........................ 237 9.3. Природа макроскопического закона . ........................ 242 9.4. Приближение линейного шума.................................. 245 9.5. Разложение основного кинетического уравнения в случае многих переменных........................................................ 250 9.6. Высшие порядки.............................................. 254 Глава 10. Процессы диффузионного типа............................ 259 10.1. Основное кинетическое уравнение диффузионного типа......... 259 10.2. Диффузия во внешнем поле................................... 262 10.3. Диффузия в неоднородной среде.............................. 265 10.4. Уравнение диффузии в случае многих переменных.............. 268 10.5. Предел нулевых флуктуаций.................................. 272 Глава 11. Неустойчивые системы................................... 276 11.1. Бистабильные системы....................................... 276 11.2. Время перехода............................................. 283 11.3. Вероятность расщепления ................................... 287 11.4. Проблема Мальтуса — Ферхюльста............................. 290 11.5. Критические флуктуации.................................... 293 11.6. Диффузия в потенциале с двумя ямами ....................... 296 11.7. Параболическое приближение ................................ 300 11.8. Предельные циклы и флуктуации ............................. 304 11.9. Лазер как диффузионная система ............................ 307 375
Глава 12. Флуктуации в непрерывных системах....................... 312 12.1. Введение ................................................. 312 12.2. Диффузионный шум............................................ 315 12.3. Метод составных моментов ................................... 317 12.4. Флуктуации плотности в фазовом пространстве ................ 321 12.5. Флуктуации и уравнение Больцмана . ......................... 324 Глава 13. Статистика скачкообразных событий....................... 331 13.1. Основные формулы и простой пример........................... 331 13.2. Скачкообразные события в нелинейных системах . ,............ 334 13.3. Фотоэффект; флуктуации числа падающих фотонов............. 336 13.4. Фотоэффект (продолжение).................................... 339 Глава 14. Стохастические дифференциальные уравнения............... 343 14.1. Определения............................................... 344 14.2. Эвристический анализ мультипликативных уравнений............ 347 14.3. Разложение по кумулянтам . ................................. 350 14.4. Три критических замечания................................... 356 14.5. Нелинейные стохастические дифференциальные уравнения .... 361 14.6. Большие времена корреляции........................ 365 14.7. Неоднородное линейное уравнение............................ 371 Ван Кампен Н. Г. СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ В ФИЗИКЕ И ХИМИИ