/
Текст
В. И. Тихонов, М. А. Миронов
МАРКОВСКИЕ ПРОЦЕССЫ
МОСКВА «СОВЕТСКОЕ РАДИО» 1977
6Ф2.4
Т46
УДК 621.37 ; 621.391
Тихонов В. И. и Миронов М. А.
Т 46 Марковские процессы. М., «Сов. радио»,
1977.
488 с. с ил.
Изложены основные теоретические сведения по разным видам марковских процессов (цепи Маркова, марковские последовательности, непрерывные, разрывные, полумарковские, смешанные и точечные процессы) и рассмотрены разнообразные задачи, связанные с достижением границ. Описана методика применения теоретических результатов для решения конкретных задач из области радиотехники, автоматики, теории надежности и массового обслуживания. Подробно рассмотрено умного разнообразных радиотехнических примеров и задач, имеющих самостоятельное практическое значение.
Книга предназначена для широкого круга специалистов в различных областях знания, интересующихся приложениями теории марковских процессов.
30401-040
046(01)-77
6Ф2.4
Редакция литературы по вопросам космической радиоэлектроники
Scanned by epsgam for ELMM 2006
ИБ № 168
Василий Иванович Тихонов
Михаил Аркадьевич Миронов
Марковские процессы
Редактор К. И. Кучумова
Художественный редактор А. Н. Алтунин Обложка художника Ю. П. Трапакова Технический редактор Г. 3 Кузнецова Корректор О. В. Щербакова
Сдано в набор 30/IX-76 г. Подписано в печать 18/1-77 г. Т-03020
Формат 60 X 90l/ie Бумага типографская № 1 Объем 30,5 усл. п. л. 29,0 уч.-изд. л.
Тираж 17 800 экз. Зак. 1216 Цена I р. 90 к.
Издательство «Советское радио*. Москва Главпочтамт, а/я 693
Московская типография № 4 «Союзполиграфьрома» при Государственном Комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли
Москва И-41. Б Переяславская. 46.
© Издательство «Советское радио» 1977 г.
Предисловие
Основой для написания данной книги послужили лекции, прочитанные аспирантам радиотехнической специальности. Первоначально предполагалось включить материал лекций в одну из глав книги В. И. Тихонова «Статистическая радиотехника». Однако, учитывая большую прикладную значимость теории марковских процессов и недостаточно полное освещение ряда вопросов в отечественной литературе, обработанные и расширенные материалы лекций оформлены в виде отдельной книги.
Книга содержит 32 параграфа и 3 приложения. Нумерация рисунков, формул и таблиц ведется по параграфам. При этом первая цифра указывает номер параграфа, а вторая — соответствующий порядковый номер в параграфе. При ссылках на формулы текущего параграфа первая цифра опускается. Матрицы и векторы выделяются полужирным набором, для их обозначения, как правило, используются заглавные буквы. В список литературы включены лишь оригинальные источники и работы, использованные при написании книги.
Большая часть книги написана В. И. Тихоновым, §4, 5, 26, 27, 28 и приложения I и И написаны М. А. Мироновым, а § 9, 12, 13, 17, 18, 19 и 25 — совместно.
Выражаем благодарность В. А. Казакову, который ознакомился с рукописью книги и сделал ряд полезных замечаний, а также В. Д. Разевигу, В. С. Ефименко, А. И. Папкову и В. Н. Харисову, оказавшим помощь при написании книги. Особую признательность выражаем проф. Р. Л. Стратоновичу, советами которого мы иользо-|»ались на всех этапах работы над книгой.
Введение
По общей классификации марковские процессы являются частным видом случайных процессов. Однако они занимают особо важнее положение среди других видов случайных процессов. Это объясняется в основном двумя обстоятельствами: во-первых, для марковских процессов хорошо разработан математический аппарат, позволяющий решать многие содержательные физические задачи, и во-вторых, при помощи марковских процессов можно описывать точно или приближенно поведение ряда реальных физических систем и устройств.
Приведем примеры тех задач общего характера, которые в принципе можно решить на базе теории марковских процессов
1. Известно, что при преобразованиях случайных процессов линейными и нелинейными (дискретными или непрерывными) динамическими системами, как правило, нет точных методов определения полных статистических характеристик выходных процессов (например, плотности вероятностей). Здесь исключение составляют только линейные преобразования нормальных процессов, при которых сохраняется свойство нормальности и в полной мере применимы методы корреляционной теории. В других случаях приходится применять весьма трудоемкий, приближенный метод вычисления моментов с последующим восстановление:,! по ним плотности вероятностей. Однако если процесс, воздействующий на систему (линейную или нелинейную), является марковским, то имеются общие методы вычисления статистических характеристик выходных процессов.
2. Предположим, что движение точки, отображающей поведение системы в фазовом пространстве, происходит при наличии определенных ограничений (например, внутри заданных границ — фиксированных или подвижных), причем при достижении границ нарушается нормальная работа системы. Задачи такого рода обычно возникают в следящих системах автоматического управления с конечной зоной устойчивой работы. В данном случае представляет практический интерес характер движения изображающей точки внутри этих границ (например, статистические характеристики времени, когда точка впервые достигнет границ, и др.). Физически содержательные задачи такого характера аналитически могут быть решены только для марковских процессов.
3. В настоящее время одним из главных направлений развития радиотехники и автоматики является синтез оптимальных систем при наличии случайных воздействий (с известными или неизвестны-
Введение
5
ми характеристиками). Наиболее полные и продуктивные результаты в этом направлении удается получить для марковских процессов.
При решении конкретных прикладных задач обычно не преследуется цель разработки новых математических методов или приемов. Как правило, дело сводится к тому, чтобы умело воспользоваться известным арсеналом математических средств применительно к рассматриваемой задаче. Ввиду того, что многие аналитические методы решения разработаны только для марковских процессов, естественно стремление «подогнать» многие задачи под аппарат теории марковских процессов.
Здесь можно указать два реальных факта, во многих случаях оправдывающих применение аппарата теории марковских процессов.
1. В практических ситуациях часто приходится рассматривать воздействие широкополосных нормальных помех или флуктуационных шумов на сравнительно инерционные системы конечного порядка. Действие такой помехи на систему в известных рамках аналогично воздействию некоторого эквивалентного белого шума, и в таких случаях оказывается допустимым рассматривать процессы в системе как марковские.
2. Нормальные случайные процессы с энергетическим спектром в виде дробно-рациональной функции частоты всегда с заданной степенью точности можно аппроксимировать марковскими процессами.
На основании изложенного читатель может составить представление о роли и месте марковских процессов среди других случайных процессов и об области применения математического аппарата теории марковских процессов для решения конкретных научноприкладных задач.
В последнее десятилетие аппарат теории марковских процессов все более широко используется специалистами разных научноприкладных направлений (радиотехника, автоматика, теория надежности и массового обслуживания, физика, биология, медицина и др.).
Чтобы у читателя не создалось неправильное впечатление о простоте и универсальности решения всех задач из области марковских процессов, полезно отметить, что к настоящему времени аналитическими и численными метсдами получено много важных оригинальных результатов в основном лишь для одномеоных и двумерных нелинейных систем. Применительно к динамическим системам, описываемым дифференциальными уравнениями третьего и более высоких порядков, часто вози и кают трудности в получении точных и компактных аналитических и численных результатов.
Наиболее существенные результаты по теории марковских процессов принадлежат отечественным ученым-математикам, в част-
Сведение
ностиА. А. Маркову и А. Н. Колмогорову. Из обстоятельных научно-прикладных исследований в этой области следует особо выделить известную монографию Р. Л. Стратоповича [21.
По математической теории марковских процессов существует ряд хороших книг, написанных математиками для математиков. К сожалению, эти работы остаются недоступными для широкого круга инженеров-исследователей, не имеющих специальной математической подготовки и заинтересованных в решении конкретных прикладных задач, а не в красоте и математической строгости вывода формул или в дальнейшем развитии самой теории. В то же время вопросы прикладной теории марковских процессов излагаются, как правило, в виде отдельных справочных сведений в различных изданиях и в весьма ограниченном объеме. По-видимому, этим объясняется тот факт, что методы теории марковских процессов до сего времени не стали рабочим аппаратом инженеров. Это обстоятельство было руководящим при написании дайной книги.
В настоящей книге систематически и полно изложены основы теории марковских процессов, на инженерном уровне строгости получены основные соотношения, сформулированы условия их применимости, четко описана методика применения для решения задач и подробно рассмотрено большее число конкретных радиотехнических примеров, представляющих самостоятельный интерес.
1. Классификация и определение марковских процессов
Рассмотрим случайную величину или случайный процесс, зависящий лишь от одного параметра (для определенности — времени /). Пусть время t изменяется на отрезке 10, TJ, т. е. 10, TL Тогда говорят, что какое-либо значение х является возможным значением (или состоянием) случайного процесса X (/), если на отрезке [0, Т] имеется такое время /, что вероятное!ь Р {х— h <_ X (t)<.x + h}^> 0 для любого h > 0.
В зависимости от того, непрерывное или дискретное множество значений принимают случайная величина X (/) и ее параметр t, различают следующие основные виды случайных процессов.
1. Дискретная случайная последовательность (дискретный процесс с дискретным временем). В данном случае время t пробегает дискретный ряд значений /0, /2, ..., tN или {/„, п = 0, .V} и слу-
чайная величина X (tn) — Хп может принимать лишь дискретное множество значений х2, .... хц или {xh, k = 1, Л }. Множества значений {tn} и {xh} могут быть конечными или бесконечными; в последнем случае М -> сю, /( ->- оо. Процессы такого вида непосредственно встречаются на практике (случайное подбрасывание монеты, радиотелеграфия, радиолокация и др.), а также могут быть получены путем квантования по уровню и по времени непрерывных процессов с непрерывным временем. Такое квантование часто применяется на практике при машинной обработке различной информации.
• 2. Непрерывнозначная случайная последовательность (непрерывный процесс с дискретным временем). Такой процесс отличается от процесса первого вида лишь тем, что теперь случайная величина X (tn), п = 0, X, может принимать континуум значений. В качестве примера можно указать временные выборки из непрерывного случайного процесса.
3. Дискретный (разрывный) случайный процесс (дискретный процесс с непрерывным временем^ В этом случае X (/) принимает дискретные значения {хк, k = I, К}, а время t — континуум значений: t £ 10, Т], где Т — длина временного интервала, на котором задан процесс X (/). Примерами могут служить показания счетчика числа случайно появляющихся частиц, результат квантования непрерывного случайного процесса только по уровню и др
4. Непрерывнозначный случайный процесс. В данном случае X (/)
8
/. Классификация и определение марковских процессов
Таблица 1.1.
Пространство состояний
Дискретное
Непрерывное
Дискретный марковский процесс
Марковская последовательность
tg t
Непрерывный марковский процесс
Я©.
принимает значения из некоторого непрерывного пространства и аргумент t изменяется также непрерывно, причем траектории процесса не имеют больших вертикальных скачков.
5. Дискретно-непрерывный процесс. В этом случае при непрерывном изменении времени t случайный процесс X (f) в некоторые моменты времени имеет скачки (дискретные или непрерывные), а на интервалах времени между скачками ведет себя как непрерывнозначный случайный процесс.
6. Помимо перечисленных пяти видов случайных процессов, возможны более сложные, смешанные виды случайных процессов. Если, например, случайный процесс X (t) зависит от двух случайных параметров — процессов К (/) и 0 (/), т. е. X (/) =
= X [X (/), 0 (/)], то один из них, допустим, X (/) может быть непрерывнозначным процессом, а другой 0 (/) — дискретным и т. д.
В соответствии с приведенной классификацией, применительно к случайным марковским процессам, определение которых приведено ниже, будем различать марковские цепи, марковские последователь
Общее определение марковского процесса
9
ности, марковские процессы с конечным и бесконечным числом состояний, дискретно-непрерывные и смешанные марковские процессы. Характер временных реализаций первых четырех основных видов марковских процессов показан в табл. 1.1.
Наряду со скалярным (одномерным) процессом X (/) на практике приходится рассматривать совокупный или векторный процесс X (/), состоящий из компонент Х± (t), ..., Xt (/),..., Хм (/). В этом случае процесс X (/) называют также многомерным (мерности М или Al-мерным) и обозначают X (/) = {Хг (/), i= 1, /И}. В общем случае компоненты Xt (/) могут относиться к разным видам случайных процессов, перечисленных выше.
Приведем общее определение марковского процесса, которое ниже будет конкретизировано применительно к отдельным частным видам процессов. Случайный процесс X (/) называется марковским, если для любых и моментов времени 4 < /2 < ... < tn из отрезка 10, Л условная функция распределения «последнего» значения X (tn) при фиксированных значениях X (/J, X (/2), ..., X (/n-i) зависит только от X (/n-i), т. е. при заданных значениях xr, xz, ..., хп справедливо соотношение
Р{Х (tn) < хп | X (/J = Х1, ..., X (Zn_J = xn_J = Р {X (4) <
^xn|X (/„-J = х^}. (1.1)
Здесь и в дальнейшем через Р обозначена вероятность события, указанного в фигурных скобках.
Для трех моментов времени tt > tj > формула (1) принимает вид
Р {X &) < | X (th) = xh, X (t}) = xj = P {X (10 <
< xt | X = х}}. (1.2)
Поэтому часто говорят, что характерное свойство марковских процессов состоит в следующем) если точно*’ известно состояние марковского процесса в настоящий момент времени (/у), то будущее состояние (при /г) не зависит от прошлого состояния (при th).
В качестве определения марковского процесса можно также принять следующее соотношение, имеющее симметричный вид относительно времени:
Р {X (it) < xh X (60 < х J X (/у) = xy} = P {X (ti) < Xi | X (t})=
~ Ху} P{ X (th)^xk\X (tj) = Xy}. (1.3)
Такая запись означает, что при фиксированном состоянии процесса в настоящий момент времени tj будущее (при /г) и прошлое (при Zft) со-
*’ Отметим, что если настоящее состояние X(tj) известно не точно, то будущее состояние марковского процеса будет зависеть от прошлых состояний.
10
2. Цепи Маркова
стояния марковского процесса независимы. Хотя определения (2) и (3) по существу эквивалентны, однако в правой части (2) фигурируют не три, а лишь два момента времени. Ввиду этого упрощения для установления марковского характера процесса в дальнейшем используется только определение (2).
Укажем еще одно общее и важное свойство марковских процессов: для них эволюция вероятности перехода Р — Р {X (t) .<( х | X (/0) — х0} описывается уравнением вида
— Р = ЛР, (14)
di
— некоторый линейный оператор (матрица в § 6, дифференциальный оператор в § 11, 13, интетродифференциальный оператор в § 23 и т. п.). Это свойство позволяет исследовать поведение марковских процессов при помощи хорошо разработанных методов решения соответствующих дифференциальных уравнений.
В дальнейшем применительно к марковским процессам будем пользоваться следующими обозначениями: X (/) = А (/), если пространство состояний (фазовое пространство) процесса непрерывно, и X (/) = 6 (/), если пространство состояний дискретно.
Имеется обширная литература, посвященная как математической теории марковских процессов, так и ее применениям к решению разнообразных прикладных задач [1—17]. В последующем будут кратко приведены основные теоретические сведения и рассмотрены иллюстративные радиотехнические примеры.
2. Цепи Маркова
Определение цепи Маркова
Рассмотрим некоторую физическую систему, имеющую конечное число К всех возможных фазовых состояний Ф2, ..., tyk, Пусть в зависимости от вмешательства случая система шаг за шагом (в моменты времени t0 <Z <Z t2 < ...) скачкообразно меняет свое фазовое состояние, т. е. имеют место переходы 90 9± 92
где 0п = 9 (/п) — состояние системы через п шагов, а 90 — 9 (/0) — начальное состояние системы.
Полное вероятностное описание поведения рассматриваемой системы дается совместными конечномерными вероятностями Р (90, 9Ь ..., 9П) при разных п. На основании теоремы умножения вероятностей можем написать
Р (й*„ .... afen) = Р{90 = 9t = О*..9П = =
Определение цепи Маркова
II
=* р {.ес = 04.. е, =. .on_t = р {о„ = $kn [ е0 =
= 04.»0. = 04.. ... 0П_, = (2.1)
ГДР 04 — ОДНО ИЗ ВОЗМОЖНЫХ фаЗОВЫХ СОСТОЯНИЙ 0Ц.
• Расписывая аналогично вероятность Р {0о = 0] — О*,, ...,
0П_£ = 04п_,}, получаем
P(0o,0J.02,...,0n_1>0n) = Pn(Oo) П nu(0u|0o....0ц-.). (2.2)
U = I
где Рп (0П) — вероятность начального состояния (в момент времени
Лц (Ч I 04., .... 04Ц _,) = Р {Ou = 0Ч | 00 = 04., .... 0ц_ , = 04Ц_
(2.3)
— условная вероятность, т. е. вероятность перехода на ц-м шаге.
Следовательно, для вычисления совместных вероятностей Р (00, 0ц •••, 0п) нужно задать начальное состояние системы и указать физический механизм осуществления смены состояний, позволяющий вычислить вероятности перехода {лм}. Исходя из возможной простоты решения задачи, можно указать следующие частные случаи.
1. Смена всех состояний происходит независимо, т. е. вероятность какого-либо состояния на ц-м шаге не зависит от того, в каких состояниях находилась система в предыдущие моменты времени. В данном случае
лп (9„ | 0О, 0!...0n_j) = Рп (0П)
и формула (2) существенно упрощается
п
Р(0О,01,...,0П)= П РД0ц). (2.4)
ц= О
Как известно, такой формулой описывается последовательность независимых испытаний. Это есть частный (вырожденный) случай Цепи Маркова.
2. К определению общей простой цепи Маркова приводит более общая возможность, когда вероятность фазового состояния пара1 метра 0П в момент времени tn зависит лишь оттого, в каком состоянии ^находилась система в непосредственно предшествующий ему момент времени /п_ъ и не зависит от того, в каких состояниях находилась система в более ранние моменты времени tn, ty, ..., /п_2.
Это свойство характерно для всех видов марковских процессов. Именно поэтому марковские процессы также называют процессами без последействия.
12
2. Цепи Маркова
Таким образом, последовательность состояний или совокупность дискретных случайных величин образует простую цепь Маркова, если для всех п = 1, 2, 3, ... и всех возможных значений случайных величин 0П имеет место соотношение
лп (0П | 0О, 0Н .... 0„_J = лп (0„ | 0п_г). (2.5)
Условные вероятности лп (0n | 0n-i) принято называть вероятностями перехода.
Нетрудно убедиться, что для простой марковской цепи формула (2) принимает вид
Р (0О 0!...0п) = Ро (0о) п Дц (0Ц | 0Ц- |). (2.6)
ц=1
Отсюда видно, что полное вероятностное описание простой цепи Маркова достигается заданием вероятностей начального состояния и вероятностей перехода
ПЦ (0ц I 0Ц— 1) — Р {0Ц = 0ЙЦ I 0ц— I = _ [} • (2.7)
Отметим, что для двух случайных величин соотношение (6) следует из теоремы умножения вероятностей и может быть написано всегда. Но уже для трех случайных величин формула (6) накладывает существенное ограничение на вид возможных совместных вероятностей.
3. Можно также ввести определение цепи Маркова порядка т (т 1), если вероятность нового состояния зависит только от т состояний системы, непосредственно ему предшествующих:
Ёлп (0„ | 0О, 0Ъ ..., 0n_J =лп (0„|0n_m, ..., ©„-Р, п>т. (2.8)
Значение т — 1 соответствует простой цепи Маркова, а при т > 1 имеем сложную цепь Маркова порядка т.
Сложная цепь Маркова порядка т может быть сведена к простой цепи Маркова для m-мерного вектора. Для этого воспользуемся тем обстоятельством, что члены конечной случайной последовательности (длины т) можно рассматривать как составляющие случайного вектора. Пусть
0n = {0j. n> i = = {0n-m+1. .... 0J (2.9)
— случайный вектор мерности т, состоящий из компонент 0fi п = = 0n_m+i. На предыдущем шаге m-мерный вектор, очевидно, равен
еп-1= {0<, п-x. i = \7т} = {вп_т, .... ©„-J,
Уравнение Маркова
13
причем выполняется следующее соотношение между компонентами векторов 0п и On-ji
0J. п = 0!+1, п-1 = 0n-m+f, (=1, ; 0im> „ = 0п, т<п. (2.10)
Следовательно, сложная цепь Маркова порядка т представляет собой частный случай простой m-мерной цепи Маркова, если положить вероятность перехода пп (0П|0n_j) равной
nn (®n I 0П-1) = лп (0щ. n I ®1, ..0да. п-1) П ^(01, п> 0’1-1,п-1)>
(2.Н) где 6 (р, v) = 6UV — символ Кронекера: 6!IV = 1 при р = v и S^v = = 0 при р =/= V. Отметим, что вероятности перехода (11) отличны от нуля и совпадают с соответствующими вероятностями (8) только для векторов, компоненты которых удовлетворяют соотношениям (10).
Случайные цепи, определенные соотношением (6), а также более общего вида, называются марковскими потому, «то они впервые систематически изучались известным русским математиком А. А. Марковым.
Уравнение Маркова
Приведем главные результаты для простых цепей Маркова, позволяющие решить следующую основную задачу. Пусть известно начальное состояние системы при /0 и указан вероятностный закон смены соседних состояний (т. е. заданы соответствующие вероятности перехода). Каким образом можно найти вероятности состояний системы в момент времени tn > ta и, в частности, при п -> сю?
Введем следующие обозначения для безусловных (абсолютных) и условных вероятностей
Pk (Л) = Р {0n = nJh (p.tl) = P {0n = |0^= 0;},
/,й=1,2....К; O^p^n; n—Q,N. (2.12)
Смысл введенных вероятностей следующий. Величина ph (ti) есть безусловная (абсолютная) вероятность нахождения системы в состоянии 0's на n-м шаге (т. е. в момент времени t = /п), a pk (t0) = =г р» — начальная вероятность состояния 0ft. Условная вероятность njk (р, п) определяет вероятность состояния 0Й при tn, если в более ранний момент времени < tn система находилась в состоянии 0^. Эти условные вероятности обычно называют вероятностями перехода из состояния 0, в состояние 0& за(и — у) шагов.
14
2. Цепи Маркова
Очевидно, что введенные вероятности неотрицательны и удовлетворяют условию нормировки: к _______
2 Рл(«)=1. Pk(n)>Q’ п = (2.13)
k=i
2 Л;й(|4,л)=1, Лм(р,П)>0, / =ТХ. (2 14)
k= I
Эти два равенства выражают очевидный факт, что на любом шаге система обязательно будет находиться в одном из К возможных состояний.
На основании теоремы полной вероятности для безусловной вероятности состояния0k можем написать к _____
Рь(п) = 2 Pi(^)nik(P- п), k=\.K\ 0<p<n. (2.15)
/= ।
В справедливости этого соотношения можно убедиться, рассматривая переходы из всех К допустимых состояний #, (лни в фиксированное состояние (цри tn /ц).
Переход системы из состояния в состояние за несколько шагов может осуществляться разными путями, т. е. в процессе такого перехода система может находиться в различных промежуточных состояниях#;. Используя формулу полной вероятности и определение цепи Маркова (6), можно убедиться, что к __
njh (р, п) = 2 (Н> т) п), 0<Zp<m<n.
(2.16)
Это функциональное уравнение для дискретных цепей с конечным числом состояний было установлено Марковым и поэтому носит название уравнения Маркова. Оно является частным случаем общего уравнения Колмогорова — Чэпмена, которое справедливо и для цепей с бесконечным числом состояний*).
Если ввести квадратную матрицу л (р, п) = {л;А (р, п)}, элементами которой являются вероятности перехода л^ (р, п), и матрицу-строку Рт (n) = {pk (п)} с элементами ph (п), то в матричной форме формулы (15) и (16) можно записать так (см. Приложение I);
Рг (п) = Рг (р) л (р, п), (2.17)
л (р, п) = л (р, т) л (т, п), п> т> р 0. (2.18)
* Можно привести примеры немарковских цепей [4,10], удовлетворяющих уравнению Маркова (16) Поэтому нельзя утверждать, что цепь является обязательно марковской, если вероятности перехода удовлетворяют уравнению Маркова.
Уравнение Маркова
16
Квадратная матрица л (р, п), элементы которой неотрицательны и сумма элементов, стоящих в каждой строке (или столбце), равна единице, называется стохастической матрицей.
Используя известный результат (см. Приложение I), что транспонированное произведение матриц равно произведению транспонированных матриц, взятых в обратном порядке, нетрудно убедиться, что соотношение (17) можно записать иначе
Р (л) = л? (р, л)Р (р). (2.19)
Здесь Р — матрицы-столбцы.
Расписывая последовательно формулу (18), имеем
л (р, л) = л (р, п — 1)л (л — 1, л) =
= л (р, л — 2)л (л — 2, л — 1)л (л — 1, л) = (2.20)
= л (р, р 4- 1)л (р 4-1, р 4- 2)...л (л — 1, л).
Отсюда видно, что для определения матрицы л (р, л) при всех р л достаточно знать последовательность матриц одношаговых вероятностей перехода
л (0, 1), л (1, 2),..., л (л, л 4- 1), ... (2.21)
Полагая в уравнении (18) р = 0, имеем
Рг (П) = рг (0)л (0, л), (2.22)
где Рг (0) = {р?}— матрица-строка вероятностей начального состояния.
С учетом соотношений (22), (20) и (6) приходим к заключению, что полное вероятностное описание простой цепи Маркова достигается заданием вероятностей начального состояния и последовательности матриц вероятностей одношаговых переходов (21).
Среди простых цепей Маркова различают однородные и неоднородные. Однородная цепь характеризуется тем, что вероятности перехода nik (р, л) зависят только от разности аргументов, т. е.
Л/ъ (р, л) — л7ь (и — р), л > р > 0. (2.23)
Поэтому для однородной цепи Маркова матрица вероятностей перехода должна иметь вид
л (р, л) = л (л — р) = {лм (л — р)}, л > р 4s 0. (2.24) При этом получаем следующую матричную форму записи уравнения Маркова (18)
л (л — р) = л (лг — р)л (л — т), 0 р < лг < л. (2.25)
Рассмотрим подробнее простые однородные цепи Маркова. Применительно к однородной цепи введем обозначение матрицы перехо-
16
2. Цепи Маркова
да за один шаг л (1) = л и обозначим одношаговые вероятности пе-
рехода этой матрицы просто через n/ft = (1):
njh - = л7> (1), л = л (1). (2-26)
Следовательно,
Лц ^12 * • •
л = Л21 л 22 . . . Л 2 к (2.27)
_ Л/<1 Л/< 2 • • • Лкк _
Эта стохастическая матрица одношаговых вероятностей перехода является квадратной, причем согласно (14) все элементы матрицы неотрицательны и сумма элементов в каждой строке равна единице.
Между матрицами л (ц) с разными аргументами существует простое соотношение. Так, полагая в (25) п = р. 4* 2, /п = р. + 1, имеем
л (2) = л (1) л (1) = л2. (2.28)
Полагая затем п = р. + 3, т = р. 4- 1, и т. д., окончательно получаем
л (н) = л1. (2.29)
Итак, для простой однородной цепи Маркова матрица вероятностей перехода за п шагов равна n-й степени матрицы одношаговых вероятностей перехода.
Если в формуле (17) положить п — р = т и учесть свойство однородной цепи (24), то можем написать
рг (т + и) = рт (2.30)
где Р7 (п)— матрица-строка абсолютныхгвероятностей состояний на n-м шаге. В частности, при р = 0 формула (30) принимает вид
pr (ГП) = рг (())„«. (2.31)
Здесь Р7 (0) — матрица-строка вероятностей начального состояния (при /0)
Рг(0) = [рМ,...,рН (2-32)
Формулы (30) и (29) показывают, что исчерпывающее вероятностное описание простой однородной цепи Маркова дается указанием вероятностей начального состояния (при /0) и матрицы одношаговых вероятностей перехода (27).
Однородная цепь Маркова, для которой вероятности {pk (п)} всех случайных величин 0П одинаковы, т. е. не зависят от п, назы
Уравнение Маркова
17
вается стационарной (или равновесн.'.й). В противном случае цепь называется нестационарной. Для однородной стационарной цепи
рт(п) = рт(1) = Р7 = {pky (2.33)
Полагая в формуле (30) т = 1 и учитывая равенство (33), для однородной стационарной цепи получаем формулу
Рт = РДг. (2.34)
Это матричное уравнение эквивалентно следующей системе К. линейных алгебраических уравнений
к ___
k=\ К. (2.35)
Z-i
Одна из важных задач в теории цепей Маркова состоит в исследовании, существуют ли предельные, стационарные вероятности случайных величин 9П при п -> оо и если существуют, то как их найти.
Оказывается, что для цепи Маркова с конечным числом состояний яри выполнении условия
л/л(/г)>°. Лг = 1 К, (2.36)
начиная с некоторого п, существуют предельные (финальные) вероятности
ph— lim ph (т), k=\ К. (2.37)
Эти финальные вероятности ph не зависят от начального распределения {p°k}.
Марковские цепи, для которых существуют финальные вероятности (37), называются эргодическими.
Финальные вероятности {pfe}, k = 1, К, являются решением системы линейных алгебраических уравнений (35), удовлетворяющим дополнительному требованию
2Л = 1. (2.38)
£=1
Эти финальные вероятности образуют стационарное распределение {Ph}-
Цепь Маркова будет стационарной, начиная с Zo, если вероятности начального состояния совпадают с соответствующими финальными вероятностями {ph}.
Как видно из (35) и (38), ДЛЯ определения К неизвестных финальных вероятностей имеется (К 4- 1) линейное уравнение. Однако первые К уравнений являются линейно-зависимыми Действительно, суммируя обе части всех равенств (35) и учитывая соотношение (14),
18
2. Цепи Маркова
придем к тождеству. Поэтому К финальных вероятностей следует определять из (К — 1) уравнения (35) и уравнения (38).
Теория цепей Маркова разработана достаточно полно и хорошо изложена во многих книгах [4—6, 10—12]. Обычно приводится раз-
вернутая классификация цепей, основанная на классификации мат-
риц переходных вероятностей я fu, п), характеризующих эволюцию процесса во времени. Здесь мы укажем лишь основные определения состояний марковской цепи.
Состояние называется нево-зВрэтным, если существует такое
% tf tn t
Рис. 2.2. Цепь Маркова с двумя состояниями.
Рис. 2.1. Граф цепи Маркова с пятью состояниями.
состояние (k =/= j) и такое число шагов п, что л/й(п)>0, но лЛу (т) — 0 для всех т. Все остальные состояния называются возвратными. Таким образом, из невозвратного состояния с некоторой вероятностью всегда можно за какое-то число шагов перейти в другое состояние, однако вернуться из этого другого состояния в первоначальное невозможно. Возвратные состояния предполагают возможность и обратного перехода, причем число шагов при прямом и обратном переходах может быть произвольным.
Если существуют таки<? состояния Оу и что для них при некоторых п и т выполняются условия njh (п) >0 и nfey (т) >0, то они называются сообщающимися. Очевидно, что если йу сообщается с а Ой с О,-, то Оу сообщается с О,-. Это обстоятельство позволяет разделить множество возвратных состояний на классы (подмножества) сообщающихся состояний. При этом состояния, принадлежащие различным классам, не сообщаются между собой. Множество возвратных состояний, состоящее из одного класса, называется эргодическим.
Если для любого п вероятность лу4 (n) = где буй — символ Кронекера, то состояние Фу называется поглощающим. Наличие в цепи Маркова поглощающих состояний радикальным образом изменяет характер процесса по ср лвнениюсо случаем отсутствия таких состояний. Если среди всех состояний пени Маркова имеется хотя бы одно поглощающее, то такая цепь называется поглощающей.
Цепь Маркова с двумя состояниями
19
Цели Маркова можно доставить в соответствие так называемый ориентированный граф 118], позволяющий наглядно представить возможный характер развития процесса. Вершины графа определяются состояниями цепи. Каждой дуге из состояния О,- в состояние ставится в соответствие число лЛ, если л,й >- 0 (т. е. когда возможен одношаговый переход из й, в ftk).
В качестве примера на рис. 2.1 показан граф цепи Маркова с вятью состояниями. Если текущее состояние системы есть <>2, то она переходит в состояния Ф3, или остается в#ас вероятностями 0,2; 0,3 и 0.5 соответственно. Аналогично интерпретируются другие дуги. Из графа следует, что состояние является невозвратным, а #5 — поглощающим.
Цепь Маркова с двумя состояниями
Пусть цепь Маркова {0п, п = 0, 1, 2, ...} имеет два состояния и О2 (рис. 2.2) с вероятностями начального состояния pt (0)=pi и Рг (0) ~ Р2> где Pi + Р2 = 1. Одношаговые вероятности перехода не зависят от времени и заданы: лп = 1 — а, л1а = а, n2i = Р, л22 = 1 —р. Исключим из дальнейшего рассмотрения два тривиальных случая: 1) а + Р — 0, т. е. а = 0, р — 0, 2) а + Р ~ 2, т. е. а = 1, Р = 1. В первом случае не происходит смены состояний (оба состояния являются поглощающими) и система остается в заданном начальном состоянии. Во втором случае смена состояний происходит детерминированным образом и если начальное состояние задано, то поведение системы будет неслучайным.
Определим вероятности перехода Л/к (п) за п шагов, абсолютные вероятности рк(п) и. финальные вероятности рк.
Применительно к данному примеру в уравнениях (35) и (38) нужно положить k = 1,2. Из первого уравнения (35) и уравнения (38) имеем
Pi = Pi (1 — а) + р2Р. Pi + Р2 = 1-Отсюда находим финальные вероятности
Pi = Р/ (а + Р), р2 == а/ (а + Р). (2.39)
Для нахождения матрицы вероятностей перехода л (п) за п шагов воспользуемся следующим результатом, известным из теории матриц (см. Приложение I). Матрицу л, имеющую различные характеристические корни, всегда можно представить в виде
0 '
Z-2
A.J
0
т-1.
л = Т
(2.40)
Здесь Т — невырожденная матрица (детерминант этой матрицы отличен от нуля |Т| =f= 0) размерности 2x2, Т-1 — матрица, обрат
20
2. Цепи Маркова
ная Т, — характеристические корни матрицы л, т. е. корни уравнения | л — А11 = 0, где I — единичная матрица
Используя представление матрицы л в виде (40), получим
лп — Т
К] 0
О А"
(2.41)
Для рассматриваемой цепи матрица вероятностей перехода за один шаг имеет вид
л •==
1 —а
Р
а
1-Р Г
(2.42)
Из уравнения
|л — XI | =
а
1-0—А
= (1 — а - А) (1 — Р - А) — ар
1 — а — А
О
находим характеристические корни
А, = 1, А2 = 1 - а - р.
При а + р #= 0 они различны.
Выражение (40) можно записать в виде
(2.43)
Отсюда получаем систему из четырех попарно-тождественных тн* нейных уравнений для определения t/k:
(1 — а — Хх)/П 4- а/21 = О, 0/u + (1 — 0 — At)Z21 = О,
(1 - а - А2)/12 + а/22 = 0, 0/12 + (1 - 0 - Х2)/22 = 0.
Находим
/ц = /21 =/= 0 /22 = 0^12/а.
Учтем, что умножение столбцов матрицы Т на постоянную величину не влияет на конечный результат. Полагая ради простоты последующих записей /ц = 1 и /12 = а, получим
т Г 1 а 1 т-1 = 1 Г Р а
L 1 — 0 ]’ «+з [1 —1 1'
Следовательно,
Цепь Маркова с двумя состояниями
21
На основании (41) находим матрицу вероятностей перехода за п шагов
ГР а’ _ "J I 1 — U
1-(1-а-₽)«]
лп = —Ц-а+₽
1 -PJ
О (1-а-Р)
(1—а—₽)л
[1—(1—а—0)п]
а+Р
Заметим, а -Ь р Ф 2. Поэтому (1 — а — Р)п -> 0 при
что |Х2| == | 1 — а
(2.44) при а + Р ¥= О и п -> оо и
1
а
1 О
Pl Р2 . Pl Р2 . где ph — финальные вероятности (39).
лп->-
По формуле (31) находим абсолютные вероятности состояний через п шагов
РГ(")=ЧР? [0 + (аР?-Рр?)(1-“-Р)п.
“+р
а + (РрО-арО)(1-а-Р)"]. (2.45)
Отсюда при п -> оо также получаем прежние значения финальных вероятностей (39).
При анализе цепей Маркова могут встретиться разнообразные задачи (см. § 4). Кроме рассмотренных, на примере цепи Маркова с двумя состояниями укажем еще две задачи.
Можно интересоваться долей времени, проведенного системой в одном из состояний в течение большого интервала времени. Отождествим состояние#! с нулем и состояние #2 с единицей. Пусть случайная величина Хп = {0, 1} обозначает состояние системы в момент времени t, причем интервалы времени между соседними скачками одинаковы, т. е. tn+1 — tn =.const, п = 0, 1, 2, ... Тогда сумма
-|- Х2 + ... + Хп представляет собой число раз из общего числа п, проведенных системой в состоянии 1. Обозначим начальное состояние через j и л>2 (п) = Р{Хп = 11 Хо = /}•
Известно, что математическое ожидание случайной величины X, принимающей лишь два значения 0 и 1, совпадает с вероятностью Р{Х = 1}. Поэтому
< (*! + х2 + ... + Хп I Хо = /)> = (1) + л,-2 (2) + ...
... + лЛ (/г).
22
2. Цепи Маркова
Здесь и в дальнейшем угловые скобки обозначают операцию статистического осреднения
Среднее значение относительной доли времени, проведенного системой в состоянии 1, очевидно, равно
{лд> (1) + л,-2 (2) + ... + л/2 (л)}/л.
Известно, что если предел последовательности при и-* со равен а, то предел последовательности (а, а2 + ... + ап)!п также равен а. Поскольку л/2 (л) -> р2 при п -* со, то среднее значение относительной доли времени, проведенного в состоянии 1,. стремится
t
Рис. 2.3. К вычислению рекуррентного времени СОСТОЯНИЯ О).
Рис. 2.4. Симметричная цепь Маркова с двумя состояниями.
к финальной вероятности при п -> оо. Аналогично, предел средней доли времени в состоянии 0 равен рх- Финальные вероятности рх и р2 даются формулой (39).
Предположим, что начальным состоянием является 0. Рассмотрим случайную величину Т, обозначающую время первого возвращения в состояние 0. По определению, 7' = п, если в моменты времени tlt t2,.... /n_j система находится в состоянии 1, а в момент времени tn она впервые возвращается в состояние 0 (рис. 2.3). Случайная величина Т называется рекуррентным временем состояния 0. Обозначим закон распределения случайной величины Т через f00 (п), п = 1, 2, ... Из рассмотрения рис. 2.3 можно заключить, что
foo (п) - Р {Т = л} = сф (1 - ₽)"-2. л = 2, 3, 4, ... и /ооО) ~ а •
Воспользовавшись известным равенством [19)
у (« + W---------------2—,
А '-ч
находим среднее значение рекуррентного времени состояния О
<Т>= «foo(«)= I—a + a₽2 n(l—В)"-2==
п—[ п = 2
= l-a + ot₽ v (б + 2)(1-₽)* = -^±0_.
Ь = 0
Симметрична;: цепь Маркова с двумя состояниями
23
Рассмотрим три примера.
Пример 1. Симметричная цепь Маркова с двумя состояниями. Пусть цепь Маркова {0П, п = 0, 1, 2, ...} имеет два состояния От й #2 (Рис- 2.4) с вероятностями начального состояния рг (0) = р( и р2 (0) = р|, где р? + р®= 1. Известны одношаговые вероятности перехода ли = п22 = р, л12 = л21 = q, где р + q — 1, р > 0. Так как матрица одношаговых вероятностей перехода
Р q
л =
ч р
(2-46)
симметрична, то цепь называется симметричной. Рассматриваемая иепь является однородной, так как вероятности перехода непосредственно не зависят от номера шага, при котором происходит смена достояний.
Нужно определить вероятности Tcjk (п) за п шагов, абсолютные вероятности рЛ (п) и финальные вероятности pft, k = 1,2.
Ответы на эти вопросы можно получить непосредственно из формул (44), (45) и (39), нужно лишь в них положить а = q — 1 — р, $ — q = 1 — р, как это следует из сравнения матриц (42) и (46). Поэтому сразу записываем окончательные ответы
2 11— (р—q)n \ + {p—q)n.
j,k=\,2,
l*r(n) = [Pi(n), p2(n)l = -y [J +(p? —P?)(p-<7)'1, 1 + (P?—P?)X
X(p —<7)n], Pi = p3 = 0-5.
(2-47)
Следовательно, цепь является эргодической и для нее существуют финальные вероятности. Из выражений для ph (и) видно, что после Начального момента времени в цепи имеет место переходный режим и лишь через достаточно большое число шагов асимптотически устанавливается стационарное (равновесное) состояние. Однако, если бы Начальные вероятности совпадали с финальными (р® = р® = 0,5), то переходный процесс отсутствовал бы и цепь сразу была бы ста-'Ционарной.
,, Приведенному примеру можно дать следующую радиотехническую интерпретацию. Пусть система связи передает двоичные символы, которые обозначим через О( и Каждый переданный символ проходит через несколько устройств (каскадов), в каждом из которых выходной символ с вероятностью р воспроизводится верно и с вероятностью р=1 — р переходит в другой. Пусть 0п — {0т. 02} — символ на выходе п-го устройства. Тогда последовательность 0О, 02, ... есть однородная цепь Маркова с матрицей вероятностей перехода (46).
24
2. Цепи Маркова
Предположим, что нас интересует вопрос: какова вероятность Р | 0,1 = О1) того, что если на выходе п-го устройства при-
нят символ &!, то был передан этот же символ.
В общем случае на основании теоремы умножения можем написать
Р {0п = <h}P {00 I 0n = м = P {00 = ^}P{0n = M0o-
=
t. e.
Pk (n)P {0O = &} | 0n = Oft} = p} (0)nik (n).
Отсюда
P {0o = |0n = Ал} = Pt (0)nM (n)/ph (n).
(2.48)
Полагая здесь / = 1, k = 1 и воспользовавшись выражениями (47), получаем нужный результат
Р {0o = ^i|0n = ^} =
Pi (0) Пи (п) Pl W
Pi + p°i (р-чГ
• + (Pi— Рз) (Р— Ч)п
Пример 2. Квазислучайный телеграфный сигнал. Пусть дискретный случайный процесс 0 (/) имеет два состояния ±0'(), причем смена состояний возможна в фиксированные моменты времени tn = &±пТ0, где То = const; п — О, 1, 2, ... — целое положительное число, А — случайная величина, не зависящая от 0 (/) и равномерно распределенная на отрезке [О, То]. Предполагается, что остаются в силе условия примера 1, причем 0'1 = 00 и#2 = —Оо- Получающийся видеосигнал (рис. 2.5) назван квазислучайным телеграфным сигналом в отличие от случайного двоичного сигнала (см. пример 1 нас. 72), у которого смена состояний может осуществляться в произвольные моменты времени. Нужно найти корреляционную функцию и энергетический спектр такого квазислучайного телеграфного сигнала в стационарном состоянии.
Известно, что корреляционная функция k (т) любого стационарного процесса X (/) является четной функцией аргумента т и определяется равенством
kx (т) = kx (|т|) = (X (t)X (t + т)> - <Х (0><Х (t + т)>,
(2.49) где угловые скобки обозначают операцию статистического осреднения.
Так как в рассматриваемом частном случае вероятности состояний одинаковы (pj = р2 = 0,5), то математическое ожидание процесса 0 (/) при любом t > 0 равно нулю:
< 0 (/)> = О'оРх — О'оРа = °-
Квазислучайный телеграфный сигнал
25
Поэтому
k Ст) — <0 (/)0 (t 4- т)>.
Вычислим сначала корреляционную функцию сигнала 0 (/), считая случайную величину А фиксированной:
й(т|А) = (0(0)0 (т)|А>.
Пусть на отрезке т лежит п возможных точек перехода (рис. 2.5). Если сигнал имеет лишь два значения ± Фо» то произведение 0 (0)0 (т) будет положительным и равным Ф§, если оба конца т-отрезка находятся на положительных (0 (0) = 0 (т) = = Фо) или на отрицательных
(9 (0) = 0 (г) = —Фо) импульсах, на разнополярных импульсах, тельно и равно —Фо. Поэтому можем написать
Рис. 2.5. Квазислучайный телеграфный сигнал.
Когда концы т-отрезка лежат произведение 0 (0)0 (т) отрица-
К (т I А) = фо2 Р {0 (0) = Фо, 0 (/) = Фо} + ф2 Р {0 (0) = -Фо, 0 (/) = — = _фо}_ф2Р{0(О) = Фо,0(/) = -фо}_ф2 Р{0(О) = -фо, 0(0 =
= = Й5 (Р1 1 («) + Рг п22 («)] — ^0 [Pl л12 («) + Р2 П 21 («Ж
Так как Pi = р2 = 0,5, то
kn М А) = Фо2 [лп (и) + л22 (п)] — 4- Ф2 [л|2 (и ) + л21 (н)]. 2 2
Выше было показано, что для рассматриваемой симметричной цепи
Лц (и) = л22 (и) = л12 (П) = п21 (и) = .
Поэтому
МТ1 А) = ф2 (р —q)n.
Пусть (п — 1)Т0 т < пТ0, где п = 1, 2, 3, ... Тогда возмож ны два случая.
1. Если А < пТ0 — т, то отрезок т содержит (п — 1) разрешен нуюточку перехода (рис. 2.5) и, следовательно, имеем
kn-i (т| А) = Фс2(р —(г)"-1.
26
2. Цепи Маркова
2. Если Д > nTti — т, то на отрезке находится п точек перехода и
*п(т| д) = е02(р—<7)г
Так как случайная величина Дне фиксирована, а может принимать любые значения на отрезке [О, 7\], то нужно осреднить выражения kn_1 (т| Д) и kn (т | Д) с учетом указанных двух условий по Д с плотностью вероятности Р (Д) = 1/7^0 при 0 sjC Д То. В результате этого для т > 0 получим
= ^о(п q)“~'+ О'о[у- —(«- 1)|(Р-<.
\ ' о / L ' о J
(n— I) То < т < пТп.
По условию четности корреляционной функции такое же выражение
применимо и для т «С 0, нужно лишь заменить т на |т|
Окончательная формула для интересующей нас корреляционной функции квазислучайного телеграфного сигнала следующая:
£(т) = ^ ---+ ---
(п-1)Г0^|т|</г7\. /г= 1,2,3,... (2.50)
По функции k (т) находим энергетический спектр сигнала
4-^1 — п + — <7)" j cos ®тйт =
: Т„ |l-(p-g)2] , sino>7~n/2 у
1— 2 (р— q) cos шТ, 4- (р— д)2\ aTt./2 /
Для частного случая р = q = 0,5 из полученных формул находим
6(т)
|ll<r"' st») -pp,(!i"“r;'2₽-</.
И>т„. k “г“/г 1
Графики корреляционной функции и энергетического спектра для трех значений р = 0,25; 0,5 и 0,75 изображены на рис. 2.6.
Отметим, что если полагать начало отсчета времени совпадающим с моментом возможного изменения состояния (Д = const = 0),
Функция корреляции радиосигнала с ФМ
27
то такой телеграфный сигнал оказывается нестационарным. В этом особенно легко можно убедиться для симметричного квазислучай-нога телеграфного сигнала (р — q = 0,5). Для такого сигнала
А(/„ ',) = <о (М о (4)> = os Р {«(/,) = Oni 0 (/2) = 1%} + ад Р {0 (/,) =
= -0о, 0(f2)= -О„}-ад/>{9(/1)=ой, 0Д3) = -^о}-
—адр{0(^) = -й0, 0(/2) = ^о} =
= [ад при (п—1)Г</1,/2<пЛ и =1,2, ... 52)
| 0 при других /2.
Рис. 2.6. Корреляционная функция (а) и энергетический спектр (б).
Видно, что корреляционная функция зависит порознь от двух рассматриваемых моментов времени и t2 и, следовательно, в этом смысле процесс 0 (/) нестационарен.
Пример 3. Функция корреляции радиосигнала со случайной фазовой манипуляцией. Вычислим корреляционную функцию радиосигнала со случайной начальной фазой при наличии дополнительной фазовой манипуляции квазислучайным телеграфным сигналом. Рассматриваемый радиосигнал имеет вид
* (0 = А о cos 1соо/ + 0 (/) + <р0]. (2.53)
Здесь
0(0 = у ад.гесТДП rect.(O = l L
--оо | 0, /^(/г,/;+1|,
q?e — случайная начальная фаза, не зависящая от 0 (/) и равномерно распределенная на отрезке I—л, л]
Такое задание фазовой манипуляции 0 (Z) означает, что во временных полуинтервалах (tlt /i+l] фаза остается постоянной и рав
28
2. Цепи Маркова
ной &;, а в моменты времени tt она меняется скачками. Пусть 9 (/) есть симметричная цепь Маркова с двумя состояниями ±90, 0^ л. Ограничиваясь рассмотрением стационарного состояния, примем вероятности начального состояния совпадающими с финальными вероятностями состояний, т. е. рх = р2 — V2; одношаговые вероятности перехода равны лп = л22 = р, л12 = л21 = q, р + q = 1. По аналогии с предыдущим примером считаем, что смена состояний процесса может происходить только через фиксированный интервал времени 7^== const, т. е. в моменты времени /, = Д ± iT(j, где i = 0, 1, 2, ... — целое положительное число, Д — случайная величина, не зависящая от 9 (/) и равномерно распределенная на отрезке [О, То1.
Запишем плотность вероятности случайной начальной фазы
Р (<рп) = 1/2л, — л Фо С л
и обозначим одномерную плотность вероятности случайного процесса 9 (/) через Рх (9t), а двумерную плотность вероятности через Р2 (9(, 9г), где 9t = 9 (t), 9Х = 9 (t + т). При этом будем пока считать т 0.
Так как среднее значение рассматриваемого сигнала равно нулю О» я
<s(0>= $ PM dQt $ 5(/)Р(фо)АРо = О, — —Я
то, по определению корреляционной функции, можем написать
«о
ks (т) = О (Л s (/+т)>фо, о = P,(9f, 9x)tft)( d0x х
-tn
X s (/) s (/+ т) P (cp0) dcp0. (2.54)
— Л
Здесь индексы при угловых скобках указывают случайные величины, по которым должно выполняться статистическое осреднение. Подставив сюда выражение для сигнала, имеем
/г6 (т) = (Д§/2) (cos (со0 т + 0Х —9()>0 + (Д ™/2) (cos (2со0/+соо т + 9, +
+ 9г + 2ф0)><ро,е
Второе слагаемое справа обращается в нуль в результате осреднения по случайной начальной фазе <р0. Пользуясь комплексным представлением для косинуса и учитывая линейность операции взятия реальной части и осреднения, можем написать
ks (т) = (/1§/2) Re {exp (/w0 т) (exp/ (9Х—9()>0}. (2.55)
Фигурирующее здесь статистическое среднее значение экспоненты выразим через заданные статистические характеристики случай
Функция корреляции радиосигнала с ФМ
29
ных последовательностей {0г} и {/г}. Для этого воспользуемся формулой полной вероятности
P2(Of,0T)= J P(Qt,Qx\k) Px(k).
4 = 0
Здесь Рх (k) — вероятность наличия в интервале (/, t + т) разрешенных точек перехода, Р (0(, 0Х|£) — условная двумерная плотность вероятности значений 0( и 0Х при условии, что в интервале (/, / + т) имеется ровно k возможных точек перехода. Поэтому можем написать
Мт) = (-у-) 2 Re {exp (/со0 т) <ехр[/(0T — 0Z) I *]>()}, (2.56) ' 1 k = 0
где
<exp[?(0x-0,)|fe|>B- g exp[/(0r-0,)]P(0r0T|fe)d0zrf0T. - k
При фиксированном числе точек перехода k величина exp [/ (0Х — — 0() | /?1 = 1, если оба конца т-отрезка находятся или на положительных (0/ = 0Х = й0), или на отрицательных (0( = 0Х = — й0) «импульсах». Если 0t = ft0, 0Х = — Фо, то exp [j (0X — 0,)) k] = — exp (—2/Oo), а при 0,= —й0, 0х=йо имеем exp [/ (0X—0() | k] = ~ exp (2/’&fl). Следовательно,
<exp [/(0X - 0f) | k]> о = 1-R{0t = й0, 0X = й0} + 1Р{0, =
= —й0, 0X = —йо) + exp (2/й0)Р {0/ = —йо, 0Х = й0} 4>
+ ехр (—2/йо)Р{0< = й0, 0Х = — й0) = рхпи (k) +
4- р2л22 (fe) 4- exp р2лг1 (/г) 4- ехр (—2/Оо) рхл12 (k).
Для стационарной симметричной цепи Маркова с двумя состояниями абсолютные вероятности состояний р± = р2 = г/2, а для вероятностей перехода за k шагов справедливы равенства nu (k) — л22 (fe), "is (k) = л21 (k). Поэтому < ехр [/ (0Х — 0,)|£] >н == лп (k) + + л12 (ft)cos 2й0. Подставив сюда выражения вероятностей перехода из (47), получим
(ехр [/ (0Х — 0;) | й]>е = cos2 й0 4- (р — q)* sin2^.
Формула для корреляционной функции теперь принимает вид
cos2 й0 4- sin2 й0 2 (Р — Я)к Рт (*) k= о
(2.57)
30
2. Цепи Маркова
Получим выражение для вероятности (k) наличия k точек перехода на интервале длиной т. Выберем произвольно начало отсчета времени и пусть первый разрешенный переход пре исходит в момент времени Д, а все последующие переходы возможны в моменты времени tf — Д + iTn, i — 0, 1,2, ... (рис. 2.7). Пусть m — = [т/7~’о] есть целая часть числа тП\. Из рассмотрения рис. 2.7 можно убедиться, что при фиксированном значении случайной величины Д число возможных точек перехода в интервале (0, т) равно [(т - Д)/Т„] + 1, т. е.
Рх (£| Д) = 6 (k, |(т — Д)/7'о! + 1), k = 0, 1, 2, ..., где 6 (т, п) — символ Кронекера; б = 1 при m ~ п и 6 == 0 при m Ф п.
О t о та гт0 5ТВ
Рис. 2.7. К вычислению вероятности Px(k). Рис. 2.8. Графики функций (А) для . Л = ОЛ и 2.
В зависимости от значения Д, возможны два случая:
Гт— Л| _|_ । ( + 1 !!РИ 0 < Д < т—тТ0
L Л, J ( m при т— тТ0 < Д < То, m = 0. 1 2...
Безусловную вероятность Рх (1г) находим осреднением выражения Рх (k | Д) с равномерной плотностью вероятности Р (Д) = l/T’o случайной величины Д:
То Pt(£) = -L Д)йД = 6(й,/« + Го и 0 Го + 6(/г rn)^- f йД = (^ тУ * 0 J \ ' 0 ' т— тТ0 + (1—+ m), m = J- Графики этой функции для значении К рис. 2,8. т—тТ0 1) — f </д + | 6(/г, tn + 1) + -1 = 0. 1,2,... (2.58) J = 0, 1, 2 показаны на
Функция корреляции радиосигнала с ФМ
31
С учетом этой формулы находим корреляционную функцию
(л2 \
-у-) cosco0r
СО'2^ 4- sin2 (р—
fr = 0
~ ) [cos2 + }т (I т I) sin2 a0J cos ш0 г, (2.59)
где
Мй = Г1 +m -~}(p—q)m + (у- — т}(Р~?)т + ' =
= (р—<7)т| 1 + 2q{m — -у)], тТ0^т<(т+ 1)70,
I \ • о / J
т = 0, 1, 2,...
(2.60)
Выражение (60) отличается от формулы для корреляционной функции (50) лишь наличием в последней постоянного сомножителя 4*. Поэтому графики для корреляционной функции k(x), приведенные на рис. 2.6, а, останутся справедливыми и для функции нужно только изменить масштаб по оси ординат.
Для некоторых частных значений Фо формула (59) упрощается. Например,
/?, (т) = (Л2/2)/т (|т|) cos <йот, Фо = л/2,
k, (т) = (Л2/2)соб соот, &(, = л.
Последнее выражение определяет корреляционную функцию гармонического колебания со случайной равномерно распределенной начальной фазой. Этот результат объясняется тем, что при &(, = л величина скачка фазы 0 (/) равна 2л (от л до —л или наоборот), а при таких скачках фазы значение сигнала s (?) не изменяется. Особенно простое выражение для корреляционной функции получается при ♦о = л/2 и р — q — V2. В данном случае р = q и в формуле (60) нужно учитывать лишь один член, соответствующий т = 0. При этом получим
—у*-)со5®<Л- (2-61)
По найденной корреляционной функции находим энергетический спектр
(ш) — 2 Jka (т) cos (ott/T = -у- J cos2 Оо о
cos ш0 т cos шт dr +
32
3. Энергетические спектры марковских сообщений
х, (т+1)Т0
+ ('j sin2 У f fm (т) cos co0 T cos meh =
k 7 n>=o mJr„
y) Ao cos2fl0 [6 (co — co0) +6 (co 4-co0)|+ (-y-) ^osin’2fy> x
x Г____________1 —(p—?)2____________/ sin Y- V
I 1— 2 (p—q) cos (co—coo) T0+(p—<?)2 \ y_ '
,______________1 — (p—<?)2__________/ sin y+ \2j
1—2(P—p)cos(co+co0)T0 + (P—<7)2 \ Y+ /J’
y± = (P± мо).Ь_ (2.62)
При = л/2 и coo = 0 эта формула с точностью м> постоянного множителя совпадает с (51).
В общем случае энергетический спектр оказывается дискретносплошным, т. е. состоящим из дискретных линий и непрерывной части. При Фо = л/2 спектр будет сплошным, а при Фо = л — чисто дискретным.
3. Энергетические спектры марковских сообщений
Рассмотрим стационарно работающий источник сообщений (сигналов), который может находиться в разных состояниях, соответствующих генерированию множества различных сообщений {sh (t), k = 1, К}. Каждое из сообщений sk (t) имеет фиксированную длительность Т, т. е. вне полуинтервала (О, Т] сообщение sh (/) тождественно равно нулю. Состояния источника могут меняться только через интервал времени Т, т. е. в моменты времени — Д ± рГ (рис. 3.1), где |х = 0, 1, 2, ... — целое положительное число, Д — случайная величина, равномерно распределенная в интервале (О, Т).
Полагаем, что последовательность состояний источника описывается простой стационарной цепью Маркова с абсолютными вероятностями стационарных состояний {ph, k = 1, К} и матрицейодношаговых вероятностей перехода
Иц ^12 ••• Я1К
^21 П-гг •••
(3.1)
ЛК1 ^К2---^КК
Общая формула
33
Здесь Лцд, — вероятность посылки сообщения sv (/), если предыдущим было сообщение (/).
Временные реализации сообщений, излучаемых источником, можно записать в виде (рис. 3.1)
s(/) = 2 su(/ — A)rectu(/— Д), (3.2)
Ц= —оо
где
Z-Ae(p7, (|х+1)П Д^(|хТ, (р+ 1)Г].
(3.3)
rectu(/ —Д) =
В каждой временной реализации s (t) на любом р,-м полуинтервале (р,Т + Д, (р + 1)Т + Д] элементарное сообщение su (t — — р.Т — Д) может быть лишь одним из возможных сообщений к (/), k = Гк}.
Вычислим сначала корреляционную функцию k (т) случайного процесса s (/)• Вследствие стационарности рассматриваемой цепи Маркова корреляционную функцию можно определить выражением
/г (т) = <s (0) s (т)> = <s0 st> = ЭД s0 sT Р2 (s0, st) ds0 dsx (3.4) где P2 (s0, st) — двумерная плотность вероятности процесса s (/). Интересующую нас двумерную плотность вероятности всегда можно представить в виде
т
Р2 (s0, sT) = J Р (s0, sTI Д) Pt (Д) db = J P (s0, sT I Д) d\ , (3.5) 0
где P (se, |SX| Д) — условная двумерная плотность вероятности случайного процесса s(/) при фиксированном значении сдвига Д.
Формулы (4) и (5) позволяют написать следующее выражение для корреляционной функции
k (т) — «So St | Д )s„. s< )д. (3.6)
Здесь внутренние угловые скобки означают осреднение с двумерной условной плотностью вероятности Р (s0, sx | Д), а внешние скобки —
2 Зак. 1216
34
3. Энергеттеские спектры марковских сообщений
осреднение по случайной величине Л с плотностью вероятности Р, (А).
Пусть т >• 0. Из рассмотрения рис. 3.1 можно прийти к заключению, что
к
(so st I A>So, st ~ У Pu :Tuv (я) (T A) sv (t A (n I)/1).
H.V= 1
(3.7)
Здесь n = [(t — A)/T] + 1 — число точек разрешенного перехода на отрезке [0, т], nuv (п) — условная вероятность появления v-ro элементарного сообщения, если после ц-го сообщения было п разрешенных моментов перехода.
В результате подстановки выражения (7) в (6) имеем к т
^(т) = у 2 Punuv(n) lsu(T —A)sv(t —A—(n —l)7)dA. u.v=l
(3.8) Так как
п = ! т' т—тТсЛ^Т, 39)
|т + 1, 0<А<т— тТ,
где т. = [т/Т] — целая часть числа т/'T, то выражение (8) можно конкретизировать
1 * г с
fe(x) = — у Pli nuv (т) Sll(T — b)Sv(-c—b— w.v = i t —
Т—mT
— (т—1) Т) г/A + nuv (т + 1) su(T—A)>v(t—A — tnT) dA .
(3.10)
Несколько упростим запись этого выражения. С этой целью введем обозначение
Т Т-т.
&uv(t) = s(l (и) sv (и -г т) du = s(l (и) sv (и + т) du. (3.11) 0 — т
Здесь последнее равенство написано с учетом того, что элементарные сообщения Sp, (н) и sv (и + т) тождественно равны нулю вне полуинтервала (0, Т]. Функцию kllv (т) иногда условно называют взаимокорреляционной функцией элементарных сообщений.
Общая формула
35
Укажем два свойства взаимокорреляционной функции (т), Которые будут использованы в дальнейшем и легко доказываются,
^uv(T) = fevu( —т), (т) = 0 при | т | > 71. (3.12)
Интегралы, входящие в формулу (10), можно выразить через ^uv (т)- Напомним, что элементарные сообщения su (/J и sv (/2) тождественно равны нулю, когда аргументы и /2 находятся вне интервала (0, Т). Поэтому первый интеграл в правой части формулы (10) может быть отличным от нуля только для тех значений А, для которых совместно выполняются неравенства 0 Т — А <7 и 0 < т — А — (т — \)Т <. Т. Записываем условие совместного выполнения этих неравенств: т — тТ А < т — (т — 1)7. С учетом этого и последующей замены переменной согласно равенству и = т — А — (т — 1)7 можем последовательно написать
Т т—(m —DT
jj su(7 — A)sv(t — а — (m— l)7)dA = J su(7— A) x »— mT t—mT
T
X (t—A — (tn — 1) 7) dA = su (u) sv (u—т + mT) du = 0
= kVtx(mT—t) = £uv(t—mT). (3.13)
Здесь при записи последнего равенства использовано первое свойство взаимокорреляционной функции (12).
Аналогичным путем получим
т—mT
su(7— A)sv(r — A — mT) d\ = kav (t — (m + 1) 7). (3.14) о
Из выражения (10) с учетом равенств (13) и (14), а также свойства четности корреляционной функции стационарного процесса получаем окончательную формулу
1 к
1ф) = — У Pw[njV(m)/;uv(|T|-|щ|7) +
+ nuv(m+ 1)(I т|- \tn + 1 | 7)|. (3.15)
Если, например, взаимокорреляционная функция элементарных сообщений /suv (т) имеет вид, изображенный на рис. 3.2, а,то графики функций /suv (т — mT) и (т — (т 4* 1)7) при т >• 0 показаны Соответственно на рис. 3.2, бив.
2*
36
3. Энергетические спектры марковских сообщений
Перейдем теперь к вычислению энергетического спектра S (ю) случайного сообщения s (/). Согласно формуле Винера — Хинчина можем написать
ОО
S (го) = (J й (т) е_/“Тг/т == 2 Re —-OP
k (т) е~/mT dx о
(3.16)
Рис. 3.2. Характер изменения взаимокорреляциоиных функций при т>0.
Распишем интеграл справа
~ Т 27
(т) е_ 1Шхйх — (J й(т) е-'“т di + k (т)е~ 1шх dx +... + оот
1)7
+ й(т)е— /a>xdx +...
mT
Введем новую переменную интегрирования т' = т — mT Тогда
im+l)Z 7
(J k (т) е~ 'ах dx = е~lma>T k (т' + mT) е— /ft)V dx1,
mT 0
k (т) е ~iax dx = У е~ ,т<йТ
\k(x' +mT)e-iax' dx'. (3.17)
Подставим сюда выражение k (т) из (15) и учтем, что
У nuv (m + 1) е~ im's>T = e'm7 у nMV(m)e~^'"ra7'. m=0 ' m=l
Тогда на основании (16) можем написать
о
S(ro) = ^-Re
Г г °°
2, Ра Awv(T')e-'mi:'dT' nuv(m) е~ ,me>r R u,v=l у т = 0
7
+ § (т' — Т) е~ ~т'1 dx’
о
У (т) е~ /таТ
(3.18)
Общая формула
37
Запишем это выражение иначе. Во втором интеграле справа сделаем замену переменной интегрирования р = т' — Т. Тогда т о
— T)e-'“'T'-rW = J ^v(p)e-/MMp. о -Т
Затем выделим слагаемое, соответствующее m =0, и учтем, что Пцу(0) = 6uV. Кроме этого, из первого свойства (12) следует соотношение
2Re
7 )
&uu (т) е~ /ит di I = Re о )
kw (т) е-/мт di
С учетом этого выражение (18) примет вид
9 ( К Г оо )
Ч-^-Re! У &uv(т)е~ di у ЯцУ(т) е-'тм7Ч. (3.19)
I Ц.,У= 1 tn^s 1 J
Для упрощения записи этой формулы введем спектральную функцию SA (/со) k-ro элементарного сообщения
7
Sh = f sh (t) exp (— /co/) dt, (3.20)
J 0
Покажем, что
kllv(i)e-,('>r dr = Si, (/co) Sv (/co), (3.21)
— 7
Здесь S*u (/co) — величина, комплексно-сопряженная c Su (/co). Подставив в левую часть равенства (21) выражение (11) и изменив порядок интегрирования, можем написать
Т 7 7
feuv (т) е~'мт di = ^sv, (и) е1<аи du sv(u + T)e~/M<"+T) di.
—т о —т
Элементарное сообщение sv (и + т) может быть отлично от нуля только в интервале (0, Т), т. е. при —и <Zi <.Т — и. Поэтому
7 Т — и
sv(u+T)e~/<“l“+t'dT= V sv(u + T)e~/“'‘i+^dT.
— Т -и
38
3. Энергетические спектры марковских сообщений
Заменив переменную интегрирования на т' = « + г, получим
т т
sv(« + T)e-'“l“+1)dx = ^sv (т') е~'ш1С' dx' = Sv (/ы).
— т о
Следовательно,
т т
5 ^uv (т) е~/<,n dx = Sv (/«) зц (и) ez“" du = (jw)Sv (». - т о
С учетом соотношения (21) из (19) получаем окончательную формулу для энергетического спектра случайного сообщения s (/):
5(®) = у 2 Pul5u(/®)|2-by pu Re|su(/®)Sv(/<o)x Ц = 1 U, V = 1
х J Jbv(zn)e-"™H . (3.22)
Формулы (15) и (22) позволяют вычислить корреляционную функцию и энергетический спектр случайных сообщений, генерируемых источником с марковским характером смены состояний. Однако часто формулы (15) и (22) записывают в другой форме, где у k (т) в явном виде выделена периодическая составляющая, а у S (<о) — соответствующая ей линейчатая часть спектра.
Запишем элементарные сообщения sh (t) в виде суммы двух слагаемых
МО = МО + МО. 0<t<T. (3.23)
Здесь
к
$о(О = 2 PkSbV)' V<t<T (3.24)
k= i
— детерминированная составляющая . элементарных сообщений, равная нулю вне интервала (О, Т), sh (/) = sh (t) — s0 (/) — случайная переменная составляющая k-ro элементарного сообщения. Для пояснения на рис. 3.3 для трех равновероятных (рх = рг = ps = = Vs) элементарных сообщений sk (/), k — 1, 2, 3, показаны s0 $ И (t).
Реализации сообщений, генерируемых источником, теперь можно записать в виде
$ (/) = s (t) + s (/). (3.25)
Здесь s (/) образуется из случайных переменных составляющих элементарных сообщений таким же образом, как и s (/) в выражении
Общая формула
39
(2) из s^t). Аналогично из s0 (/) формируется s (О, представляя собой периодическую составляющую сообщения со случайным началом отсчета времени.
С учетом (25) выражение (4) для корреляционной функции принимает вид
k (т) = <Г(0) s (т)> + <s (0) s (т)>. (3.26)
так как
<s (0) s (т)> = (s (0) s (т)> = 0. Выражение для первого слагаемого в правой части (26) дается формулой (15), нужно лишь заменить k^v (т) на (т).
~ 7
Kv ("0 = J S~ (Ы) «V (« + т) du.
0
(3.27) Выражение для второго слагаемого в (26) также дается формулой (15) с заменой /г^(т) на k00 (с):
Г
*оо(т) = § s~(u) s0 (и + т) du. о
Рис. 3.3. Графики элементарных сообщений s*(0. sZ (О H~s»(0 для k-1, 2, 3.
(3.28)
Применительно к введенным обозначениям для детерминированной составляющей в формуле (15) нужно положить ц = v — 0, р0 = 1 и л00 (т) = 1 при т = 0, 1, 2, ... При этом получим
<s(0)s(t)> = J- т|_| m | У) + feou(| т| —|m + 11 Т)]. (3.29)
Итак, корреляционная функция сообщений, генерируемых марковским источником, определяется формулой
^(т) = у [UH~ I "i|D + feoo(|T| — |m + 1 I Т)] +
1 z<
+ — 2 Pp[JlH'’(m)^v(|T|—|m|T) +
+ л^(т+ 1)£йу(|т| — |m+ 1|T)J. (3.30)
40
3. Энергетические спектры марковских сообщений
Здесь первое слагаемое справа представляет собой периодическую составляющую корреляционной функции.
Окончательное выражение для энергетического спектра сообщений марковского источника имеет вид
оо К,
S (®) = I So (/<->) I2 У ^.)+1 У [Su (/со) I2 -I-Т£ \ Т J Т
П~ —ОО 1Л= 1
2 жтЧ (-Х ~ °° 1
+ — 2 Ax Re S;(/®)Sv(/®) 2 ^v(m)e-"™r , (3.31)
ц, v= 1 I m = 1
где _ т _
So (/®) = $ s0 (/) e~di, (3.32)
0
T
Su(/co) = jjs;,(/)e-'“' di. (3.33)
о
В формуле (31) первое слагаемое соответствует первому слагаемому в (30) и представляет линейчатую часть энергетического спектра. Это слагаемое получается из общей формулы для энергетического спектра (22), если учесть, что для детерминированной составляющей сообщения $ (/) в (22) нужно положить р, = v = 0, р0 = 1, л00 (т)= = 1, т = 0, 1, 2, ... При этом получим
S(w) = -^|Sfl(/«)r + y Re j| S„(/co) |2 2 e-^| = m = I
= y |Su(/(< + y |Sa(/(0)|2Re
co
у e/m“7 — 1
m — — oo
= y-| S0(/co) |2 2 e/m“r-m = — oo
Воспользуемся известным разложением в ряд Фурье периодической последовательности дельта-функции (37J:
2
2л
т
2тл
(3.34)
Биполярные равновероятные сообщения
41
Подставив это соотношение в предыдущее выражение, придем к нужному результату. Отметим, что линейчатые составляющие спектра будут отсутствовать, если kQQ (т) = 0, т. е. при выполнении равенства
к
МО =2 pftsft(O = O. (3.35)
л= i
Второе слагаемое в правой части (31) получается из (22) простой заменой 5ц (/со) на (/«).
Таким образом, интересующие нас выражения для корреляционной функции и энергетического спектра сообщений, генерируемых марковским источником, даются соответственно формулами (30) и (31).
Рассмотрим два частных примера [20].
Пример 1. Биполярные равновероятные сообщения. Пусть источник генерирует сообщения, удовлетворяющие следующим трем условиям:
1. Для каждого сообщения зц (/) множества имеется принадлежащее этому множеству сообщение — 8Ц (/).
2. Стационарные вероятности р* сообщения 8ц (/) и сообщения — 8Ц (/) равны друг другу (р£ = р~ = рц).
3. Для одношаговых вероятностей перехода выполняется соотношение ЛцУ = nqr, ГДе 8Ц (/) = ±з9 (/) и sv (/) = ±sr (/).
Энергетический спектр сообщений такого источника не содержит дискретных линий и вообще не зависит от вероятностей перехода. Он определяется формулой
1 к
S(®) = ^2 Рч|5ц(/(о)|г, (3.36)
и= 1
т. е. равен взвешенной сумме элементарных сообщений.
Для данного примера первое слагаемое в формуле (31) равно нулю, так как выполняется равенство (35):
К/2
So(0=2 Ри[^(0-«и(01 = 0. (3.37)
И== 1
Поэтому энергетический спектр не содержит дискретных линий, и в формуле (31) применительно к нашему примеру вместо Sh (jm) можно писать просто Sh (/со).
Покажем, что третье слагаемое в формуле (31) также равно нулю. Для сокращения записей введем обозначения вида
^v"(z)= 2 P{—sv(tnT) +5Д0)}2-.
m = l
42
3. Энергетические спектры марковских сообщений
Используя второе и третье условия, можем последовательно написать
к К/2
2 PuS|l(/m)Sv(/(o) Juv(z)= 2 (/Cd)Sr(/®)[Pff+(z) —
u. v = I q. r= 1
— pq S'qr~ (Z)~pq S'qr + (Z) + pq &qr~ (Z)J =
K/2
= 2 (z)-£r(*)-^’ (z) + ^--(z)]=0’
q. z=i
(3.38)
так как можно показать, что
S'qr + (z) — S^ qr , S' qr (Z) — S' qr* (?).
С учетом написанных равенств (37) и (38) из формулы (31) получаем требуемый результат (36).
Пример 2. Чисто случайные сообщения. Пусть механизм генерации сообщений источником характеризуется тем, что сообщение, генерируемое в данном интервале времени длительностью Т, не зависит от того, какими были сообщения в предыдущие интервалы времени Т, т. е. для вероятностей перехода справедливо соотношение
(m) = pv при m=l, 2, 3... (3.39)
В данном случае матрица вероятностей перехода имеет вид
Pi Pi ••• рк л = ...............
-Р\ Pi Р&-
Для такой матрицы выполняется равенство лт = л для всех т > 1.
По формуле (22) находим энергетический спектр рассматриваемых сообщений:
। * 2 К
S(®) = — AjSn(/®)|2+y У PuPv X
а= 1 и. v= 1
I °°
х Re Su (/со) Sv (» е"'тшг = у 2 |5ц (/ю) |2*
I 71= I Ц = 1
+ 7"Re|2 2 PvSv(/(0) 2 е-'тмг) =
(Ц=1 V = | 71=1
К ( К к
= ~ S Р“ I (/®) |г + у Re 2 Su Id pv Sv x
u=l (ц = 1 V = 1
Биполярные равновероятные сообщения
43
X
Здесь при записи последнего сомножителя было использовано соотношение (34). В результате дальнейших преобразований получим । *
$(“) = у |2“
ц = 1
К
2 Ри (/со)
и = 1
Выделив во втором слагаемом член, соответствующий ц = v, и объединив его о первым слагаемым, получим окончательную формулу оо К 2
W = - ос ц = 1 '
1 Л о К к
+ у 2 ^PvRelSiOcoJSvyto)!.
|Л= 1 |Л= 1 v= 1
U<V u*v
(3.40)
В частном случае при К = 2 и рх = р, р3 = 1 — р эта формула упрощается
S(“)=~ 2 IAW+0-p)S2№) m = —оо '
+ yp(l-p)|S1(/(o)-SJ/(o)|a. (3.41)
Если в дополнение к указанным условиям s, (t) — —s2 (/) и р = Ч3, то формула (41) переходит в (36), и спектр сообщений оказывается сплошным.
Выполним конкретные вычисления по формуле (41) для следующего простого случая. Пусть имеется только два элементарных сообщения Sj (t) и s2 (t). Такими сообщениями являются биполярные прямоугольные видеоимпульсы высотой ± А и длительностью Т. В данном случае
St(/w)= —32 (/«) = (' —)( 1-е-/“7')-
\ /со ]
44
4. Одномерные дискретные блуждания
Подставив эти выражения в (41) и выполнив простые преобразования, получим
5(ю) = — Е(1— 2pY У .sitl2<MLffl- —
v ' Т U (ыТ/2)2 Т
т=х —оо
+ 4£р (1 - р) -sin2 (юГ-^ = — £(1— 2р)2 х (юТ/2)2 Т v
00 sin2 тл с / 2тп \ . , . sin2 (со7'/2)
-----------------6 со----------+ 4E/J (1 — р)-----------— , х Zj (ял)’ V Т ) v (иГ/2)2
tn = —
где Е = А2Т — энергия элементарного сообщения.
Так как sin2 тл/(тл)2 = 0 при m — ±1, ±2, ±3, то сумма содержит только один член, отличный от нуля, который соответствует m = 0. Но lim (sin2mn.)/(mn.)2 — 1 и поэтому т->0
= -у- (1 - 2р)2 б (со) + 4р (1 - р) Si^^-21- • (3.42)
При р = V2 дискретная линия на нулевой частоте отсутствует и энергетический спектр будет сплошным
S (со)/£ = sin2 (со7'/2)/(со7'/2)2. (3.43)
Приведенные выше формулы позволяют вычислить корреляционные функции и энергетические спектры разнообразных сообщений марковского типа.
4. Одномерные дискретные блуждания
Теория марковских процессов позволяет решать ряд содержательных задач. Например, можно находить непосредственно вероятностные характеристики при наличии различных ограничений на процесс, вычислять вероятности выхода процесса за границы и др. Наглядное представление о содержании подобного рода задач, а также о применяемых методах решения для цепи Маркова можно составить на примере одномерных дискретных случайных блужданий.
Рассмотрим одномерные блуждания частицы вдоль оси 0, представляющие собой однородную цепь Маркова со счетным числом состояний. Пусть через некоторую единицу времени возможны переходы из любого /-го состояния в три ближайших состояния: / 4- 1, /, / — 1 с вероятностями (1) = р, njj (1) = 1 —р —q, (О = Я-
Неограниченные блуждания
45
Примем, что в начальный момент времени t0 = 0 частица имеет координату д0 (рис. 4.1) и в дискретные моменты времени t — = 1, 2, ..., п, ... координата частицы изменяется на случайную величину Zj. Случайная величина zt может принимать три значения: 1, 0, —1 с вероятностями
Р{г, = 1} = р, Р{ zt = 0} = 1 - р - q, Р {zt = —1} = q.
В момент времени t = п случайная координата частицы равна
= 2 гг.
Движение частицы может происходить как по всей прямой 0, так и на некотором ограниченном отрезке. В последнем случае говорят о границах (экранах), поставленных на пути движения частицы. Обычно различают три вида экранов: поглощающий, отражающий и упругий жесткий. Если частица попадает на поглощающий
Я
J -
2 -
Рис. 4.1. Одномерные дискретные случайные блуждания.
экран, то на этом ее движение заканчивается. Если частица достигает отражающего экрана, то в следующий момент времени ее координата может только уменьшиться (увеличиться) на единицу. Более общим является упругий жесткий экран. Когда частица достигает упругого жесткого экрана, то в следующий момент времени ее координата может уменьшиться (увеличиться) на единицу с вероятностью г либо остаться неизменной с вероятностью 1 — г.
Для одномерного случайного блуждания в зависимости от вида экранов можно рассматривать несколько задач [6, 21].
Неограниченные блуждания
Пусть движение частицы, исходящее из точки О0 = 0, возможно на неограниченной прямой (т. е. от —со до 4-оо). Тогда через п шагов координата частицы будет равна
(4.1) ’=1
Случайная величина 0П может принимать различные значения £=0,±1, ...,±п. Чтобы попасть в точку k, частица должна сделать «1 положительных шагов, п2 отрицательных шагов и п0 «нулевых»
43
4. Одномерные дискретные блуждания
шагов, где п1( п2 и п0—неотрицательные целые числа, удовлетворяющие равенствам
«1 — «2 = пй ~ п — (п1 + п2). (4.2)
Вероятность того, что 0n = k, определяется обобщенным биномиальным законом
P{0n = k} = 2 p^(\~p-q)^q\ (4.3)
/Zo! Л|! л2!
где суммирование производится по всем значениям п„, п1, п2, удовлетворяющим равенствам (2).
Обозначим через ц и о2 среднее значение и дисперсию случайной величины zt (за один шаг); они равны
ц ~ р — q, о2 = р 4- q — (р — q)2. (4.4^
Тогда среднее значение и дисперсия случайной величины 0П будут определяться формулами
<0п> = «н. = <(0д — пц)2> = по2. (4.5)
Вычислим вероятность Р {jУ 0n k} того, что в момент времени t = п частица находится в одном из состояний /, /4-1, ... ..., k (j < k). Так как эта вероятность определяется суммой вероятностей отдельных состояний, то для нее можно получить приближенное выражение, которое следует из центральной предельной теоремы. Согласно этой теореме случайная величина 0П при больших п распределена приближенно по нормальному закону со средним значением пц и дисперсией по2. Поэтому
/’ Ь С k} —---------5----С ехр — dx ==
' (2лло*)1/2 j L 2^ \
i
=ф//у=^\ ф/у^м (4>6)
\о ~\/п / \ о ~[/п /
где
Ф(т)= —L- f ехр( — Pl2)dt (4.7)
У?л J — оо
— интеграл вероятности.
Более общие характеристики дискретного блуждания по неограниченной прямой можно получить при помощи производящей функции (см. Приложение II). По определению производящая функция одного скачка z,- равна
= </‘’> = W + 0—р—<7)+ <7/!Л (4.8)
Один поглощающий и один упругий жесткий экраны
47
Так как отдельные скачки независимы, то (увп > — IG ({/)!". Полагая |sG (у) | <1, введем производящую функцию
G(y, s)~ £ s«[G(z/)p = 1/(1 —sG(у)) =
n = 0
= (//( — spy2 + y(l— s—sp — sq)—sq). (4.9)
Производящая функция G (у, s) содержит всю информацию о процессе в том смысле, что вероятность Р {0n = k} является коэффициентом при sAyn в разложении G (у, $).
Один поглощающий и один упругий жесткий экраны
Пусть движение частицы происходит на отрезке [с, d], ограниченном в точке с поглощающим, а в точке d упругим жестким экранами. Наличие экранов означает, что если частица попадает в точку с, то
на этом движение заканчивается, а если она попадает в точку d, то в следующий момент времени частица с вероятностью г попадает в точку d — 1 либо с вероятностью 1 — г останется в точке d (рис. 4.2).
Обозначим через ве-
роятность того, что частица, первоначально (при / = 0)
d-------.------—----------------
- • • • • •
/" •
diii ‘ - 1 1 । ух ‘ । » । । > 2 5 4 d ff 7 , n t
777777777777Т7777777777777777777Л"
Рис. 4.2. Дискретные случайные блуждания
при наличии упругого жесткого и поглощающего экранов.
занимающая положение й0 = /, в момент t = п впервые попадает в положение 0П — с, после чего движение прекратится. Таким об-
разом.
/Г = Р {01 > с......> с, 0П = с 10в = /}. (4.10)
При п = 0 имеем очевидное равенство
1
0
при / = с, при / 7^ С.
(4.11)
Оно означает, что частица, находящаяся в положении с. поглощается в момент времени I = 0 с вероятностью единица.
Пусть Ап означает событие «поглощение произошло в точке о в момент t = п». Тогда = Р (<4П |О0 = /}. Если на первом шаге частица изменила положение на +1, то для осуществления события Ап необходимо, чтобы произошло событие А п_г при начальном уело-
48
4. Одномерные дискретные блуждания
вии #0 = / + 1. Поэтому вероятность того, что произошел скачок на +1 и что произошло событие Ап, равна
P-Р {Xn-Jfl'o = j + 1}.
Так как на первом шаге частица может изменить положение на +1, О, —1, то
fl1' = рР{Ап^ | d0 = j + 1} + (1 - р - q)P {Ап^ | d0 =
= /} + <7P Mn_1|d0 = /- 1}.
В обозначениях (10) это означает, что вероятность поглощения удовлетворяет разностному уравнению
/Г> = р/7+-1’ + (1-р-<7)/Г1’ + <?Л-“>1 (/ = с+ 1,..., d-1).
(4.12)
Кроме того, очевидно, должны выполняться начальные и граничные условия
г = ( °’ n¥=0; ^) = (l-r)^-h + r^-ih. (4.13)
[ 1, п = 0;
По определению производящая функция вероятностей поглощения за п шагов равна
^(S)=2 (414)
Умножив обе части уравнения (12) на $" и суммируя по всем п, для F} (s) получим разностное уравнение
F, = s {pF1+l + (1 - р - q)Ft + qFi-J. (4.15)
Из (13) находим граничные условия для уравнения (15)
Fc = 1; Fd = s 1(1 - r)Fd + AFd_J. (4.16)
Введение производящей функции (14) позволяет свести разностное уравнение (12) от двух переменных п и j к разностному уравнению (15) только от одной переменной j.
Общий метод решения однородного линейного разностного уравнения типа (15) состоит в подстановке Ft (s) = А/, откуда следует
М — s [pV+I + (1 — р — q)7J + gA/-Ii или
psk2 — А [1 — s (1 — р — g)l + qs = 0. (4.17)
Решения квадратного уравнения (17) даются выражением
*1,2(«) = {1 — s(1 —p—q) ± V[l — s(l—р — g)]2—4pqs2}/2ps. (4.18)
Один поглощающий и один упругий жесткий экраны
49
Величина s предполагается действительной и положительной, так чтобы подкоренное выражение в (18) было положительным, т. е.
[1 — s (1 — р — (?)]2 > 4pqs2 или
О < s <------!---— =-------J.
1 — р — <7 + 2T/w i—(Vp—У<?)2
Учитывая сказанное, далее в (18) берется арифметическое значение корней.
Таким образом, находим общее решение разностного уравнения (15)
Fi (s) = A [Xt (s)J' + В [Х8 (s)l'.
Для определения постоянных А и В, которые могут зависеть от s, из граничных условий (15) следует система уравнений
4Xct + BX2c= 1;
ДХ^-1 [Хх —sX, (1 —г) — sr] + ВХ^~* ]Х2 —sXa (1 —г) — sr] = 0.
Проделав соответствующие выкладки, для производящей функции вероятностей поглощения получим выражение
F (S) = Y-£ М-7 —s + sr) —.
(4-19)
Нетрудно убедиться, что
B;(S)|S=1 = 1- (4.20)
Равенство (20) выражает очевидный факт, что поглощение за сколь угодно большое время обязательно произойдет.
Производящая функция (19) представляет собой рациональную дробь
F (S) = _^L/'^_y-e (4.21)
м 7 Н (S) р / *
где Q (s) и Н (s) являются многочленами степени s. Если знаменатель Н (s) степени d. — с — 1 имеет различные корни sx, s2, .... sd_c_], то (21) можно разложить на простые дроби
^(s) = d~iT' ah/(sk-s). (4.22)
k=i
Постоянные ah разложения (22) определяются равенством
а,--(“Г‘ --- (4 23)
\ Р ] {уН/ds)s—s^
50
4. Одномерные дискретные блуждания
Раскладывая (22) в ряд по степеням s”, получаем
^(«)= 2 “~S
п=0 4 = 1
Согласно (14) можем написать
, d—c—1
= 2 (aA/s2_i) (п = /-с, /-с+1....). (4.24)
4= 1
Для определения корней многочлена Н ($) иногда бывает удобно воспользоваться заменой переменных
s= 1/(1 — р—<? + 2 Vp^coscp). (4.25)
В этом случае Х12 = ~Vq/p exp (±iq>) и (19) принимает вид
F (<р) = ( ? \?+2Vwcos<p)Vgsin(d — j)<p—r~|/psin(d—j- 1)<р \ Р / (г—р—<?+ 2‘l/p<?cos<p)‘l/<?sin(d—с)<р—r‘p/psin(</-c— 1)<р
(4.26)
Проделав соответствующие выкладки, из (23), (24) и (26) для вероятностей поглощения на л-м шаге получим следующее выражение:
' М ' 4 = 1
Х(1 — р — q+ 2]f pqcosqk)n-' sin <pft. (4.27)
Здесь приняты обозначения:
U (<Рл) = {г — Р—q + 2 Vpq cos cpj V~q sin (d — j) <pk —
—r /psin(d — /— l)<pft; (4.28)
V (<pft) = 2q]/~p sin <pft sin (d — c) cps —(d —c) —
—P — q+ 2 Vpq cos cpft)cos(d — c) <pA —
—r]Sp(d — c— 1) cos(d — c— l)cpft.
Значения корней (k = 1,2.........d — c — 1) определяются уравне-
нием
—p — q-\-2yfp^costp) sin (d—c)cp—r p sin (J—c— 1) cp = 0.
(4.29)
. При наличии у многочлена Н (s) кратных корней, вероятности поглощения f'jl} могут быть найдены в каждом конкретном случае аналогичными методами.
Два поглощающих жрана
51
Математическое ожидание и дисперсия времени до поглощения могут быть найдены с использованием свойств производящей функции вероятностей поглощения
\ ds ) |s= i
,/v . cPFj dFj
° W =---------Г-------1-----
ds1 ds
C dFj \2|
\ ds I |s = i
(4.30)
(4.31)
Например, для среднего времени до поглощения в точке с из первоначального состояния j из (19) при г =£ 0 имеем
При помощи (31) из (19) можно получить выражение для дисперсии среднего времени до поглощения, которое здесь не приводится из-за его громоздкости.
Bi d
Два поглощающих экрана
Пусть частица, которая в первоначальный момент времени находилась в точке й0 = /, движется на отрезке, ограниченном в точках с, d поглощающими экранами (рис. 4.3). Это означает, что при попадании частицы в точку с или d движение прекращается. Обозначим через вероятность того, что частица, в момент t = 0 занимающая положение й0 = /, в момент времени t — п попадает в точку с и при этом ни разу не попадает в точку d. Таким образом,
fT^P{c<^<d c<bn<d, Qn = c\% = iY (4.33)
Поступая аналогично предыдущему для производящей функции FjC (s) = Fj (s). вероятностей поглощения //?’, получаем разностное уравнение вида (15) с граничными условиями
Fc(s) = l, Fd (s) = 0. (4.34)
Решение уравнения (15) с граничными условиями (34) имеет вид
fj (S) = 6. (S) = (М~а- ?.^)/(>Г-V). (4.35)
0
I • I---
_ 1 Z-l 4 з 6 7
П t
С
блуждания экранов.
Рис. 4.3. Дискретные случайные при наличии двух поглощающих
52
4. Одномерные дискретные блуждания
Так как согласно (17) = q!p, то можно убедиться, что выраже-
ние (35) совпадает с (19) при г = 0. Следовательно, вероятность поглощения в точке с за п шагов также может быть найдена из (27) при г = 0.
Аналогичным путем из решения уравнения (15) с граничными условиями Fc (s) = 0, Fd (s) = 1 можно получить выражение для производящей функции F jd (s) вероятности достижения границы d:
FJd(s) = [K1 . (4.36)
l*i (s)]d-c-[X2 (s)]*-'
Раскладывая полученные выражения в ряд по степеням s, согласно (14) получаем интересующие нас вероятности и
Например, полагая для простоты / = 0, согласно теореме 4 (см. Приложение И) представим FM (s) в виде разложения на элементарные дроби
Fod (s) = (2psr “ V ' ---, (4.37)
1—(s/sv)
где sv — корни знаменателя выражения (36)
sv= (1—p—2 Kpgcos ' (v=l,..., d— c— 1). (4.38)
\ d — c /
Приведем используемые ниже соотношения
= l/"— exp [( — iy+' V p L d—c
— \ (s) = —---------, /=1,2. (4.39)
ds [A,y (s)!"1 —pX.,(s)}
Первое равенство получается подстановкой (38) в (18), а второе— непосредственным дифференцированием (17).
Используя равенства (39), находим постоянные av:
av = lim ( 1--— 'j (2ps)~d FOd (s) =
’s \ So /
= (2psr.immi-hmmi-
—so~T~ {[^1(S)1 d C — [Ws)]14 e}s = s0
. ,,v . CTW! . TW
(— 1) sin —-------sin —------
____________a—c_________a — c 2(d-c) (4pq)d'2 s*-1
v= 1, 2. d—c— 1.
Два поглощающих экрана
53
Таким образом, согласно (37) получим
^ = (2p)d 2 V=1
( —l)vsin-
«V 1 t p \d/2
------- = I ] V sn-d----------2(d—c) \ q J
cnv nv
sin 4—c--------d—c
n = d, d+ 1,... (4.40)
s'1-1 sv
Для вероятностей f$ можно получить аналогичное выражение, которое совпадает с (40), если в нем заменить с на —d и р на q.
Вероятность поглощения частицы на экранах с или d за произвольное время получается из (35), (36), если положить $ = 1:
P(d) = Fw(l)= 5/ГЛ P(c) = l—P(d). (4.41)
п - 0
В частности, для j = 0 получим
/3(d) = /?0d(D =
' (4.42)
Чтобы завершить вероятностное описание рассматриваемого процесса случайных блужданий, можно определить вероятность того, что частица в момент времени t = п находится в положении k, ни разу не достигнув поглощающих границ. Для этого введем производящую функцию вида
Ph(s)= pg” = 60ft, (4.43)
и = 0
и аналогично (15) для нее получим уравнение
Ph (s) — 1 = s[pPft_! (s) + (1 — р — q)Pk (s) + qPk+1 (s)l. (4.44)
Граничные условия для уравнения (44) имеют вид
Рс (s) = Pd (s) = 0.
В отличие от (15) разностное уравнение (44) является неоднородным и его решение можно получить довольно громоздким методом вариации постоянных ’(см. также пример 3 § 9).
54
4. Одномерные дискретные блуждания
Один поглощающий экран
Пусть движение частицы начинается из положения #0 = / и ограничено только одним поглощающим экраном, расположенным в течке с. Этот случай аналогичен предыдущему, где нужно положить
°°- Так как Zj > Х2, то при d —> оо из (35) получим
(s) = lim (s) = Х(~с. (4.45)
rf->00
Это выражение определяет производящую функцию вероятностей поглощения, когда движение происходит на полуинтервале 1с, оо).
При помощи производящей функции (45) можно найти выражения для среднего времени <jVc> и дисперсии времени о2 (AQ первого достижения границы с. Так при / = 0 и с < 0 имеем
W =
^c(s) ds
c/(p-q), oo
q>P< q<P>
°М) =
' &FC dF,
ds1 ds
= {c[<7 + P—(q—p)2]}/(p~q)3 (q>p)-
Если использовать обозначения (5), то
<Л/С> = |с|/р, = |с| W) (q>P>-
(4.46)
(4.47)
Вероятность поглощения частицы за произвольное время при / = О равна
P(c) = Fc(l) = Hp/<7)C’ р>я' (4.48)
I 1, Р<Я-
Следовательно, при р > q с вероятностью 1 — (plqY частица может блуждать сколь угодно долго, не достигнув границы,
Два отражающих экрана
Пусть частица движется из первоначального состояния / в области, ограниченной двумя отражающими экранами в точках с и d (рис. 4.4). Наличие отражающих экранов означает, что сразу после п-го скачка частица занимает положение
(0П-1 + гп, с С 0п_! + г„ С d,
°n= d, + (4.49)
( с, +
Два отражающих экрана
55
Обозначим pfk вероятность того, что частица в момент времени t — п займет положение k, если ее начальное состояние было /. Применяя рассуждения, аналогичные использованным при выводе уравнения (12), получаем
P$’ = /M"7-i + (1 — Р — q) Р([/Г1} + М("7+г c<k<d. (4.50)
В граничных точках в данном случае имеем
^’ = /’•^7-1 +(1-?) руг1’; С = а-р)руг1’ + ^<лГ+’- (4.51)
Наибольший интерес представляет стационарное (установившееся) распределение, которое получается при п -> оо. При этом p("t -> nh (k = с ,...,d).
Согласно (50), (51) nh должны удовлетворять уравнениям
Рис. 4.4. Дискретные случайные блуждания при наличии двух отражающих экранов.
nh = pnh^ + (1 — р — q)nh + qnlt+1 (k = с + 1................................ d— 1),
«с = (1 - p) лс + qnc+t,
(4-52)
"d = P nd_! + (1 — q)nd.
Выражая лс+1 через лс, имеем п„+, = n„p!q Тогда из первого уравнения (52) следует, что
лс+2 = [(р + q) лс+1 — рлс1 (1/<7) = (р/<7)2лв.
В общем случае ль = (p/q)k~c лс (k = с.......................d).
d Вероятность лс определяется из условия нормировки — 1,
согласно которому получим
1—д/?
\-(plq)d-c+l
(k —с, ...,d). (4.53)
Формула (53) дает равновесное распределение вероятностей нахождения частицы в состоянии k, которое устанавливается за достаточно большое время.
Получение нестационарного решения для случая р + q = 1 приведено в [6].
56
5. Анализ цифровых систем ФАП первого порядка
Один отражающий экран
Для одного отражающего экрана, помещенного в точке с, результаты могут быть получены из предыдущего случая при d -> В этом случае, при р <q для равновесного распределения вероятностей состояний получим
= (1 — plq)(plq)k~c (k = с, с 4- 1, •••)• (4-51)
Отметим, что при р q равновесного распределения не существует, так как частица уходит в бесконечность.
5. Анализ цифровых систем ФАП первого порядка
Основные принципы работы цифровых систем ФАП первого порядка
В современных радиотехнических системах находят все более широкое применение цифровые схемы фазовой автоподстройки (ФАП). Это обусловлено возможностями микроминиатюризации соответствующей аппаратуры, низкой стоимостью элементов цифровых систем и их высокой надежностью, высокой степенью стандартизации. Общая задача исследования статистической динамики цифровых систем связана с анализом стохастических разностных уравнений. При этом весьма эффективным оказывается применение аппарата теории цепей Маркова.
Рассмотрим цифровую систему ФАП первого порядка [22], структурная схема которой приведена на рис. 5.1. Предположим, что на вход системы действует аддитивная смесь полезного сигнала $ (/) и шума п (/), т. е. принятое колебание имеет вид
|(/) = s (/) + п (t). (5.1)
Здесь s (/) — сигнал прямоугольной формы с постоянными и известными амплитудой А и периодом Ts, п (t) — нормальный белый шум с известными статистическими характеристиками
<п(/)> = 0, <п(/)п(/ + т)у = -^-6(т). (5.2)
Принятое колебание через узкополосный фильтр (Ф) с полосой пропускания AF поступает на вход квантователя (К). Предполагается, что сигнал s (/) проходит через фильтр без искажений. В квантователе через равные промежутки времени берутся выборки смеси
Принципы работы цифровых систем ФАП первого порядка
57
полезного сигнала и шума. По теореме отсчетов частота взятия выборок для адекватного представления сигнала должна быть равна f к =
= 2ДА, т. е. за один период сигнала должно браться не менее 2&FT3 отсчетов.
Выборки смеси полезного сигнала и шума преобразуются в цифровую форму в аналого-цифровом преобразователе (АЦП). Предполагается, что ошибки преобразования аналог — цифра пренебрежимо малы за счет использования достаточно большого количества двоичных разрядов для представления чисел.
Рис. 5.1. Структурная схема цифровой ФАП первого порядка.
Рис. 5.2. Ошибка сиихроиизации в случае двух выборок за период сигнала прямоугольной формы.
Преобразованные в цифровую форму выборки подаются на фазовый детектор (ФД), который представляет собой комбинацию селектора выборок перехода (СВП) и накопителя (Н). Селектор выборок перехода выделяет выборки, соответствующие оценкам моментов времени смены знака полезного сигнала. По определению, ошибка синхронизации равна интервалу времени между отрицательным переходом полезного сигнала и моментом взятия соответствующей выборки перехода. На рис. 5.2 ошибка синхронизации отрицательна и равна по абсолютной величине т, т. е. оценочное значение момента времени отрицательного перехода отстает от истинного на т. Отметим, что в отсутствие шумов сигнал ошибки, обозначенный на рис. 5.2 знаком (+) и равный величине выборки отрицательного перехода, вырабатывает положительный сигнал управления. Если бы эта выборка бралась после истинного момента времени отрицательного перехода полезного сигнала, ее величина была бы отрицательна. Таким образом, знак сигнала на выходе селектора выборок перехода противоположен знаку ошибки синхронизации. Чтобы это свойство сохранялось, знак следующей выборки, т. е. выборки положительного перехода (на рис. 5.2 обозначена (—)) следует заменить на противоположный, так как только в этом случае будет вырабатываться правильный сигнал управления.
Наличие аддитивного шума вызывает ошибки синхронизации, величина которых зависит от отношения сигнал/шум в выборке.
58
5. Анализ цифровых систем ФАП первого порядка
Чтобы уменьшить влияние шума на точность синхронизации, коррекция положения выборок перехода на оси времени производится после суммирования в накопителе m выборок. Если подстройка производится через каждые М периодов сигнала, т. е. через интер-
Делитель частоты на н-в
llllllllllllllllllllllllllllll
I I
S
Рис. 5.3. К принципу изменения фазы в процессе деления частоты.
вал времени Т = MTS и для формирования сигнала управления используются все выборки переходов, то т = 2М.
Сумма т выборок перехода жестко ограничивается в знаковом детекторе (ЗД). Сигнал на выходе знакового детектора появляется один раз за время Т и равен знаку суммы т выборок перехода, накопленных к этому моменту времени. Этот сигнал подается на схему добавления или исключения импульсов (СДИИ), которая обычно используется в устройствах фазирования без непосредственного воздействия на местный генератор (Г). В подобных устройствах фаза
Модель случайных блужданий
59
подстраивается в промежуточном преобразователе, через который проходят импульсы от задающего генератора. В качестве промежуточного преобразователя чаще всего используется делитель частоты (Д), который в нашем случае осуществляет деление тактовой частоты генератора до частоты взятия отсчетов в квантователе.
Фазирующие устройства с делителем частоты можно реализовать целиком на цифровых элементах, что упрощает их изготовление, настройку и эксплуатацию. Часто такие устройства называют устройствами с дискретным управлением (или дискретными устройствами фазирования).
Принцип изменения фазы в процессе деления частоты поясняет рис. 5.3. Генератор (Г) вырабатывает тактовую последовательность импульсов с частотой Д, в R раз больше частоты взятия отсчетов f„, где R — коэффициент деления делителя частоты. Далее эта последовательность импульсов делится на R, например, делителем в виде цепочки из двоичных счетчиков (рис. 5.3, а). В нашем случае R = f^hF. Процесс деления в отсутствие управляющего сигнала со знакового детектора иллюстрируется временной диаграммой, представленной на рис. 5.3, б. Здесь изображена исходная последовательность импульсов с тактовой частотой fc и получаемая на выходе делителя последовательность с частотой /к. Коэффициент деления взят R = 8. При этом на выход делителя подается каждый восьмой импульс тактовой последовательности.
Если на вход делителя подать дополнительный импульс через схему добавления или исключения импульсов, то фаза выходной последовательности сместится в сторону опережения на заданную величину Л (рис. 5.3, в). Заметим, что дополнительные импульсы нужно вырабатывать при отрицательных сигналах управления и они не должны совпадать по времени с импульсами задающего генератора. Если же один из тактовых импульсов, подаваемых на делитель частоты, исключить (положительный сигнал управления), то фаза выходных импульсов сместится на ту же величину Л в сторону отставания (рис. 5.3, г).
Таким образом, путем добавления или исключения импульссв в тактовой последовательности можно изменять в нужную сторону фазу последовательности импульсов, используемых для управления квантователем, т. е. изменять положение выборок смеси сигнала и шума на заданную величину Л. Очевидно, что при заданной частоте взятия отсчетов можно обеспечить любую необходимую величину шага коррекции Д путем изменения частоты задающего генератора.
Модель случайных блужданий
Из приведенного описания основных принципов работы цифровых систем ФАП первого порядка следует, что ошибка синхронизации изменяется через время Т на заданную часть Д периода сигнала
60
5. Анализ цифровых систем ФАП первого порядка
Ts. Отсчеты белого шума, пропущенного через идеальный фильтр с полосой пропускания Д/7 и квантованного по времени со скоростью 2Д/7, дают статистически независимые выборки. Так как изменение ошибки синхронизации определяется суммой tn этих статистически независимых выборок, то вероятности изменения ошибки на величину ±Д для сигнала прямоугольной формы не зависят от положения выборок на оси времени. Определив «состояние ошибки» как полную ошибку синхронизации непосредственно перед коррекцией, можно заметить, что в этом случае статистическая динамика цифровой си-
Рис. 5.4. Диаграмма состояний ошибки синхронизации по периоду сигнала прямоугольной формы.
стемы ФАП первого порядка описывается цепью Маркова со счетным числом состояний. На рис. 5.4 показаны возможные состояния ошибки по периоду сигнала прямоугольной формы. Ошибка синхронизации измеряется по отношению к моменту отрицательного перехода полезного сигнала. Все состояния цепи разделяются равными долями Д одного периода сигнала и, следовательно, существует 2N = 1/Д возможных состояний в одном периоде.
В отсутствие шума в цепи обратной связи всегда будет вырабатываться правильный сигнал управления и система будет совершать последовательные переходы из состояния +1 в состояние —1 и обратно, т. е. ошибка синхронизации будет равна ±Д/2.
Выборки nt нормального белого шума (2), взятые со скоростью 2Д/7, являются нормально распределенными и имеют следующие статистические характеристики [301:
<nj> = 0, о? — <п/> = Мо Д/7. <п(пу> = 0 при «=/= j. (5.3)
Вычислим вероятность того, что в результате накопления m выборок перехода на выходе знакового детектора будет сформирован правильный сигнал управления, т. е. в результате последующей коррекции абсолютная величина ошибки синхронизации уменьшится на
Модель случайных блужданий
61
Д. Для определенности положим, что система находится в одном из положительных состояний ошибки (рис. 5.5). Тогда искомая вероятность равна
{т
2
/ = 1
(— A + nf)<0
т
Сумма у = 2 (ni — ^4) независимых нормальных случайных t= ।
величин будет распределена по нормальному закону со следующими
-N -N+1 -N+2 -5-2-1 1 2 5 N-2 N-1 N
рис. 5.5. Модель случайных блужданий ошибки синхронизации за один дериид полезного сигнала.
ха ра ктер истм ка ми
пги = —тА\
Таким образом, можно
— 1
& 1/2лс„
= 2 ст,г ~ mN<AF-
написать
о
С expl — (y~,miy^]dy=‘
I I I
J \ V f
• ОС
ехр(—t'll2)dt = (5.4)
где р = mA^IN0AF — отношение сигнал/шум иа выходе накопителя, Ф (г) — интеграл вероятности.
Вероятность q появления неправильного сигнала управления, очевидно, равна
q = 1 — р. (5.5)
Нетрудно убедиться, что аналогичные выражения получатся, если рассматривать отрицательные состояния ошибки. Заметим, что для отрицательного полупериода полезного сигнала правильный сигнал управления вызывает вычитание из общей ошибки синхронизации величины Д, т. е. переход системы из состояния / + 1 в состояние / (/> 1). Для положительного полупериода полезного сигнала правильный сигнал управления приводит к прибавлению величины Д, т. е. переходу из состояния / в состояние / + l(j < —1).
62
5. Анализ цифровых систем ФАП первого порядка
В этом смысле модель случайных блужданий, описывающая статис-тическую динамику цифровой системы ФАП первого порядка, существенно отличается от модели простых одномерных блужданий, рассмотренных в § 4. На рис. 5.5 схематически показаны возможные изменения состояния ошибки синхронизации за период полезного сигнала с соответствующими вероятностями перехода.
Средний квадрат ошибки синхронизации
За оценку качества работы цифровых систем ФАП обычно принимается величина среднего квадрата ошибки синхронизации в стационарном состоянии. Прежде чем перейти к ее вычислению, заметим, что для модели неограниченных случайных блужданий финаль-
Рис. 5.6. Диаграмма состояний для
анализа среднего квадрата ошибки синхронизации.
ные вероятности состояний с течением времени стремятся к нулю, а средний квадратошибки синхронизации неограниченно возрастает. Как и в непрерывных системах ФАП первого порядка (см. §22, рис. 22.3), это вызвано тем, что с ростом времени становятся возможными любые сколь угодно большие ошибки синхронизации. Поэтому по аналогии с непрерывными системами в дальнейшем будем рассматривать значения ошибок синхронизации, приведенные к интервалу, равному одному периоду полезного сигнала Ts. При этом переход из состояния Л/ в N -j- 1 (рис. 5.4) приводит к попаданию системы в состояние — N, а переход из состояния—N в — N— 1 к А.
При вычислении среднего квадрата ошибки синхронизации имеет значение лишь абсолютная величина этой ошибки. С этой точки зрения, попадание в состояние — N (или N) из состояния N (или — N) можно рассматривать как продолжение (с вероятностью!?) пребывание^ состоянии N (или — N). Кроме этого, состояния j и—j (j= = 1, N) дают одинаковый вклад в величину среднего квадрата ошибки. Поэтому для ее вычисления вместо модели случайных блужданий, приведенной на рис. 5,5, можно воспользоваться более простой моделью, диаграмма состояний которой показана на рис. 5.6. Здесь состояния 1 и А являются упругими жесткими, стрелками указаны возможные изменения состояний с соответствующими вероятностями перехода.
Средний квадрат ошибки синхронизации
63
Пусть по-прежнему л7& (п) обозначает вероятность того, что система в момент времени t = пТ попадет в состояние k, если начальное состояние было равно /. Тогда стационарные значения вероятностей состояний равны
Pft = limn>ft(n).
п->сю
Повторяя рассуждения, использованные при выводе уравнения (4.50), получим, что стационарные значения вероятностей состояний Pk удовлетворяют разностному уравнению
Рк = qPk-1 + pPk+i, ft = 2, (5.6)
с граничными условиями
Pi — pPz + рР\, Pn = qPu—\ + qPu- (5-7)
Аналогично (4.53) решение уравнения (6) с граничными условиями (7) запишется в виде
k=~N.......(5-8)
Здесь было использовано свойство симметрии Рк = и условие
N 1
нормировки вида У, Ph — -=.
*= 1 2
Из формулы (8) следует, что в случае отсутствия полезного сигнала (р = 0 и, следовательно, р = q) равновесное распределение вероятностей состояний ошибок в цифровой системе ФАП первого порядка имеет вид
Ph = 1/2Л7, k = —N, .... -1, 1, .... N. (5.9)
Таким образом, в отсутствие полезного сигнала ошибки синхронизации, приведенные к его периоду, распределены, как и в аналоговых системах ФАП первого порядка (см. § 22), по равномерному закону.
По определению, средний квадрат ошибки синхронизации в стационарном состоянии определяется формулой
а2 = 2Д(*~тУд2р‘- (5-10)
Подставив в (10) значения вероятностей состояний (8), получим
64
5. Анализ цифровых систем ФАП первого порядка
где а = q/p. Отметим, что при наличии полезного сигнала (А #= 0) выполняется неравенство р > q, т. е. а < 1. Обозначив сумму ряда
геометрической прогрессии 2 а* = У (а), из (И) имеем
4=1
Л2 4
2 Д2 1 — Г 2 ^2 У I 1
2а !-<«+'> ^ +2g.2=2L
I —а2
W -I
.(5-12)
Л2 Г
Цг I __л/(Л/+1)а''' +
Рнс. 5.7. Зависимость стандартного отклонения ошибки синхронизации от отношения сигнал/шум на выходе фазового детектора.
На рис. 5.7 показаны зависимости стандартного отклонения ошибки синхронизации (360° соответствует периоду сигнала Ts) от отношения сигнал/шум на выходе фазового детектора. Асимптотическое значение о в пределе при р -> оо равно о = А/2. Поэтому уменьшение интервала коррекции А приводит к повышению точности синхронизации. Здесь следует также отметить, что отношение сигнал/шум р на выходе фазового детектора связано с отношена входе
нием сигнал/шум E/No системы соотношением
р = (E/N0)(m/bFTs), где Е — A2TS — энергия го сигнала прямоугольной формы. Из (13) следует, что при заданном отношении сигнал/шум £7(V0 увеличение полосы пропускания узкополосного фильтра с целью уменьшения искажений полезного сигнала приводит к снижению точности синхронизации.
(5.13)
полезно-
1 — а
Среднее время до срыва синхронизации
Другой важной характеристикой качества работы цифровых систем ФАП первого порядка является среднее время до срыва синхронизации. Под срывом синхронизации обычно понимают первый выход величины ошибки синхронизации за заданные границы. В данном случае будем считать, что в системе ФАП происходит срыв синхронизации, если ошибка попадает в состояния N + 1 или —(N 3- 1) (рис. 5.4). Вычислим среднее время до срыва синхрони-
Среднее время до срыва синхронизации
65
зации Т\ при условии, что в первоначальный момент система находится в состоянии +1 или —1.
Поскольку нас интересует время первого попадания в состояние N + 1 или —(N 4- 1), то в соответствующей модели случайных блужданий в эти состояния необходимо поместить поглощающие экраны. Используя свойства симметрии (рис. 5.5) и независимости смены состояний, аналогично предыдущему разделу модель случайных блужданий с 2N + 2 возможными состояниями можно свес-
Ч Ч Ч Ч Ч q
Р Р Р р р '
1 Z 3 Р N-1 Ц ' n+f
Рис. 5.8. Диаграмма состояний ошибки при анализе среднего времени до срыва синхронизации.
ти к модели с N + I состояниями, приведенной на рис. 5.8. Здесь состояние I является упругим жестким, а состояние N + I — поглощающим.
Обозначим через Тк среднее время достижения поглощающего состояния N + 1 из первоначального состояния k, нормированное к величине Т = МТs. Аналогично (4.32) значение Тк для показанной на рис. 5.8 модели случайных блужданий может быть вычислено при помощи аппарата производящих функций, который одновременно позволяет получить вероятности срыва синхронизации из заданного состояния k. Для определения только самих величин Тк существует более простой способ, которым мы и воспользуемся ниже.
Если на первом шаге система из состояния k с вероятностью q перейдет в соседнее состояние k + 1, то дальнейший процесс случайных блужданий будет продолжаться, как если бы начальное состояние было равно k + 1. Поэтому нормированное среднее время до срыва синхронизации при условии, что на первом шаге система перейдет в состояние k + 1, будет равно Тк+1 + 1. Аналогично, если на первом шаге система перейдет в состояние k — 1, то это условное среднее принимает значение Тк_г + 1. Следовательно, среднее время Тк должно удовлетворять разностному уравнению
Tk = q (Тк+1 + 1) + р (Тк_х + 1) = qTk+1 + рТ+ 1, k = 2, N
(5.14)
с граничными условиями
TN+i =0, Т, = qT2 + pTi + 1. (5.15)
3 Зак. 1216
Cf>
Анализ цифровых систем ФАП первого порядка
Граничные условия (15) учитывают наличие поглощающего экрана при k = N -Г 1 и упругого жесткого экрана при k = 1 Непосредственной подстановкой можно показать, что общее решение уравнения (14) имеет вид
П = —+ Д + В(-^)4, P>q, p—q \ q /
(5.16)
1 Z 5 р,ЗБ
Рис. 5.9. Среднее время до срыва синхронизации, нормированное к величине Т = МТз.
где А и В — произвольные постоянные.
Подставив (16) в (15) и проделав соответствующие выкладки, из (14) получим
? _ k —N— 1 р Г / р ____
к p—q (p—q)2 L\ q J
Следовательно, искомое нормированное среднее время до срыва синхронизации из состояния k = 1 определяется соотношением
MTS p — q
Р Г/Р\" d (p—q)2 L\ q / Г
(5.18)
где p>q, так как p = q соответствует отсутствию полезного сигнала.
На рис. 5.9 приведены результаты расчетов по формуле (18) нормированного к величине Т = МТв среднего времени до срыва синхронизации из состояния k = 1, в зависимости от отношения сиг-нал/шумр и шага коррекции А. Из представленных графиков следует, что величина Тх очень быстро растет с ростом отношения сигнал/шум р и уменьшением А. Можно показать, что при р -> оо величина 7\ асимптотически ведет себя как ехр (р/4А), т. е. при заданном р уменьшение А приводит к увеличению среднего времени до срыва синхронизации.
Если предположить, что начальные состояния системы случайны со стационарными значениями вероятностей (8), то для характеристики качества синхронизации можно использовать безусловное среднее время до срыва синхронизации
<Т) = 2 ^ThPk. (5.19)
* = i
Очевидно, что имеет место неравенство так как (18)
дает максимальное значение (17) для всех k = 1, N 4- 1.
Обобщение на случай сигналов более сложной формы 6J
Обобщение на случай сигналов более сложной формы
До сих пор мы предполагали, что полезный сигнал s (/) на входе цифровой системы ФАП первого порядка имел прямоугольную форму. При этом условии оказалось возможным свести задачу исследования статистической динамики системы к анализу характеристик однородной марковской цепи, т. е. к модели случайных блужданий с вероятностями перехода, не зависящими от номера состояния. Такой подход позволил продемонстрировать основные идеи и методы анализа характеристик синхронизации без дополнительных сложностей, которые возникают в более общем случае. Между тем, на практике обычно применяются сигналы, форма которых существенно отличается от прямоугольной. Кроме этого, даже если на вход системы ФАП поступает полезный сигнал прямоугольной формы, то при анализе характеристик синхронизации следует учитывать искажения, вносимые узкополосным фильтром. Поэтому рассмотрим далее общий случай, когда в соотношении (1) 5 (/) представляет собой периодический сигнал, который является нечетной функцией относительно момента каждого перехода и имеет два пересечения нуля за период.
В этом случае значения выборок амплитуды полезного сигнала зависят от величины ошибки синхронизации и, следовательно, вероятности перехода зависят от номера состояния ошибки. Повторяя рассуждения пункта 2 этого параграфа, для вероятностей перехода получим
Рь = Ф\У fnAl/N0&F] (5.20)
где — значение амплитуды полезного сигнала в состоянии k. При этом для стационарных значений вероятностей состояний Ph аналогично (6) получим разностное уравнение второго порядка
Ph — Як-1 Ph-i Н" Pk+i Pk+i' й = 2, N 1, (5.21)
с граничными условиями
Pi ~ PiPi + Р2^2, Pn — Як—\Рк-1 + ЯиРы' (5.22)
Решение уравнения (21) с граничными условиями (22) может быть получено методом математической индукции. Непосредственной подстановкой можно убедиться, что оно имеет вид
i*i-i
П — > -1, 1....а, (5.23)
Pt+i
(=1 0 ? где, по определению, полагается П = 1.
3*
68
5. Анализ цифровых систем ФАП первого порядка
Из условия нормировки для Р, получим соотношение
N х— 1
Р1 = — 2
< + 2П
= 2 i =
(5.24)
Таким образом, средний квадрат ошибки синхронизации в этом случае может быть вычислен по формуле (10) с использованием (23) и (24).
Для нормированного среднего времени до срыва синхронизации аналогично (14) получим разностное уравнение
Ти — 4k Th+i + Ph ^k-i + 1> k — 2,N, (5.25)
с граничными условиями
Л = <71Л + Р1Л + 1. (5-26)
TN+i = 0. (5.27)
Из (26) и (25) следует рекуррентное соотношение
4—1 , k
Tk+i = Th-yl П -М—L. (5.28)
* * I 1 1 Qi Qi I Qk i=' 4< = / + l '
Введем следующее обозначение:
k— 1 / h \
П — i+t- (5-29>
\ QiQj / 4k
i= \i—l + l )
Тогда из (28) с учетом (29) и граничного условия (27) имеем
N N
2(Tft-n+1) = T1= 2^- (5.зо)
4=1 4=1
Если в (30) проводить суммирование не от А = 1, а от произвольного k — I, то получим
N
Tk-Ъ <*1-
1 = 4
Таким образом, подставляя в последнее соотношение выражение (29), для нормированного среднего времени до срыва синхрониза-
Обобщение на случай сигналов более сложной формы
ции из состояния k в общем случае имеем
91 9/ / 9l
(5.31)
k
Здесь, по определению, = 0 при j > k. Формула (31) обобщает
(17) на случай сигналов более сложной формы.
6. Дискретный марковский процесс
Предположим, что случайный процесс 0 (/) представляет собой ступенчатую кривую вида рис. 6.1, т. е. 0 (/) может принимать только дискретные значения О1( 02, ..., Фк или {$ft, k — 1, Л}, причем смена этих значений (состояний) происходит в некоторые случайные моменты времени.
Введем вероятности перехода
л;,(/0, /) = Р (0 (/) = й,|0 (tn) = т%}, t>t0. (6.1)
Это есть условные вероятности принять системе состояния О'; в момент времени I, если известно, что в предшествующий момент времени /о она находилась в состоянии О/.
Очевидно, что
2 лг,(?о> 0=1, ni;(/0, 0>0, 4, /=1,/С, (6.2)
/=1
nii (^о> ^о)
при i = /, при ' j.
(6.3)
В формуле (2) и ниже суммирование производится по всевозможным СОСТОЯНИЯМ {0;, / = 1, К }-
Те же соображения, которые применялись при получении уравнения (2.16), позволяют записать для дискретного марковского процесса следующее уравнение Колмогорова — Чэпмена:
n;;(Z0, t + Д0= У л;л(^> 0^/(Л ' + z>zo> Д/>0. (6.4)
Основная задача при рассмотрении марковских процессов состоит в вычислении вероятностей перехода и безусловных (абсолютных)
70
6. Дискретный марковский процесс
вероятностей различных состояний, если известны начальное состояние системы и одношаговые вероятности перехода.
В случае разрывных марковских процессов для малых временных интервалов А/ вероятности перехода имеют вид
Яы, (Z, t + М) = Р {0 (/ + А/) = 6(i |0(/) = Ы =
= 1 + akk + о (А/), (6.5)
nkJ (t, t + А/) = Р {0 (Z + А/) = 6, | 0 (/) = ®h} =akj (f)\t + + о (&t), k j.
Здесь символом о (AZ) обозначены члены выше первого порядка малости относительно А/, т. е. lim [о (AZ)/A/J = 0. Конечно, возмож-
Рис. 6.1. Дискретный марковский процесс.
ность записи (5) должна следовать из анализа физических процессов в рассматриваемой системе.
Соотношения (5) показывают, что характерная черта рассматриваемых процессов состоит в том, что для малых временных интервалов А/ вероятность лкк того, что состояние не изменится, превышает вероятность изменения состояний.
Первое соотношение (5) согласуется с (3) и физически выражает два факта: во-первых, что при AZ = 0 система достоверно находится в сзстоянии $к и, во-вторых, вероятность перехода из данного состояния Фь в любое другое возможное состояние в общем случае зависит от рассматриваемого момента времени и для малого временного интервала А/ пропорциональна величине этого интервала. Второе соотношение (5) говорит о том, что вероятность смены состояния (зависящая от рассматриваемого момента времени) за малый интервал времени А? пропорциональна величине этого интервала.
Так как вероятности перехода из одного состояния в другое неотрицательны (akj (Z) 0) и для них должно выполняться условие
нормировки (2), то из (5) получаем
а«(0>0. (6.6)
Прямое и обратное уравнение
71
Подставив (5) в правую часть уравнения (4) и перейдя к пределу при Д/ -* 0, получим следующую систему линейных дифференциальных уравнений:
д к ____
^о(М) = 2 ам(/)Я;А(/0, /), I, /=1, К, (6.7) 01 k= 1
где ahj (/) удовлетворяют соотношению (6). Решение этой системы при начальных условиях (3) дает зависимость вероятностей перехода от времени. Если число возможных состояний системы конечно, то для любых непрерывных функций ah} (/), удовлетворяющих условиям (6), система уравнений (7) с начальными условиями (3) имеет единственное неотрицательное решение, которое определяет дискретный марковский процесс.
Дискретный марковский процесс остается марковским и в обратном направлении. При этом наряду с уравнениями (7), для процесса оказывается справедливой и другая система уравнений. Для получения этих уравнений выберем промежуточный момент времени близким не к «конечному», а к «начальному» моменту времени t0. Запишем уравнения (4) в виде
к
«м0=2 (О. 4 + д0(0 + ДЛ О t> 0 + > 0- (6-8)
1
Учтем, что для достаточно малых Д/ справедливы равенства
лгг (/0, /0 4- ДО = 1 -Ь ait + о (Д/),
лгй (t0, t0 + ДО = aik (/П)Д/ + о (М).
Подставив (9) в правую часть уравнений (8) и перейдя к пределу при Д/ -> 0, получим следующую систему линейных дифференциальных уравнений:
а к
/) = - 2 aih(ta)nkl(ta,t) t>t.. (6 10)
Уравнения (7) часто называют «прямыми», а уравнения (10) «обратными».
Уравнениям (7) удовлетворяют не только вероятности перехода, но и абсолютные вероятности состояний pj (t). Действительно, если заданы начальные вероятности состояний pf = pj (/0), то для дискретного марковского процесса справедливы соотношения
РД0 = 2р“ ло(/0> t), pj(t + \t) = ^ipi(t)nij(t,t + (6.11)
/ i
Умножив обе части уравнений (7) на и взяв сумму по I, с учетом (11) получим
= (б-12)
ш k
72
6. Дискретный марковский процесс
Эти дифференциальные уравнения нужно интегрировать при начальных условиях
Pi (О = Pi (Л>) = Pi при t = t0. (6.13)
Дискретный марковский процесс называется однородным, если вероятности перехода л(> (/0, t) зависят только от разности т = = t-tp.
пИ (*о, = пИ (т)> т = z — zo- (6.14)
«ЯГА
Рис. 6.2. Случайный двоичный сигнал.
Из (5) следует, что для однородного процесса akj (/) = постоянные величины и дифференциальные уравнения (7) и (10) упрощаются
л;Дт) = (т), (6.15)
ах ь
лг/(т) = аи лгДт) +
</т
2 athnkib)-
4(4^./)
(6.16)
Если при т оо существуют предельные значения вероятностей перехода
р — lim лг>(т), Г-эс
(6-17)
которые не зависят от начального состояния, то говорят, что марковский процесс обладает эргодическим свойством и существует однозначно-определенное стационарное (равновесное) состояние.
Как следует из (2) и (15), вероятности стационарных состояний определяются системой алгебраических уравнений
^ahjPh = 0, 2Ра=1- (6.18)
4 4
Рассмотрим два примера.
Пример 1. Дискретный марковский процесс с двумя состояниями (случайный двоичный сигнал). Пусть процесс 0 (t) в любой момент времени может принимать лишь два значения Oj = 1 или 02 — —1 (рис. 6.2), причем вероятность перехода 1 -> —1 за малое время А/ равна ХА/, а вероятность перехода —1 -> 1 равна цА/. Известны вероятности начального состояния р" = Р {0 (/0) = 1} и р% = = Р {0 (/0) = -1} = 1 -р?.
Нужно вычислить вероятности перехода Лц (/0, t) = Р {0 (/) = = | 0 (t0) = О/} (где Ох = 1, 02 = —1; i, j = 1, 2), вероятности
стационарного состояния Р1 и р2, а также среднее значение и корреляционную функцию процесса 0 (/).
Дискретный процесс с двумя состояниями
73
Укажем, что если дискретный марковский процесс Ф (/) имеет два произвольных состояния <рх и <р2, то его можно выразить через случайный процесс 0 (7) с двумя состояниями ±1 при помощи следующего линейного преобразования:
Ф(О = 4'(ф1 + ф2 + (ф1~ф2)0(/)]- (6-19)
В рассматриваемом примере, как следует из (5), а12 = X, а21 = у. Из (6) находим ап = —X, а22 = —у,. Так как все четыре коэффициента atj — постоянные величины, не зависящие от времени, то процесс 0 (0 является однородным (см. ниже).
Дифференциальные уравнения (7) принимают вид
-|-лг1(/0, /)= — Хлп(/0, O + H’Wo.
0t
д (6.20)
— ni2 (/0, t) = —улг2 + Хлг1 (t0, t), i = 1, 2. Ot
Из условия нормировки (2) имеем л12 (/0, t) — 1 — лп (/0, t). Поэтому первое из уравнений (20) можно записать иначе
4-ли(/о> 0 = — (Х + у)лп(/0, ^) + Н> (6-21)
ot
Общее решение этого линейного неоднородного дифференциального уравнения первого порядка с начальным условием ли (/0> 6>) == = 1, которое следует из (3), известно
ли (/0, 0 = Н$e_(I+g)('-s) ds + =
^0
В результате решения системы уравнений (20) для любых т > 0 получим
«11(Т) = 7Т- +
п22 (т) = ——- + х+ц
Г X '
L х+ц.
и 1 — (Х-Ьц) т
—— е
. X+pJ
е
Отсюда видно, что рассматриваемый марковский процесс с двумя состояниями является однородным, так как вероятности перехода зависят только от разности фигурирующих в них времен. Кроме
74
б. Дискретный марковский процесс
этого, процесс эргодичен, поскольку при t -> оо существуют предельные значения вероятностей перехода
Pj = ц/(Х -р ц), р2 = V (X + ц), (6.23)
которые определяют вероятности стационарного состояния. Эти вероятности можно было легко найти из уравнений (18).
Зная вероятности начального состояния и вероятности перехода, легко находим общие выражения для абсолютных вероятностей состояний
Pi (Zo + s) = р? ли (s) +(1 - р',!) л21 (s) = + [pj —-Ме (Х+ц>$,
Pi (^0 + S) = (1 “ Р?) (8) + Pl Я12 (8) =
По определению, среднее значение процесса 9 (/) равно М) = <0(/)> = ПрИО— l-P2(0 = Pi л11(т) + (1—р1;)л.21(т) —
— (1—р?)л2, (т)—р>12(т). (6.25)
Здесь последнее равенство написано на основании формулы (11)-Подставив выражения вероятностей перехода из (22). получим
= + 2 (р?— )е <X+u'\ 1 = 7 — /0. (6.26)
л.+ц V л+и /
Вычислим теперь корреляционную функцию
Ле (s, т) = <0 (70 + s)0 (/0 + s + т)> —
— <0 (t0 + s)> <0 (t0 + s + т)>, s, т > 0.
Расписав, по определению, среднее значение произведения, имеем
<0 (/0 + s)0 (to + $ + т)> = pj (to + s)nu (т) +
+ Pi (to + s)n22 (т) — Р1 (t0 + s)n12 (т) — р2 (t0 + s)nai (т), s, т > 0.
Воспользовавшись формулами (22), (23) и (26), находим
4А.ц
(X + |т)г А. + ц
И— А , ( о Н \ —(^ + ч) s ц—+ Р1- е
\
a LI \ — (Л- + ц) S 1 — (Х+ Т
р1-ГТ- е е
(6.27)
Предположим теперь, что в качестве вероятности начального состояния взята вероятность стационарного состояния, т. е. р? =
Корреляционная функция сигнала с ФМ
7>
= Pi = р/(Х + ц). В данном случае процесс 9 (/) будет стацион арным с момента времени и из формул (24) и (25) получим
те (/) = (р — Х)/(Х + р) = const, ($, т) = ke (т) =
= 4Хп (X + р)-2 exp I—(X + р)т].
На основании четности корреляционной функции стационарнгго процесса 9 (/) приходим к следующей окончательной формуле, справедливой для положительных и отрицательных значений г,
ke (т) = 4Хр (X + р)-2 ехр [—(X + р) | т | ]. (6.28)
Если X — р, то процесс 9 (/) принято называть симметричным случайным двоичным сигналом (случайным телеграфным сигналем). Полагая в предыдущих формулах X = р, находим вероятности перехода, вероятности стационарного состояния, а также среднее значение и функцию корреляции в стационарном состоянии для случайного телеграфного сигнала 9 (/):
лп(т)= JI22(t)=(y )(1 + е-2?л) л12 (т) = л21 (т) = (-у )(1 — е~2>'),
PiРг~ mlt = 0, fet>(T)=exp( — 2ХIт I). (6.29)
Пример 2. Корреляционная функция радиосигнала со случайной фазовой манипуляцией. Вычислим корреляционную функцию радиосигнала (2.53), считая теперь, что фазовая манипуляция О (/) осуществляется стационарным случайным телеграфным сигналом, характеристики которого даются формулами (29).
Применительно к данному примеру остаются в силе все рассуждения, приведшие к выражению (2.55):
Мт) = Ке{ехр(/Чт)<ехр/ (0т—9<)М- (6.30)
Каждая из случайных величин 9Т и 9( может принимать только два значения ±O0. Учитывая вероятности различных комбинаций этих значений, можем написать
<ехр / (9t - 9Z)>0 = 1 • Р {9, = О0, 9Т = О0} + 1 • Р {9, =
~ -О0, 9Т = -О0} + ехр (2/Л) Р {0( = -О0, От = О0) 4-
+ ехр (—2/Оо) Р {9, = О0, 9т = —О0) = р^и (т) +
+ P^tt М + ехр (г/'до) р2л21 (т) + ехр (—2/#0) Доц (т).
После подстановки сюда выражений (29) формула (30) примет вид
ks (г) = f-y-J Leos2 О0 + ехр (— 2ХI т I )sin2 О0] cos соо т. (6.31)
76
7. Типовые разрывные марковские процессы
+ A2 Xsin2 тЭ-0
По корреляционной функции находим энергетический спектр
оо
Ss (со) = 2J ks (т) cos cordr= --9- [6 (со — соо) + 6 (со + со0)] cos2^0 + о
------! + !-1. (6.32) 4^+(ш—ш0)2---------------------------4^+(ш + ш0)2 .1
В общем случае энергетический спектр является дискретносплошным. В частном случае = л/2 спектр будет сплошным, а при = л спектр оказывается чисто дискретным, совпадающим со спектром гармонического колебания со случайной и равномерно распределенной начальной фазой. Этот результат был пояснен в примере 3 § 2.
7. Типовые разрывные марковские процессы
Рассмотрим несколько основных видов разрывных марковских процессов, которые хорошо изучены и часто используются в качестве моделей различных процессов в физике и радиотехнике [5].
Пуассоновский процесс
Пусть нас интересует число 0 (О появлений некоторого случайного события в полуинтервале [/0, /). Ясно, что случайный процесс О (О является дискретным, принимает только целочисленные зна
чения 0, 1, 2, ..., j, ... и может лишь возрастать (рис. 7.1), т. е.
ло- ('о, /) = Р {9 (0 = /|9 (4) = 0=0
при j < i, t t0.
Предположим, что вероятность одного изменения состояния в малом интервале времени (/, t + Д/) равна vA/ ф о (А/), где v =
рис. 7.1. пуассоновский =const > 0, а вероятность сохранения прежнего состояния равна 1—vAZ — о (Д/). При этом подразумевается, что вероятность смены состояния более одного раза в интервале (/, t + ДО есть о (Д/). Следовательно,
Р {0 (/ + Д/) = j | 0 (0 = / — 1} = vM + о (ДО,
(7.1)
Р {0 (t + ДО = / | 0 (0 = /} = 1 — vA/ — о (ДО-
Пуассоновский процесс
77
Зададим следующее начальное состояние:
о i х ( 1 при / = О, Pi = Pi(h)= . ' ’ 7.2
I 0 при /= 1, 2...
Вычислим абсолютную вероятность какого-либо состояния. Для этого воспользуемся уравнением (6.12), в котором согласно (1) отличны от нуля только два коэффициента а)} = —v и v.
Поэтому
dp} = — vPj (/) + vp^ (/), j > 1;
dpjdt = —vp0 (t).
Общее решение этих линейных дифференциальных уравнений первого порядка известно 15]. С учетом начальных условий (2) получим
py(T)=ve-VT ^ev*py_1(x)dx, /> 1; р0 (T) = e-V1!, т = /—/о>0. о
Выполнив вычисления, придем к закону Пуассона
Р/(т) / = 0,1,2, ... (7.4)
В рассматриваемом примере параметр v не зависит ни от времени, ни от состояния системы j. Поэтому пуассоновский процесс является однородным, однако нестационарным, так как стационарное состояние не существует (pj = lini р, (т) = 0).
.. Прямые и обратные уравнения (6.15) и (6.16) для однородного пуассоновского процесса принимают соответственно вид
(т)/Л = —vnti (т) + vnit (Т), (r)/dr = — хпц (т)4-улг+1. ; (т).
Можно убедиться, что эти уравнения при начальном nij (0) = имеют решение
л(/(т) =
(ут)'-' (/-О!
0,
(7.5) условии
(7.6)
/</.
Укажем, что если бы параметр v пуассоновского закона зависел от времени, т. е. во все предыдущие соотношения входил бы параметр v (/), то процесс 9 (/) был бы неоднородным. Для пуассоновского процесса с переменным параметром v (/) вместо формул (4) справедливо более общее выражение
t Vi* \
J v (х) dx I ехр I—J v (х) dx I. (7.7)
* *0 '
78
7. Типовые разрывные марковские процессы
Это решение можно получить так. Нужно в уравнениях (3) сделать t
замену независимой переменной t на s = J v (х) dx, воспользо-^0
ваться для полученных уравнений предыдущим результатом (4). а затем возвратиться к первоначальной переменной t.
Процесс рождения и гибели
Рассмотрим дискретный процесс 0 (/), в котором возможны как положительные, так и отрицательные скачки. Этот процесс, называемый процессом рождения и гибели, сочетает в себе черты простого процесса рождения и простого процесса гибели.
Процесс рождения и гибели подчиняется следующим условиям.
1. Если в момент времени t система находится в состоянии / (/ =1, 2, ...), то вероятность перехода /'->/ + 1 в малом интервале времени (/, t + А/) равна Х;А/ + о (А/).
2. Если в момент t система находится в состоянии / (/ = 1, 2, ...), то вероятность перехода /->/ - 1 в интервале времени (t, t + А() равна |1УА/ + о (А/).
3. Вероятность перехода в состояние, отличное от двух соседних, есть о (А/).
4. Вероятность сохранения прежнего состояния равна 1 — — (^у + Ну) А/ + О (А/).
5. Состояние / = 0 является поглощающим, т. е. если изображающая точка попала в это состояние, то процесс прекращается.
На основании перечисленных условий записываем уравнения (6.12):
~~ Pi (0 = Vi Pi-1 (0 — (^ + Ну) Pi (0 + H;+i Pi+1 (0> /==1,2,...
' (7.8)
В рассматриваемом конкретном случае, когда состояние / = О является поглощающим, нужно полагать X_1=X0=|i0 = 0. Поэтому
= (7.9)
at
Предполагается, что в начальный (нулевой) момент времени система находится в некотором состоянии /0, 0 < /0 < <х>, и следовательно, начальные условия имеют вид
р/(О) = в//.= Р ПРМ~_/о’ (7.10)
I 0 при /У=/о.
Процесс рождения и гибели
79
Уравнение (6.7) в данном случае принимает вид
Ю ~ nt, j-i (0 — (^/ + Н/) (О + И/-н я/. ;+1 (О- (7 11) си
В общем случае, при произвольиых функциях К3 и р;, решение уравнений (8), (9) и (11) оказывается затруднительным. В том частном случае, когда процесс рождения и гибели является линейным, T. е. интенсивности рождения и гибели являются линейными функциями состояния: Ху = X/, ру = р/, X = const > 0, р = const > О, решения при начальном условии 0 (0) = /0 = 1 даются выражения-кв!
Ро (0 = а (/),
ру (t) = [1 -а (/)] (1 -₽(/)]₽'-> (0 (/ = 1,2,...), (7.12)
Пи (0 = 1 Сп С^~п~ ‘ (/)Г" [₽ (/)?-" 11 - а (/) - р (/)]", I > (, п=0
(7.13)
Среднее значение и дисперсия линейного процесса рождения и гибели равны
то (/) = exp [(X—р)/], ое (f) — е<х—и-> [е(Х~^’1— 1]. (7.15)
А. — п
Их значения зависят от соотношения между X и р, а также от времени t. В частности, при X = р и 0 (0) = /0 = 1 средняя интенсивность роста равна нулю (/по (/) — 1), а дисперсия линейно увеличивается во времени (а§ (/) = 2Х/).
Из (12) и (14) находим вероятность того, что ко времени t система будет находиться в состоянии / = 0 (вырождение числа частиц или индивидуумов):
. (7.16)
Вероятность того, что «коллектив» когда-нибудь выродится, получаем отсюда предельным переходом при 7->оо;
г ( 1 приХ<р,
limp0(/)= _ <7-17)
j'->OC ( р/Х при Х>р.
Этот результат является очевидным и говорит о том, что «коллектив» вымирает с вероятностью единица, если интенсивность гибели боль
80
7. Типовые разрывные марковские процессы
ше интенсивности размножения. Если же интенсивность рождения больше интенсивности гибели, то вероятность вырождения равна отношению этих интенсивностей.
Рассмотрение более общих (неоднородных) процессов рождения и гибели, когда интенсивности рождения и гибели являются произвольными функциями времени, показывает [5], что в этом случае остается в силе решение (12), только теперь функции а (/) и 0 (/) должны вычисляться по формулам
“«-'-dr6”” <7Л8)
где
Т (0 = 5 ГР (т)—МОМт; о
б (/) = e~v (t> 1 + Р (т) ет(т) dx . (7.19) о
Для таких неоднородных процессов среднее значение и дисперсия равны
t
= о|(/) = е-2т(п^[Х(т) + р,(т)]е^<^с1т. (7.20)
о
Вероятность вырождения, как следует из (12) и (18), формулой
1 Г 1 I-1
Ро (0 = 5(1 (т) eV <*> dx 1 + Jp(T)ev<v>dT о L о
дается
(7.21)
Она стремится к единице при /~>оо, когда расходится интеграл f р (т) ev<T> dx — оо. о
Приведенные выше результаты, начиная с формулы (12), справедливы при начальном условии 9 (0) = /0 = 1. Если /0 > 1, то формулы для средних значений и дисперсий получаются умножением правых частей выражений (15) и (20) на /0. Вероятность вырождения (17) равна по-прежнему единице при X < р, и равна (рА)'« при р,. Когда X и р зависят от времени, вероятность вырождения получается возведением в степень /0 правой части выражения (21).
Применение рассмотренных дискретных (разрывных) марковских процессов в задачах надежности и массового обслуживания, а также вопросы моделирования таких процессов на ЦВМ изложены в [8,24—26]. Более подробно пуассоновские процессы и их обобщения рассматриваются также в § 30—32.
Полумарковские процессы
81
8. Полумарковские процессы
Рис. 8.1. Иллюстрация поведения полумарковского процесса.
Полумарковские процессы широко используются в теории надежности и теории массового обслуживания [6, 25, 27, 28, 146]. Они объединяют теорию цепей Маркова, разрывных марковских процессов и теорию восстановления (см. § 31). Приведем сначала определение полумарковского процесса.
Пусть поведение некоторой системы описывается следующим образом. В каждый момент времени система может находиться в одном из К возможных фазовых состояний Од, #2, •••» Фк, причем известны начальное состояние системы (в начальный момент времени t0 она находится в состоянии 0О = &;) и одношаговые вероятности перехода «А = Р {6m = fl'h 10m-i = fl',}, /, k = 1, К- Следовательно, процесс 0m = 0 (im) есть однородная цепь Маркова.
Сопоставим каждому ненулевому элементу nJk матрицы вероятностей перехода случайную величину Т jk с функцией распределения Fjh (t) — — Pjk (xik О- Величине T}к, зависящей как от состояния &;, так и
от состояния можно придавать разный физический смысл. Она может быть непрерывной или дискретной. В теории надежности и теории массового обслуживания случайную величину Tjk обычно рассматривают как время пребывания системы в состоянии при условии, что следующим состоянием, в которое перейдет система, будет При этом величина Тjh считается неотрицательной и непрерывной с плотностью вероятности fjh (/). При такой интерпретации величину Tjh можно назвать временем ожидания в состоянии О, до перехода в 0^.
Можно себе представить (рис. 8.1), что точка, отображающая поведение системы на фазовой плоскости, остается в состоянии О,-в течение времени Tjk, прежде чем она перейдет в По достижении «мгновенно» (в соответствии с матрицей вероятностей перехода {л7&}) выбирается следующее состояние fy, и после того как состояние выбрано, время ожидания в полагается равным Tkl с функцией распределения Fkl (/) или плотностью вероятности fkl (/). Этот процесс затем следует неограниченно продолжать, выбирая каждый раз независимо следующее состояние и время ожидания. Если через 0 (/) обозначить состояние системы, занятое в момент
82
8. Полу марковские процессы
времени /, то полученный случайный процесс принято называть полумарковским.
Из приведенного определения следует, что если игнорировать случайный характер времени ожидания и интересоваться только моментами перехода, то процесс 0 (/) будет представлять собой однородную цепь Маркова (в литературе ее часто называют вложенной цепью Маркова, а в общем случае — вложенным марковским процессом). Однако при учете пребывания процесса в разных состояниях в течение случайного отрезка времени процесс 0 (/) не будет удовлетворять уравнению Маркова (если не все времена ожидания распределены экспоненциально). Следовательно, процесс является марковским только в моменты перехода. Сказанное оправдывает название «полумарковский процесс» или «полумарковская цепь».
При заданном начальном состоянии дальнейшее поведение по-лумарковского процесса (полумарковской цепи) полностью определяется матрицей вероятностей перехода /, k — 1, К, и матрицей функций распределения {Fjh (/)} или (для непрерывных случайных величин Тjh) матрицей плотностей вероятностей {/>&(/)}
Предположим, что в некоторый момент времени, принимаемый за начальный (/0 = 0), система находится в состоянии Пусть в качестве следующего состояния выбрано (с вероятностью л0) состояние &/. Тогда по теоремам умножения и сложения вероятностей находим безусловную функцию распределения полного времени ожидания системы в состоянии 0'г:
к ____
= 5 ntJFtf(t). (8.1)
/=i
Соответственно для безусловной плотности вероятности полного времени ожидания в состоянии О,- можем написать
к. ____
2 JtiJi;(/). 1\/=I К. (8.2)
i—1
Среднее значение безусловного времени ожидания в состоянии О, равно
~ к
<Л> = С t Wt (0 dt = 2 <ТИ>- (8.3)
о i='
Для дальнейшего введем следующее обозначение
Y. (/) = 1 —Ft (/) = (0 dt - Р {Tt > t}. (8.4)
t
Перейдем теперь к решению основной задачи, возникающей при анализе полумарковских процессов,—вычислению вероятностей
Основная система уравнений
83
состояний. Пусть Ф/у (/) есть условная вероятность того, что в момент времени t система находится в состоянии если в момент времени t0 = 0 она была в состоянии Вероятность Ф,7 (/) можно назвать интервально-переходной вероятностью. Система, стартуя из начального состояния fy, может попасть в состояние ft, в момент времени t разными путями. Во-первых, если = О7-, она может не покидать состояние в течение всего промежутка времени или, выйдя из состояния Фг по меньшей мере однажды, она все-таки возвращается в состояние О; = fl'j к моменту времени t. Во-вторых, система может попасть в произвольное состояние занимая в момент времени т некоторое промежуточное состояние Вероятности этих двух взаимно исключающих возможностей должны складываться. Таким образом, приходим к уравнению
к f
Фо (0 = Ън Ъ (0 + 2 \ flk (т) Фк} (t - т) dx, 1 I, / Л,
*=i £
(8.5)
•где б,7—символ Кронекера: 6О = 1 при I — j и bi} — 0 при i =/= j.
Первый член справа в уравнении (5) учитывает вероятность события так как (/) есть вероятность того, что система
не покинет состояние Ог до момента времени А Второй член представляет вероятность последовательности событий, когда система совершает переход из в (может быть даже в себя) к моменту г и затем переходит из состояния в состояние •О; за оставшееся время / — т. Вероятности частных переходов суммируются по всем промежуточным состояниям -^й, в которые возможны переходы из начального состояния •О',, и интегрируются по всевозможным временам перехода т между 0 и /.
Система линейных интегральных уравнений (5) является основной. Она дает выражение интервально-переходных вероятностей через основные характеристики полумарковского процесса. Получить аналитическое решение этой системы непросто. Некоторое упрощение дает применение метода преобразования Лапласа. Обозначим одностороннее преобразование Лапласа от функции f (х) через
/* (s) — (j e~sx f (x) dx. (8.6)
о
Применяя преобразование Лапласа к уравнению (5), получаем
к
фу (s) = 5о- (8) + 2 Ъь f-k (S) ф;г (s), 1 < i, / к. (8.7)
k= i
84
8. Полу марковские процессы
Из (4) имеем
ЧгН0 = — [1-ю* (0L (8.8)
S
Полученная система алгебраических уравнений связывает преобразование Лапласа от интервально-переходных вероятностей с основными характеристиками процесса.
Чтобы воспользоваться известными результатами матричного исчисления, запишем систему уравнений (7) в матричном виде. Для этого введем матрицы Ф (0 = [Ф/у (0], л = [ло], f — [ffJ, а также диагональные матрицы W (0 = [б;/е>; (0], F (0 = [б,-; Ft (01, 'F (0 = [6o-4Tf (0]. Для учета специфического вида суммирования в (7) определим специальный вид умножения матриц, обозначив эту операцию символом X. Если А, В и С — квадратные матрицы размерности К х К, то С = А х В означает, что ctj = ацЬц, 1 0 / К. Другими словами, операция X обозначает лишь ум-
ножение элементов матриц [29].
Теперь уравнение (7) можно записать в следующем виде:
Ф* (0 = 4е* (0 + 1л х f* (0) Ф* (0 (8.9)
или
ф* (S) = [I - л х f* (0)-1Т* (0, (8.10)
где I — единичная матрица. Предполагается, что обратная матрица в (10) существует.
Из уравнения (10) следует, что интервально-переходные вероятности зависят только от произведения л0- и fijt а не от каждого из сомножителей в отдельности. Уравнение (10) определяет интервально-переходные вероятности через основные характеристики полумарковского процесса, которые считаются заданными. Решение этого уравнения позволяет исследовать как режим установления, так и стационарное состояние. Если же интересоваться только стационарным состоянием, то в уравнении (10) возможны упрощения.
В теории преобразований Лапласа хорошо известен следующий асимптотический результат:
Ф = НтФ(()= lims®*(0, (8.11)
i->oo s-*0
если существует хотя бы один из этих пределов.
На основании (10) можем написать
Ф = ИтзФ*(0=11т s [I—л х f* (s)]-1 Кт Ч*1* (0. (8.12)
s-+0 s-+0 $->0
Рассмотрим каждый из пределов в правой части (12) отдельно.
На основании (8) можем написать
limT*(0 = lim—[I —W*(0], (8-13)
s->0 s-+0 S
Решение основной системы уравнений
85
где I — единичная матрица. Учитывая условие нормировки плотностей вероятностей Wt(t), нетрудно убедиться, что W* (0) = I. Поэтому значение предела в правой части равенства (13) оказывается неопределенным. Применяя правило Лопиталя для раскрытия неопределенности, находим
lim Т* (s) =---— W* (s) |s =0 = f t W (0 dt = Т. (8.14)
s-*o ds J
о
Здесь Т — диагональная матрица размерности К X К средних безусловных времен ожидания в каждом из состояний (3).
Найдем теперь предел первого сомножителя в правой части (12). Обозначив
Н (s) = s [I — л х f* (s)]-1, можем написать
Н (s) — Н (з)л х f* (s) = si. (8.15)
Из условия нормировки плотностей вероятностей следует, что lim f-/ (s) = lim f e~st fi} (/) dt = 1.
s-+0 s->0 J
Поэтому при s —> 0 все элементы матрицы f* (s) равны единице. С учетом определенной выше операции перемножения матриц из (15) получаем
lim H(s) = H(0) = H(0)n. (8.16)
S4-0
Покажем, что строки матрицы Н (0) должны быть пропорциональны финальным вероятностям состояний вложенной цепи Маркова, которая описывает характер смены состояний без учета их длительности. Предположим, что вложенная цепь Маркова имеет однозначные финальные вероятности, не зависящие от начального состояния. Эти финальные вероятности являются решением системы алгебраических уравнений (2.35) и (2.38):
к к
Pj=tiPinu> 2 Pt=[- <8-17>
< = ! <=1
Учитывая предположенную единственность решения этой системы уравнений и сравнивая (16) с (17) или (2.34), можно прийти к заключению, что в качестве решения матричного уравнения (15) можно взять квадратную матрицу Н (0) размерности К X К. »-я
86
8. Полумарковские процессы
строка которой Нг = {/iu, /1(2, .... ^к} пропорциональна матрице-строке финальных вероятностей Р = {plt р2, рк}, т. е.
Нг = ^Р,
где kt — некоторый коэффициент пропорциональности.
Следовательно, для стационарного состояния уравнение (12) принимает вид
Ф==Н(0)Т. (8.18)
Отсюда следует, что элементы матрицы Ф должны удовлетворять соотношению
Фо = hlt (0) <7\> = klPi <Т}>- (8.19)
Для определения коэффициентов kt воспользуемся условием, что сумма финальных интервально-переходных вероятностей должна равняться единице:
Поэтому
£ фг,=^ %
1=1 /=1
= Г' .
Л = 1
(8.20)
(821)
Коэффициенты пропорциональности оказываются одинаковыми для всех состояний.
На основании (19) и (21) можем написать
(8.22)
Видно, что финальные интервально-переходные вероятности Фц не зависят от начального состояния i и для их обозначения можно использовать только второй индекс. Эти вероятности равны финальным вероятностям состояний вложенного марковского процесса, взвешенным с относительными средними безусловными временами ожидания в каждом состоянии. Следовательно, единственной статистической характеристикой каждого времени ожидания, которая влияет на поведение процесса в стационарном состоянии, является его среднее значение.
Укажем, что, кроме рассмотренной задачи, для полумарковских процессов, как и для цепей Маркова (см., например, § 4) могут быть сформулированы и решены другие задачи [29]. Приведем здесь две из таких задач.
1. В некоторых случаях желательно знать не только вероятность пребывания системы в каждом состоянии в момент времени t, но также и число переходов п (/), которые были сделаны системой
Характеристики переходного процесса
87
в течение интервала времени (0, /). Пусть s (t) — номер состояния, которое система занимает в момент времени t, и t (п) — время, когда произошел л-й переход. Тогда нужно знать условную вероятность
Фо (л, t) = Р {п (/) = л, s (/) = О;|з (0) = О;, л (0) = 0},
I < t, j к-, л = 0, I, 2, .... (8.23)
Таким образом, Фг; (л, t) есть совместная вероятность того, что система находится в состоянии Оу в момент времени t и что она сделала л переходов при условии, что в момент времени t = 0 она находилась в состоянии О(.
Очевидно, что
Фо (0, t) = 60Тг (/), 1 < / с К, (8.24)
так как существует единственный способ не совершить переходов: система в течение интервала времени (0, t) остается в начальном состоянии. Кроме этого, оо
Фи(0= 2 Фг> (»,/), (8.25)
4=0
поскольку Фо (/) есть безусловная вероятность времени ожидания t.
Применяя рассуждения, аналогичные использованным при получении уравнения (5), можно прийти к следующему рекуррентному соотношению
ОО
/глМФ^Дл,/—т)йт,
о
К; л = 0, 1,2,...’, 0</. (8.26)
2. Важной характеристикой переходного процесса является величина времени и число переходов, необходимых для достижения впервые состояния 0; из состояния О(. Когда i = j, эти величины иногда называются рекуррентными временами. Однако нас интересует вероятность
ф;у (Л, t) = Р {п (t) = Л, S (t) = Оу, S (т) =/= Оу,
0 < т < ф (0) = О4, л (0) = 0}. (8.27)
Функция фгу (л, t) есть совместная вероятность того, что потребуется л переходов и время t для достижения в первый раз состояния Оу, если при t= 0 система находилась в состоянии Ог. Вероятности Ф;У (л, /) и Фгу (л, t) связаны соотношением
Фгу(л,/)= 2 \Фгу(лг,т)Фу7(л——t)dx,
m = l о
1 С i, f^K; л-1,2,3,...; (8.28)
Фгу(л+1,/)= У
88
8. Полу марковские процессы
Если система стартовала из состояния 0г, то вероятность оказаться ей в состоянии Оу после п переходов за время / определяется вероятностью того, что система достигает состояния Оу в первый раз после т переходов за время т и затем возвращается в состояние за п — т переходов в течение времени t — т, причем необходимо взять сумму по всем значениям т от 1 до п и проинтегрировать по всем значениям т от 0 до t. При п = 0 справедливо равенство
<р0 (0, t) = 0, 1 < i, / < К; О С t, (8-29)
так как невозможно переместиться из состояния Ог в состояние Оу, не совершая переходов.
Уравнение (28) можно записать в следующем виде:
п е
Фо(п+1,0= 2 \Фо("г+1>т)Ф0(л—m,T)dr, m = 0 о
/г = 0, 1, 2,...; 0</. (8.30)
Для решения уравнений (26) и (30) можно применять разные методы, в том числе и метод преобразований Лапласа.
Рассмотрим три иллюстративных примера, показывающих, что из теории полумарковских процессов как частные случаи следуют результаты теории цепей Маркова, дискретных марковских процессов и процессов восстановления.
Пример I. Цепь Маркова. Пусть полумарковский процесс с дискретным временем задан матрицей одношаговых вероятностей перехода л и времена ожидания в каждом состоянии одинаковы и равны единице, т. е.
ft, (i) = b(t- 1), Г/ (s) = e-s, 1 < i, j < K.
В данном случае
к w*(s) = 7ti>e~s = e~s, i = i
T;-(s)=—[1-®}(s)J = — (1—e~s), s s
Согласно (10) имеем
Ф* (s) = [I —e~s л]—1 — (1 — e~s) s
или
Ф* (s) = R* (s) q (s), где
R* (s) — [I —е-'л]"1, <7(s)=(l— e~s)/s.
Дискретный марковский процесс
89
В теории матриц доказывается [143], что справедливо соотношение
[I —Aj-!= 2 А».
п— о
Поэтому
R* G)= У, е— ns я».
п= о
Из обратного преобразования Лапласа получаем
°° (1 о • < t 1
R(0 = xn6(t—n), ?(/)=*’ = ’
п — о [У, I 'Д-> 1
На основании этих выражений находим матрицу интервально-переходных вероятностей
Ф(/) = ^И(/—т)<7(т) dr = л", n^t^n+\.
о
Это выражение показывает, что для рассматриваемого полумарковского процесса, когда переходы возможны только в дискретные, равноотстоящие моменты времени, вероятность перехода из первоначального состояния fl; в состояние fly за п шагов равна элементу матрицы л" с индексом ij. Этот результат совпадает с формулой (2.29) и свидетельствует о том, что частная конкретизация полумарковского процесса с дискретным временем позволяет получить правильные результаты для цепей Маркова.
Пример 2. Дискретный марковский процесс. Пусть полу марковский процесс с непрерывным временем имеет заданную матрицу вероятностей перехода л и одинаковые экспоненциально-распределенные времена ожидания во всех состояниях (со средним значением 1/v):
ftj (t) = ve~vt, ftj (s) = v/(s + v), 1 C i, j С K.
В рассматриваемом примере
Wi (s) = v(s + v)-1, 4*7 (s) = (s + v)-1, 1 sC i
Теперь записываем основное уравнение (10)
Ф* (s) = [I—л X f* (S)]-1 V* ($) = ГI--лГ1 —!— =
L s + v J S-f-V
= (s +V) [(S + V) I — VЛ]-1-5-= [8 + V (I —л)]-1.
90
8. Полу марковские процессы
Так как матрица (I — л) не зависит от s, то можем записать
Ф* (s) = Is + v (I — л)]-’.
Отсюда получаем обратное преобразование Лапласа
Ф (/) — ехр I—v (1 — л) /).
Это выражение по существу является матричной записью частного случая формул (6.5) для дискретного марковского процесса.
Пример 3. Альтернирующий процесс восстановления (см. с. 427). Пусть система имеет только два состояния Oj и 02, причем матрица вероятностей перехода имеет простой вид
ГО 11
1
л =
При такой матрице невозможны переходы из какого-либо состояния в самого себя, так как лп = л22 = 0. За состоянием Oj достоверно следует состояние Г), и наоборот. Предполагаем заданными плотности вероятностей f12 (/) и f21 (t) соответствующих времен ожидания. Вычислим интервально-переходные вероятности Фг,-, i, j = 1,2.
Воспользуемся основным уравнением (10):
1—/12(«) /i2(s)[l—/2i(s)]
/21 (5)1 I-/12 (5)] 1-/21 (5)
В частном случае, когда /12 (/) = v2 ехр (—v2/), /21 (/) = Vj. ехр (—Vj/), т. е. /12 (5) = v2/(s + V2), /21 (s) = v1/(s + Vi), приведи ное выражение принимает вид
Ф* (S) =------------!--------
s(s + vi + v2)
s + v,
Vl
v2
s + v2
Из обратного преобразования Лапласа легко находится интересующая нас матрица интервально-переходных вероятностей
Ф(0 1
v1 + v2e-<v> + ^'
Vl + v2 V1 (1 _e-<Vi + v2) 1),
V2(l — e-(v. + v2) v2 + v1e-(v‘-i-v«)
Альтернирующий процесс восстановления
91
Отсюда при I = 0 имеем
ф(0) =_____!__+ 0 1
vl + v2 () Vj + v2
что, как и следовало ожидать, совпадает с л. При t-> оо получим
lim Ф(/) =----------
t -* ос V1 + V2
2
Этот результат находится в согласии с формулой (22).
9. Марковские последовательности
Основные определения и свойства
Пусть случайные величины кп = X (/п) в некоторые дискретные моменты времени принимают непрерывнее
многообразие возможных значений (см. табл. 1.1). Под случайными величинами можно, например, понимать временные отсчеты непрерывного процесса X (/). По такому принципу работают все импульсные системы радиосвязи. Известно, что непрерывные случайные величины можно характеризовать функциями распределения или плотностями вероятности.
Последовательность случайных величин Хп называется марковской, если при любом п для условных функций распределения Fn или условных плотностей вероятностей лп выполняются соотношения
Fn (Х„|ХЬ .... Xn_x) = Fn (Xn|Xn_i), (9.1)
лп (^п | •••» ^п-1) ~ яп (^п I ^п—1)- (9-2)
Эти соотношения выражают тот факт, что для марковской последовательности условные функции распределения или плотности вероятностей для момента времени tn зависят только от того, какие значения принимала случайная величина в предшествующий момент времени /п_1( и не изменяются от добавочных сведений о том, какие значения были приняты случайной величиной в более ранние моменты времени.
Из формулы (2) следует, что совместная плотность вероятности рассматриваемых случайных величин выражается через плотность вероятности начального состояния Pt (AJ и плотности вероятности перехода лв (A,n | п. = 2, N:
Р(Xi, Х2..Хп) = Л (X,) П Ъ I h-1 )• (9-3)
И = 2
92
9. Марковские последовательности
Эту формулу можно принять за определение марковской последовательности, так как из нее следует (2):
лп (Xn IХъ ..., Xn_J = Р(Х1’- Л-1’--п) = лп (Xn | Х^). (9.4)
П \ П I, I* » fl х/ п /1 1 \ fl v fl | fl х/ \ >
Г (Л1.....^п-1)
Укажем некоторые свойства марковских последовательностей.
1. Если известно состояние марковской последовательности в настоящий момент времени, то ее будущее состояние не зависит от прошлого состояния. Это означает, что если известно состояние Хт, то при л > m > р случайные величины Хп и Хц независимы
Р (Х„, Хи |Хга) = лпга (Хп |Хга) лцт (Xu|Xm). (9.5)
Действительно, на основании (2) можем написать
Р (К X IX )___ Р ’ ^~т 1 (Хп | ^rn) _
ni ul m ” P^m) ” P(Xm) “
Сформулированное положение справедливо для нескольких прошлых и будущих состояний.
2. Любая подпоследовательность, взятая из марковской последовательности, является также марковской, т. е. если при заданном tn рассматривать моменты времени tn <Z tn tn , то
Л (^nm I ^«1» •••> ^nm_i) — nnmI An-P' (9.6)
3. Марковская последовательность остается марковской и в обратном направлении,т.е.
Л (Xn|Xn+l..... Kr + m) = лп (Хп|Х„+1). (9.7)
В этом можно убедиться, расписав левую часть равенства (7) согласно формуле (2):
л (Х„ | X,
Р (Хп, Хп+1.....Хп + т) _
Р (Хп+1 , ^-п + т)
Р (Хп, Хп+1) Р (Хп+2, • • • , Хп+ni I Хп + 1) \
------------------------------------------= лп (Хп I Хп+1).
Р (Хп+1) Р (Хп+2, • - • < Xn+m I Хп+1)
4. Плотность вероятности перехода удовлетворяет уравнению
00
Л(ММ= $ л(Хп|М Л(М^1) Ап, п>т>р, (9.8) — 00
являющемуся частным случаем уравнения Колмогорова—Чэпмена. Действительно, для марковской последовательности можем написать
Р (Хц, Xm, Xn) = Р (Хц) л (Хт | Хи) л (Хп | Х^.
Мартингалы
93
Проинтегрировав обе части этого равенства по Кт, получим
оо
Р (^ц» ^n) = Р ~ Р (^ц) л (^n I =
— оо
оо
= Р(А,Ц) J л (kn | Хт) л (Хт | Xu) dKm.
ОС
Отсюда следует уравнение (8).
Марковская последовательность называется однородной, если плотности вероятностей перехода лп (7.n|ln_J не зависят от п.
Марковская последовательность называется стационарной, если она однородна и все состояния лп имеют одну и ту же плотность вероятности
Рп (к) = Р М = const (п).
По аналогии со сложной цепью Маркова можно ввести непрерывную сложную марковскую последовательность произвольного порядка т (т 1), определяемую следующим образом:
пп (^п I •••> ^п-1) —
(лп (лп | Xn__m, ..., Хп_^), и tn,
(9.9)
При т = 1 сложная марковская последовательность переходит в простую. При п^т следует формально положить т = п—1 (« > 2).
Пример I. Мартингалы. Независимые случайные величины llt 12, •••, ^ni ••• имеют плотности вероятностей Рп (к) соответственно. Покажем, что случайные величины
— Xj, х2 — М Х2, ..., хп — Xj Х2 ф* ... Ц- Хп, ...
образуют марковскую последовательность.
Используя правило композиции законов распределения, находим совместную плотность вероятности
Р (м> ^2> •••> %п) ~ Pl (^1) Pi (^2 ^1) ••• Рп (^П ^п-1).
На основании этого соотношения определяем условную плотность вероятности
Лп (хп I хь х2,..., xn_i) = ^(Х1’ *2 Хп) = Рп (х„ — Xn_j).
Р (*1, *2..ХП-1)
Так как последнее выражение не зависит от xlt х2, хп_2, то по-
следовательность случайных величин хп является марковской.
Отметим, что если <Хп>=0, то <хп>=0. Кроме этого, поскольку хп — 1,, + xn_lt то
I Хп-1) = I ^п-1^ + ^п-1»
94
9. Марковские последовательности
так как не зависит от хп_х и <Z.„> = 0. Следовательно, при любом п
<Х„|Х1, х2, .... хп_х> = <Хп-1>-
Последовательности случайных величин, обладающие таким свойством, называются мартингалами.
Пример 2. Спектр радиосигнала с разрывной фазой.
Вычислим спектр радиосигнала вида (2.53):
s (/) = До cos [ю0/ + 0 (/) + <р0). (9.10)
В отличие от примера 3 § 2 примем, что значения О; есть непрерывные случайные величины, равномерно распределенные в интервале (—л, л), причем и О;- при i j статистически независимы. Разрывы (скачки) фазы 9 (/) допускаются только через фиксированный временной интервал То — const, а в пределах каждого интервала длительностью То фаза остается постоянной. В данном примере последовательность значений {О,} независима и, следовательно, является частным и наиболее простым случаем марковской последовательности.
Оставляя в силе другие условия примера 3, для решения задачи можно воспользоваться формулой (2.56): •
ОО
px(£)Re{exp(/(o. т)<ехр[/(0т — 0()|/г|>е}, (9.11) ' ' k = о
где вероятность Рх (k) определена формулой (2.58) и
<ехр I/ (0Т — 9,) |/г)>е =
= Я ехР Ч (0т — 9,)] Р (0„ Bi | k) dQtd$x.
При k = 0 значения 0Т и 9, принадлежат одному и тому же интервалу длительностью То, т. е. 0t = 0Т = 6,. При этом
<ехр [/ (0Т — 0,) \k = 0]> е = 1.
При k = 1, 2, 3, ... случайные величины 0, и 9Т берутся на разных интервалах и поэтому независимы. Для них условная совместная плотность вероятности равна произведению одномерных плотностей вероятностей
P(0t, 0V|*) = Pi(0t)P1(0,) = —, -л<0у,0т<л; £=1,2,3,... 4л2
Поэтому
<ехр[/(0Х—0,)|fe]>0 = —1— J ехр(/0т)А J ехр( — flJdQt = O, — л —л
£ = 1,2,3,...
Спектр радиосигнала с разрывной фазой
95
Следовательно,
<exp[/(0t —0()| Аг]>0 =
при k = О, при
Подставив это выражение в (11) и воспользовавшись затем формулой (2.58) при k — 0, получим
ь,(т)=(^2~)Рх cos “°т=(4^) (1 ~ *44)cos “°т’ ।т । т*'
(9.12) По виду корреляционной функции (12) находим энергетический спектр
Ss (со) = 2 f ks (т) cos сотс/т = — А В То |7 /2) Т° V +
J 4 L\ (ш—со0) т'о/г )
о
. / sin (1/2) (оз-j-Юр) Гр \а1 g .„
к (ш4-и0) Т0/2 /]' }
Эта формула другим методом была получена в [34].
Формула (13) показывает, что если в отсутствие разрывов фазы спектр радиосигнала был дискретным, то при наличии описанных скачков фазы спектр становится сплошным. Ширина спектра зависит от того, насколько часто возможны скачки фазы.
Предположим теперь, что указанные выше скачки фазы могут происходить не через фиксированный интервал То, а в случайные моменты времени, причем характер временных точек возможных скачков задается законом Пуассона
px(fe) = -^- e-vc, т>0; fe = 0, 1,2,... (9.14)
Повторив предыдущие рассуждения, можно убедиться, что в данном случае остается справедливой формула (12), согласно которой
ka (т) = Ну) (0)cos иот = (-у-) e~v cos соот. (9.15)
Характер спектральной плотности будет отличным от (13), а именно
(9.16)
(<й) _ А Г-------у-------+--------у------
2 [ № + («— <о»)а v2+(w4-(Bo)2
Спектр по-прежнему является сплошным, он расширяется при увеличении частоты скачков v.
96
9. Марковские последовательности
Общая модель одномерных случайных блужданий
Теория марковских последовательностей позволяет исследовать общую модель одномерных случайных блужданий частицы вдоль оси 0, когда в дискретные моменты времени t = 1, 2, п, ...
координата частицы изменяется на случайную величину А.г, имеющую заданную функцию распределения F (К). При этом сама величина Хг может быть дискретной или непрерывной. В последнем случае случайные величины А.г являются марковской последовательностью. Как и в случае простых дискретных блужданий (см. § 4), в момент времени t = п случайная координата частицы равна
п 0п = ^о+ 2 хг, i= 1
где •О'о — начальное состояние, которое может быть детерминированным или случайным.
В общем случае движение частицы может происходить как по всей прямой 0 (неограниченные блуждания), так и на некртором интервале, ограниченном различного рода экранами [6].
Если движение частицы происходит по всей прямой 0, то вероятность того, что после достаточно большого количества шагов частица попадет в заданный интервал (у1г у2), может быть приближенно вычислена по формуле
___1_Уг
р {У1 < °п < = (2яог tt) 2 Г exp |.........\dz, (9.17)
J I. 2nd1 ) у,
где р, и о2 — среднее значение и дисперсия случайной величины с функцией распределения F (z).
Выражение (17) следует из центральной предельной теоремы, согласно которой сумма большого числа независимых случайных величин распределена по нормальному закону. Очевидно, что при ii > О частица в основном движется в направлении возрастания координаты, т. е. 0П -> оо, а при ц < 0 соответственно 0П -> —оо. В общем случае неограниченных блужданий не удается получить более точных вероятностных характеристик типа (4.3), справедливых при любых (в частности, малых) значениях п.
Случайные блуждания между поглощающими экранами
При анализе простых дискретных блужданий между поглощающими экранами достаточно было рассмотреть поглощающие состояния в точках с и d, не обращая внимания на состояния, лежащие выше и ниже этих точек, поскольку частица заведомо попадала в эти состояния. В общем случае при определении поглощающих экранов
Случайные блуждания между поглощающими экранами
97
следует учитывать возможность скачкообразного превышения координатой частицы заданных значений end. Поэтому в дальнейшем будем предполагать, что все состояния, принадлежащие полубеско-нечным интервалам (—оо, с] и [d, +оо), являются поглощающими. Таким образом, произведение числа шагов N до поглощения на интервал между двумя скачками равно времени до первого выхода частицы за границы интервала (с, d). По-прежнему предполагается, что после поглощения движение частицы прекращается.
Последующие рассуждения будут проводиться в основном для непрерывных независимых случайных величин Х;, имеющих плотность вероятности f (К) = dF (K)/dK, для которой существует двустороннее преобразование Лапласа
Г (со) = J e~«*f(%)dK. (9.18)
— оо
Применение результатов, полученных при этих предположениях, для анализа характеристик случайных блужданий в случае дискретных случайных величин Хг будет проиллюстрировано на конкретных примерах. Отметим, что в общем случае функция f* (со) может быть определена как двустороннее преобразование Лапласа—Стил-тьеса от функции распределения F (К), т. е.
/*(со) = J e~aKdF(X). (9.19)
— ОО
В дальнейшем по аналогии с определением производящей функции вероятностей (4.14) будем говорить, что выражения (18) и (19) определяют производящую функцию моментов по непрерывной переменной X.
Обозначим через fn (X) dX вероятность того, что частица находилась внутри интервала (с, d) в течение первых п — 1 шагов и что в результате приращения координаты частицы на n-м шаге ее значение будет заключено в интервале (X, К 4- dX), т. е.
fn (X) dX = Р {с <0Ъ 02.... 0П_, <d, Х<0п<Х + dX},
п — 1, 2, ..., —оо < X < оо. (9.20)
Здесь X может быть как поглощающим, так и непоглощающим состоянием. Кроме этого, без ограничения общности можно положить
k (X) = 6 (X),
где 6 (X) —дельта-функция. Это предположение эквивалентно тому, что начальное положение частицы Хо = 0. Поэтому без ограничения общности всюду далее предполагается, что с < 0, так как нижний поглощающий экран расположен ниже точки начала отсчета.
4 Зак. 1216
98
9. Марковские последовательности
Хотя функция fn (X) зависит от значений с и d, однако для упрощения формы записи этот факт в обозначении опускается.
Если в (20) положить X < с или X > d, то
fn (X) dX = Р {N = n.X < Qn < X + dX},
X < с или X > d, п = 1, 2, ... (9.21)
В данном случае fn (X) dX равна совместной вероятности того, что число шагов до поглощения Л/ равно п, а в момент поглощения частица находится в интервале (X, X 4* dX). Переходя к производящей функции моментов по дискретной переменной п и непрерывной переменной X, учитывающей все поглощающие состояния, из (21) имеем
<e-“ejv sN>= 2 n =
е~“х fn (X) dX 4- J е-°х f п (X) dX sn = d
oo d
$ e-“x/n(X)dX —Je~“^n(X)dX — oo C
(9.22)
Получим рекуррентное соотношение, связывающее fn (X) и fn-i (X). Для этого заметим, что если на п —1 шаге частица находилась в состоянии у (с < у < d), то для того, чтобы на п шаге частица попала в состояние X, величина скачка Хп должна быть равна X — у (по предположению, распределение случайной величины Хп не зависит от у). Следовательно, можно написать
Р {X < 0n < X 4- dX | 0П_! = у} = Р {к — у < 0п < X — у -k
Отсюда имеем
4" dX) == f (X — у) dk.
а
fn(k)dk=^p{k<en<k+dk\en.1^=y}fn-1(y)dy^
~d
^f(k-y)fn^(y)dy с
dX.
Таким образом, искомое рекуррентное соотношение имеет вид fnW =$fn-1(//)/(^-l/)^. n=l, 2,... (9.23)
Взяв от обеих частей равенства (23) двустороннее преобразование Лапласа, получим
оо оо
V e-“^/n(X)dX= ( е-“х
'd
\ fn-i(y)t{^—y)dy
dk =
Случайные блуждания между поглощающими экранами
99
d
= ^~ayfn (У) С
00
е-0И-й((Х—y)dk
— 00
dy =
d
= (y)dy.
(9.24)
Введем производящую функцию К (ш, s) для fn (X):
/((w, s)= 2 sn\e-^fn(k)dk. (9.25)
n = Q r
Тогда из (22) с учетом (24) и (25) следует соотношение
<e-“°w SN> = 1 _[ 1 _,sf* (со)] X (0) 8). (9.26)
Соотношение (26), как будет показано ниже, обобщает известное тождество Вальда [33] и дает довольно общее выражение для <e_“0AZsw > в случае рассматриваемой модели случайных блужданий. Оно остается справедливым и при наличии только одного поглощающего экрана (например, при d-> оо). Однако в этом случае операция математического ожидания в (26) может проводиться по вероятностям, сумма которых будет меньше единицы. Другими словами, при решении задач с одним поглощающим экраном следует иметь в виду, что с определенной вероятностью частица будет блуждать сколь угодно долго без поглощения (см. (4.47)).
Если случайные величины Х; имеют дискретные значения, то, повторяя предыдущие рассуждения, получим
<У^ sN> = 1 - [ 1 —sG (у)] L (у. s), (9.27)
где L (у, s) есть дискретный аналог К. (cd, s), a G (у} ~ ( у 1 > — производящая функция одного скачка Xf. Формально соотношение (27) может быть получено из (26) заменой у = е~“ с учетом (19).
Пример 3. Дискретные случайные блуждания.
В качестве простого примера рассмотрим применение тождества (27) для анализа статистических характеристик простых дискретных блужданий [см. (4.33) и далее]. Так как в этом случае поглощение происходит только в точках с или d, то с учетом обозначений, использованных при анализе простых дискретных блужданий, тождество (27) принимает вид
Ус («) + Уа (s) = 1 — [ 1 — s
(py+l—P—<74-y
L (y, s), (9.28)
100
9. Марковские последовательности
где
L(y.s) = 2* yk isn№= s' У* PM (9.29) k = c+l -? = 0 fr = c4-1
Здесь производящие функции Pk (s) определяются соотношением (4.43) и удовлетворяют уравнению (4.44) с нулевыми граничными условиями. Следовательно, если известны выражения для FOc(s) и Fod (s) типа (4.36), то производящие функции Ph ($) могут быть найдены из (28) как коэффициенты разложения левой части равенства по степеням yk.
Тождество (27) может быть также использовано для нахождения самих функций F^ ($) и Fl!d (s). Действительно, пусть (s) и ($) являются корнями уравнения
1 — sG {у) = 0.
Тогда, подставляя в (28) у = ($) и у = (s) и замечая, что вто-
рое слагаемое в правой части (28) равно нулю, получаем
l^i W («) + (s)]dFod (s) = 1, Щ (S)F Лх, (S) + [^2 (s)ld Fod (S) = 1.
Решив эти уравнения относительно FOc (s) и Fod (s), получим все результаты § 4 п. 3.
Тождество Вальд
Подставим в (26) значение s = If* (со)]-1. Так как второе слагаемое в правой части в этом случае будет равно нулю, получим
<е~“е" [/* (co)]-JV > = 1- (9.30)
Выражение (30) называется тождеством Вальда [33] и широко используется в последовательном анализе. Кроме этого, оно позволяет в самом общем случае получить статистические характеристики случайных блужданий при наличии поглощающих экранов.
При выводе (30) предполагалось, что в результате подстановки s = If* (со)]-1 значение К (<о, $) остается конечным. Докажем этот факт, так как в противном случае такую подстановку делать нельзя. Предварительно остановимся на некоторых свойствах производящей функции f* (w), определяемой соотношением (18), и получим одно полезное неравенство.
Из свойств преобразования Лапласа следует, что среднее значение случайных величин равно
Р = <^г>=[--?-/*(»)] •
£ J © = о
Тождество Вальда
101
Поэтому, если мы построим график функции f* (<о) в зависимости от <о, то тангенс угла наклона кривой при ы = 0 будет равен —р. Кроме этого, кривая /* (со) будет выпуклой вниз, так как вторая
производная
<Р Г (<о) da>2
е~га*7(^Ж
положительна для любых действительных значений w и f* (w) -> оо при со->±оо. Поэтому график f* (со) для разных значений ц имеет вид, показанный на рис. 9.1. Отсюда следует, что f* (<о) имеет минимум в единственной точке <о = = <о1, причем Wj имеет тот же знак, что и среднее значение р случайных величин («! — 0 при р. =0). При этом выполняется соотношение
при р=/=0, (931) = 1 при |Л = 0.
Очевидно, что для уравнения
Г (со) = 1 (9.32)
значение <о = О всегда является одним из корней. Если р 0, то второй действительный корень этого уравнения <о — w0 0 также
Рис. 9.1. Производящая функция моментов обшей модели случайных блужданий.
имеет знак, совпадающий со знаком р. При р = О оба корня совпадают и равны нулю.
На основании свойств производящей функции для плотности вероятности gn (А,) неограниченных случайных блужданий в мо-
мент времени п можно написать
$ e-“^n(X)dX==[/*(to)F‘.
Тогда, для любого <о > 0 имеем
did
уп (X) rfX < J gn (к) d'K < J е-“ gn (X) dK <
c c c
102
9. Марковские последовательности
^.ead e-raKgn (X) dX = effld [/* (<o)p.
— ос
Для любых to > 0 левая часть последнего неравенства не зависит от ш. Учитывая, что при р. > 0, <ог > 0, можно написать
(9-33)
С
Аналогично, для ц < О получим
d
рп(Х)Л^е“-Ч/*(®1)Р. (9.34)
Покажем теперь, что функция К (to, s) имеет конечное значение при s = (/* (со)]-1. Действительно, для любого со > 0 из (25) следует неравенство
со £
К((0 s)<2 sn e-ad\fn(X)d\.
'1 = 0 с
С учетом оценки (33) отсюда имеем
К (a s)<e®' d~wl 2 sn I/* (“i)]”-
n = 0
Ряд в правой части последнего неравенства сходится при
sf* (<oj <1, т. е. s< [/* (mJ]-1. (9.35)
Аналогично можно показать, что для любых <о < 0 функция К (со, $) остается конечной при выполнении условия (35). Так как в точке со = Wj функция /* (<о) имеет единственный минимум, то равенство (30) справедливо для любых значений <о, для которых |/* (<о) | >/* (coj. Отметим, что для задач с одним поглощающим экраном аналогичные соотношения могут быть получены предельным переходом при d -> оо или с -> —оо.
Обозначим через pd и ре вероятности поглощения соответственно на верхнем и нижнем экранах. Тождество Вальда (30) может быть использовано для нахождения приближенных значений этих вероятностей. Действительно, так как события 0w d и 0/v jgC с взаимно исключают друг друга, (30) можно записать в виде
pd<e-“0W[/*(«)]-w>d + Pc<e-“9N[r(«)]-w>c= 1, (9.36)
где <->d и <->с означают операцию условного математического ожидания, например,
<е~гаИ" [/* ((□)]-">, = [/* (м)Г' 10N > d). (9.37)
Тождество Вальда
10 3
В том случае, когда р. =£= 0, второй действительный корень уравнения (32) (оо^О и из (36) следует
pd<e-“‘^)d + pc<e-““9">c=l. (9.38)
Если пренебречь явлениями вне границ экранов, то приближенно можно положить
0W « d при > d,
8,v « с при 0jv с. (9.39)
Из (38) и (39) имеем
pd е~й»d + рс е-®»с ~ 1.
Используя тот факт, что вероятность поглощения на каком-либо экране за бесконечно большое время равна единице, т. е. рс 4- pd = = 1, получим приближенные выражения для вероятностей поглощения на каждом из экранов в отдельности
1 _р-Мо с р-йо __ 1
pd * , Р^ --------------— • (9.40)
е-га0 d_ е-га0 с с е~<в» а__е-<в« с
При р = 0 и, следовательно, w0 = 0 из (40) путем предельного перехода при (£>0 -> 0 имеем
pd с/(с — d), р, « d/(d — с). (9.41)
Напомним, что всюду предполагалось (см. (20) и далее), что с<0. Из (41) следует, что приближенные значения вероятностей поглощения не зависят от конкретного вида плотности вероятности распределения одного скачка.
. Используя ту же методику, можно получить приближенное выражение для производящей функции числа шагов до поглощения N.
/Из свойств функции f* (w) следует, что уравнение f* (<о) = = 1/s имеет два действительных корня, обеспечивающих выполнение неравенства 1/s > (wj. Обозначим значения этих корней через p,j (s) и р2 (s); для них выполняются равенства щ (1) = 0, Щ (1) = w0. Полагая в (26) о> = (s) и w = р2 (s), вместо (30)
получим два уравнения
(ехр I—цг (s) 0,vl sw> = 1 (/ = 1, 2). (9.42)
С учетом приближенных соотношений (39) из (42) следует
pde-^(s)d<sv>d + pce-^(s)£<s">c = l (< = 1 2). (9.43)
Определив из (43) значения (sw>c, (sw>d и воспользовавшись соотношением
= Pc <SN>c + Pd <SN)d,
104
9. Марковские последовательности
для производящей функции числа шагов до поглощения получим приближенное равенство
е~Н1 (S) d _е-ц2 (s) d I р-Н, (S) (s)c
<sN>«----------------------------------(9.44)
е-Щ (s) d — щ (s) c_e-Hi (S) с— о,- (s) d
Так как левая часть равенства (30) зависит от со, а справа стоит постоянная величина, то функцию, стоящую под знаком математического ожидания, можно разложить в ряд по степеням ю и приравнять нулю математические ожидания коэффициентов при соответствующих степенях <о. Эта операция эквивалентна дифференцированию по со под знаком математического ожидания с последующей подстановкой <о = 0.
Воспользуемся известным разложением характеристической
функции [30]
^*(со) = ехр <|)'> (9.451
ft=i М
где х/г — кумулянты (хх = р., х2 = о2).
Подставляя (45) в (30), имеем
<^ехр — (0w — УУц) со--1- No2 <о2+ ...jy = Ь
Приравнивая нулю математические ожидания коэффициентов разложения экспоненты при степенях <о и со2, получаем
(0/v — 7Vp> = О, <(9Л—TVp)2 — Л'о2> = 0.
Следовательно, имеют место равенства
<0w> = ц (JV>, (9 46)
< (0„ -/Vp)2 > = о2 < W >. (9.47)
Для среднего числа шагов до поглощения из (46) и (47) получим соотношения
<7V> =
— <0W) при р.у=0, 1*
—— <0jv> при ц = 0. О2
(9.48)
Так как <0W) « срс + dpd и <0д-> « с2ре + d2pd, то
из (40) получим приближеннее выражение для среднего числа шагов до поглощения
<N>
d—с — de й’°с4-се “°11 g d________g с
—edits2
при ц =# 0,
(9.49)
при 0.
Случайные блуждания между отражающими экранами
1С5
’ Формула (49) находит широкое применение в теории последовательного анализа.
Пример 4. Случайные блуждания по нормальному закону. Рассмотрим одномерные блуждания, когда случайные приращения координаты распределены по нормальному закону со средним значением [х и дисперсией о2, т. е.
f* (<о) = ехр (—pw — o2w/2).
В этом случае, как нетрудно убедиться, т0 = 2р/о2 и для вероятности поглощения рс и pd из (40) следуют приближенные соотношения
р _________1—ехр ( —2щ/о2)________
d ехр (— 2jid/o2) —ехр (—2цс/о2)
, ( „J.
ехр (— 2pd/o2) — ехр (— 2цс/о2)
Для среднего числа шагов до поглощения на основании (49) получим
(jV) ~ (^—с)—^ехр ( —2рс/о2)+сехр (—2prf/o2) .
ехр ( —2pd/o2) —ехр (— 2рс/о2) ’
При и = 0 значения рс, pd и < N > определяются формулами (41) и (49).
Случайные блуждания между отражающими экранами
Предположим, что в точках с и d помещены отражающие экраны. Под этим имеется в виду, что если частица на очередном шаге попадает в точку, лежащую за пределами какого-либо экрана, то она мгновенно возвращается на его поверхность и остается там до тех пор, пока на каком-то шаге она не перейдет внутрь области (с, d). По-прежнему без ограничения общности предполагается, что в начальный момент частица находится в состоянии Хо = 0. Таким образом, в момент времени t = п координата частицы равна
9П_Х + А.п
0П= d
при с < 0n_x + Xn < d, при 0n_x + Xn>d, ПРИ ©„-J-Мп с.
Отметим, что даже при непрерывном распределении каждого скачка после некоторого количества шагов п функция распределения координаты будет дискретно-непрерывной. Она будет складываться из конечных вероятностей пребывания на каждом из экра? нов и непрерывного распределения вероятности пребывания частицы между экранами. Поэтому для описания статистических характеристик случайных блужданий между отражающими экра
106
9. Марковские последовательности
нами удобнее пользоваться функциями распределения, а не плотностями вероятности.
Обозначим вероятность того, что на n-м шаге координата частицы будет меньше некоторой величины X через
Нп (Ь) = Р {0п С М-
По определению, Нп (X) будет с <Z X < d, непрерывной справа и
неубывающей функцией для
Нп (X) = 0 (X < с), Нп (с) = Р {0П = с}, 1 - Нп (d - 0) = Р {0П = d}, Нп (X) = 1 (X > d).
Если в момент времени п — 1
0п-1 = У (с < у < d), то
частица занимает положение
0 при X < с,
^(Х—у) при c^CX<rf,
1 при X^d.
Здесь F (X) — функция распределения случайной величины А.п. Отсюда следует, что Нп (К) = 0 при X < с, Нп (X) = 1 при X > d и при с X d
rf+o
P{0n<X) = tfn(X) = j F(K-y)dHn^(y).
c — 0
Интегрируя правую часть последнего равенства по частям и предполагая, что существует функция f (X) = dF (K)/dK, с учетом (50) получим
' /7n(X) = F(X-d)/7„_1(d + 0)-F(X + c)/7n_1(c-0) +
d d
+ $ Нп.х (у) f (X—у) dy = F (К-d) + J Ha^(y)f(K-y)dy (c^K^d). . c c
(9-51)
Как и в случае простых одномерных случайных блужданий, можно ожидать, что после достаточно большого числа шагов в системе установится равновесное распределение Н (X) = lim Нп (X).
Из (51) следует, что в равновесном состоянии
H(K) = F(K—d) + ^H(y))(K—y)dy (c^K^d). (9.52)
Случайные блуждания между отражающими экранами
107
Если случайные приращения координаты дискретны, то вместо (52) следует использовать соотношение d
H(X) = F(X—d—O) + ^H(y)dFCk—y) (9.53)
С
В частности, если случайные приращения координаты могут принимать только целочисленные значения, то существует стационарное (равновесное) распределение вероятностей {лА} для целых значений k = с, с + 1, ..., d. Такие процессы называются цепью Маркова и их свойства подробно изучались в § 2, 4.
Укажем два основных свойства равновесного распределения. Во-первых, оно не зависит от начального значения координаты, так как в (52) входят известные величины о, d, f (А) и одна неизвестная функция Н (Л). Во-вторых, если начальное состояние представляет собой случайную величину с функцией распределения И (1), то согласно (51) Нп (к) — Н (А) для всех п > 1.
В настоящее время не существует методики, позволяющей достаточно просто получить аналитическое решение интегрального уравнения Фредгольма (52) и, следовательно, найти равновесное распределение Н (А). Однако для одного отражающего экрана, полагая d-+ оо и с = 0, из (52) получим
Н (А) = О (А < 0),
= \ H(y)f(h—y)dy (у^О). (9.54)
о
Интегральное уравнение Винера—Хопфа (54) в ряде частных случаев может быть решено аналитически [31].
До сих пор рассматривались отдельно характеристики случайных блужданий между поглощдющими и отражающими экранами. Можно показать, что эти задачи в некотором смысле эквивалентны, т. е. из решения одной из задач следует решение другой. В частности, если известны вероятности поглощения на каждом экране из произвольного начального состояния, то очень просто может быть найдено равновесное распределение Н (F) [32].
Рассмотрим случай, когда приращения координаты частицы являются непрерывными случайными величинами с плотностью вероятности f (А). Без ограничения общности можно поместить начало системы координат посредине экранов, т. е. положить с = —d. Пусть нам известна функция Q (А), которая представляет собой вероятность поглощения на нижнем экране при условии, что Начальное состояние О0 = А. Для отражающих экранов Нп (А) будет функцией распределения местоположения частицы после п
108
9. Марковские последовательности
шагов при условии, что первоначально она находилась на верхнем экране. Тогда
<9-55) ( 0 при Х<я,
и согласно (52) функция Нп (X) удовлетворяет интегральному уравнению
tfn(X) = F(X-d) + J (»>1- ~d^<d).
— d
(9.56)
Для случайных блужданий между поглощающими экранами из произвольного начального состояния X (| X|< d) обозначим через Qn (X) вероятность поглощения на нижнем экране за число шагов, не превышающее п. Для того чтобы получить рекуррентное соотношение, связывающее Qn (X) и (X), заметим, что поглощение может произойти в результате двух взаимоисключающих событий: либо оно произойдет на первом шаге с вероятностью F (—X — d), либо часшца на первом шаге попадет в некоторое состояние у £ (—d, d) и тогда с вероятностью Qn_x (у) поглощение произойдет в моменты 2, 3, ..., п. Таким образом, имеем
Qn{^ = F{-\-d) + $ f(y-VQn-Ay)dy |X|<d),
— d
Q,W-l ‘ "P" | 0 при X> — d.
Заменив в последних соотношениях X на —X, получим
й(-Ч = ( 1 "Р"Х=А
1 0 при Х< d, d
Qn(-k) = F(X-d)+ $ f^_y)Qn_1(-y)dy (n>l, |X|<d).
-d
(9.57)
Из (55), (56) и (57) видно, что функции Нп (X) и Qn (—X) удовлетворяют одними тем же интегральным уравнениям с одинаковыми начальными условиями. Поэтому имеет место соотношение
Нп (X) = Qn (—X). (9.58)
В пределе при п -> оо из (58) получим
Н (X) = Q (—X). (9.59)
Случайные блуждания между отражающими экранами
109
Так как в точках к = +d функция Н (к) имеет разрывы, то все предыдущие результаты были получены в предположении, что |^| <Zd. В этих точках, очевидно,
//n(_ d +0) = limQn (А,),
—0 (У.ьи)
1— Hn(d — 0)= 1 —limQn(X).
%-»d + 0
Если случайные приращения координаты могут принимать только дискретные целочисленные значения, то функцию Qn (к) следует вычислять для поглощающих экранов, расположенных в точках d + 1 и —d. Тогда непрерывная справа функция Нп (к) будет по-прежнему описывать характеристики блужданий между отражающими экранами, помещенными на концах отрезка [—d, d], и для к = —d, —d + 1, ..., d остаются в силе формулы (58) и (59).
Может показаться, что для вычисления равновесного распределения при случайных блужданиях между отражающими экранами могут быть использованы приближенные выражения для вероятностей поглощения, полученные при помощи тождества Вальда. Одна-Ко эти выражения справедливы в том случае, когда экраны расположены достаточно далеко от начальной точки. При этом на основании (59) может быть вычислено равновесное распределение Н (А,), когда X расположено примерно посредине между экранами. Для вероятностей же пребывания на отражающих экранах, которые представляют наибольший интерес, мы не получим даже приближенных выражений.
Пример 5. Простые случайные блуждания. В случае простых одномерных случайных блужданий между отражающими экранами, расположенными в точках —d, d, равновесное распределение вероятностей согласно (4.53) имеет вид
!-(?/?) {k =
— d,..., d\ p=£q).
По
определению,
Н(к) = J = k = - - d
\-(plq}d+X + K \-(p!q]M+i
(k=—d,..., d).
Рассмотрим простые одномерные случайные блуждания между поглощающими экранами, расположенными в точках —d и d + 1. Пусть Q (к) обозначает вероятность поглощения из начального состояния к на нижнем экране. Тогда из формулы (4.42) имеем
Q(X)=I~W-^ (*=-*•••> d+D-l-(p/q)2d + '
Следовательно, Н (к) = Q (—к), что наглядно иллюстрирует справедливость (59) в данном частном случае.
110
10. Непрерывный марковский процесс
10. Непрерывный марковский процесс
Определение непрерывного марковского процесса
До сих пор изучались разрывные марковские процессы, характерной особенностью которых было то, что для малых временных интервалов Л/ вероятность сохранения предыдущего состояния превышала вероятность изменения состояния, причем каждое такое изменение состояния было существенным.
Рассмотрим теперь непрерывные (непрерывнозначные) марковские процессы. В противоположность разрывным процессам, непрерывные процессы характеризуются тем, что в любом малом интервале Д/ имеет место некоторое малое (порядка /Д/) изменение состояния.
Приведем определение непрерывных марковских процессов 1 (/). Возьмем в последовательные моменты времени Zo < /1 < ... < /„-j < tn значения случайного процесса Хо = X (/0), Xj = X (/,), ..., Xn_j = X (/n-O, Xn = X (tn). Процесс X (t) является марковским, если условные плотности вероятностей
ял (Хп> |Хл_j, fn—1, Xj, /], Xq, С) =
= Рпн-i (Хо, ..., Хп, /р, .... tn)/Pn (Хо, ..., Xn_j, /0, ..., ^n_j) (10.1) зависят только от последнего значения Xn_i в момент /n_j и не зависят от других более ранних значений, т. е.
(^n> tn tn—]1 ...; Xj, Zj‘, Хо, /0) — л (Xn, tn |Xn_j,
п>1. (10.2)
Иначе говоря, будущее поведение марковского процесса не зависит от прошлого, если точно известно его состояние в настоящий момент времени. Именно поэтому марковские процессы также называются процессами без последействия.
Следовательно, для марковских процессов формулу (1) можно записать так
Рп+1 (^о» ..., tn) = л (Xn, Zn|Xn_1, /n_j) Рп (Хр, ...,
1» ^0) •••> ^п-1)- (10.3)
Интегрируя это равенство по Хо, на основании условия согласованности плотностей вероятностей имеем
Рп (^i> •••, Xn, Zj, ..., /п) = л (Xn, tn | Xn_j, /n_i) Рn_j (Xj, ...,
^п-1» ti, ^n-l)‘
Отсюда следует, что при любом п > 1 в формулу (2) входит одна и та же условная плотность вероятности л (X, /)Х', /'), /> кото
Определение непрерывного марковского процесса
111
рую принято называть плотностью вероятности перехода (из состояния К' в состояние X за время между f и /).
Применяя последовательно соотношение (3) для разных п, получим
Pn+i (Хо, Хп, /0, •••. tn) = л (Хп, 4 ^п-1) х
X л tn_j | Хп_2, /п_2) ... л (Х1Э /j | Хо, Zo) Р (Хо, Zo). (Ю.4)
Следовательно, многомерные плотности вероятностей марковских процессов выражаются через плотность вероятности перехода я (X, Z|X', /') и одномерную начальную плотность вероятности Р (Хо, 6>)- Можно сказать, что характерное свойство марковских процессов состоит в том, что начальная одномерная плотность вероятности и плотность вероятности перехода полностью определяют марковский случайный процесс.
Воспользовавшись соотношением (3) и теоремой умножения вероятностей, нетрудно проверить, что марковский процесс остается таковым и в обратном направлении, т. е.
л (A-о, | XL, /р ...; Xn, Zn) = л (Хо, I ^i> G)> < ^1 < • • • tn •
(10.5)
Плотность вероятности перехода непрерывного марковского процесса удовлетворяет нескольким условиям.
1. Она неотрицательна и нормирована к единице
л (X, /|Х0, 1^) 0, J л (X, /|Х0, /0) = I- (10.6)
2. Переходит в дельта-функцию при совпадении рассматриваемых моментов времени (физически это означает малое изменение состояния за малые промежутки времени)
lim л (X, 11 Хо, /0) —6 (X — Хо). (Ю.7)
г-и,
3. Удовлетворяет уравнению Смолуховского, являющемуся частным случаем уравнения Колмогорова—Чэпмена: для любых t > t’ > Zo
л (X, /|Х0, /0) — J л (X, /|ХГ, /') л (X', f | Хо, /0) dX'.
(10.8)
В справедливости этого уравнения нетрудно убедиться. На основании (4) можем написать
j (Хо, X*, X, /0, t) d'K' — Р (Хо, /0) J л (X, 11X', t') л (X', t' | Хо,
Zo) dX'.
112
10. Непрерывный марковский процесс
По условию согласованности плотностей вероятностей интеграл слева равен двумерной плотности вероятности, которая для марковских процессов выражается через плотность вероятности перехода
Р2 (Хо, X, /0, 0 = Р (Хо, t0) л (1, /|Х0, /0). (10.9)
Приравняв правые части выписанных равенств, получим (8).
В тех случаях, когда плотность вероятности перехода зависит только от разности временных аргументов т = t — t', т. е.
л (X, 11X', /') = л (X', X, т), т = t — t'\ t, t' > to, (10.10) марковский случайный процесс называется однородным во времени. Если при т —>-оо плотность вероятности перехода стремится к некоторому пределу
lim л(Х', X. т) = Р,г(Х), (10.11)
не зависящему от «начального» состояния X', то говорят, что процесс эргодичен.
Если известна начальная плотность вероятности Р (Хо, t0) и найдена плотность вероятности перехода л (X, /|X', /'), то можно вычислить другие характеристики марковского процесса X (/). Интегрируя обе части равенства (9) по Хо, получим одномерную плотность вероятности в произвольный момент времени t
Р(Х /)= J Р(Х„, /0)л(Х, /|Х0, QdK,. (10.12) — оо
Зная одномерную и двумерную плотности вероятностей можно вычислить корреляционную функцию
Л4Л Г) = <[Х(0-<Х(0>][Х(Р)-<Х(Р)>]> =
= ^Х'ХР2(Х«, X, Р, OdX'dX — — оо
— J Х'Р(Х', t')dV J ХР(Х, t)dk, V t>t0. (10.13)
— 00 —оо
Если существует стационарное состояние, то одномерная плотность вероятности в стационарном состоянии не зависит от времени и равна Psi(X), а двумерная плотность вероятности зависит только от разности рассматриваемых моментов времени т = t — f:
Р2 (X', X, т) = Р (X', X, С, t) = P8i (X') л (X', X, т). (10.14)
Дискретная модель непрерывного процесса
113
Применительно к стационарному процессу X (/) формула (13) для функции корреляции упрощается
fe\(x) = X- k, т)с(Х' d’k—
— оо
— Х'Р8((Х') dX'l = X' KPst (X') л (X', X, т! d’k' сП.—
{со 2
J X'PS/(X')</X' . (10.15)
— оо
По функции (15) можно найти энергетический спектр S (со) стационарного процесса X (Z)
оо
S (со) = 2 k (т) cos (orrfx, со 0. о
(10.16)
Дискретная модель непрерывного процесса
Чтобы представить себе характер изменения координаты X (/) непрерывного марковского процесса при малых А/, полезно рассмотреть предельный переход от цепи Маркова к непрерывному процессу.
Введем в рассмотрение однородную цепь Маркова, в которой за единицу времени возможны переходы из любого /-го состояния в три ближайших состояния: j + 1, j и j — 1 с вероятностями а,, 1 — а, — Ру и Ру соответственно. Пусть лгу (т) — вероятность перехода за т шагов (см. (2.24)). Тогда на основании уравнения Маркова (2.16) можем написать
пгу (т) = а,-! л,, y_j (т — 1) + (1 — ау — Ру) пгу (m — 1) + + ру+1 лг, у+1 (т — 1). (10.17)
Будем рассматривать реализации процесса как траектории движения некоторой частицы. Ограничимся следующей моделью характера движения. Пусть частица совершает малые перемещения —АХ, 0, АХ вдоль оси X в течение малого интервала времени А/. Если частица в момент времени t находится в состоянии X, то вероятности того, что в момент времени t + AZ она окажется в состояниях X + АХ, X, X — АХ, равны соответственно а (X), 1 — а (X) — — Р (X), р (X). Обозначим через л (X, Z|X0, Zo) АХ условную вероятность нахождения частицы в интервале (X, X + АХ) в момент времени Z, если в момент времени /0 она находилась в состоянии Хо.
По аналогии с уравнением (17) можем написать
п (X, /1 Хо, Zo) АХ = л (X — АХ, t — Az1 Х„, Zo) АХа (X — АХ) +
114
10. Непрерывный марковский процесс
+ л (X, t — tat | Хо, /0) АХ fl — а (X) — р (Х>] +
-f- л (X + АХ, t — At 1Хо, tu) АХр (X + AX)
или после сокращения на AX
л (X, /|Х0, /0) = л (X — АХ, t — М|Хо, /0) а (X — АХ) ф
+ л (X, t — А/1 Хо, /0) [1 — а (X) — Р (X)] +
+ л (X + АХ, t — AZ|X0, /0) Р (X + АХ). (10.18)
Чтобы перейти к непрерывному случаю, нужно положить АХ и AZ стремящимися к нулю. При этом оказывается необходимым наложить некоторые ограничения на вероятности а (X) и Р (X).
Введем среднее значение условного приращения (при фиксированном X (/)) координаты за малое время А/
т}. (А/) = <[Х (/ + А/) - X (OJIX (0>, а также дисперсию этого приращения
d(А/) = <[Х(/ 4- А/)-X(0J21 МО>—"Я(О-
Обозначим предельные значения этих величин через
«1 (А/) а? (Д/)
t(4'J5v
Если частица в момент времени t находится в состоянии X, то возможные значения изменения ее состояния в течение следующего малого интервала есть АХ, 0 и —АХ, причем вероятности этих изменений равны соответственно а (X), 1 — а (X) — р (X) и Р (X). По известным правилам находим среднее значение условного приращения координаты за время А/
тх (А/) = la (X) — р (X)] АХ, а также дисперсию этого приращения
cl (ДО = {а (X) + р (Х)-(а (X) - р (X)]2} (АХ)2.
При этом
fl(X) = lim [а(Х)-Р(Х)] , (Ю.20)
да, м -»о \ Д/ /
fc(X)= lim {a(X) + P(X)-[a(X)-p(X)J2}-^-. (10.21)
ДА д/-»о А/
Чтобы эти предельные значения были конечными, выражения (20) и (21) определяют допустимый вид вероятностей а (X) и р (X), а также требуют согласованного стремления АХ и А/ к нулю. С учетом последнего обстоятельства и берется предел при одновременном стремлении АХ и А/ к нулю.
Пискретная модель непрерывного процесса
115
Предположим, что в интересующей нас области значений 1 величина b (Л) ограничена, т. е.
О < b (X) < с = const. [ (10.22)
Если теперь положить
(ДХ)2 = c\t, (10.23)
а (X) = t 8 (X) = - (К)~-а(К) t (10.24)
2с 2с
то равенства (20) и (21) будут выполнены.
Следовательно, в дискретной модели непрерывного марковского процесса элементарные приращения пространственной координаты ДХ за малое время Д/ должны иметь порядок ДА, не больший, чем (Д/)1/2, т. е. ДА, =0{(Д/)1/2}*’, а вероятности а (А,) и Р(Х) отличаются отодной и той же постоянной на малую величину О {(Д/)1/2}, так что разность между ними имеет порядок 1а (А.) — 0 (1)] ~ О {(Д/)1 /2 }.
Допустим, что входящие в уравнение (18) функции можно дважды дифференцировать и их можно представить рядом Тейлора. Например,
л (Х+ ДХ, / -4- Д/ | X,,, /0) Л/ л (X, 11 А.0, ta) zfc
± дх д/ + ± (ДХ)2 22.
ЭХ д/ 2 v ’
а (А — ДХ) « а (X) — ДХа' (X) + (ДХ)2 а" (а).
Если подставить такие разложения в (18), выразить а (X), 0 (X) И их производные через а (Х)и b (X) согласно (24), учесть равенство (23), разделить результат на Д/ и перейти затем к пределу при Д/—> 0, то для непрерывного процесса X (/) получим уравнение
di 2 дк [ 2
или
-2-=--2.[а(Х)л] + -2-_g_[fe(X) л] л = л(Х,/|Х0, /„). (10.25)
О! О К 2 ОМ
Полученное дифференциальное уравнение в частных производных принадлежит к параболическому типу и играет фундаментальную роль при изучении непрерывных марковских процессов (см. § 11). Наше рассмотрение дискретной модели непрерывного процесса преследовало две цели: 1) установить, что приращения ДХ
* Если отношение двух функций !(x)[g(x) остается ограниченным, когда х стремится к некоторому своему пределу, то пишут f(x)—O(g(x)).
116
11. Уравнение Фоккера—Планка—Колмогорова
непрерывного марковского процесса за малое время Л/ имеют порядок, не больший p^AZ, 2) проиллюстрировать связь между цепями Маркова и непрерывными марковскими процессами, которые будут подробно рассмотрены в последующих параграфах.
11. Уравнение Фоккера — Планка — Колмогорова
Вывод уравнения Фоккера — Планка — Колмогорова
Вероятность перехода л (A., 11 А.о, Zo), t > t0 непрерывного марковского процесса удовлетворяет следующим уравнениям в частных производных:
Q=------^[a(d ОМ*- 0*о, OI +
ot ок
I д2
+ ОМ*. ZK /0)] (11.1)
---л (*> О *»• 0) = а (*о> О) л (* О h, d) + 01 о ОКц
+ vfc(*o, '|*0. '»)• (11.2)
Л ОЛ/q
Уравнение (1) называется уравнением Фоккера—Планка—Колмогорова или прямым уравнением (поскольку в нем фигурирует производная по конечному моменту времени t> t0), а уравнение (2) называется уравнением Колмогорова или обратным уравнением (так как в него входит производная по начальному моменту времени t0 < t). Такое название оправдано тем, что уравнение (1) для процесса броуновского движения встречалось в работах Фоккера (1914 г.) и Планка (1917 г.). Строгое математическое обоснование (1) было дано А. Н. Колмогоровым; им же впервые было получено уравнение (2) [11.
Получим уравнения (1) и (2). При этом будем предполагать, что все условия, при которых правомерны приводимые ниже математические операции (дифференцирование, интегрирование, существование пределов и т. п.), выполняются.
Для получения прямого уравнения (1) нужно в уравнении Смо-луховского (10.8) взять промежуточный момент времени f близким к конечному моменту времени /, а для получения обратного уравнения (2) — близким к начальному моменту времени tQ. Поскольку все математические выкладки в обоих случаях идентичны, то приведем здесь вывод только уравнения (1).
Вывод уравнения Фоккера — Планка — Колмогорова
117
Запишем уравнение Смолуховского (10.8) в следующем виде: лг(Х, I + А/|Х0, /0) = J л(Х, t + А/|Х', f) л (X', /|Х0, /0) dk',
t + А/ > t to< (11 >3)
где интервал времени А/ предполагается малым.
Введем в рассмотрение условную характеристическую функцию 0 (Й, t + А/1X', /) случайного приращения (X — X') за малое время А/ при условии, что X' фиксировано. По определению характеристической функции имеем
0(й, Z + A/|X', t) = <ехр {/й (А.—А.')} | X', /> =
= F e/2<x-v> л(А., t + А/| k’, t)dk.
Согласно обратному преобразованию Фурье можем написать
ОО
л(Х, /+Д/|Х\ /) = — f e-/Q‘K-v-0(Q,/ + A/|V, t)dQ. (11.4) 2л J
— 00
Путем разложения в ряд Тейлора условную характеристическую функцию можно представить в виде
0 (Q, / + А/1 V, /) = j? тп(К' ’-L (/Й)”, (11.5)
где тп (X', t) = <{Х (/ + А/) — X' (?)}"|А/ (/)> — условные моменты приращения (X — X') за время А/
mn(k', t)= F (X—Х')"л(Х, / + AZ | X', Z)dX.
Если подставить (5) в (4), то получим
л(Х, / +Д/|Х', о=2
mn(V, t) 1
п! 2л
J e-/aa-V)Q-Qyi ^й =
0 . J_ . f e-/Q (%—A.') dQ =
п1 2л J
118
11. Уравнение Фоккера — Планка — Колмогорова
Подставив это выражение в уравнение Смолуховского (3) и выполнив интегрирование с дельта-функцией, получим
л (A, t + bt | А^, /0) = У [тп (А, /) л (A, 11 Ао /0)]
П1 д№ n = Q
ИЛИ
л (А. / +Д/| Аи, /„) — л (А, /|А0, /,,) =
0°
= 2 /)1г(Х> Z|X”’ZJL
n= 1
Поделив обе части этого равенства на AZ и переходя затем к пределу при Д/-* 0, найдем
^-л(А,/|А0,/0)= У LzlT _^_[/(n(A, /)л(А, /|АО,/Й)], (11-7) ot п! длп
где
Kn(A. /) = lim f-L]<{A(/ + A/)-A(/)}4A(/)> =
= 11П1 ( — ) С[А(г + Д/) — А(/)р л (А, Z + ДНА, l)dk. (11.8) ы-*о \ К 1 J
Следует указать, что уравнение (7), при выводе которого была использована лишь формула полной вероятности (10.8), справедливо для любых случайных процессов, для которых существуют коэффициенты Кп (А, /)
Рассмотрим далее один важный, но частный случай полученного уравнения (7), когда первые два «коэффициента» (A, t) и К2 (^» О отличны от нуля, а остальные «коэффициенты» Кп (А, /) при п > 3 равны нулю:
Кп&, 0¥=0, п = 1,2; Кп(К, OsO, п>3. (11.9)
Марковские процессы, удовлетворяющие этим условиям, называются диффузионными.
В дальнейшем будем использовать следующие обозначения:
а (А, /)=К1 (A, /) = lim -L <[А (/+ Д/)-А(^)] | А(/)>, (Ц.Ю) л/-»0 А/
Ь(А, /) = Л2(А, /) = lim -1_<[А(/ + Д/)-А(/)]2 |А(/)>. (11.11) д(-»0 At
Как следует из (8), условие (9) характеризует быстроту уменьшения вероятности больших отклонений с уменьшением Д/: до
Вывод уравнения Фоккера — Планка — Колмогорова
119
пускаются весьма быстрые изменения процесса К (/), но в противоположных направлениях. Поэтому_среднее приращение процесса за малое время Л/ имеет порядок Л/ (см. (10.23)). Конечные скачки процесса появляются с нулевой вероятностью, и все траектории процесса непрерывны с вероятностью единица в обычном смысле [35].
Следовательно, чтобы непрерывный случайный процесс X (f) был марковским диффузионным процессом, необходимо и достаточно, чтобы для него выполнялись условия (9).
Можно доказать следующее утверждение [36]. Для любого непрерывного процесса, если Кп (X, t) <.°о при всех п и если Кп (X, 0 = 0 при некотором четном п, то Кп (X, 0 = 0 для всех п > 3. Этот результат при существовании «коэффициентов» Кп (X, /) позволяет записать условие непрерывности процесса (9) иначе: например, (X, t) = 0.
Для диффузионных марковских процессов уравнение (7) упрощается и переходит в уравнение Фоккера—Планка—Колмогорова (1):
АП(Х, /|ХЭ, /0)= _-L[a(X, 0*(ИМ,)] + д' дк
'о)]- (11.12)
По традиции, связанной с применением уравнения Фоккера— Планка—Колмогорова первоначально в основном для изучения поведения броуновских частиц, «коэффициенты» а (X, 7) и b (X, t) часто называют соответственно коэффициентами сноса и диффузии или локальными характеристиками процесса X (t) (см. § 19). “
Как следует из (10), коэффициент сноса а (X, /) характеризует среднее значение локальной скорости, а коэффициент диффузии b (X, 0 — локальную скорость изменения дисперсии приращения марковского процесса. Коэффициент диффузии не может быть отрицательным: Ь (X, 0 0.
Линейное уравнение в частных производных (12) относится к параболическому типу и для отыскания его решения можно применять обычные методы решения уравнений этого типа [37]. Решение должно удовлетворять обязательным условиям (10.6) и (10.7), т. е. оно должно быть неотрицательным, нормированным к единице и должно удовлетворять начальному условию
я (X, t0 |Х0, t0) — 6 (X — Хо). (11.13)
Решение уравнения Фоккера—Планка (12) для неограниченного пространства при дельтообразном начальном условии (13) называется фундаментальным решением задачи Коши.
120
11. Уравнение Фоккера — Планка — Колмогорова
Если значение марковского процесса X (/) в начальный момент времени /0 не фиксировано, а является случайным и имеет плотность вероятности Ро (X), то в качестве начального условия указывается эта плотность вероятности
Р (X, /0) = Ро (X). (11.14)
При этом одномерную плотность вероятности Р .(X, /) в произвольный момент времени />/0 можно вычислить двумя способами
1. По условию согласованности плотностей вероятностей из (10.9) имеем
Р (X, /) = Р (Хц, /0)л(Х, 11 Хо, /0)А0. (11.15)
— оо
Отсюда видно, что при заданном начальном распределении Ро W для определения Р (X, /) нужно найти фундаментальное решение уравнения (12), определяющее плотность вероятности перехода л (X, /|Х0, /0).
2. Можно сразу искать решение уравнения Фоккера—Планка—Колмогорова для плотности вероятности Р (X, I) с начальным условием (14).
Действительно, умножив (12) на Р (Хо, /0) и проинтегрировав по Хо, с учетом (15) получим
4-Р(х, /)=__! {а(х, /)Р(х, /)] + ±^[б(х,/)Р(Х,/)].
01 дл. 2
(11.16)
Следовательно, одномерная плотность вероятности марковского диффузионного процесса удовлетворяет уравнению Фоккера—Планка—Колмогорова (16). При дельтоообразном начальном распределении плотность вероятности совпадает с плотностью вероятности перехода и соответственно становятся идентичными уравнения (12) и (16). Имея в виду эту некоторую общность уравнения (16), а также то, что для многих задач непосредственный практический интерес представляет именно плотность вероятности Р (X, /), в дальнейшем будем рассматривать в основном уравнение (16).
Уравнение (16) нужно решать при начальном условии (14). Решение должно быть неотрицательным и нормированным к единице
Р(Х, А)>0, Р(Х, /)dX= 1. (11.17)
— ОС
Если рассматриваемый диффузионный процесс X (/) однороден во времени, т. е. плотность вероятности перехода (10.10) зависит
Вывод уравнения Фоккера — Планка — Колмогорова
121
лишь от разности временных аргументов т = t — t0, то коэффициенты а и b не зависят от t и /0. При этом прямое и обратное уравнения (1) и (2) можно записать в виде
-^-л(Х . Хц, т)= — ~ [а(Х)л(Х, Хо, т)] +
+ y~-[Z>(X)n(X, Хо, т)], (11.18)
— л(Х, Хо, т) = а(Х0)—л(Х, Хо, Т) + от дк0
+ тг?(Х°)^Гл(к Х°’ т)< (1119)
Отметим, что если условия (9) не выполняются, т. е. марковский процесс не является диффузионным, то на основании (7), для одномерной плотности вероятности вместо уравнения (16) получим обобщенное уравнение
ос
/)= 2(-1)"-7Г-£г^п(^ t)P(K 0L (11.20) п = 1
где «коэффициенты» Кп (X, 0 определены формулой (8). Этим обобщенным уравнением можно пользоваться при анализе более широкого класса марковских процессов (см. § 24, 25).
Поскольку прямое и обратное уравнения (1) и (2) определяют одну и ту же плотность вероятности перехода марковского процесса л (X, 11Хц, /0), то они не независимы. В частности, дифференциальные выражения в правых частях прямого и обратного уравнений являются взаимно сопряженными [38]. Однако не следует трактовать прямое и обратное уравнения лишь только как взаимно сопряженные операторы.
При решении научно-прикладных задач, в зависимости от конкретной формулировки задачи, применяют прямое или обратнее уравнение Колмогорова. Если нас интересует плотность вероятности непрерывного марковского процесса X (/) при заданной плот-*ности вероятности начальной координаты X (/0) = Хо, то естественно использовать прямое уравнение Колмогорова. Наоборот, если нужно вычислить распределение первого времени достижения фиксированного уровня с как функцию начального состояния Ха, то целесообразно пользоваться обратным уравнением Колмогорова.
В некоторых случаях, когда на поведение процесса X (/) наложены ограничения, может оказаться, что прямое уравнение в обычном виде неприменимо, в то время как обратное уравнение остается в силе. Пусть, например, рассматривается поведение марковского процесса в некотором ограниченном интервале его
122
И. Уравнение Фоккера — Планка — Колмогорова
значений. Допустим, что при достижении блуждающей частицей границы интервала, она остается на границе некоторое случайное время т, имеющее экспоненциальное распределение. Затем частица мгновенно возвращается в некоторую внутреннюю точку А интервала, имеющую известную плотность вероятности, после чего из точки А продолжает обычное блуждание (см. пример 8 § 26).
Описанный процесс со скачкообразным уходом с границы будет марковским. Однако при попытке применения прямого уравнения Колмогорова мы встретимся с трудностью, обусловленной тем, что переходы из одного состояния в другое не являются локальными. В течение малого временного интервала значение А может быть достигнуто не только из какой-либо близко расположенной точки, но также и из точки, расположенной на границе. Именно последнее обстоятельство нарушает непрерывный характер движения и делает неправомерным непосредственное использование прямого уравнения в обычном виде (1). Однако обратное уравнение Колмогорова не изменит своего вида [6].
Для описанного непрерывно-разрывного процесса целесообразно оперировать не с плотностью вероятности перехода л (А, И Ао, /0), а с функцией распределения перехода
х
F (А 11 Ао, t0)= л (А', /' | Ао, /0) d’k'. (Н-21)
—-оо
Интегрируя уравнение (2) по А в пределах от—оо до х и вводя функцию распределения перехода (21), получим, что обратное уравнение сохраняет прежний вид и для функции распределения перехода
---A- F (А, 11 Ао, /в) = а (Ао,‘ Q -±-F(Kt\ Ао, /0) +
I Л2
+ 4^(А0, Q^-F(K 11 A,, /„). (11.22)
Однако аналогичное выражение несправедливо для прямого уравнения.
Граничные условия
Для отыскания решения уравнения Фоккера—Планка—Кол могорова (16), кроме начального условия, нужно указать еще и граничные условия. Граничные условия могут быть весьма разнообразными и определяются существом физической задачи [2, 4, 5].
При формулировке граничных условий и при решении уравнения может оказаться полезной следующая наглядная интерпретация уравнения (16). Будем трактовать вероятность как некую
Граничные условия
123
субстанцию. В частности, плотность вероятности Р (к, t) можно рассматривать как концентрацию (относительное число) частиц в точке к в момент времени t. Поток частиц G вдоль оси к складывается из систематического потока аР, где а — локальная скорость систематического движения, и случайного (диффузионного) потока — т. е.
G(k. t)^a(k. t) Р (к, t)-L_l_[b(k, t)P(k, 0)- (Н-23)
2 дК
Из (16) и (23) следует, что уравнение Фоккера—Планка—Колмогорова представляет собой уравнение непрерывности
4~Р{к. t) + 4-G(X, /) = 0, (11.24)
01 ОК
выражающее сохранение числа частиц.
Взяв достаточно малые приращения ДА и Д/, уравнение (24) можно записать иначе:
Р(Х,<+Д/)-Р(Л,0 G (Л4-ДЛ,/)—0 (А,/) = 0
Л/ ' ДА ~
или
[р (к, I + А/) — Р (А, /)] ДА = [G (А, /) - G (А + ДА, /)1 Ы- (11 -25)
Видно, что приращение вероятности за малый промежуток времени Д/ на элементе фазового пространства ДА равно разности потоков за этот же промежуток времени Д/: приходящего через левое сечение А и выходящего через правое сечение к + ДА (рис. 11.1).
Выражение (25) будем называть законом сохранения вероятности или законом непрерывности. Этот закон позволяет сравнительно легко записывать аналогии уравнения Фоккера—Планка—Колмогорова для различных классов смешанных (дискретно-непрерывных) процессов (см. § 23).
Если случайный процесс А (/) может принимать всевозможные значения от —оо до оо, то уравнение (24) справедливо на всей прямой. В качестве граничных условий при этом следует брать условия на ±°°- Интегрируя (24) по А от —оо до оо и учитывая условие нормировки (17), получаем обязательно выполняющееся равенство
G (—оо, f) = G (оо, /).
Однако, помимо этого равенства, обычно в практических задачах выполняются более сильные условия
G (—оо,/) = G (оо,/) = 0, Р (—оо, t) = Р (оо, /) = 0, (11.26) которые можно назвать нулевыми граничными условиями.
124
11. Уравнение Фоккера — Планка — Колмогорова
В тех случаях, когда функция X (/) принимает ограниченные значения на интервале (с, d), уравнение (16) следует рассматривать лишь в этой области. При этом граничные условия нулевого потока имеют вид
G (с, t) = G (d, t) = 0.
(11.27)
CO„t) t !
.---*- •
Л'Л'+ЛЛ' Л Л+ЛЛ Л" Л'+АЛ” Л
Задание граничных условий в таком виде физически означает, что не допускается поток частиц через границы с, d. Можно считать, что в граничных точках с, d поставлены отра-
жающие экраны, и если части-Рис. ПЛ. К вычислению потока вероятно- Ца ДОСТИГаеТ ЭТИ ЭКраНЫ, ТО ОНЭ сти- зеркально отражается от них.
Поэтому условие (27) можно кратко назвать условием отражающих границ (экранов). Роль отражающего экрана наглядно иллюстрируется рис. 11.2, где изображен один отражающий экран, расположенный в точке К — а.
Рис. 11.2. Влияние отражающей границы на процесс и плотность вероятности.
Конечно, граничные условия могут быть заданы и в другом виде. Например, в граничных точках с, d могут быть расположены поглощающие экраны: частица, достигшая экрана, поглощается им (т. е. остается там навсегда) и исключается из дальнейшего рассмотрения. Поэтому плотность вероятности Р (X, t) должна обращаться в нуль на границах
Р (с, = Р (d, t) = 0.
(11.28)
Это есть условие поглощающих границ (экранов).
Граничные условия
125
Влияние поглощающих экранов на поведение процесса и плотность вероятности схематически изображено на рис. 11.3, на котором показан один поглощающий экран в точке К = с.
Возможен также более общий случай, когда в точках с, d расположены упругие жесткие экраны: часть попавших на них частиц отражается, а остальные поглощаются. В этом случае граничные условия задаются линейной комбинацией условий поглощения и отражения.
Рис. 11.3. Влияние поглощающей границы на процесс и плотность вероятности.
Отметим, что при наличии отражающих или упругих жестких экранов, а также для описанных выше процессов со скачкообразным уходом с границы граничные условия проще задаются для обратного уравнения (2). Формулировка этих граничных условий и некоторые примеры рассматриваются в § 26.
Возможны также различные комбинации трех перечисленных выше границ. Например, в точке с может быть расположен поглощающий экран, а в точке d — отражающий и т. д. Иногда роль граничного условия играет условие периодичности плотности вероятности, например, вида Р (К + 2л, I) = Р (X, f).
Отметим специфическую особенность решения уравнения Фоккера—Планка—Колмогорова (16) при наличии поглощающих границ или упругих жестких экранов. До тех пор, пока частица не коснулась экрана, ее статистическое поведение описывается уравнением (16). Однако с ростом времени все большее и большее число частиц будет «прилипать» к экрану и в пределе при t -> оо практически все частицы окажутся поглощенными экраном, т. е. внутри и на границе имеем lim Р (X, t) = 0. Поэтому нельзя требовать, t ->оо
чтобы решение уравнения Фоккера—Планка—Колмогорова (16) при наличии поглощающих границ (28) или упругих жестких экранов удовлетворяло условию нормировки (17).
126
11. Уравнение Фоккера—Планка—Колмогорова
Однородный диффузионный процесс X (/) называется регулярным, если с положительной вероятностью его траектория покидает любое множество вида {с, а] или [0, d), выхоця через внутренние точки а или р интервала (с, d). Если это происходит с вероятностью единица, процесс !(/) называется возвратным. Диффузионный процесс будет регулярным, если коэффициент диффузии fe(X) не обращается в нуль на интервале (с, d).
Характер границы целиком определяется локальными характеристиками марковского процесса X (/). Введем постоянные
В
АГ \
\^Ldz\dx, J Hz) в )
3
Г 2g (г)
J b (z) 3
I y
, , Р 2a (г) , ,
dz dx exp 1 —— dz dy, J b (z)
3
v
f 2a (г) , ,
| ---— dz dx.
J Hz)
3
(11.29)
Граница с, в зависимости от значений постоянных Llt Lit L3, называется**:
1) естественной, если L} = +00;
2) притягивающей, если Lx < +°°, Л2 = + °°,
3) захватывающей, если Lr < + °о, Г, < +°°, L3 = +00;
4) регулярной, если Ц < Дос, Е2 <; +°°, Ln<Z+°o.
Граничные условия нужно ставить лишь на захватывающей и регулярной границах, а естественные и притягивающие границы являются недостижимыми. На регулярной границе можно задавать все указанные выше граничные условия, а на захватывающей границе лишь поглощение и скачкообразный уход с границы, так как уйти с нее непрерывным образом невозможно.
При правильно сформулированной задаче начальные и граничные условия однозначно определяют плотность вероятности Р (X, /) как решение уравнения Фоккера—Планка— Колмогорова.
*' Подробнее см. Гихман И. И., Скороход А. В. Стохастические дифференциальные уравнения. Киев, «Наукова думка», 1968.
Методы решения
127
12. Методы решения уравнений
Фоккера—Планка — Колмогорова
Так как уравнение Фоккера—Планка—Колмогорова принадлежит к уравнениям параболического типа, то для решения его можно применять известные методы решения уравнений этого типа [371. В дальнейшем мы не будем касаться так называемых сингулярных (вырожденных) диффузионных марковских процессов, требующих специального рассмотрения. Для таких процессов коэффициент b (X, /) исчезает около одной (возможно двух) из границ или же один из коэффициентов а(Х, /) или b (X, t) при X -> оо растет слишком быстро (см. §19).
Применительно к одномерным марковским процессам во многих случаях просто находится стационарная плотность вероятности. Для стационарного состояния плотность вероятности перехода (10.10) зависит только от разности рассматриваемых моментов времени, а коэффициенты а (X) и b (X), определенные формулами (11.10) и (11.11), не зависят от времени t. Одномерная стационарная плотность вероятности Pst (X) = lim Р (к, t), если она существует, !-юе
вообще не зависит от времени t и от начального распределения Ро М- Поэтому в стационарном состоянии dPsi (ty/dt = 0 и, следовательно, G (X) = G = const. При этом уравнение Фоккера— Планка—Колмогорова (11.16) переходит в линейное дифференциальное уравнение для P,t (X):
^-[ft(X)Ps((X))-2a(X)Ps((X) = -2G, (12.1)
ал
для которого хорошо известно общее решение [391: р Л А. у
?«<Х)=Т777ехр 2f ‘Йт£/лг fexp 2 d{/’
MX) J b (x) MX) J J b(x)
V L V J
(12.2)
Здесь произвольная постоянная С определяется из условия нормировки (11.17), а величина потока G находится из граничных условий. В качестве нижнего предела интегрирования X' можно взять любую точку интервала, в котором определен процесс X (/).
При нулевых граничных условиях для потока (G — 0) уравнение упрощается
^tb(X)PM-2a (X) Р„(Х) = 0.
(12.3)
128
12. Методы решения уравнений Фоккера—Планка — Колмогорова
Общее решение
этого уравнения дается выражением
2 f -^-dx
J b (x)
(12.4)
где постоянная С определяется из условия нормировки (11.17). Этой формулой часто пользуются при решении конкретных задач.
Таким образом, определив из уравнения, описывающего поведение системы, коэффициенты а (X) и b (X) по формулам (11.10) и (11.11), в некоторых случаях можно сразу написать выражение для одномерной стационарной плотности вероятности. Это показывает эффективность использования уравнения Фоккера—Планка—Колмогорова.
К сожалению, полное исследование переходных процессов, связанное с решением нестационарного уравнения (11.16), является довольно сложной задачей. Аналитическое решение нестационарного уравнения не удается получить в общем виде, кроме некоторых частных случаев, например, когда
а (X) = р — аХ, b (X) = b = const, а, р = const. (12.5) Такое задание коэффициентов сноса и диффузии соответствует исходному стохастическому дифференциальному уравнению (см. § 19):
d'Kldt = —аХ + Р + п (/).
Здесь п (Z) — нормальный белый шум с нулевым средним значением и корреляционной функцией <п (/) п (I + т)> = бб (т), б (т) — дельта-функция (см. Приложение 111). Отсюда видно, что случайный процесс Х(/) является нормальным и может быть исследован другими методами.
Если коэффициенты сноса и диффузии имеют вид
а(Х)=а1Х + а0, b (X) = б2Х2 + бхХ + Ьо, (12.6) то решениями уравнения (11.16) при нулевых граничных условиях для потока и различных значениях отдельных постоянных коэффициентов являются плотности вероятности Пирсона (см. § 16).
Приведем теперь шесть наиболее часто применяемых методов получения нестационарного решения уравнения Фоккера—Планка-Колмогорова (11.16). Такими методами являются: 1) метод разделения переменных, 2) метод преобразования Лапласа, 3) метод характеристической функции, 4) метод замены независимых переменных, 5) метод гауссова приближения и 6) численные методы.
1. Метод разделения переменных. Его целесообразно применять в тех случаях, когда коэффициенты сноса и диффузии не за-
Метод разделения переменных
129
висят от времени (однородный во времени процесс) и уравнение (11.16) принимает вид
уР(М) = - A[aWp(M] +^^[&(Х)р(М)Ь(12.7)
Будем искать решение в виде произведения двух функций
Р (к, 0 = Л (Х)Т (/), (12.8)
где Л и Т являются функциями только X и t соответственно. Поделив обе части уравнения (7) на (8), будем иметь
F= {“ J?[а (МЛ(*)] + Т 16(МЛ(М1}Л-1 (12'9)
Левая часть равенства (9) зависит только от /, в то время как правая часть зависит только от X. Поэтому обе части равны одной и той же константе, которую обозначим через —у2. Следовательно, из (9) получаем два обыкновенных дифференциальных уравнения
= (12.Ю)
4--^ [Ь (X) Л(X)][а (к) Л (Х)]+у«Л (Х)=0. (12.11)
2 ал2 ал
Простое уравнение первого порядка (10) имеет решение
T(/) = e-v21, (12.12)
а решение линейного уравнения второго порядка (11) может быть найдено известными методами решения обыкновенных дифференциальных уравнений с переменными коэффициентами. Это решение Л (X, А, В, у) зависит от двух произвольных постоянных А и В. Так как уравнение (7) линейное, то общее решение имеет вид
оо _ v2 t
P(K,t)= 2 Л(Х,Лп.Вп,уп)е (12.13)
п— 0
где постоянные Ап, Вп и уп определяются граничными и начальными условиями, которые должны быть заданы для любой рассматриваемой задачи.
Можно показать [2], что если разность потоков G (X, /) через границы равна нулю, то решение (13) можно представить в виде
оо —Vrt
P(X,/) = TOPS/(X)+ 2 Л»(Х) Т-»е , (12.14)
«= 1
5 Зак. 1216
130
12. Методы решения уравнений Фоккера — Планка — Колмогорова
где Лп (А)— собственные функции уравнения (11), соответствующие собственным значениям Тп — постоянные коэффициенты. Функции Лп (Л) ортонормированы с весом -1
*81
Ат (А) Лп (А)
Pst (А)
бтп =
п = т, п =#=т.
(12.15)
1
0
При заданной начальной плотности вероятности Р (А, /(|) = Рп (А) коэффициенты Тп определяются выражением
Т — С ^>о (12 16)
71 J Pst (A) '
Если начальная плотность вероятности является дельтообразной: Ро (А) — б (А — Ао), то решение (13) имеет вид
P(A,/) = n(A,/|A0,Z0) = У An(Ao)An(A)e-v^»-u)| (12.17) n = 0 ₽s' (Хо)
где Ло (А) = Pst (А), у0 = 0.
2. Метод преобразования Лапласа. Смысл применения преобразования Лапласа к уравнению Фоккера—Планка—Колмогорова состоит в том, что при этом «устраняется» временная переменная t и уравнение в частных производных сводится к обыкновенному дифференциальному уравнению. Проиллюстрируем это на примере уравнения (7), предварительно записав его в развернутом виде
- т6 (Х> +<*>— м %+[1 w ~ ' <4 р-
(12.18)
Здесь штрихи обозначают дифференцирование по А.
Обозначим преобразование Лапласа функции Р (А, /) через
P*(A,s) = £{P(A,/)} = J P(A,/)e-s'd/. (12.19)
Применяя правила преобразования Лапласа к уравнению (18), получим
SP*-ро = 4- b (*) (*) - а WI + 1т Ь” -
2 ам ак [2
— а' (А)]Р*
Метод преобразования Лапласа
131
или
1 Р* HD* Г 1 Л
2 Ь (Х) Ж + 1Ь' (Х)~а (X)J + [Т Ь" (Х) + а' (X)“S] Х
ХР* + Ро = 0. (12.20)
Здесь Ро = Ро (X) — начальное значение плотности вероятности (11.14).
Уравнение (20) для определения преобразования Лапласа плотности вероятности является неоднородным обыкновенным дифференциальным уравнением второго порядка. Начальное условие, которому должна удовлетворять плотность вероятности Р(к, /), входит в уравнение. Граничные условия для функции Р перейдут в соответствующие условия для функции Р*, которые нужно учитывать при решении уравнения (20).
После того как решение уравнения (20) найдено, функцию Р (X, /) можно получить согласно теореме обращения, а в некоторых случаях можно воспользоваться таблицами преобразований Лапласа.
Укажем, что в некоторых случаях (например, когда коэффициенты сноса и диффузии имеют вид а (X, /) = Хо0 (/), b (X, /) = аХп0 (/), а = const) целесообразно применять к уравнению Фоккера—Планка-Колмогорова (11.16) преобразование Лапласа по переменной X.
3 . Метод характеристической функции. В некоторых случаях (например, при нахождении фундаментального решения) удается получить упрощение путем перехода в уравнении (11.16) от плотности вероятности Р (X, /) к характеристической функции
0(Й,/) = $ Р(Х,/)е'аМХ. (12.21)
— 00
Обычно это делается следующим образом. После подстановки конкретных значений коэффициентов а(Х, t) и b (X, t) обе части уравнения (11.16) сначала умножаются на ехр (;ЙХ), а затем интегрируются по X в соответствующих пределах или же используют сразу известные правила преобразования Фурье и записывают уравнение (11.16) для характеристической функции. Начальное значение характеристической функции находится подстановкой в (21) вместо Р(X, /) начальной плотности вероятности (11.14). Такой прием выше был назван методом характеристической функции.
4 . Метод замены независимых переменных. Целевое назначение замены независимых переменных заключается в том, что в ряде случаев удается существенно упростить уравнение Фоккера—Планка—Колмогорова, а иногда свести его к простейшему уравнению
132
12. Методы решения уравнений Фоккера — Планка — Колмогорова
(12.22)
диффузии (см. § 14)
дР 1 Р _0
дт 2 д№
При замене независимых переменных затруднительно указать какую-либо единую рецептуру. Рассмотрим два частных случая.
а) Преобразование координаты фазового пространства. Взаимно-однозначным преобразованием
ы=ф(Х) (12.23)
фазового пространства марковский процесс X — К (/) с плотностью вероятности Р (X, t) может быть преобразован в случайный процесс и = и (/), который также будет марковским процессом с плотностью вероятности р (и, f), причем
р(л. /)=Р(ц,/)|^т
(12.24)
В однородном случае, когда коэффициенты сноса а (к, /) =s а (X) и диффузии b (X, /) = b (X) не зависят от времени, при помощи такого преобразования можно перейти от марковского процесса X (/) с произвольными коэффициентами а (X) и b (X) к марковскому процессу и (0 с соответствующими коэффициентами сноса а (и) или диффузии Ь(и), имеющими очень простой вид.
В результате перехода к новой переменной уравнение (7) заменится аналогичным уравнением для плотности вероятности р (и, I) с коэффициентами а и Ь, которые как функции старой переменной имеют вид
а{Х) = а(Х)ф'(Х)+уЬ(Х)ф"(Х); Ь (X) = Ь (X) [ф'(Х)]а. (12.25)
Из первого соотношения (25) следует, что если мы хотим получить процесс с нулевым коэффициентом сноса а (X) = 0, то преобразование (23) должно быть таким, чтобы выполнялось равенство
ф' (X) = ф( (X) = ехр
к
—2 [
J И*')
Хо
(12.26)
Выбирая
ф'(Х) = ф; (X) = b(X)J-'/2, (12.27
получаем процесс и (/) с единичным коэффициентом диффузии 6(Х) = 1.
Итак, однородный марковский процесс при помощи преобразования (26) всегда можно свести к процессу с нулевым коэффици
Метод замены независимых переменных
133
ентом сноса, а при помощи преобразования (27) — к процессу с единичным коэффициентом диффузии,
б) Преобразование координатов и времени. Естественно, что при одновременной замене координаты и времени иногда можно добиться упрощения уравнения Фоккера—Планка—Колмогорова общего вида (11.16). Такая возможность была впервые подмечена и применялась А. Н. Колмогоровым [1].
Перейдем в (11.16) от независимых переменных t и Л к новым переменным т и и путем взаимно-однозначного преобразования
т = ф (/), и = ф (X, /), (12.28)
где ф (/) — непрерывная и нигде не убывающая функция, ф (X, /) — относительно t произвольна, а по X допускает непрерывную производную. При этом
Р(Х, t) = p(u, (12.29)
В результате перехода к новым переменным для плотности вероятности р (и, т) получим уравнение, аналогичное (11.16);
+ т'й’ ^(и>т)рЬ <12-30)
Здесь коэффициенты сноса а (и, т) и диффуЗии b (и, т) определяются равенствами
а (и. г) = [-L b (X. /) + а (Х. /) + ,
4 <р' (О L 2 d\ dt]
~b (и, т) = b (X, /) (12.31)
ф (/) о к J
где X и t в правых частях написанных формул предполагаются выраженными через «ит.
В зависимости от конкретного вида коэффициентов а (X, t) и b (X, t) путем подбора соответствующих преобразований (28) можно получить разные упрощения. Укажем одну замечательную возможность, когда уравнение (11.16) может быть сведено к уравнению чистой диффузии вида (22). Введем обозначения
х(X, /) = 2а (X, t) -^4 - j (*'. 0Г3/2d X',
О
134
12. Методы решения уравнений Фоккера — Планка — Колмогорова
6 (X, /) = Vb (К, t), ^(k,t)=yb (К, t) f Т=у^7ту b v
Q(K t) =
b(Kt) K(Kt) xi(X. t)
R(K,t) =
e (X, t)
e£(X t)
(12.32) x(X, /) x£(X,f)
В приводимых выражениях индекс обозначает дифференцирование по указанной переменной.
Справедлива следующая теорема, доказанная И. Д. Черкасовым (40]. Пусть существуют непрерывные производные би, ей, хи на всей оси X и функции 6, б-1 ограничены. Тогда необходимым и достаточным условием существования преобразования типа (28), переводящего уравнение (11.16) взаимно-однозначно в уравнение (22), является тождественное выполнение равенства D = 0, где
D =
б(Х /) бх (X. /) 6Д(Х./)
е (X, /) е£(Х, /) eu (X, /)
х(Х./) хх(Х, t) xu(XJ)
(12.33)
При выполнении этого тождества искомое преобразование дается формулами
q>G) = ^ехр
— ^Q(X s) б—1 (X, ^)ds
^0
(12.34)
Q (X, s) б-1 (X s) ds
e(X,/)б~’(Х, /) +
ф (X, t) = ехр
( Q (X, s) б-1 (X. s) ds
I
R (X, t>) б-1 (X, t>) dv.
Нетрудно, йапример, убедиться, что условия теоремы выполняются в частном случае, рассмотренном в (1], когда
а (X, /) = а (/) X + р (/); b (X, t) = с (t). (12.35)
При этом преобразования (28) должны иметь вид
t
<₽(/)= С-1 Go) $ С (и) ехр te.
V
— 2 a (s) ds
^0
dv,
ф(Х,/) = с-1/2(/о)Х х
хехр
I
— ^a(s)ds
—с-1/2 Go) J р (и) ехр
*0
dv. (12.36)
Гауссово приближение
135
Полагая в (35) коэффициент a = из (36) получаем формулы преобразования, позволяющего свести уравнение Фоккера— Планка—Колмогорова к чисто диффузионному уравнению (22) для однородных по координате процессов, коэффициенты сноса и диффузии которых зависят только от времени (процессы типа Ба-шелье).
Можно убедиться [1], что при
а (X, t) = а (/) (X — с0), b (X, /) = ₽ (/) (X — с0)2 (12.37) формулы перехода к новым переменным будут иметь вид
Ф (/) = f р (/) dt, ф (X, /) = In (К - с0) + J [р (/) -
— а (/)] dt. (12.38)
В некоторых случаях оказывается полезной замена самой искомой функции, т. е. переход в уравнении (7) от Р (X, t) к другой функции, например, z (X, t) = In Р (X, t) (см. § 18).
5. Гауссово приближение. Кроме перечисленных четырех строгих методов решения уравнения Фоккера—Планка—Колмогорова, применяются различные приближенные приемы. Укажем здесь один из таких приближенных способов решения. В некоторых задачах на основании физических соображений можно заранее ожидать определенный вид плотности вероятности Р (X, /). При некоторых условиях плотность вероятности Р (X, /), являющаяся решением уравнения (11-16), является нормальной или близкой к ней.
Нормальная плотность вероятности
n/. 1 ( (Х(/) - ть(/)Р 1 ,1O,Q.
Р (X, t) = '>.4—-г—. ехр 1--------- (12.39)
' ’ yinDK(t) 2DJ/) / '
определяется двумя параметрами: математическим ожиданием тк (/) = <Х (/)> и дисперсией Da (0 = <[Х (t) — (/)F>.
При выполнении условий (5) нормальная плотность вероятности является точным решением уравнения (11.16) для неограниченного пространства.
С учетом сказанного иногда применяется следующий способ (так называемое гауссово приближение). Разложим коэффициенты а (X) и b (X) в ряд Тейлора в окрестности точки /па и ограничимся первыми членами разложения
а (X) « а (тк) + a' (wa) (X — wa), b (X) ж b (12.40)
Подставив выражения (39) и (40) в уравнение (11.16) и приравняв члены при одинаковых степенях разности (X — т^), получим систему из двух обыкновенных дифференциальных уравнений для определения параметров т\ (/) и Da (/):
dmiJdt = а (тк); dDJdt = 2Dx.a' (тх) + b (wa). (12.41)
136
12. Методы решения уравнений Фоккера— Планка — Колмогорова
Начальные значения тк (/0) и Dk (/о), необходимые для решения системы, легко вычисляются по заданной начальной плотности вероятности Р (X, /0) = Ро (X). Найдя тк (/) и Dk (f) из этой системы и подставив их в (39), получим решение уравнения (11.16) в гауссовом приближении.
Отметим, что описанное гауссово приближение следует рассматривать как один из приемов, позволяющих получить из основного сложного дифференциального уравнения в частных производных (11.16) систему из двух сравнительно простых обыкновенных дифференциальных уравнений (41). Разумеется, что вместо гауссовой плотности вероятности (39) можно задаваться и другими видами плотностей вероятностей, соответствующих ожидаемому физическому результату.
В заключение получим более точные уравнения, чем (41), для определения математического ожидания тк (/) и дисперсии Dk (/) марковского диффузионного процесса X (/), заданного уравнением (11.16) [41]. Вычисление этих характеристик на выходе нелинейных инерционных систем представляет самостоятельный интерес вне связи с гауссовым приближением.
По определению,
/Пх(о= J ХР(Х, t)dt. (12.42)
— оо
Умножая обе части уравнения (11.16) на X и интегрируя результат по X, можем написать
X—dX= - j xA[a(XJ)P(X./)]dX4-— со —- оо
оо
+ Т J х (Х’ ° Р (Х'/)] (12-43)
— оо
Считая, что в левой части этого равенства допустима перемена порядка интегрирования и дифференцирования, имеем
j rfX A J XP(M)dX=-^-mx(0. (12.44)
— оо — оо
Интегралы в правой части равенства (43) находим интегрированием по частям
ОО оо
-J х£ [а (X,/)Р (X,/)] JX + у J X^-[6(X,/)P(X,/)]dX = — оо — оо
Гауссово приближение
137
= —ta(M)P(M) | + J a (X, t) P (X, t) dK +
A>= — oo — oo
00 00
+4-^4-[б(М)/чм)1 I I .
Z OK I z
X= — oo \=— oo
Предположим, что выполняются следующие граничные условия:
Ka(K,t) P(K,t) У =0,
\= —00
^~[b(K,t)P(K,t)] 7=0, b(K,t)P(K,t) | =0. (12.45)
оЛ | I
— 00 Х.= —оо
Тогда из (43) получим
-^-mx(0= \ a(K,t)P(K,t)dK = <.a(K.i)>. (12.46)
oi J
— оо
Данное уравнение при выполнении условий (45) является точным. К сожалению, этим уравнением невозможно пока воспользоваться, так как неизвестна плотность вероятности Р (К, /) и поэтому нельзя найти среднее значение коэффициента сноса (а (К, f) >. Можно получить приближенное выражение, раскладывая а (К, t) в ряд Тейлора в окрестности значения тх (/) и ограничиваясь членами до второго порядка включительно:
да (mr t) i(K,t)7ti 4---------[Х(/)~m (/)] +
дтк
cP о (тх> t)
л а ’ - [X (/)—тх(/)]2. о/п£
(12.47)
Беря математическое ожидание от обеих частей этого равенства, получим 1 д2а (т^ t) „ „
<а (К, /)> « а (тк, t) +^- , Dx (/). (12.48)
2 ornfc
Отметим, что если в разложении (47) учитывать члены более высокого порядка, то в правую часть (48) войдут третий, четвертый и другие центральные моменты.
1.38
12. Методы решения уравнений Фоккера — Планка — Колмогорова
Подставив (48) в (46), приходим к окончательному приближенному дифференциальному уравнению для математического ожидания
= а t)+~DK (t). (12.49)
dt 2
Если в правой части разложения (47) учесть только первые два члена (линейная аппроксимация), то для математического ожидания можно получить уравнение
= /), (12.50)
а>
совпадающее с первым уравнением системы (41). Если коэффициент сноса имеет вид а (X, /) = A (I) X (/) (система линейная), то уравнение (50) является точным. Естественно, что для линейной системы математическое ожидание процесса не зависит от его дисперсии.
Возвратимся к основному уравнению (49). В него входит неизвестная пока дисперсия процесса Щ (/). Чтобы получить уравнения для дисперсии, умножим обе части уравнения (11.16) на (X — (Z)]2 и затем проинтегрируем по X:
оо
[X-mx(0]2-^(M)dX=- f X
от - J
— 00 —оо
оо
*4 [a(X,/)P(X,/)]dX + 4- f [X-mx(/)j2~[6(X /)Р(Х /)]Л.
оЛ I J
—- ОО ’
(12.51) В левой части этого равенства «поменяем местами» порядок интегрирования и дифференцирования, а в правой части применим интегрирование по частям к первому интегралу один раз, а ко второму дважды. В результате получим
[X — mK(t)]2P(Kt)dX= -[X—mx(/)j2a(X, j° +
—oo 00
+ 2 J [X-mK(P)]a(^,t)P(Kt)dK + ±- [X—mx(/)j2 X —• 00
Х^[6(МИ(М1 °| -[л-тх(/)]Ь(л,/) P(X, t) J + — OO “JO
+ J b(K,t)P(K,t)dX.
д f dl J
Гауссово приближение
139
Предположим, как и ранее, что три явных слагаемых в правой части этого равенства при X = ±оо обращаются в нуль. Тогда можем написать
00 00
Л £)>.(/) =2 j [X — mx(/)]a(X, t)P(k, t)dk + J b (X, t) P (X, /) dk «—00 — 00
(12.52) или
— Dx(/) = 2 <[X-rnx(m a (X, /)>+<£ (X /)>. (12.53)
at
Хотя это дифференциальное уравнение является точным, однако им практически нельзя воспользоваться, так как неизвестны средние значения, входящие в правую часть (53). Для получения замкнутой системы дифференциальных уравнений применим следующие разложения коэффициентов сноса и диффузии в ряд Тейлора в окрестности тк (t):
да (т, I)
а (X, 0 « а (тк, t) -1-— [X— тк (01,
дтк
, . , , db (т-. t) 1 д1 Ь (т» /)
b (к, /) « b (тк, t) + — х--- [X- тк (01 + 4-X
дтк 2 дт^
Х[к-тк(1)]2.
Подстановка этих выражений в (53) приводит к следующему окончательному результату:
л да (т, t)
JL Dk = 2 ' х’ Dk (0 + b (тк, t) +
at дт^
I д2 b (пи I) Л %
+ г (12.54)
2 дт{
Отметим, что если в разложении коэффициента диффузии отбросить квадратичный член, то вместе (54) получим уравнение
^-Dk(() = 2^^-DK(t) + b(mK,t), (12.55) ai дт^
совпадающее со вторым уравнением системы (41).
Следовательно, система дифференциальных уравнений (41) получается из уравнения Фоккера—Планка—Колмогорова (11.16) при линейной аппроксимации коэффициентов сноса и диффузии в окрестности текущего значения математического ожидания
140
12. Методы решения уравнений Фоккера — Планка — Колмогорова
т\ (/). Очевидно, что система уравнений (41) является точной лишь для линейного стохастического дифференциального уравнения вида
«('МО.О-'МОх dt от^
да (пи (t), t) о
X—' +irb(jnK(t),t)n(t) , (/) No
где n (1) — нормальный белый шум (см. § 14).
Замкнутая система из двух обыкновенных дифференциальных уравнений первого порядка (49), (54): dnu 1 дг а (пи t)
+4-—^ dt 2 дт^
2 -^—a(mK, t) + -L-JL b(mK, t) DK(t)+ b(mK, t)
dDK (') dt
(12.56)
из уравнения (11.16) при аппроксимации коэффициен-диффузии с учетом не только линейных, но и квадратич-
получается тов сноса и ных членов разложения и поэтому является более точной, чем (41).
Система уравнений (56) должна решаться при начальных условиях
co
тк((0) = XP(X,
—- oo
oo
DM= J [K-mK(t0)]2P(Kt0)dX. — oo
(12.57)
6. Численные методы. В тех случаях, когда перечисленные пять методов не позволяют решить уравнение (11.16) с соответствующими начальными и граничными условиями, для получения решения можно воспользоваться численными методами, которые достаточно просто реализуются на современных ЦВМ [42—44).
Пусть требуется найти решение уравнения (11.16) с начальным условием (11.14) и граничными условиями (11.28). Для получения приближенного решения этой задачи численными методами рассмотрим прямоугольную сетку узлов, образуемую точками пересечения двух семейств параллельных прямых:
X = с + ih (7 = 0, 1, ..., Л/; N = (d — с)/А), / = /I
и = 0, 1, ...).
Численные методы
141
Узлы, лежащие на прямых X = с; X = d; t = 0, будем называть граничными узлами, все остальные — внутренними. Для каждого внутреннего узла (i, /) запишем разностное уравнение, аппроксимирующее с некоторой точностью уравнение (11.16). Предварительно заметим, что уравнение (11.16) можно записать в виде
= /) +
di 2 дм
+ <)]~Р&, 0 +
[ дХ J дХ
[ 2 ол£ оК
(12.58)
При построении конечно-разностной аппроксимации производные в уравнении (58) можно заменить разностными отношениями различным образом и возможные комбинации этих способов весьма многочисленны [44]. Ограничимся случаем, когда производные дР/дк и d^P/dtf в узле (i, /) заменяются центральными разностными отношениями
дР Pi+i,j-Pt-i,j Pi+i,
дк ~ 2й ’ д№ ~ Л2
где Plt j = Р (с 4- ih, jl).
Производную dPIdt заменим разностным отношением вперед dP/dt^(P^}+1-Plij')ll. (12.60)
Подставив (59) и (60) в (58), получим
Pi, 1+1 ~ai. }Pt+i, > + Pi, jPt, > + Yi, } Pi-i, i (/>0), (12.61)
где
T(X. ')]• (12.62)
Разностное уравнение (61) содержит значения решения в четырех узлах, изображенных на рис. 12.1, и аппроксимирует уравнение (58) с точностью до О (I + /г2).
Из начального условия (11.14) и граничных условий (11.28) следует
Pi, о = Ро (с+ ih), (12.63)
Po./^Pn, / = о. (12.64)
142
12. Методы решения уравнений Фоккера — Планка — Колмогорова
Соотношения (61)—(64) в совокупности образуют явную разностную схему, которая очень удобна для выполнения вычислений на ЦВМ. Действительно, так как из начальных условий (63) известны значения решения в узлах начального слоя (/ = 0), то по ним из (61) легко находятся значения решения во внутренних узлах первого слоя (/ = 1), затем с учетом (64) второго слоя (/ = 2) и т. д.
Рис. 12.1. Явная разностная схема для шаблона из четырех узлов.
Рис. 12.2. Неявная разностная схема для шаблона из четырех узлов.
Следовательно, соотношение (61) дает явное выражение решения в слое / + 1 через найденные значения решения в слое j.
Практическое применение явных разностных схем наталкивается на необходимость выполнения специальных условий устойчивости. Для определения понятия устойчивости разностной схемы предположим, что значения функций в граничных узлах вычислены точно. Предположим далее, что при отыскании решения разностных уравнений (61) погрешность допущена на р-м слое, а до этого слоя и дальше вычисления проводились точно. За счет погрешности на р-м слое мы получим добавок О',-; к точному решению разностной схемы. Без ограничения общности можно считать, что погрешность допущена на начальном слое. Тогда ошибки О,; будут являться решением той же самой системы уранений, причем значения их в граничных узлах, лежащих на прямых Х~с и X, = d, равны нулю, а значения в граничных узлах начального слоя равны допущенным погрешностям. Разностная схема называется устойчивой, если для всякого е > 0 найдется такое 6 > 0, что как только
N-1
1=1 то будет иметь место неравенство N-1
2 Ом <8
Z=1
Численные методы
ИЗ
для любого / (/7^ Т), причем б не зависит от А и I. Фактически устойчивость характеризует непрерывную зависимость решения разностной схемы от начальных значений, которая обеспечивает убывание случайно допущенной погрешности при проведении дальнейших расчетов. Поэтому этот тип устойчивости еще называют устойчивостью по начальным значениям.
Можно показать [43, 44], что явная разностная схема (61)—(64) устойчива, если в рассматриваемой области выполняются неравенства
b (X, /) > О, IW < Mb (X, f). (12.65)
Из второго неравенства (65) следует, что явная разностная схема требует применения очень мелкого шага I по времени, т. е. если нужно найти решение на конечном отрезке изменения /, то количество слоев j должно быть достаточно большим. Кроме этого, если в процессе вычислений нужно уменьшить шаг h по координате X, то нельзя этого сделать, не уменьшая I.
От этого недостатка свободны неявные разностные схемы, одна из которых получится, если вместо (60) для аппроксимации dPIdt воспользоваться разностным отношением назад
dP'dt « (Pi j - Pit (12.66)
В этом случае аналогично (61) получим
Pi,j-1= —ai. ) ^i+1, i + ^i. } — Vi, j Pl-l, 1 (12.67)
где
d(X, /) = 1 +—— b(k r) — / —7—6 (X, t)----—a (X, /)! .
(12.68)
Разностное уравнение (67) содержит значения решения в четырех узлах, изображенных на рис. 12.2, и также аппроксимирует уравнение (58) с точностью до О (I + /г2). Для отыскания значений решения в узлах р-го слоя при известных значениях в узлах предыдущего слоя в этом случае приходится решать систему алгебраических уравнений (67) ври i = 1, N — 1 с большим числом неизвестных. Широкое применение неявных разностных схем на практике оправдывается тем, что они всегда устойчивы [42—44]. Поэтому выбор значений шагов I и h определяется лишь необходимой точностью вычислений и способом решения системы алгебраических уравнений.
Для решения разностных уравнений (67) с граничными условиями (64) можно воспользоваться методом прогонки [42]. Суть
144
12. Методы решения уравнений Фоккера—Планка—Колмогорова
этого метода состоит в следующем. Рассмотрим трехточечное разностное уравнение
JV-1 (12.69)
с граничными условиями
Уч = Xif/1 + yN = 4- v2. (12.70)
Здесь Ait В,, Ct, Dt, xt, x2, vn v2 — известные числа, yt — неизвестные значения искомого решения. Очевидно, что разностное уравнение (67) с граничными условиями (64) при фиксированном / является частным случаем (69) и (70).
Будем искать решение уравнения (69) в том же виде, в котором заданы граничные условия (70), т. е. в виде
yt = Ei+1y(+1+Fl+v i = 0, tf-1, (12.71)
где Е[+1, Fi+l — неизвестные пока коэффициенты.
Подставляя (71) и следующее из (71) соотношение
Z/t-i ~ Bt (Ei+lyl+l + Ft+1) + Ft
в уравнение (69), получаем
[£i+1 (EtAi - BA + CJ yt+l + (EtAi - BA Fl+, + FtAi + Dt = 0.
Отсюда видно, что равенство (69) будет выполнено, если потребовать
Et+1 (BiAi — BA + Ci — 0, (EtAi — Bt) Fi+l + AtFi + Di = 0.
Таким образом мы получим рекуррентные соотношения для определения прогоночных коэффициентов Ег+1 и Ft р _____________б;_____ р _____ Aj Fj~)~ Dj
1+1 ~ Bi-AiEi ’ 1+1 ~ Bi—AiEi
i=l, N— 1.
Величины Ег и F± определяются из (71) и граничного условия (70) при i = 0:
Bi = Xj, Ft = vP
Значение yN, необходимое для начала счета по формулам (71), получается из (71) и граничного условия (70) при i = N —1: yN = (va И' — ^BN).
Численные методы
145
Итак, решение краевой задачи (69), (70) может быть получено при помощи алгоритма
Е — —_ i+1“ Bt-AtEt '
t+1==-A^i+Di , i=l, jV-l, 1+1 Bt-AiEi
Ej = Ki, = vb
l/i = Ei+1i//+1 + Ff+1 (j = /V —1, 1), lXv = (v2 4* XjE^y).
(12.72)
Этот способ решения разностных уравнений (69) получил название метода прогонки. Согласно алгоритму (72) сначала определяются значения коэффициентов прогонки Ei+1 и Fi+1 при i = = 1, N — 1, т. е. совершается прогонка вперед, а затем находятся значения yt при i = N — 1, 1.
Формулы прогонки (72) называются устойчивыми, если коэффициенты Et не превосходят по абсолютной величине единицы. В этом случае ошибки округления, возникающие в процессе вычислений по формуле (71), не будут возрастать.
Условия
Дг>0, Сг>0, Bi > At 4- Cit 0<х,<1, j = 1,2
(12.73) обеспечивают устойчивость формул прогонки (72).
Действительно, если Ех = xt < 1 и 0 Et < 1, то
0 < £ —_____________£1__________<-- 1
i+1 (Вг-4г-Сг) + Сг+(1-£г) At
Возвращаясь к неявной разностной схеме (67), (63) и (64), на основании (62) и (68) можно показать, что выбором достаточно малых значений I и h условия (73) всегда могут быть выполнены при b (X, t) > 0. В том случае, когда выполнение условий (73) потребует меньших значений шагов, чем выполнение неравенств (65), для решения линейной системы алгебраических уравнений (67) при i = 1, N — 1 можно воспользоваться каким-либо другим методом [42].
Если требуется найти решение уравнения (11.16) с другими граничными условиями, то в приведенных разностных схемах изменится только (64). Так, например, при решении (11.16) с граничными условиями (11.27) они сами должны быть аппроксимированы разностными соотношениями. При этом следует стремиться использовать аппроксимации, которые не ухудшают общей точности разностной схемы.
146
13. Многомерные марковские процессы
Отметим, что замена точных значений решения в граничных узлах приближенными приводит к проблеме обеспечения устойчивости по граничным значениям [42]. Для повышения устойчивости счета во всех случаях целесообразно использовать выполнение условия нормировки в каждом слое, если оно имеет место в рассматриваемой задаче.
Использование численных методов для нахождения плотности вероятности перехода, т. е. для решения уравнения (11.12) с начальным условием (11,13) и соответствующими граничными условиями, имеет специфические особенности, связанные с заданием значений решения на начальном слое. В этом случае решение уравнения (11.12) методом сеток начинают со слоя, отстоящего от начального на некотором расстоянии Д/. На интервале (О, Д/) используется гауссово приближение, которое при малых Д/ согласно асимптотическому представлению 6-функции (см. (III—7)) выполняется достаточно точно. Таким образом, вместо (11.13) будем иметь
л (X, | X.j, 0) = —_ ехр
l/2n.Dx (Д')
(12.7<)
Значения тк (Д/) и Dk (Л/) находятся из решения уравнений (56) с начальными условиями тк (0) = Хо и Dk (0) = 0.
13. Многомерные марковские процессы
Уравнение Фоккера — Планка — Колмогорова
Предположим, что состояние системы в некоторый момент времени описывается совокупностью М случайных функций Х4 (/)(г = 1, Л1), т. е. случайным вектором k(t) — {Хх (/), Хдл (Z)} в М-мерном пространстве. Компонентами X,- (/) случайного вектора 1 (/) могут быть координаты системы или же часть из них представляют координаты системы, а остальные — скорости (см. ниже).
Векторный случайный процесс X (/) определяется абсолютными плотностями вероятностей Рп+1 (Хо, ..., Хп, /0, ..., /„), через которые могут быть выражены условные плотности вероятностей (плотности вероятностей перехода)
п(^п> Zn~!;...; Хь Хо, t0) =
__ РД-Ц (Хд, . . , ХП, /р, , /д) . . Q . ,
Рп (Хо> • • • > Xn_ j, t0,, tn_L)
Уравнение Фоккера—Планка—Колмогорова
147
Многомерный марковский процесс определяется точно так же, пак и одномерный марковский процесс (см. § 10). Для этого нужно в формулах (Ю.1)—(10.10) формально заменить скалярную случайную функцию X (t) на векторную X (/). В многомерном случае плотность вероятности перехода л (X, /| X', /') характеризует вероятность перехода из точки X' = {X', ..., Х^} в область X + d’k — = {Xj + dXb Хм + dkM} за промежуток времени t — t' > Q.
Повторив рассуждения § 11, можно убедиться, что одномерная плотность вероятности Р (X, /) и плотность вероятности перехода п(Ъ, г^Хо, /0) многомерного диффузионного марковского процесса X (/) удовлетворяют прямому и обратному уравнениям Колмогорова. Применительно к плотности вероятности Р (X, /) прямое уравнение (многомерное уравнение Фоккера—Планка—Колмогорова) имеет вид
, м л
~Р(К /)=- V -^-IMX. t)P(K 01 +
UI 0fy
1 М
+4 у <13-2>
2 Okj
f = 1
Коэффициенты at (X, t) и bi} (X, t) этого уравнения определяются формулами
а,(Х, /) = lim ('J-V[Xi(/ + A/)-Xi(01|X(0>, . д(-»о \ А/ /
&О.(Х, /) = lim |-М <[Х,-(/ + А/)-Х1(/)][Х;(/ + А/)-ХД/))|Х(/)>. д;->а \ ы )
(13.3)
Можно показать, что если X (/) — М-компонентный марковский случайный процесс, имеющий почти все траектории непрерывными и удовлетворяющий условиям (3), где аг (X, t), Ьц (X, t) —функции непрерывные вместе со своими производными, и квадратичная м
форма У, bij (X, f) ХгХ;— неотрицательно определенная, то для про-<, /= I
цесса X (t) существует плотность вероятности Р (X, /), удовлетворяющая уравнению (2). Марковские процессы, для которых выполняются указанные условия, называют диффузионными.
Естественно, что решение уравнения (2) и формулировка граничных условий являются существенно более сложными задачами, чем в одномерном случае. Укажем здесь один частный случай, для которого можно записать выражение стационарной плотности вероятности Pst (X) [2).
I 48
13. Многомерные марковские процессы
Совокупность коэффициентов bi} (X, /) образует матрицу диффузии В = Пусть отличны от нуля и равны друг другу лишь диагональные элементы матрицы
btj = b&i}, (13.4)
где — 1 при i — j и 8i} = 0 при i j. При этом условии диффузионное движение по всем координатам Хг протекает одинаково, и поэтому условие (4) можно назвать условием диффузионной изотропности.
При выполнении условия (4) многомерное уравнение Фоккера— Планка—Колмогорова можно записать иначе
м
дР (X, I) ______ dGi (А., /)
a.
(13.3)
где Gi (X, t) — составляющие вектора потока в Л4-мерном пространстве
Gt(K. t) = at(‘k, t)P(k t)--0P(X./)]. (13.6)
2 5л,-
Из (5) видно, что стационарная плотность вероятности (если она существует) удовлетворяет уравнению
м а
£_2_0,(Х. ,) = ». <13.7)
Допустим, что для всех i = 1, Л-f выполняется условие
t) Psi (X)—L -4" 0 Pst (MJ -= 0. (13.8)
2 oki
Полагая здесь
b (X, /) Psi (X) = ехр [—U (X, 0J, (13.9)
получаем
dU (X, /)/дХ, = —2а, (X, /)/6 (X, t).
Отсюда следует, что должны выполняться равенства
(13.10)
d\t Ь (X, /) ) дК, \ Ь(Х. О )
т. е. составляющие at (X, t)/b (X, t), i = 1, M являются компонентами градиента некоторой функции U (X, t), называемой потенциальной или потенциалом. Поэтому рассматриваемый случай (8) можно назвать потенциальным случаем.
Уравнение Фоккера—Планка—Колмогорова
149
Известно, что вычисление потенциала поля в прямоугольных координатах равносильно нахождению функции U (X, t) по ее полному дифференциалу
d[/ = ^LdX1 + ... +J^Xm. оЛ1 дкм
Отсюда следует, что функция U (X, t) определяется контурным интегралом
U (К t) =
(М..... *м)
= —2 С ————[«! (Хр..., Хм, t) + ... +
J b (Aa,...,
+ Qm (Xj,..., Хм)<^Хм]4-С. (13.11)
Здесь С — аддитивная произвольная постоянная, v = (vn ..., vm) — произвольная «начальная» точка, принадлежащая рассматриваемой области.
На основании (9) стационарная плотность вероятности равна
Pst^i...... Хм) = —--— ехр[ —£/(Хх........ Хм. 01- (13.12)
6 (*-1.Лм> О
Входящая сюда произвольная постоянная С определяется (выражается через координаты начальной точки v) согласно условию нормировки
У ... fPei (Xt.Хм) dX, ... (/Хм = 1. (13.13)
Конкретные примеры многомерных марковских процессов будут рассмотрены в § 18 и 20. Приведем здесь лишь иллюстративный пример.
Пример 1. Диффузионно-изотропный двумерный марковский процесс.
Пусть двухкомпонентный марковский процесс X (/) = {Хг (/), Х2 (/)} задан дифференциальными уравнениями
dKJdt = Л (Хх, X,) + «j (/), d^/dt = f2 (Xj, Х2) + п2 (/), (13.14)
где fi и /2 — детерминированные функции своих аргументов, (/) и п2 (/) — взаимонезависимые белые шумы, имеющие нулевые средние значения и одинаковые дельта-функции корреляции
& (^1> /2) ~ (^1) (^2)) = (rt2 (/j) п2 (^2)> = Л/о6 (/2 — /1)/2.
(13.ИХ
150
13. Многомерные марковские процессы
Уравнение Фоккера—Планка—Колмогорова для системы (14) имеет вид
дР(^ М = --(Л Р)-(/аР) +
д2 р \
дЦ J ’
(13.16)
В данном примере условия (4), (10) выполнены. Введем потенциальную функцию U (Хп Х2) при помощи соотношений
dU/d^ = —К (Xv Х2), dU/fot = —f2 (Х1( Х2). (13.17)
Стационарное решение уравнения (16), удовлетворяющее естественному условию исчезновения плотности вероятности на бесконечности, как это следует из (12) и как легко убедиться непосредственной подстановкой, дается выражением
Р(Х1, Х.2) = С ехр
4“^’ М],
(13.18)
где С — нормировочный множитель.
Граничные условия
Аналогично одномерному случаю решение многомерного уравнения Фоккера—Планка—Колмогорова (2) ищется при начальных условиях
Р (X, 0) = Ро(Х) (13.19)
или
Л!
qX0J0) = 6(X-X0)= п 6(Х/-Х/П). (13.20)
<= 1
Граничные условия также могут быть весьма разнообразными и определяются существом физической задачи 12, 17, 102].
В общем случае составляющие вектора потока G (X, /) в некоторой точке X равны
G^X, t) = ai(K, t)P(K, t) —
, м я ___
---О 5 W 01. i=l, М. (13.21) 2 ОЛ у
Если векторный случайный процесс X (1) может принимать всевозможные значения (—оо <С X, < оо, i — 1, М), то аналогично (11.26) обычно выполняются граничные условия
G(-oo, 0 = G(oo, 0 = 0, P(M)Li=±„=0 (i=Uf)-
(13.22)
Граничные условия
151
Отметим, что при М > 1 поток вероятности G стационарного распределения не обязательно обращается в нуль внутри области существования X (t) при выполнении граничных условий (22), так как могут иметь место вихревые перемещения вероятности [2]. Это существенно усложняет отыскание стационарного решения уравнения (2).
Рассмотрим некоторую замкнутую область Q многомерного пространства, которая имеет границу Г. Выделим из Г регулярную часть границы Г, через которую траектории марковского процесса X (/) в принципе могут выйти из области Q (см. § 27). По определению [102, 103], точка принадлежит регулярной части границы X f Г, если выполняется одно из следующих условий:
1) Матрица диффузии В = [Ь,> (X, /)] не вырождена в направлении, нормальном к границе, т. е.
м
в,= 2 ^(Х OWWO. (13.23)
Z, / =1
Здесь /г (X) (/ — 1, Л1) — направляющие косинусы внешней нормали 1 (X) к границе области Q.
2) Матрица диффузии вырождена в направлении внешней нормали к границе В, = 0, но выполняется условие
М Г | М Лк А 3
2 |мх, о-у 2 (13,24)
Обозначив через Гх часть границы Г области Q, на которой выполняется условие (23), а через часть границы Г, на которой выполняется условие (24), можно написать
(13.25)
Фазовые траектории недифференцируемы по направлению нормали к границе Гр Поэтому приближаясь к границе Гр траектории случайного процесса пересекают ее бесчисленное множество раз. На границе Г? движение по дифференцируемой траектории определяется однозначно и направлено из области Q (см. § 27).
Войти внутрь области Q извне можно через границу Г*, которая в общем случае состоит из двух частей
Г* = Г1иГ2“. (13.26)
Точка X принадлежит границе TJ, если в этой точке матрица диффузии вырождена в направлении внешней нормали к границе и выполняется условие
i °,(«..о-4-i ‘’Х0 '<«>• <1з-27>
152
13, Многомерные марковские процессы
На границе Гг направление движения по траекториям внутрь об-ласти Q также определяется однозначно. Следовательно, на границах Гг и Гг не может происходить мгновенное упругое отражение в той же точке (см. § 11).
В общем случае возможными типами поведения диффундирующей частицы на границе области являются поглощение, отражение, скачкообразный уход с границ, диффузия по границе, остановка и их различные комбинации [17]. Слово «комбинация» означает просто линейную комбинацию соответствующих граничных условий, но вероятностный смысл такого комбинирования совсем не прост. Каждому типу граничных условий соответствует определенный процесс, происходящий на границе. Он определен на случайном множестве моментов времени, в которые частица находится на границе (вообще говоря, это множество не содержит никакого интервала). Изучение граничных процессов можно поэтому рассматривать как одну из задач еще не построенной общей теории многомерных марковских процессов со случайной областью определения. Учитывая это обстоятельство, ограничимся рассмотрением граничных условий для двух типов физических задач.
К первому типу относятся задачи, в которых в любой момент времени 0 t < сю траектория многомерного процесса X (^(диффундирующая частица) находится в области й. Попадая на границу, частица либо отражается в той же точке, либо мгновенно переносится в другую точку границы и продолжает движение внутрь области (для наглядности можно представить броуновское движение молекул газа в ограниченном объеме, работу систем автоматического поиска полезного сигнала и т. п.). Общая запись граничных условий для уравнения (2) в этих задачах имеет вид
Gi t) |кег* = —$ л (к ,/| k') G( (V, t) dk'. (13.28) г
Здесь Gj (k, f) = (G, 1) — нормальная составляющая вектора потока на границе, л (к, /|к')— плотность вероятности перехода частицы из точки к' границы Г в точку X границы Г*. Эта плотность определяется существом физической задачи и удовлетворяет условию нормировки
л (к, t |k')dk = 1. (13.29)
г*
Условие мгновенного отражения в той же точке, которое может задаваться только на границе Гь следует из (28) в частном случае при л (X, /|к') = 6 (к — к'). Аналогично (11.27) это условие записывается в виде
G;(k, 0 = 0,
к £ ГХ.
(13.30)
Граничные условия
153
Отметим, что граничное условие (28) не исключает поток вероятности вдоль границы области Q.
Ко второму типу относятся задачи, связанные с достижением границ многомерным марковским процессом (см. § 27). В этих задачах Q представляет собой область, из которой частицы могут свободно выходить. Однако, после того как частица впервые покидает область Q, она уже не может возвратиться обратно или, как иногда говорят, исключается из дальнейшего рассмотрения (такие задачи возникают, например, при анализе срыва слежения в динамических системах). Чтобы запретить возвращение внутрь заданной области, уравнение (2) нужно решать с граничными условиями
Р(Х, /) = 0, Г*. (13.31)
Условие (31) обеспечивает поглощение частиц на той части границы области, через которую они в принципе могут войти в нее.
Пример 2. Граничные условия для двумерного марковского процесса.
Рассмотрим двумерный марковский процесс X (/) = {Хх (/), Х2 (/)}, поведение которого описывается системой стохастических ди4хйренциальных уравнений
^- = X2 + n1(f), -^= — 2аХ2—(0§Xi + %(0 (13.32)
dt dt
где п, (/) и п2 (0 — взаимонезависимые нормальные белые шумы с известными статистическими характеристиками
<nx(0> = 0> <«i(0ni(z + T)> = -y- б<т)>
<п2(0> = 0, <п2(/)п,(/ + т)> = -^-6(т).
Коэффициенты уравнения Фоккера—Планка — Колмогорова (см. § 19) в этом случае равны
Oj (X. /) = Х2, а2 (X, 0 = — (2аХг + cog XJ. Ьп (X. () = ~~ ,
Ь21(Х, O = bi2(X П=0. Ь22(Х, 0 = Д/2/2. (13.33)
Поэтому уравнение (2) принимает вид
J-pa, z)==^_^L + 2^^L__^fx2P1 +
dt ' ’ 4 ах/ 4 ax2 dXj ' 2
+ [(2aX, + cog Xj) Р]. (13.34)
ax2
Рассмотрим на фазовой плоскости (Xv Х2) область Q: { | Xj | < с, —оо < Х2 < оо} с границей Г: {Xj = ±с} (рис. 13.1, а). На пра-
154
13. Многомерные марковские процессы
вой части границы (Хг = с) направляющие косинусы внешней нормали равны — 1, 12 = 0. Аналогично при Xj = —с имеем /х = — 1, /2 = 0. Из (23) и (33) следует, что в данном случае матрица диффузии не вырождается на всей границе Г, т. е. вся граница является регулярной Г = Г = Гр При этом траектория марковского процесса X (/) может выйти из области Q и войти в нее через любую точку Г.
Рис. 13.!. Различные типы границ для двумерного марковского процесса.
Составляющие вектора потока G (X, /) = {Gt (X, /), G2 (X, /)} согласно (21) и (33) определяются соотношениями
G,(X. /) = Х.2Р(Х. /)_Л_^_р(Х, /),
4 dAj
G.,(X, /)= — (2аХ2 + «о XJ Z3 (X, /)--- Р (X. /). (13.35) 4 ах2
Если по физическому смыслу задачи при достижении границы траекториями марковского процесса X (/) происходит абсолютно упругое отражение в той же точке, то уравнение (42) следует решать с граничным условием (30), которое в данном случае имеет вид
= о] =0.
L 4 дм ]Л., = ±С
(13.36)
Отметим, что в этом случае существует стационарное решение уравнения (34), так как при Р (X, /) — 0 уравнение (34) совместно с (36) образуют классическую смешанную краевую задачу для уравнения эллиптического типа [37J.
В задаче о первом выходе траектории X (/) из области й уравне
Граничные условия
155
ние (34) нужно решать с граничным условием
P&i, 0к=±г = 0, (13.37)
так как в данном случае имеется равенство Г = Г*.
Пусть теперь в первом уравнении (32) отсутствует белый шум П1 (() Такой двумерный марковский процесс рассматривается в [66|, где приведено решение уравнения (34) при N±=Q на всей фазовой плоскости (Хп Х2). Нетрудно убедиться, что при этом выполняются граничные условия (22) и процесс будет нормальным.
Для рассматриваемой области Q из (23) и (33) при N± = 0 следует, что матрица диффузии на всей границе Г вырождена в направлении внешней нормали. В этом случае регулярная часть границы Г определяется из условия (24), которое дает Г: = с, Х2 > 0;
Xj = — с, Х2 < 0}. Аналогично получим Г*: = с, Х2 < 0;
А-1 = —с, Х2 > 0} (рис. 13.1, б).
Уравнения (32), (34) при = 0 можно записать иначе
^- + 2а-^- + (О2Х1 = п2(0> (13.38)
Ар(х,/) = ^- + -L [(20^ + ^)?]-(13.39)
01 4 0К% 0Л.2
Уравнение (38), в частности, описывает случайные колебания механической резонансной системы, где — перемещение центра массы, а Х2— скорость перемещения. Предположим, что движение подобной системы ограничено абсолютно упругими отражающими экранами, расположенными в точках ±с. Так как при достижении такого экрана меняется знак скорости, то л (X, 11X') = д (Х2 + Х2) и из (28) следует
Р (с, Х2, t) = Р (с, —Х2, t), Р (—с, Л2, t) = Р (—с, -Х2, t). (13.40)
Решение уравнения (39) с граничными условиями (40) даст распределение координаты и скорости системы (38) при движении между абсолютно упругими отражающими экранами. В терминах теории марковских процессов такой простой физической задаче соответствует довольно сложное движение частицы на фазовой плоскости (Лц Х2). При достижении границы Г частица мгновенно переходит в симметричную точку границы Г* и продолжает движение внутри области Q.
При решении задачи о первом выходе траектории марковского процесса к (/) из области Q граничные условия для уравнения (39) в соответствии с (31) имеют вид
Р (X, = с, Х2 < 0, t) = Р (X, = —с, Л2 > 0, t) = 0. (13.41)
156
14. Чисто диффузионный процесс
Частица может свободно выйти из области Й через регулярную часть границы Г. Однако попасть в область Й она уже не может в силу условий (41). Поэтому вероятность того, что частица впервые выйдет из области Й за время, не превышающее t, определяется соотношением
p~(t, XO)=1-JP(X. /IJQ'tt. (13.42)
я
где Р (Ъ., /|Х0) —есть решение уравнения (39) с начальным условием (20) и граничными условиями (41).
При анализе первого выхода за заданные границы огибающей ' (t) процесса X (/) [104], описываемого уравнением (39), область имеет вид, показанный на рис. 13.1, в. Напомним, что для огибающей процесса X (/) имеет место равенство
r2(/) = ^(O + -!-^W. (13.43)
со|
В этом случае вся граница Г области Й является регулярной.
14. Чисто диффузионный процесс
К понятию чисто диффузионного процесса, называемого также процессом Винера или процессом Винера—Леви, можно прийти разными путями: путем надлежащего предельного перехода при анализе простейшей задачи о симметричном случайном блуждании частицы, встречающейся в теории броуновского движения, или же рассматривая случайную фазу колебаний автогенератора при учете собственных тепловых и дробовых шумов элементов схемы автогенератора (см. § 21).
Из курса физики известно, что молекулы газа или жидкости в отсутствие внешних влияний находятся в постоянном, хаотическом движении (броуновском движении), интенсивность которого зависит только от температуры и плотности. Молекула в случайные моменты времени сталкивается с другими молекулами и меняет при этом свою скорость и направление.
Рассмотрим движение относительно тяжелых частиц в газе или жидкости, считая, что масса такой частицы много больше массы молекул окружающей среды. Будем следить, как изменяется с течением времени одна из координат избранной тяжелой частицы, допустим, горизонтальная координата. При этом можно не учитывать силу тяжести; на частицу действуют только сила трения об окружающую среду и случайная сила толчков. Если масса тяжелой
Физическая интерпретация
157
частицы равна т, то, пренебрегая силой трения, для горизонтальной компоненты скорости v (/) на основании закона Ньютона записываем уравнение движения частицы
=«(/), (14.1)
где через п (/) обозначена составляющая случайной силы толчков вдоль горизонтальной оси.
Путь, пройденный частицей в горизонтальном направлении, очевидно, находится из уравнения
clStclt = о (/), S (0) = So.
Чтобы поведение частицы было статистически определенным, необходимо указать характеристики случайной силы. При соблюдении условий симметрии толчки, испытываемые данной частицей в результате столкновения с молекулами окружающей среды, в разных направлениях равновероятны. Поэтому среднее значение <«(/)>, очевидно, равно нулю. Случайная сила п(/) представляет результирующий эффект, обусловленный большим числом отдельных толчков. Время корреляции п(/), грубо говоря, равно среднему времени т0 между толчками. При большой концентрации молекул за временные интервалы Д/^>т0 частица испытывает большое число соударений. Поэтому для таких временных интервалов Д/ согласно центральной предельной теореме теории вероятностей случайную силу п(/) можно приближенно рассматривать как нормальный процесс с дельтообразной корреляционной функцией (нормальный белый шум).
Приведенные качественные соображения сводились в основном к тому, что в уравнении (1) воздействующую силу п(0, строго говоря, нельзя считать белым шумом, т. е. дельтокоррелированным процессом. В действительности п (/) имеет конечное, отличное от нуля время корреляции т0, a v(t) есть разрывный процесс. Если отказаться от упрощающего допущения о дельтокоррелированности, то уравнение (1) будет математически вполне корректным. Однако введение идеализированного белого шума существенно упрощает все вычисления и во многих случаях позволяет получить правильный окончательный результат.
В известной мере такая идеализация оправдана тем, что обычно нас интересует не микроскопическая, а макроскопическая картина явления. Все реальные физические приборы, при помощи которых осуществляются наблюдения и измерения, имеют конечное время разрешения и неизбежно осуществляют некоторое взвешивание воздействующих на них процессов (за время Д/).
Отвлекаясь от рассмотрения других физических параметров, приводящих к чисто диффузионному (винеровскому) процессу, при
158
14. Чисто диффузионный процесс
ведем формальное определение винеровского процесса н перечислим его основные свойства.
Винеровский процесс v(t) можно определить через белый шум п (/) при помощи стохастического дифференциального уравнения (см. § 19)*
dvldt = п (/), v (0) = 0. (14.2)
Под белым шумом п (/) понимается нормальный стационарный процесс с нулевым средним значением и дельтообразной корреляционной функцией
<«(/)> = 0, fen(/1,Z2) = <n(/1)n(/2)> = Yyvo6(/2-<1). (П-3)
где AZ0 — интенсивность (высота) одностороннего энергетического спектра, 6 (х)—дельта-функция (см. Приложение III).
Из (2) следует, что
t
и (/) = ^ n (х) dx, или dv(t)~n(f)dt. (14.4)
о
Эти выражения можно также принять за определение винеровского процесса.
Поскольку белый шум «(^предполагается нормальным процессом и при линейных преобразованиях свойство нормальности сохраняется, то процесс v(t) будет также нормальным. Согласно (4) среднее значение и дисперсия процесса v (t) равны
t
<?(/)> = 0, а?(/) = ^<«(.т1)«(тг)>г/т1йтг = Л^0//2, (14.5)
о
Поэтому одномерная плотность вероятности процесса v(t) имеет вид
Р (о, Q = — - ехрf-----— Y />0. (14.6)
v ' VnNot N„t )’ v ’
Итак, винеровский процесс v(f) является нормальным нестационарным процессом с нулевым математическим ожиданием и дисперсией, пропорциональной времени.
На основании (4) находим выражение для автокорреляционной функции
M'v <г) = J J<n(x1)n(T2)>rfx1dT2 = y lVomin(<1, Q. (14.7) о 0
*> Более корректно определять нормальный белый шум через производную по времени от винеровского процесса, как это делается в математической литературе.
Свойства приращений винеровского процесса
159
: Установим некоторые свойства приращений нормального процесса v (0 на неперекрывающнхся интервалах времени. Пусть t3 > h > 0 > 0- Вычислим среднее значение, дисперсию и взаимную корреляционную функцию приращений. Из очевидного соотношения
v(t2)—р (G) = 5" (т)(14-8) г,
следует, что среднее значение приращений равно нулю, а дисперсия приращений пропорциональна разности рассматриваемых моментов времени
<[и(/2)-и(/1)]2> = ^-Л/0(/2-^1), (14.9)
С использованием (7) находим взаимную корреляционную функцию приращений
<1у (G) — v (/3)J |ц (t2) — и (0)]> = (t3, Q —
- (l2, t2) - ke (G, 0) + (t2, 0) = 0. (14.10)
Следовательно, приращения процесса v(f) на неперекрывающих-ся интервалах времени некоррелированы. Поскольку эти приращения нормально распределены, то они независимы. Кроме этого, приращения можно назвать стационарными, так как среднее значение их равно нулю, а дисперсия пропорциональна разности рассматриваемых моментов времени.
Покажем, что винеровский процесс v(t) является марковским. По теореме умножения вероятностей трехмерную плотность вероятности всегда можно представить в виде
РЙ (Уъ v2, v3, 0, /2, t3) = P(vlt я (v2, 01^, tj) я (v3, 0|u2, t2; vlt /J.
На основании (2) можем написать
I*
u(/3) = rt(T)rfT= J n(x)di-|-^ n (t) di = v(t2) -t-jj п(т)4т. (14.11) oo'
Отсюда видно, что при фиксированном значение v(t3) не зависит от y(/t) и, следовательно,
Л (и8» ^1^2, 0) = П (Уз. 0)1 У2.
Поэтому
Р3 (Уц ^2’ Уз. 0. ^2> ^з) = Р (^1. G) (^2. ^2 I ^1. 0) Л (Уз. /Я|У„
160
14. Чисто диффузионный процесс.
Применяя метод математической индукции, путем таких же рас-суждений можно убедиться, что для плотностей вероятностей высших порядков остается в силе аналогичное соотношение, т. е. оказывается справедливой формула (10.4).
Отметим, что при доказательстве не было использовано свойство независимости приращений (10). Следовательно, условие независимости приращений на неперекрывающихся интервалах времени является необязательным, чтобы процесс был марковским.
Винеровский процесс v(t) является также мартингалом в том смысле, что условное математическое ожидание v (lk) при фиксированных значениях и (/0), и (/J, ..., о(^_1), где th > > ... > /0,
равно предшествующему наблюдаемому значению v
t>(/ft_2), ..., pU0)> =t»(/ft_!). (14.12)
Этот результат непосредственно следует из равенства (11), если положить в нем th = t3, /ft_j = t2.
На примере винеровского процесса (1) проиллюстрируем подробно методику вычисления коэффициентов сноса и диффузии, а также методику решения прямого уравнения Колмогорова при разных граничных условиях.
По формуле (11.10) применительно к (2) имеем a(v, /) = lim-J-<[y(/ +А/)—ц(/)]|ц(/)> = д(-*о Ы
= lim— £ <п(т)>dx = 0. (14.13)
д;-о Д/ J
Распишем для рассматриваемого примера формулу (11.11): b(v, t) = lim -J-<[u(Z +АО —у(012|ц(/)> = Д(->оо Ш
t -ь Аг
= <n(T1)n(r2)>dx1dT2 =
д; - о Д/ J J t
t+&t
= ff v б(т2—= = const. (14.14)
Д(-о Д/ JJ 2 2
t
Для найденных коэффициентов прямое уравнение Колмогорова (11.16) принимает вид
о-4-Л^(14.15)
Рассматриваемый винеровский процесс можно получить из дискретного случайного процесса в результате предельного пере-
Решение уравнения Фоккера—.Планка—Колмогорова
161
хода. Действительно, для симметричного однородного дискретного процесса с тремя состояниями в формулах (10.20) и (10.21) нужно положить а (X) = (3 (X) = const. При этом а (X) = 0, b (X) = const и таким образом приходим к уравнению (15).
Уравнение (15) часто встречается в теории теплопроводности и диффузии. В теории теплопроводности решение Р (о, t) определяет температуру в системе как функцию координаты v и времени t. В теории диффузии Р (о, f) определяет концентрацию диффундирующего вещества. В теории случайных процессов решение P(v, f) является одномерной плотностью вероятности, а при дельтообразном начальном условии — плотностью вероятности перехода.
Рассмотрим вначале фундаментальное решение уравнения (15), удовлетворяющее начальному условию
Р (v, 0) = 6 (о — о0) (14.16)
и граничным условиям
Р (—оо, t) = Р (оо, t) = о. (14.17)
Получим решение методом характеристической функции. Для этого умножим обе части равенства (15) на ехр (jQv), затем проинтегрируем результат по v в бесконечных пределах и введем характеристическую функцию
0(П, /) = е'йр Р (у, t) dv, 0(Q, 0) = e/Qp6(y — n0)do = e/Qp».
—ОО —00
(14.18)
Используя свойства преобразования Фурье, из (15) получаем
2.0(й, о = -^-уоп20(й, /).
Отсюда с учетом начального условия (16) находим
0(Q,/) = ехр^/Пп0—^-2VOQ2/). (14.19)
Плотность вероятности определяем из обратного преобразования Фурье
ОО
f e-»Sp0(Qj)dQ = -4==expf-(-^^l. (14.20) 2л J J
, —oo
Рассмотрим случай, когда в точке v =Ov0 помещен отражающий экран. Это означает (см. § 11), что если некоторая реализация процесса v (/) пересекает линию Lo при t = т, то эта реализация заменяется новой кривой оо (/), которая совпадает с v (f) в интервале (0, т), а при t > т заменяется некоторой новой кривой v' (/).
6 Зак. 1216
162
14. Чисто диффузионный процесс
Следовательно, при наличии отражающей границы вместо процесса v (/) нужно рассматривать новый процесс
... если у(/)<с,
Ор (0 = (
(о (/), если v (/) > с.
Плотность вероятности процесса о0 (/) определяется формулой
Ро (v, /) = Р (», /) + Р (2с — v,t). (14.21)
Используя найденное выше решение (20), запишем плотность вероятности
Ро (у. 0= 4 7==- (ехр Г — (с,~Ро)8.1 +
°' УлЛ'цЦ [ Nui
+ ехр[—(2с—1>—1>0) 1) —оо<у^с. (14.22)
L av JJ
Предположим, что в точке v = с > v0 расположен поглощающий экран, что соответствует граничному условию (см. § И)
Р (с, t) = 0. (14.23)
Можно показать [3, 6], что описанный выше процесс о0 (/) остается винеровским и для него сохраняет силу уравнение (15). Чтобы удовлетворить нулевому граничному условию (23), нужно в правой части формулы (21) изменить знак у последнего слагаемого:
РП (v, t) = Р (о, 0 — Р (2с - v, t). (14.24)
Такой метод решения можно кратко назвать методом отражения с переменой знака. Подставив в (24) выражение (20), получим
Pn(v, 0 =
1
УлЛ'о /
(а —во)2 ~
Л'р/ .
—ехр
__(2с—с—с0)2 Л'о/
— оо < V С.
(14.25)
Рассмотрим небольшое обобщение винеровского процесса, а именно простейший случайный процесс, для которого коэффициент сноса отличен от нуля. Пусть процесс задан стохастическим дифференциальным уравнением
Ар_+и=/ф), Х(0) = \. (14.26)
где |т > 0 — постоянная величина; п (() — нормальный стационарный белый шум.
Нормальный марковский процесс
163
Случайный процесс X (/) является марковским. Используя очевидное выражение для приращения процесса
/4- Д/
Х(/ + Д/)—Х(/) =—n(x)dx,
t
нетрудно показать, что коэффициенты сноса и диффузии равны соответственно
а (X, t) = —Ji = const, b (X, /) = Л/о/2 = const.
Для таких коэффициентов уравнение (11.16) принимает вид
Р (X, 0 - р 4 Р (X, 0 + 4- N. Р (X, /). (14.27)
VI Ок 4 д№
Фундаментальное решение этого уравнения при дельтообразном начальном условии Р (X, 0) = 6 (X — Хо) дается выражением
P(X,0 = -4^exp[-^T:1^l> z>°- (14-28)
15. Нормальный марковский процесс
Рассмотрим случайный процесс X (I), заданный стохастическим линейным дифференциальным уравнением первого порядка
4- + аХ = уп(/), (15.1)
at
где а, у — постоянные коэффициенты, п (/) — нормальный белый шум.
Покажем, что случайный процесс X (/) является марковским. Этот результат в литературе иногда называют первой теоремой Дуба [3]. При доказательстве воспользуемся рассуждениями, аналогичными приведенным в предыдущем параграфе.
Решение уравнения (1) при начальном условии X (0) = Хо имеет вид t
X (/) = Хо е~а1 + уе-“4 е<хх п (*)dx- (15-2)
о
Рассмотрим три произвольных момента времени /3 > /2 > Л 0-Из (2) следует, что
X (/3) = е ~ “ ««~ '>>|Х0 е - + ye - а( е“х п (х) dx + о
в*
164
15. Нормальный марковский процесс
t, t,
+ е°“ п (х) dxj = Х (0) е~а((»_(=> + уе~°“’ eotxn(x)dx. (15.3)
ta t2
Отсюда видно, что X (t3) не зависит от X (/J, если задано X (/2). Поэтому, например, для плотности вероятности перехода справедливо равенство
л (^3, О |^2’ 0) = л (^з> О|^2> 0)>
что и доказывает марковский характер процесса 1 (/)•
Вычислим теперь коэффициенты сноса и диффузии. Для этого положим в (3) /2 = t, t3 = t + Д/. Приращение процесса за время Д/ равно
Х(/ + Д/) — Х(/) = (е~аД' — 1)X(/) + уе~“((+ 4/) ea*n(x)dx. (15.4)
t
При вычислении коэффициентов сноса и диффузии по формулам (11.10) и (11.11) воспользуемся разложением ехр (—аД/) да да 1 —аД/, аД/<^1, и правилом интегрирования с дельта-функцией (см. (III—6)). Тогда получим
а (1, 0 = lim — <[X(Z + Д/) —Х(/)] | X (/)> = lim — (еа4г —1) = At — 0 Д/ At — о Д/
= — ak = а (X), (15.5)
b (X. /) = lim -L <[Х(/ + ДО—k(/)]21 к (/)> = lim — [(e~“4/ — I)2 V-f-
Д1-.()Д^ Д1-.0 Д/
t Д/
+ ?2 e-2a<t+ Л0 Jp (x + yl<n {y} n (x)> dxdy] = f
r-f-At
= Hm^ у2 e- 2а«+д« JJ ea(x+w 8 (y — x) dxdy = y2 = const.
(15.6)
Отметим, что значения коэффициентов а (к, t) и b (к, t) можно получить без использования явного решения уравнения (1). Это важно в случае нелинейных стохастических уравнений.
Действительно, приращение к (t + ДО — к (0 согласно (1) равно
4-Дг
Х(/ + Д0 —Х(/)= f [-aX(x) + yn(x)Jdx. (15.7)
Уравнение Фоккера—Планка—Колмогорова
165
Отсюда находим среднее значение условного приращения t+м
<[Х(/ + А/) — Х(/)]|Х(/)> = — « b(x)dx,
а также выражение для коэффициента а (X):
'+д<
а(Х) = —alim — Г X(x)dx = — аХ(/).
Д1-.0 Ki J
Ha основании (7) для среднего квадрата условного приращения можем написать
(4-Д!
<[Х(/ + Д/)—Х(/)]2|Х(/)> = JJ <1— аХ(х) + уп(х)][ — ак(у) + t
' -f“ Л < 4“ Ai
+ Уп (y)]> dxdy — |а J X(x)dx|2+ у2 <уг (х) п (у)> dx dy =
= а2{ J X(x)dx)2 + у2-^-. t
Поэтому
fe(X, n = lim —<[X(Z + ДО—X(/)J2| X (/)> =
Д1-.0 Д/
= a2lim ± [X(ОДО2 +
At->0 Kt 2 2
Уравнение Фоккера—Планка—Колмогорова (11.16) принимает вид
-^Р(Х,/) = а^(ХР) + -^-^Л (15.8)
dt ok 4 ok1
Применяя метод разделения переменных (см. § 12), можно показать [771, что фундаментальное решение уравнения (8) имеет вид л(Х, t J Хо, 0) = [2ла2(1 — е-2“()]-‘/2 ехр{-(15.9)
Это есть нормальная нестационарная плотность вероятности с математическим ожиданием Хо ехр (—а/) и дисперсией о2 [1 — — ехр (—2а/)1. Полагая в (9) /->оо, находим стационарную плотность вероятности
= 7Й”Р(
^(М
____Х2_\ а2 = Y2A/0
2а^ ) 4а *
(15.10)
186
15. Нормальный маркавспий процесс
Характер изменения шютности вероятности л ере хода л (X, 11 Хо, 0) показан на рис. 15.1. Начальная дельтообразная плотность вероятности б (X— Х.в) с течением времени систематически смещается влево и расплывается все шире и шире, приближаясь к нормальной стационарной плотности вероятности Pst (X).
Рис. 15.1. Изменение плотности вероятности перехода во времени.
Предположим, что плотность вероятности для начальной координаты Хо является нормальной:
Р0(Х) = —* (15.11)
аоу2л [ 2о1
Умножив (9) на (11) и выполнив интегрирование по Х^, имеем
Р^' = уЙГ[аЧ1-е“г“')+о§е-:2«г1а/4 Х
X ехр j--------— 1 (! 5.1 2)
I 2[o2(l—е ?a,)-|-w§e 2at]f
В том частном случае, когда плотность вероятности начальной координаты (11) совпадает со стационарной плотностью (10), т. е. о0 = о, т0 = 0, из (12) получим
Р (X, 0 = Pst (X). (15.13)
Следовательно, если плотность вероятности начальной координаты совпадает со стационарной плотностью вероятности, то переходный процесс в системе отсутствует и стационарное состояние имеет место, начиная с начального момента времени t—'O. Этот результат для непрерывных марковских процессов полностью аналогичен результату для дискретных процессов, который был сформулирован на с. 17.
Отметим, что формулы (9) и (10) можно получить более простым и коротким путем, не прибегая к аппарату марковских процессов. Известно, что в результате линейного преобразования нормального процесса получается также нормальный процесс. Так как шум п (1) в правой части линейного дифференциального уравнения (1)
Первая теорема Дуба
167
предполагался нормальным, то случайный процесс X(Z) будет также нормальным. Для записи одномерной нормальной плотности вероятности- процесса X (Z) нужно найти его математическое ожидание и дисперсию.
При начальном условии X (0) = Хо решение уравнения (1) дается выражением (2). Используя характеристики белого шума (14.3), из (2) находим математическое ожидание и дисперсию
m (0 = <Х (0> = Хое-“(/
о2 (/) = у2 е~2“( J J еа<х+0 <п (х) п (у)> dx dy = о2 (1 - е~2а(). (15.14) о
Из нормальности процесса X (/) и этих соотношений сразу следуют формулы (9) и (10).
Воспользовавшись решением (2), нетрудно найти корреляционную функцию процесса X (t):
Z2) = o2e-“ll|(l — е-2<х(), r = Z2 — tlt f = nun(G, t2) >0.
(15.15)
В стационарном состоянии корреляционная функция равна fex(x) —о2е~а|х|. (15.16)
В связи с приведенными выше результатами первую теорему Дуба часто формулируют так. Нормальный случайный процесс с экспоненциальной корреляционной функцией является также марковским процессом.
Отметим, что в отличие от винеровского процесса (14.2), для которого приращения на непрекрывающихся интервалах независимы, для рассматриваемого нормального марковского процесса (1) приращения зависимы. Действительно, введем приращения процесса X (Z) на примыкающих интервалах времени и т2 >0
AXj = X (Z 4- tj) — X (Z), ДХ2 = X (t *Ь Tj 4* т2) — X (t Xi) и обозначим дисперсии этих приращений соответственно через а2г (AXj) и о2 (ДХ2).
Воспользовавшись формулой (16), нетрудно убедиться, что нормированная корреляционная функция приращений на примыкающих интервалах длительностью т3 и т2 в стационарном состоянии равна
Р(ъ = -4^ -е~“т*)(I-е-“^)11/2.
Gj (Д^1)
Отсюда видно, что для малых временных интервалов тх « т2 «
Д<С1/« нормированная корреляционная функция между приращениями мала (р (Д, Д) « —аД/2<^1) и приращения можно
168
16. Процессы с распределениями Пирсона
считать практически независимыми. Наоборот, при больших временных интервалах (tx » т2 « Д >> 1/а) нормированная корреляционная функция стремится к постоянной величине р (Д, Д) «—1/2. Этот пример наглядно подтверждает, что условие независимости приращений на неперекрывающихся интервалах времени является необязательным, чтобы процесс был марковским.
Укажем, что нормальные марковские процессы вида (1) часто используются для моделирования телевизионных сообщений и некоторых сообщений в телеметрии.
16. Процессы с распределениями Пирсона
Известно [48], что большой класс непрерывных плотностей вероятностей Р (X), называемый системой распределения Пирсона, удовлетворяет дифференциальному уравнению
dP (X)/dX = [(аД + а0)/(62Х2 + bjk + Ьо)1 Р (X). (16.1)
Рассмотрим одномерный марковский процесс X (/) на интервале с < X < d, считая, что в точках X = с и X = d расположены отражающие экраны, т. е. выполняются граничные условия (11.27):
(1/2) [d (b (X) Р (X))/dX] - а (X) Р (X) = 0 при X = с, d. (16.2) При таких граничных условиях стационарная плотность вероятности определяется дифференциальным уравнением (12.3)
d (b (X) Pst(X))/dX - 2а (X) Pst(X) = О или
dPsi (X) __ 2а (X) —(db (k))/dK dX b (X)
Из сравнения (1) с (3) следует, что марковский процесс с коэффициентами
а (X) = (1/2) [db (X)/dX + р (arX + a0)l, b (X) = p (62X2 +
+ bjk + b0) > 0, (16.4)
где p — несущественный постоянный коэффициент, в стационарном состоянии дает систему плотностей вероятностей Пирсона.
Приведем для нескольких частных случаев выражения одномерных плотностей вероятностей Пирсона и соответствующих им плотностей вероятностей перехода л (X, 11 Хо, 0) [49], являющихся решением уравнения Фоккера—Планка—Колмогорова
dnldt = —д (а (Х)л)/дХ + (1/2) д2 (Ь (X) л)/дХ2,
л = л (X, t\Хо, 0) (16.5)
Р8;(Х). (16.3)
Частные случаи
Г69
при дельтообразном начальном условии л (X, 01 Хо, 0) = 6 (X — Хо) и отражающих граничных условиях. Приведенные ниже выражения для плотностей вероятностей перехода получены методом разделения переменных. (Ради простоты математических записей в дальнейшем будем полагать Р = 2.)
I. Пусть
Р (X) = е-\ 0 С X < оо, (16.6)
что соответствует уравнению Пирсона
dP (K)/dK = — Р (X).
В данном случае уравнение (5) принимает вид
dnldt — дп/дХ + д2п/д№, (16.7)
причем наличие отражающего экрана предполагает, что выполняется граничное условие
дп (X, /|Х0, О)/дХ = 0 при X = 0.
Решение уравнения (7) дается выражением
л(Х,/[Хо, 0) = е~х
00
1 + е~'/4 е~ц2' 11? (|л, Хо) ip (р., X) ф
О
(16.8)
где
ty(u, Х) = 1/ —------7===- cospX,----------— sin pxl ех/2.
’ V л У1 + 4ц2 г 2ц J
Это решение можно также представить в другом виде
л (X, /| Хо, 0) = (1/2 Ул/) ехр [ —(X—Хо)/2] ехр(—Z/4) X
X {expl — (X—Xo)2/4/J + ехр[ — (X + Хо)®/4/]} + (1/Ул) X
X е~х е~хг dx. (16.9)
2. Одномерная плотность вероятности
Р (X) = (Х“/Г (а + 1)) е~\ а > — 1, 0 < X < оо (16.10)
удовлетворяет уравнению
dP (X)/dX = [(а — Х)/Х] Р (X).
Уравнение для плотности вероятности перехода (5) принимает внд
дл/д/= — д l(ct +|1—X) л!/дХ 4- д2 (Хл)/дХ2. (lb.ll)
170
16. Процессы с распределениями Пирсона
Решениями этого уравнения являются выражения
»(М|Х0, 0)^Х«е-‘ 2 Г( J'Ln е~^^(ХоИ“(Х)’ (1612) п = 0 (л“Га-Г
где Ln (X) — полиномы Лагерра,
Lan (X) = (1 /п!) к~а ех\dn (кп+а е- x)/dXnl;
П(мч.о)=-—Х
1—ехр( —0 \Хоехр( — О/
(Х + \,е-')1 /а( 2,е~'/2У? ) - (16 13>
J \ 1— ехр( — t) /
X ехр.
[ 1—ехр( —/)
где /0 (г) — функция Бесселя от мнимого аргумента.
3. Для случая, когда уравнение b (X) = 0 имеет два различных действительных корня, одномерная плотность вероятности определяется формулой
Р(Х)=- г («+.?+2)------(i+X)«(i-X)v „ a)V5>„1(
Г (а+1) Г (y + 1) 2“+v+1
’ (16.14)
соответствующей уравнению Пирсона
dP(k)/dk = {[(а — у) — (а 4- у) 11/(1 — X2)} Р (X).
Уравнение (5) теперь имеет вид
dnldt = —(а — у) (Ол/дХ) 4- (а 4- у -J- 2) (d (Хл)/дХ) 4-
4-d2 [(1 — X2) п]/дХ2. (16.15)
Приведем решение этого уравнения
л(Х,/|Х0> 0)~ (1+2eFF)V 5 е-п <"+“+*+"'Ди*
XP“-v(X0)P«.v(X), (16.16)
где P“’v (X) — полиномы типа Якоби,
рал (X) = ((— 1 )"/2n) (1 4- Х)“ (1 - X)v {dn {(1 + Х)«+ "(1 - Х?+-J/dX"}, Л ж — [(2/г + а + у + 1)Г(/г4-<х-|-у4-1)]/[Г (пЦ-ссЦ-1) Г (и4-у4- 1)н!].
4. В случае, когда уравнение 6 (X) = 0 имеет пару комплексносопряженных корней, можно взять плотность вероятности
Р(Х) = Г^+1/2).(1+х2)-<«+1/2>, а>0, -оо<Х<оо,
’ Г (1/2) Г (а) ' ' ’
(16-174
Частные случаи
171
являющуюся решением дифференциального уравнения
dP (k)/dk = —[((2а + 1) Х)/(1 + X2)] Р (X).
Уравнение (5) имеет вид
dn/dt = (2а — 1) (д (Хл)/ЗХ) + d2 [(1 + X2) л]Ж2. (16.18)
Его решение дается выражением
Я (*, t I 0) = (1+ х2)-<а+ 1 /2) h у (а-п)X
л д1 Г (2а+1 —п)
I п = 0
х е-я <2я-я> '0П (Ч) еп(Х) + 4- f ‘ [ф (ц, Хо) ф (-ц, X) + 2л J
+ ф(—ц, Х„) ф (ц, X)] dp}, а—1^Л?<;а,' (16.19)
где 0n (X) — полином степени п,
0n (X) = 2а-я Г (а—n+l/2)( — 1)л (14-Х2)а+1/2 {dn [(1 +
+ X2)"-“-i/2]/dV},
ф(р,Х) = (Х + УТ+Т2)^ (1 + Х2)172/7!(—а,а-[-1; 1 + ф;
1/2 + X/2VT+X2),
tFi — ги пер геометрическая функция Гаусса.
Более компактное решение в частном случае а = k, где k — целое положительное число, а также решение, когда уравнение b (X) = 0 имеет два нулевых корня, приведены в [49].
Для рассматриваемого класса марковских процессов можно доказать следующие два утверждения [49, 50].
Пусть плотность вероятности перехода я (X, /|Х0, 0) марковского процесса удовлетворяет уравнению Фоккера—Планка—Колмогорова (5) и
lim я (X, 11 Хо, 0) = Psi (X) = Р(Х). /->оо
Тогда плотность вероятности перехода можно представить в виде бесконечного ряда по ортогональным нормализованным полиномам 0n (X)
я (X, /1Ч, 0) = Р (Л.) 2 е-?я ' 0П (К) 9п (Ц (16.20) п — 0
а корреляционная функция процесса имеет вид
/si(t) = <[2i(/) —<2i)][X(/ + t) —<2i>])=aie-VT, v>0; т>0,
(16.21)
172
17. Процессы с кусочно-линейными коэффициентами сноса
если и только если выполняются следующие три условия:
b(k) = b2 Х2 + >0, а(Х) = а1Х + а0;
а
b(c)P(c) = b(d)P(d) = O; ^nP(X)dX<°°. «=0,1,2. (16.22)
17. Процессы с кусочно-линейными коэффициентами сноса
Рассмотрим процессы, которые описываются нелинейными стохастическими дифференциальными уравнениями вида
d'kldt + f (X) = п (/), —оо < X < оо, (17.1)
Рис. 17.1. Кусочно-линейное преобразо-
вание.
где/ (X) — кусочно-линейная функция (рис. 17.1), п (/) — нормальный белый шум.
Процесс X (/) является марковским (см. § 19), причем коэффициенты сноса и диффузии для такого процесса равны
а (X) = -/ (X),
b (X) = b = Л/о/2. (17.2)
Поэтому уравнение Фоккера—Планка—Колмогорова (11.12) для плотности вероятности перехода принимает вид
dn/dt = d [/ (А) л|ЛД (1/4) 7V0 (52л/5Х2), л = л (X, /|Х0, /0) (17.3)
с начальным условием л (X, /|Х0, ^0) = б (Х-Хо, (17.4)
Обозначим точки излома кривой / (X) через Xlt ..., (рис. 17.1). Тогда в дополнение к обычному условию нормировки плотность вероятности перехода л (X, ^|Х0, t(j) и поток вероятности
G (X, I) = —/ (X) л (X, /|Х0, t0) — (Wo/4) 5л (X, /| Хо, /0)/5Х (17.5)
должны быть непрерывны на всем интервале (—оо, оо), в том числе и в точках Xlt ...,
Граничные условия
173
Поясним подробнее эти условия на частных примерах. Рассмотрим сначала стохастическое дифференциальное уравнение первого порядка
dk/dt 4- аХ — п (/) при Х1,
db/dt -\-k — n(t) при X >
с дельтообразным начальным условием вида (4). Рассматриваемая кусочно-линейная функция f (X) изображена на рис. 17.2, а. За-
Рис. 17.2. Кусочно-линейная функция (а) и траектории марковского процесса е куси-г ио-линейиым коэффициентом сноса (6).
метим, что траектория процесса X (7) непрерывна и не делает скачков на границе X = А1( хотя характер ее несколько различен: выше и ниже границы (рис. 17.2, б). Вид траектории также зависит от начального значения Хо. Это особенно наглядно видно в отсутствие шума (п (/) ss 0). Тогда
X (/) = Хо е ~ш, 0 t < °® при Хо ,
л (j\ 0 t <С (\> —
МО — < ~ ~
Р^е- at, при Хо >
Соответствующие траектории изображены на рис. 17.2, б пунктиром.
При наличии случайного воздействия п (/) траектории процесса К (0 будут случайными функциями времени. Для нас важно то, что эти траектории не возникают и не исчезают на границе X = Поэтому плотность вероятности перехода и поток вероятности должны быть непрерывными на границе [51, 52]:
lim л (X, 11 Хо, /0) — lim л(Х,/|\„/0), а.-»м+о
lim G(k, t)= lim G(X, t). (17.6)
174
17. Процессы с кусочно-линейными коэффициентами сноса
Аналогично обстоит дело и в многомерном случае при выполнении условия диффузионной изотропности (13.4). Пусть, например, задано уравнение Фоккера—Планка—Колмогорова (13.2) для двумерного диффузионно-изотропного процесса X (/) = {Xt (/), К «)}
[аг (X, О Р (X, /)] + А + -А- ) X
X[t>(X /) Р (X /)]_fd [<24 (X,/) Р (X,/JJ/dXj при Хх Xlf
Id[aj(X, /) P(X,/)]/dXj при Xj > Xt
Рис. 17.3. Характер траектории марковского процесса с разрывным коэффициентом сноса.
с начальным условием
Р (Ь1, х2, t0) = 6 (Xj -Х10)Х
X б (Ха — Х20).
В данном случае выражение (13.6) для составляющей потока вдоль оси Xj принимает вид
GdKt)-
^(Х.о/ЧМ) ajX,/)?^, О
при Xj Xj, при Xj^.Xp
Чтобы получить граничное условие при Хх = Х1( будем интерпретировать Р (X, /) как относительную долю большого числа частиц (первоначально сконцентрированных в точке (Х10, Х20)), Оказавшихся в момент времени t в элементарной ’ площадке dXjdXjj, расположенной около точки (Хр Хг). Траектория частиц показана на рис. 17.3.
Так как частицы вследствие диффузионного характера движения нигде не концентрируются, а также нигде не возникают и не исчезают, то на границе Хх = Хх должны выполняться два условия:
1) условие непрерывности плотности вероятности
lim Р(Х,/) = lim Р(Х, /);
—> Xj •{- О Xj О
(17.7)
2) условие неразрывности потока
d
At
J J Р (X, /) dS = ф GvdCiv. з о
Граничные условия
175
Здесь S — площадка, ограниченная контуром О, dQv — элемент контура с нормалью v, направленной вовне S, Gv — плотность потока Р (X, /) в направлении v. Если взять площадку S очень узкой вдоль оси Xlt как это показано на рис. 17.3, то на границе Ач = Xj поток должен быть непрерывным:
lim G1(X,Z)= lim (17.8)
Перейдем теперь к фактическому решению простейших уравнений. Укажем, что одномерную стационарную плотность вероятности Psl (X) можно найти сравнительно просто по формуле (12.2) или (12.4). Уравнение Фоккера—Планка — Колмогорова для P,t (X) согласно (3) имеет вид
(7V0/4) <PP3l (X)/rfX2 + d 1/ (X) Pst (X)]/dX = 0. (17.9)
Интегрируя это уравнение один раз по X в бесконечных пределах и принимая во внимание условие отсутствия потока вероятности (11.26), получим
(Л70/4) (dP,t (X)/cfX) + f (X) P,t (X) = О.
Общее решение этого уравнения дается формулой (Г2.4), т. е.
P,t (X) = С ехр |-(4/УУ0) f/(X) cfX], (17.10)
Однако получить выражение для плотности вероятности перехода в большинстве практически интересных случаев затруднительно. В работе [53] показано, что преобразование Лапласа от плотности вероятности перехода может быть найдено для широкого класса кусочно-линейных коэффициентов сноса. Но обратное преобразование Лапласа удается получить только для некоторых простейших случаев.
Пример 1. Рассмотрим простой пример [54], когда
/(X) = £sgnX = ! —оо<Х<оо. (17.11)
(— k, Х<0,
Воспользовавшись формулой (10), записываем одномерную стационарную плотность вероятности
P,t (X) = (2W0) ехр (—4£ | X |//Vo). (17.12)
Уравнение Фоккера—Планка—Колмогорова для плотности вероятности перехода получаем в результате подстановки выражения (11) в (3):
дп (X, 11 Хо, t^ldt —
₽ д [(£ sgn X) л (X, /|Х0, /0)]/дХ + (7V0/4) (д2л (X, 11 Хо, /0)/дХ*).
(17.13)
1 76
17. Процессы с кусочно-линейными коэффициентами сноса
Если перейти к новым переменным т и х в соответствии с равенствами
t = Л70т/2/г2, X = N^xlZk
и обозначить плотность вероятности перехода в новых переменных через л0 (х, т | х0, т0), то из (13) получим
дл0 (х, т | х0, т0)/дт =
= д [sgn (Nfpc/Zk) л0 (х, т |х0, t0)J/dx + (1/2) (<?2л0 (х, т |х0, ти)/дх’).
(17-14)
Решая это уравнение методом разделения переменных, нетрудно убедиться, что в данном случае уравнение (12.11) для собственных функций будет иметь вид
d2X/dx2 + 2 (dXIdx) + 2у2Х = 0, х > 0,
d2X/dx2 - 2 (dXIdx) + 2у2Х =0, х < 0. (17.15)
Предполагается, что собственные функции X (х) можно дважды дифференцировать, причем X и dXIdx непрерывны в точке х = 0. Решением уравнений (15), удовлетворяющим условию непрерывности, являются собственные функции
Хп(х) = (sinпх/ Ул)ехр( — |х|), п^\,
соответствующие собственным значениям у2 = 0, у« = (1 + п2)/2. Поэтому
л0 (х, т | х0, т0) =- ехр (— 21 х |)--хр(~ 1 *11 V sin (nl0) х
лехр(-|хи|)
X sin (nl) ехр [ — у„ (т — т„)]. (17 16)
Возвращаясь к первоначальным переменным, получаем окончательное выражение плотности вероятности перехода, являющейся решением уравнения (13):
71 (У f |Х0, /0) = v ехр (— 2v I XI) + vexp (-v| M) * лехр( — v [ X, |)
Х^ sin (vnX0) sin (vnl) exp[ — vky’„ (I — /0)], v = 2k/N0. (17.17) /7= 1
На основании формулы (10.15) находим корреляционную функцию
fex(t) = (l/n) 2 14п2/(! + п’П е~ vevA 111 (17.18)
1
Многомерные нормальные процессы
177
и энергетический спектр
$(ш) = 2{(Аи/4иг) + (2^/Аош<)[1 — 2’/2(1 + VT+GV>W)I/21}.
(17.19)
18. Многомерные нормальные марковские процессы
Пусть векторный случайный процесс X (/) с компонентами {Xj (/), Х2 (/), Хп (/)} задан системой линейных стохастических дифференциальных уравнений
— S «<%Xft + n,(O, l=l,2,...,n. (18.1)
Здесь aih — постоянные коэффициенты, не зависящие от времени и Х(, nt (t) — нормальные белые шумы с нулевыми средними значениями и дельтообразными корреляционными функциями
<n*(G)^(M> = (l/2)^ УлГл^б^-^), /?о=1 при 1 =/. (18.2)
Предполагается, что коэффициенты Nt и Р1} не зависят от времени.
Требуется найти совместную плотность вероятности Р (X, I) = = Р (Хр Х2, Xn, t) при начальном условии
Р (Xj, Х2, ..., Хп, /0) = б (Xt — Х1о) б (Х2 Х20) ... б (Хп Хп0).
(18.3)
Запишем систему уравнений (1) и начальное условие (3) в матричной форме
dk/dt = —АХ (0 4- N (/), Р (X, 0) = 6 (X — Хо), (18.4)
где Л «У ^10 ХЮ*
А=[«о1. МЛ = .Mb » Хо = . N (/) = ЛпЮ. . (18.5)
Поставленную задачу можно решать несколькими способами [45, 52, 55]. Они базируются на следующих двух фактах.
1. Так как система стохастических дифференциальных уравнений (I) является линейной с постоянными коэффициентами и белые шумы nt (/) нормальные, то интересующая нас совместная плотность вероятности Р (X, I) будет также нормальной. Для ее фактического определения нужно лишь с учетом начального условия вычислить
178
18. Многомерные нормальные марковские процессы
математическое ожидание М=<Х> и матрицу дисперсий (значения всех компонент Х(- (/) берутся в один и тот же момент времени /)
К = <(Х — М) (X — М)г>, (18.6)
где верхний индекс «Т» означает транспонирование. Это можно сделать путем непосредственного вычисления математического ожидания М и дисперсии К по виду уравнения (4). Действительно, усредняя правую и левую части уравнения (4), получаем
M/dt = —AM. (18.7)
Аналогично можно получить уравнение для матрицы дисперсий dK/dt = —АК — КАГ + В, (18.8)
где
В = 1М, Ь(7 = (1/2)ЯОУЛ/Л; (18 9)
Зная матрицу дисперсий, можно найти матрицу корреляционных) функций К ((, т), воспользовавшись соотношениями 155]
К(/,т)= (Ф^т)К (т> (18.10)
(К (/,/)ФГ (т,/), г>/.
Здесь Ф (/, т) — фундаментальная матрица решений (см. Приложение I).
После того, как найдены матрицы М (/) и К (/), можно определить n-мерную плотность вероятности перехода
л(Х,/|Х0) = [(2л)п detK]1/2expj — у (k-M)rK-4X—М)], (18.11)
где К'1 V) — матрица, обратная матрице дисперсий.
Методика решения матричных уравнений (7)—(11) известна 156], хотя практическое выполнение соответствующих выкладок может оказаться весьма громоздким (см. Приложение I).
2. Можно воспользоваться тем обстоятельством, что па основании теоремы Дуба (см. § 19) случайный нормальный векторный процесс Х(/) с компонентами {Xj (/), Х2 (/), .... Хп (/)}, значения которых рассматриваются в один и тот же момент времени t, является марковским. Его плотность вероятности удовлетворяет уравнению Фоккера—Планка—Колмогорова с коэффициентами
М*) = -£«Л ^ = (1/2)/?/;Ул^= const. (18.12)
<f=i
Подставив в это уравнение многомерную нормальную плотность вероятности (11), можно получить уравнения для математических ожиданий и дисперсий. •
Уравнение Фоккера — Планка — Колмогорова
179
Для нашей системы (1) уравнение Фоккера—Планка—Колмогорова имеет вид
2 О8.<3)
Л ** Oki |_ J 2 ij^i dkidkj
Учтем следующие равенства:
1 дР dlnP . 1 дР _ d In Р .
Р dt dt ' Р dKt ~ dkt ’
1 d3 Р = d* 1пР , / dlnP \ / d In Р \
Р dXidkj dkidkj.y dKi Д d\j /'
Тогда уравнение (13) преобразуется к следующему виду:
п
п
п
dlnP Ф
— 2 ~&к~ 'п 2+ 2 а*А 1= 1 1 L »=!
fterl
1 у, ь Г d21пР / Э1пР \ / dlnP \1
2 г/[ dXtd’kj "Ц dKt Д dKj )]’
(18.14)
Запишем логарифм многомерной нормальной плотности вероятности
1пР = С(/)-1 2 (18-15)
e.v=i
где /фу — элементы матрицы Н, обратной матрице дисперсий,
H-! = K= (X —М)(Ь—М)ГР(М)^- (18Л6)
— ОО
Подставив (15) в (14) и приравняв коэффициенты при одинаковых степенях X, получим л п
2 (₽=1,2,..„п), (18.17)
а/ , _ ,
— 2 h&i bil hiv + 2 h^at»+ 2 /l₽«a"(₽»Y= !>-, n).
i.i^l 1= 1 i= 1
(18.18)
Отметим, что в рассматриваемом случае нормальная плотность вероятности (15) удовлетворяет уравнению (14) точно.
Уравнения (17) и (18) можно записать в матричной форме
dM/rf/ = _AM, (18.19)
</Н/Л = —НВН + Ат Н + НА. (18.20)
180
18. Многомерные нормальные марковские процессы
Учитывая, что
dMjdt = —К (dWdf) К, из (20) получаем уравнение для матрицы дисперсий
dK/dt = В — КАГ — АК. (18.21)
Решение матричных уравнений (19) и (21) дается формулами [561
М = е-АЧ0> (18.22)
К = Je-Al Be-A^dr. (18.23)
о
В этом можно убедитья непосредственной подстановкой (22) в (19) и (23) в (21).
Из (22) и (23) видно, что задание стохастических дифференциальных уравнений (1) эквивалентно заданию матриц А и В.
Рассмотрим частный случай, когда матрица А при помощи невырожденного линейного преобразования приводится к диагональному виду. Это означает, что выполняется равенство
САС~! = D,
<*1—0
(18.24)
D =
0 ... dn
Здесь С — [Cjjl — матрица преобразования; С-1 — матрица, обратная С; D — диагональная матрица, причем dt — собственные числа матрицы А, определяемые из уравнений
det | aift—|= 0, 6/ft=P’ (0, = k, k.
Известно 156], что Поэтому из (22) следус е-А' = С"1 е-°' С. ‘7 *ехр(—dlt) 0
М = С-! . 0 ехр (—dnt) CXg,
(1872'5)
(18.26)
Для определения матрицы дисперсий К из (23) получим соотношение
К = С-1 R (С-1)т, (18.27)
где
гы = lgi/(^i + <G)1 11 — ехр (—di — d}) t], G = CBC\
(18.28)
Стохастические дифференциальные уравнения
181
Таким образом, определение плотности вероятности Р (X, /) при заданных матрицах А и В сводится к следующим этапам. Определив из уравнений (25) собственные числа dit т. е. диагональную матрицу D, из соотношения (24) находим матрицу С. Вычислив затем матрицу G (28), по формулам (26) и (27) находим все параметры интересующего нас нестационарного нормального распределения.
Применение описанной методики для вычисления статистических характеристик двумерного нормального марковского процесса подробно рассматривается в [77].
19. Стохастические дифференциальные уравнения
Пусть поведение некоторой системы описывается дифференциальным уравнением
= + Х(/0)=Х0, (19.1)
at
где f и g — детерминированные функции своих аргументов, удовлетворяющие условию Липшица
I/ (х, t) —f (у, 01 + |g (х, t) —g (у, 01 < L\x — у\,
L = const > 0, n (0 — нормальный белый шум с известными статистическими характеристиками
<п(0> = 0, <п(0)п(0)> = -^б(/а-М- (19-2)
Рассматривая белые шумы, необходимо иметь в виду их специфику, нередко приводящую к существенным особенностям. Белый шум есть удобная математическая идеализация, он недифференцируем и имеет бесконечную дисперсию (см. § 14). Поэтому уравнения типа (1), в которые входят белые шумы, выделены в особый класс и называются стохастическими дифференциальными уравнениями*’.
Кроме записи стохастического дифференциального уравнения в форме (1), можно указать еще две эквивалентные формы записи
dX = /(X, t) dt + g(X, t) dv(t), X(/0)=X0, (19.3)
X(/) = X(f0) + J f (X (x), x) dxg(X(x),x)do(x). (19.4)
*> Уравнения (1), (3), (4) понимаются в симметрированном смысле (см. ниже).
182
19. Стохастические дифференциальные уравнения
Здесь v(t) — винеровский процесс (14.4) — см. § 14.
Так как винеровский процесс недифференцируем (его производная по времени имеет бесконечную дисперсию), то выражение
т) йЬ(т)
(19.5)
нельзя трактовать ни как обычный интеграл Коши—Римана, ни как интеграл Лебега—Стилтьеса. Чтобы стохастические уравнения (1), (3), (4) имели смысл, необходимо определить, что понимается под выражением (5).
Стохастические интегралы И дифференциалы
По определению 13,57—60], стохастическими интегралами называются выражения типа
< Ф(о(т), т)йо(т), (19.6)
i Ф(А(т), T)dA(x), (19.7)
t i Ф(А(т),т)4и(т). (1*9.8)
Здесь Ф — непрерывно дифференцируемая детерминированная функция своих аргументов, А(0— диффузионный марковский процесс с коэффициентами сноса a (A, f) и диффузии Ь (А, /), непрерывными по обоим аргументам.
Строгая математическая теория стохастических интегралов и дифференциальных уравнений впервые была дана японским -математиком К. Ито [59].
В случае (6) стохастическим интегралом в смысле Ито*> называется предел сходящихся в среднем квадратичном интегральных сумм вида
п— I
l.i. m. 3 ф(у(Ч)-Ч)[у(ч+1) — f(4)] =
П-МЮ ,=0
j Ф (о(т), т) d* v (т). (19.9)
*> Здесь и далее стохастические интегралы и дифференциалы, понимаемые в смысле Ито, обозначаются звездочкой при дифференциале d*v(i), белом шуме п* (/) и т, д.
Стохастические интегралы и дифференциалы
183
Напомним, что последовательность случайных величин сходится к случайной величине g в среднем квадратичном I.i.m. £„=£, если
П-*<Х выполняется условие lim ((gn — £)2) = 0.
Интегральная сумма в (9) строится следующим образом. Отрезок интегрирования [/0, /] разбивается на п элементарных подынтервалов, и значение функции Ф берется на левом конце каждого подынтервала. Если функция Ф интегрируема с квадратом, то предел в (9) существует и определение является корректным.
Аналогично определяются в смысле Ито стохастические интегралы (7) и (8):
е п~1
<Ф(Х(т),т)о!*Х(т) = I.i.m. Ф(*(тД т4)[Х(тт)-Х(т,)1,
У п-*х “о
*0
(19.10)
\ Ф(Х(т), x)d*v(x) = \. i. m. 2 Ф(Х(тД T()[v(Tf+l)—
I <Ь*оо Z=Q
(19.11)
Пусть процесс X (t) имеет стохастический дифференциал, понимаемый в смысле Ито, т. е.
dk = f(k, t)dt + g(k, t)d*v(t). (19.12)
Пусть функция F(x, l) непрерывна и имеет непрерывные производные F't (х, t), F'x (х, I) ц F‘xx (х, 0- Тогда процесс F (X (/), I) также имеет стохастический дифференциал
dF (X (0, /) = F't (X, /) + F‘x (X, /)! (X, t) + ^Fxx (X. t) (X. /)] dt + L 4 J
' + F'x(k,t)g(k, t)d* v(t). (19.13)
Формула (13), полученная К. Ито, называется формулой Ито.. Ее также называют формулой замены переменных в стохастическом интеграле Ито (стохастические дифференциалы, по определению, — сокращенное выражение некоторых интегральных соотношений).
Заметим, что для обычных гладких функций v(t) третий член в квадратных скобках формулы (13) отсутствует. Поэтому интегралы в смысле Ито нельзя при замене переменных преобразовывать по обычным правилам, пригодным для гладких функций, нельзя просто интегрировать по частям и т п.
Пример 1. Требуется вычислить стохастический интеграл в смысле Ито
(* = ^v(x)d* ц(т), ц(())=0, (19.14)
о
184
19. Стохастические дифференциальные уравнения
где у(/) — винеровский процесс (14.4), имеющий постоянный коэффициент диффузии b = Мо/2.
По определению (9), имеем
п— 1
/*= I.i.m.Sn= l.i.m. 2 v^) [о(тг+1)~ и(т,)].
П->0О П->0О I Q
Обозначим = v (тг+1) — v (тг), т0 = 0, t = тп. Тогда пер-
вый сомножитель под знаком суммы можно представить в виде
у(тг)= 2 у(ть_!)]= 2 Л^-1’
4=1 4=1
Следовательно,
5п = 2 АУг ( Z = Y ( 2 — 2 (А "
1=0 \4=1 / LV=1 /4=1 J
= у ^(/) - 2 (Avft-1)2 •
L «=1
Переходя к пределу в среднеквадратичном при п -> оо, с учетом (14.9), получим
/* = _ЬГу(/)_ Л. /1. (19.15)
2 L 2 J
Этот же результат может быть получен при помощи формулы замены переменных (13), которая в частном случае/(х, t) = F (х), f (X, t) = О, g (X, /) = 1 имеет вид
dF (v) — F'x(v)d*v + F"xx(v)dt. (19.16)
4
Поэтому, полагая F'x (о) = v, имеем
/* = J v (т) d* v (т) = Jd (j----С dt =
О о о
= — f iF(t) — А./],
Однако для дифференцируемых функций
/ = Jo(t)c1o(t) = u2(/)/2. (19.17)
о
Стохастический интеграл Ито, определенный для прямого времени, не совпадаете таким же интегралом,определенным для обрат-
Стохастические интегралы и дифференциалы
185
него времени (см. ниже). Р. Л. Стратоновичем было обосновано определение стохастического интеграла в симметризованной форме [57, 60], которое характеризуется определенной симметрией по отношению к прошлому и будущему.
Симметризованным стохастическим интегралом типа (6) называется предел сходящихся в среднем квадратичном интегральных сумм вида
Li.m. Уф [р(т<+1)-0(тг)] =
о->оо \ 2 2 j
i = 0
I
= ^Ф(о(т), т)^о(т)» (19.18)
В отличие от интеграла Ито, здесь при формировании интегральных сумм берутся значения функции Ф в середине элементарных подынтервалов. Вследствие предполагаемой дифференцируемости функции Ф по t в правой части (17) можно брать
I и(тг+1)+и(тг) _ А ( и(тг+1)+о(тг) „ А
Ч» 1 , Т* | ИЛИ Ч» 1 —— , T*j_i • •
\ 2 \ г +;
Одним из важнейших свойств симметризованных стохастических интегралов является то, что с ними можно обращаться по обычным правилам, как если бы диффузионные процессы были гладкими функциями (имеются в виду правила замены переменных, интегрирования по частям и т. п.)*>. Покажем справедливость этого утверждения на примере вычисления стохастического интеграла вида
t i
^Ф(о(т))с(о(т) = ^Ф (у) dv.
^0 If»
Предварительно установим связь между симметризованным стохастическим интегралом (18) и интегралом Ито (9). Вычитая (9) из (18), имеем
t t
1—/*= f Ф(у(т), т)Л>(т) — ^Ф(г?(т), т) с(т) = »О ^0
1 -
= l.i.m. У [ф [ v(Tt) + P<T<+^~”(T.,L> —ф(ц(т<), т()I X
Л-*ОО L \ 2 ' J
х [v(Tf+1)—v(Tf)J. (19.19)
*> Поэтому для симметризованных стохастических интегралов и дифференциалов используются обычные обозначения.
186
19. Стохасиечеекие дифференциальные уравнения
/-/* = I.i.m. J— п-т<хз 2
Так как Ф (х, t) предполагается дифференцируемой функцией евоих аргументов, ее можно разложить в ряд Тейлора относительно точки (о (тг), г,). Ограничиваясь учетом первых двух членов разложения, можно написать
ф(р(Ь-)+ т()=Ф(о(тДтг) +
+ У Ф* (Г (Tf+1) — Ц(т4)] + O-I© (т<+1) — V (х()1.
Подставив это разложение в (19), имеем
л—!
2 фду(т0’ T<)iy(Ti+i)—у('ч)]2+ / =0
+ e>h>(Ti+i)—•
Переходя к пределу в среднеквадратичном, с учетом (14.9), получим
/ г
Ф(у(т), x)dv(x)— Сф(у(т), т) d* у (т) =-^2- [ф,(у,т)4т.
J 4 J
1> f. t,
(19.20)
Здесь последний интеграл Донимается в обычном смысле.
Из (20) следует, что если функция Ф нё зависит от ©(/), т. е. Фх (v, т) = 0, то стохастический интеграл Ито совпадает с симмет-ризованным стохастическим интегралом.
В частном случае Ф (v, х) Ф (у), обозначив Ф (о) = F'x (у), из (16) и (20) имеем
dF (у) = F‘x (у) dv. (19.21)
Формула (21) соответствует обычному определению дифференциала. Таким образом, рассмотренный частный случай подтверждает, что с симметризованным стохастическим интегралом можно обращаться по обычным правилам, как если бы реализации диффузионных процессов были гладкими функциями.
Аналогично определяются симметризованные стохастические интегралы (7) и (8). При помощи методики, использованной при выводе (20), можно показать, что они связаны с соответствующими
Стохастические интегралы и дифференциалы
187
стохастическими интегралами Ито соотношениями
t t t
j1 Ф (X (т), т) </Х (т) — J Ф (X (т), т) d* X (т) = -^- j ф; (X, т) b (X, т) dx, « t» t,
(19.22)
^Ф(Х(т), x)dv(x)— (j Ф(Х(т), x)d* у(т)= f Ф*(Х,т)^(Х, r)dx. и 4 Т,
(19.23)
Эти соотношения справедливы независимо от того, связаны ли процессы Х(/) и v(t) формулой (3), где стохастические интегралы понимаются в симметризованном смысле, или формулой (12), где стохастические интегралы понимаются в смысле Ито; b (X, I) —коэффициент диффузии случайного процесса X (/).
Определения стохастических интегралов Ито и Стратоновича можно обобщить, если при формировании соответствующих интегральных сумм использовать произвольную точку элементарного подынтервала [58, 61). Например, для интеграла (7) можно написать
/v= Ф (Х(т), т) dv Х(х) =
л— 1
l.i.m. V ®((1-v)X(t()-|
П->00
+ vX(xt+1), ^)[1(т<+1)—
(19.24)
Здесь v (O^v 1) обозначает, в какой точке подынтервала берется значение функции Ф при формировании интегральной суммы. Очевидно, что при v = О определение (24) соответствует определению Ито (справедлива формальная запись d0X (т) = d*X (т), /0=/*), а при v = 0,5 оно соответствует определению Стратоновича (do,5 X (т) = dX (т), /0,5 = /)•
Соответственно обобщаются формулы (22), (23):
— /v, = (?i — v2) j Фх (X, т) b (X, т) dx, t,
/v, —/v, = (*1 “* V«)*V J ф* T^T’
u
(19.25)
(19.26)
где 0 < Vj C 1, О C < 1.
188
19. Стохастические дифференциальные уравнения
Вне зависимости от способа определения стохастических интегралов (т. е. для любых 0 v 1) имеют место равенства
t t
Фх (Х(т), т) + С2 Ф2 (X (т), т)] dv и(т) = Cj Фх (X (т), т) dvv(r) +
+ С2 (^Ф2(Х(т), T)dvy(x), Сп С2—const, (19.27) (()
t tt t
^Ф (Х(т), T)dvf(x)= ^Ф(Х(т), T)dvy(T)+ ^Ф(Х(т) T)dvn(x)
() ' (19.28)
Аналогично определяются стохастические интегралы для многомерных процессов. Пусть X (/) = {%!(/), (/)} — Л4-мерный диф-
фузионный процесс с матрицей диффузии В=[&<7 (X, /)] (см. с. 191), а Ф (Хь Хд1, t) = Ф (X, t) — непрерывно дифференцируемая детерминированная функция своих аргументов. Тогда по аналогии с (24) можно написать
< п— 1 •
lvk= ?Ф(Х(т). x)dv^(T)= l.i.m. V Ф((1—v)X(t;) +
t« I=о
+ vX (т/+1), тг) [ХА (т/+1) — ХА (т{)]. (19.29)
Точно так же определяются многомерные аналогии стохастических интегралов (6), (8) и выводятся формулы связи между стохастическими интегралами, определенными для различных v. Например, вместо (25) будем иметь
' м
lVlk — lv, A = (v1 — v2) f 2 (^> т)йй>(Х, т)й(т. (19.30)
Теорема Дуба и вычисление локальных характеристик марковского процесса
Из приведенных определений и свойств стохастических интегралов и дифференциалов следует, что при задании стохастических дифференциальных уравнений обязательно нужно указывать, в каком смысле понимаются соответствующие интегральные соотношения. В принятых обозначениях под обобщенным стохастическим дифференциальным уравнением для одномерного процесса Х(/) будем понимать уравнение вида
dX = f (X, t) dt -f- g (X, t) dvv (/), 0 < v < 1- (19.31)
Теорема Дуба и локальные характеристики процесса
189
Для уравнения (31) можно указать еще две эквивалентные формы записи
t)+g&,
I I
A.(/) = A.(/0) + ^/(X, x)rfx+ ^(X(t), T)dvy(x).
О
При v = 0,5 из (31) следуют симметризованные стохастические уравнения (1), (3), (4), а при v = 0 стохастическое дифференциальное уравнение Ито (12) и соответствующие ему эквивалентные формы записи.
Большой класс одномерных систем, выходные процессы которых являются марковскими диффузионными, определяются следующей теоремой Дуба [3].
Теорема 1. Случайный процесс Х(/), заданный обобщенным стохастическим дифференциальным уравнением (31), является марковским.
Строгое доказательство этой теоремы связано с некоторыми математическими тонкостями. Ограничимся формальным пояснением процедуры доказательства.
Возьмем три момента времени ta > t2 > > /0 и воспользу-
емся интегральной формой записи обобщенного стохастического дифференциального уравнения (31). Тогда можно написать
X(/3) = X(/0) + (Л, т) dx + ^g(X(т), т)dv v(т).
^0 ^0
Воспользовавшись свойством (28) стохастических интегралов, это равенство можно записать иначе:
W = M*o)+т) dx + ^g(k (x), x) dv v(x) +
*8
k, x) dx + g (k (t), x)dvv(x) = k(t2) +
<. t.
t, i,
+ ^f(k, x)dx + ^g(k(x), x)dvv(x). if if,
Пользуясь независимостью приращений винеровского процесса, можно показать, что k(ta) при фиксированном k(t2) не зависит от к((г) и, следовательно, для плотности вероятности перехода будет выполняться равенство
л (ka, ta[Ад, klt t-d = л (Х.3, /3|Xs, /g).
190
19. Стохастические дифференциальные уравнения
Нетрудно убедиться в выполнении аналогичных равенств не только для трех, а для большего числа рассматриваемых моментов времени и прийти к окончательному заключению, что процесс Х(/) — марковский.
Известно, что всякий марковский процесс полностью описывается своими локальными характеристиками (см. § 11). Поэтому нужно знать правила вычисления этих характеристик по исходному стохастическому дифференциальному уравнению.
Из стохастического дифференциального уравнения Ито (12) и определения (И) следует
Х(/ + А/) — Х(/) « /(X, 0 А/ + g(k, t) [v(t + АО — у(/)1. (19.32)
Подставляя (32) в (11.10) и (11.11), усредняя полученные выражения при условии X (0 — const с учетом (14.9) и переходя к пределу при А^->0, получим, что коэффициенты сноса и диффузии при задании стохастического дифференциального уравнения Ито определяются соотношениями
а (X, /) = f (X, 0, b (X, 0 = Mog* (X, 0/2. (19.33)
Для обобщенного стохастического дифференциального уравнения (31), воспользовавшись (26), можно написать
X (/ + А/) - X (/) xf (X, /) Ы + v g(krt)bt+
2 дХ
+ g (X, 0 [п (/ + ДО—V (/)].
Аналогично (33), отсюда следует, что для обобщенного стохастического дифференциального уравнения (31) локальные характеристики марковского процесса Х(0 имеют вид
а(Х,г) = /(Х,/)4-т-^^(Х,/)-^М-, (19.34)
I Ок
b(kt) = lVog*(Kt)/2.
Сравнивая (33) и (34), можно заметить, что от того, в каком смысле понимается стохастическое дифференциальное уравнение, зависит только коэффициент сноса а (X, /).
Следующая основная теорема Дуба [3] определяет важный класо многомерных систем, процессы в которых являются диффузионными марковскими.
Теорема Дуба и локальные характеристики процесса
191
Теорема 2. Пусть векторный случайный процесс Х(/) = {Х^/), Л,м(7)} задан системой обобщенных стохастических дифференциальных уравнений
м ___
dXi = fi(k,i)dt+i=l,M, (19.35) k~ I
где fi (X, t) и gih(k, t) — непрерывно дифференцируемые детерминированные функции, удовлетворяющие условию Липшица, vh(t) — независимые винеровские процессы с известными статистическими характеристиками
(0> = 0, <[о„ (/,)-vh О (/,)—v} (/2)1> =
= = (19.36)
бд — символ Кронекера.
Тогда многомерный случайный процесс Х(/) является ' марковским.
Формальное доказательство этой, теоремы полностью аналогично одномерному случаю, рассмотренному выше.
Заметим, что задание статистических характеристик винеров-ских процессов (36) эквивалентно заданию вектора белого шуыа с нулевым средним значением и корреляционными функциями1
<М<Л(У>=[ 8 ('!"'х)/2’ *"'• —
Повторяя рассуждения, использованные при выводе (33) и (34), можно показать, что для локальных характеристик многомерного марковского процесса Х(4), заданного обобщенными стохастическими дифференциальными уравнениями (35), имеют место равенства
м м
fl((MHi(M + v У У ^g]k(Kt)-±-gthM1
• -1/Й 2 (19.37)
1 м
2 UhgnAWgiktM
2 t = l
В частности, для симметризованных стохастических дифференциальных уравнений
м ---
d\ = ft(l,t)dt+ gih(Kt)dvk(t), 4=1,М, (19.38)
k = i
192
19. Стохастические дифференциальные уравнения
из (37) следует
аг(М) = П(М) + 4- У 2
4 t = i /= i ~j
м (19.39)
ММ) = {2 ^£м(М)£Л(М).
1 4=1
Для стохастических дифференциальных уравнений Ито
^ = Л(М)Л + 2 £и(ММ*^(П. » = ПТ, (19.40)
£== 1
локальные характеристики марковского процесса Х(/) определяются соотношениями
«,-(М) = Ш О, 1 м
Ьц(К1)=-^ Mhgih(Kt)g}k(ka (19.41) 4 = 1
Стохастические дифференциальные уравнения, записанные в симметризованной форме, можно интерпретировать как предел уравнений, записанных для немарковских (но близких к марковским) процессов (571. В технических задачах входные воздействия обычно представляют собой достаточно гладкие (дифференцируемые) случайные процессы с ограниченной дисперсией. При описании статистической динамики систем, на вход которых действует широкополосный процесс, он приближенно заменяется нормальным белым шумом (см. § 20). Это означает, что стохастические дифференциальные уравнения, описывающие поведение подобных систем, должны пониматься в симметризованном смысле, так как они должны быть устойчивы к такому предельному переходу. При необходимости использования другой формы записи этих уравнений переход к этой форме записи осуществляется следующим образом: сначала по виду (38) при помощи (39) вычисляются локальные характеристики марковского процесса Х(/); после этого по формулам (37) или (41) определяются значения коэффициентов уравнений (35) или (40). Обратно, если необходимо практически реализовать динамическую систему, описываемую уравнением (35) или (40), сначала необходимо записать эти уравнения в симметризованной форме. Имея это в виду, будем в дальнейшем оперировать, как правило, только с симметризованными стохастическими дифференциальными уравнениями и называть их просто стохастическими дифференциальными уравнениями.
Теорема Дуба и локальные характеристики процесса
193
Применительно к стохастическому дифференциальному уравнению (1) по формулам (34) находим коэффициенты сноса и диффузии а (X, /) = f (X, t) + g (X, /) ° = f (X, /)+y ,
b(k,t) = N0g2(k,t)/2. (19.42)
При этом уравнение Фоккера—Планка—Колмогорова (11.16) принимает вид
<?Р(Х,/) _ <3 [f (X, QP]_1_ д Г Р db(k,t) d[MXJ)P]l , 19 43)
dt дк 2 <ЭХ [ 2 ах д X J'
Если коэффициенты а(Х) и b(k) не зависят от времени, причем 6(Х) > 0, то при граничных условиях нулевого потока вида (11.26) стационарная плотность вероятности PS/(X) определяется обыкновенным линейным дифференциальным уравнением первого порядка
d?st (X) _ / 2/ (X)_Ь (X) db (X) \ р .у. , jg
dX \ 6(Х) 2 dk ) st{ h 1 ‘ ’
Решение этого уравнения дается выражением
п ,,, С /оНй j \ f 4 Г f(x) , \
PSL (X) =---ехр 2 I dx = —- ехр — | dx .
1/б(Х) U / 8(X) Ч М, J g2 (X) /
(19.45)
Такой же результат следует непосредственно из формулы (12.4).
Отметим, что если ограничиться стохастическими уранениями типа (1),то можно решить обратную задачу: по заданному уравнению Фоккера—Планка—Колмогорова (43) можно найти исходное стохастическое дифференциальное уравнение для процесса Х(/) [2]. В этом смысле стохастическое уравнение (1) и уравнение Фоккера— Планка—Колмогорова (43) можно назвать статистически эквивалентными.
Действительно, разрешая соотношения (42) относительно fug, находим
g(X, 0 = [4- W)]1/2, /(X, t) = а (X, /)--L .
L 4*0 J 4
(19.46)
Поэтому исходное дифференциальное уравнение можно записать через коэффициенты сноса и диффузии
— = а(ХД)-------- (Х’-)- +( —6(ХД)У/2п(/). (19.47)
dt 4 dk \ Ne }
7 Зак. 1216
194
19. Стохастические дифференциальные уравнения
Пример 2. Плотность вероятности Накатами [30]. Рассмотрим нелинейное стохастическое дифференциальное уравнение
— = v-4m + /2X1-2m n(/),
X>0, (19.48)
где tn и Q — постоянные параметры.
Из сопоставления (48) с (1) следует, что
/(%)= — g(X) = VW-2"1 .
Подстановка этих выражений в формулу (45) дает
__ mV
P,((K) = C^ie "o’.
Воспользовавшись известным интегралом [19]
xv~1 е-“*dx == р~v Г (v), о
где f(v) — гамма-функция, из условия нормировки определяем постоянную С:
о
Теперь записываем окончательное выражение для плотности вероятности Накатами
Р“(Х) = (TFTN ТгГ Х2т' ‘ e~ V • \ Г (tn) / \ Й /
Х>0,(19.49)
Плотность вероятности Накатами (49) часто используется для описания амплитудных замираний радиосигнала, прошедшего через турбулентную среду.
Пример 3. Релеевская плотность вероятности. Пусть задано нелинейное стохастическое дифференциальное уравнение
~= -V*+-^- + n(/), Х>0. (19.50)
Теорема Дуба и локальные характеристики процесса
195
В частности, таким уравнением описывается огибающая случайного процесса на выходе колебательного контура, когда на него воздействует белый шум, причем в этом случае у есть затухание контура [64].
Согласно (42) имеем
а(Х) =-TX-f-^-, 6 = -^-
v r 4Х 2
й уравнение (43) принимает вид
dt \ 4 ) dM \ 4Х / д\ V 4Х« J
Из (45) получаем стационарную плотность вероятности
р =/_L>)expf_2LV о2=^-, Х>0. (19.51)
st \ о2 / ( 2о2 J ... 4у ' *
Плотность вероятности (51) называется релеевской. Она часто применяется для моделирования амплитудных флуктуаций отраженных сигналов в радиолокации.
Пример 4. Рассмотрим подробно нелинейное стохастическое дифференциальное уравнение первого порядка более общее, чем (50) [2,65].
— 4-аХ — fi)=n(Z). Х0 = Х(/0), 0<Х<оо. (19.52) dt \ X /
Это уравнение переходит в (50) при частном значении 0 =
В данном случае коэффициенты сноса и диффузии
а (X) = —аХ + (Р/Х), b = NJ2
не зависят от времени. Обозначив согласно (10.10) плотность вероятности перехода из точки Хо = X (/0) в точку X = X (X) за время т — t — t0 > 0 через л (Хо, X, т), запишем прямое уравнение (11.1):
-^- = —[faX—₽-U] + ±A/0-Й-. (19.53)
dt «ЭХ |Д X / j 4 ° ЭХ2
Решим это уравнение методом разделения переменных при дельтообразном начальном и поглощающих граничных условиях:
л (Хо, X, 0) = 6 (X - Хо), (19.54)
л (Хо, 0, т) = л (Хо, оо, т) = 0. (19.55)
7*
196
19. Стохастические дифференциальные уравнения
На основании формулы (45) записываем стационарную плотность вероятности
Ps/(X)=Cexp[-^-^-pinX)] = CX“o2 ехр(—Х>0,
(19.56)
где
о2 =2^, с=-------------------Г Г— + -^Ц. (19.57)
4а M_+_L к 2 No )
(2аа) Na 2
Воспользовавшись значениями гамма-функции Г (х), нетрудно проверить, что из (56) при р = 0 получаем одностороннюю нормальную плотность вероятности, а при Р = No/$ — плотность вероятности Релея (51).
Если в (53) положить л = A (X) Т (0 (см. (12.8) и далее), то получим
+ т2Г(/) = 0> (19.58)
а!-^-+£(и)"4-т1 (т)+-А==о- (19-59) dA? dh Nt, dA \ Л J а
Обозначив собственные функции уравнения (59), соответствующие собственным значениям через Ап, запишем решение в виде (12.17)
л (Хо, К t —/0) = j? Лп(Хо) Лп е~ ((~~и. (19.60)
Предполагается, что собственные функции ортонормированы, т. е. удовлетворяют условию (12.15).
Перейдем в уравнении (59) к новым переменным
U = г-^Л, г = V/2o2, g = (4р/А0 — 1)/4.
В результате получим уравнение ги пер геометрического типа
dW t dU Г (1/2) + н + (Та/2а) f <1/4>~ И3] jy _ р
dz2 dz L г г2 J
Собственным значениям уп = 2па этого уравнения соответствуют собственные функции
Un (г) — z|x+(112‘ е~г L2*1 (г),
Теорема Дуба и локальные характеристики процесса
197
где
Л“(г) = — егг~“ (е~г гп+“) «I dzn
— полиномы Лагерра.
Возвращаясь к первоначальным переменным и используя условие (12.15), получим следующее выражение для ортонормированных собственных функций
л (2)1/2 г2ц+<1/2)е гЬ2*(г)
1\.„ == -" -----------------------Г“7о >
о [п! Г(п+2|1+1) Г(2ц+1)]1/2
г = Х2/2о2. (19.61)
Окончательное выражение для плотности вероятности перехода получаем подстановкой (61) в (60):
я (Хо> X, т) =-------—-----------
° 2ц + ,1/2) -г
е п= 0
L2» (г) L2* (г0) п! Г (п+2ц 4-1)
е—2па । т ।
г0 = Х§/2о2. (19 62)
Учитывая равенство L“ (х) = 1, отсюда находим стационарную плотность вероятности (56):
PM(X)=lim л(Х0Д, т) = А0(Х) = (2)1г21х+(1/2' е-г?оГ(2р4- 1).
Т—>оо
Используя известные интегралы 1191 оо
С е-*‘ (/) dt = ПР+1)Г(а+п+1) s_p_,
J ' п!Г(а+1)
О
X F f —n, p-f-1; a-f-1; —1, \ s / где F (a, 6; y; 1) = Г (у) Г (у — a — ₽)/Г (у — а) Г (у — 0), нетрудно показать, что
7г2м. + (1/2) е- г L2fX ^г== ,Г (3/2И Г ИТЩ?-)] , (19.63)
J п ' -2(л),/2«1
(1
Воспользовавшись этим интегралом, находим условное математическое ожидание
<М Т) Ю = [ Wo A t) dX = -qr i27vz-" x 0
~ Г(п-(1/2)]1^(г„)_ e_2fig|TL (19 64)
x (n!)2 Г(п4-2ц4- 1)
198
19. Стохастические дифференциальные уравнения
При т оо отсюда получаем безусловное математическое ожидание в стационарном состоянии
тк = <Х> = (2)М2 стг (2Ц + (3/2)]/Г (2ц + 1). (19.65)
Зная одномерную стационарную плотность вероятности и плотность вероятности перехода, по формуле (10.14) находим двумерную плотность вероятности
(ХЛ0- т)=л (Хо, X, т) PSI(X)= (2го)2р,+11 /2> X
оо
х 2
п = 0
^(г)^(г0) ----------------Р2 (т), п\ Г(п + 2ц+1) Г(2ц-(-1) v ’
(19.66)
где
р2 = р2(г) = е-2аи. (19.67)
Учитывая выражение (63), получаем формулу для корреляционной функции
Мт) ==<ХХ0> —ml— ^ХХ0Р2(Х, Хо, T)dXdX0—= о о
__ а» Р[2ц+(3/2)1 у Г2 [л —(1/2)] ,
2л Г (2ц 4-1) (п 1)3 Г («+ 2ц +1) Р 1 ’
(19.68)
Спектральная плотность марковского процесса Х(/) равна
5Ц<о)=± С х
2л J 1 \ 2л / Г (2ц 4-1)
х у Г2 [п —(1/2)] ton (19 69)
2л (п!)з Г (п 4-2ц4- 1) (2ап)2 4-со2 * ' ' '
п = 1
Применительно к релеевскому случайному процессу (Р = Д/0/4, ц = 0) формулы (66), (68) и (69) упрощаются. Так, например, формула (66) принимает вид
Р2(ХД0, 4ri +(n p2"(t)‘ (19>70)
° п=0 П >
Применяя известное соотношение [191
" L“(x) L“(f/) г» _
2d п1Г(«4-а4-1)
—— (хг/г)~“/2 ехр ( 1а (2Ул^.£
1— г \ 1 —г/ \ 1—г
(19.71)
Численные методы решения стохастических уравнений
199
получаем двумерную релеевскую плотность вероятности 130)
Р (к К т) = 2 <гг»)1/2 exD ( .г+ г°. \ i ( 2рУ гго 'l _
А0Т) а2(1_р2) ехР^ 1_р2 ) ]_ра ) —
_ ХХ0 ехо [_____~Ь 1 / Г рХХ0 1
^(I-P2) 2o2(l_p2) J »[ а2(1_р2) ] • (19.72)
Приведем также формулу для функции корреляции в этом частном случае
-П(ЭД „ Р[.-(1'2)1 г.(1)_2.то. 2л n^i (п!)»Г(п +1) V ' - 2
Ир2(*) +
У [-(2п- 3)111.р2п(т)
А 22" (nip К ’
л = 2 ' '
Пример 5. Логарифмически-нормальная плотность вероятности. Для стохастического дифференциального уравнения
— = — аХ In f — \ 4- акп (/), X Ъ- 0 dt \ m у
уравнение Фоккера—Планка—Колмогорова (43) примет вид
— Р=а A [fin—---------аЛХ0?)ХР] + — aPN . А_(^р).
dt |Д. m 4 °) J 4 0 3XS ’
Воспользовавшись формулой (45), находим стационарное решение
Pti (X) = -А= ехр Г _ (1га~ln w)21 a* = aNa/4,. Х>0.
81 k ' оХ1/2л 2о2 J’ °'
(19.73)
Логарифмически-нормальная плотность вероятности (73) широко используется в теории распространения радиоволн и в теории надежности. Свойства и разнообразные приложения этого закона рассмотрены в ряде работ.
Численные методы решения стохастических дифференциальных уравнений
Для исследования статистической динамики сложных радиотехнических систем все более широко применяются методы математического моделирования на ЦВМ. При этом возникает необходимость разработки численных методов решения стохастических дифференциальных уравнений, описывающих поведение подобных систем.
В теории случайных процессов (см., например, [7]) существо, вание решения стохастического дифференциального уравнения (1)
200
19. Стохастические дифференциальные уравнения
на отрезке Uo, t] доказывается методом последовательных приближений, который в принципе может быть использован и для численных расчетов. Последовательные приближения определяются с помощью стохастических интегралов как
t t
(/) = Ао + /(^~1](т)> т)г/х +^g(A[/-I] (х), t)dv(r). (19.74) /о ig
Здесь / = 1, 2, ... — номер приближения; в качестве нулевого приближения можно взять постоянную во времени (вообще говоря, случайную) величину %0.
Последовательность случайных процессов АДЛ (/) с вероятностью единица сходится равномерно по t на каждом ограниченном интервале /0 t Т к решению А(/), причем среднеквадратичное отклонение АДЛ (/) от X (/) убывает экспоненциально быстро с ростом /:
т
$ <[Ь[Л (т) — X (х)]2> di < L ехр (—Lj). (19.75)
io
При численном решении на ЦВМ значение первого интеграла в (74) может быть получено любым известным методом численного интегрирования [1121. Для вычисления второго интеграла в (74) на основании определения симметризованного стохастического интеграла имеем
t
g(A[/-1J(x), x)dv(x)«
io
—-- \Vi, 2 J 1
(19.76)
где t = n\t, Д/ = /i+1 — ft, — шаг дискретизации по времени; Дог = v {ti+1) — v (tj) — приращения винеровского процесса.
Так как при отыскании АДЛ (/) значения случайного процесса Ml— Ч (/) известны, то при заданных значениях приращений винеровского процесса Ди; интеграл (76) легко вычисляется. Отметим, что последовательные приближения при j = 1,2, ... следует проводить при одних и тех же значениях Дуг (i = 0, 1, ..., п), поскольку под точным решением (74) обычно понимается реализация случайного процесса А(/) при условии, что задана реализация процесса v(t) (нас интересует отклик динамической системы (1) на заданное входное воздействие n(t)). Способ задания приращений винеровского процесса Ду; зависит от существа решаемой задачи. Так, например, при реализации на ЦВМ алгоритмов оптимальной фильтрации Дуг = £гД/, где h = g(/j) — выборки аддитивного шума [77].
Численные методы решения стохастических уравнений
201
При исследовании статистической динамики методом Монте-Карло значения Дц, согласно (14.9) могут быть получены по формуле
= 1 = 0,1, 2,...
(19.77)
Здесь Сг — независимые случайные величины, распределенные по нормальному закону с нулевым математическим ожиданием и единичной дисперсией. При проведении расчетов на ЦВМ эти числа вырабатываются с помощью специальной стандартной программы.
Описанный метод последовательных приближений редко применяется на практике, так как он требует сравнительно больших затрат машинного времени. С этой точки зрения, более удобны одношаговые разностные методы, при использовании которых значение решения Хг+1 = К (ti+^ на (i + 1)-м шаге вычисляется по найденному ранее значению А,г = X (/,) на г-м шаге последовательно при I = 0, 1,2, ..., п на всем отрезке [/0, /].
Разностные методы численного решения стохастического дифференциального уравнения (1) вытекают из рассмотренных определений стохастических интегралов [61—63, 144]. При этом следует иметь в виду, что при записи стохастических дифференциальных уравнений обязательно нужно указывать, в каком смысле они понимаются (см. выше).
Для оценки точности одношаговых разностных методов будем далее пользоваться сходимостью в среднеквадратичном. При этом члены с Ду;, Дцг Д/, (Дц,)2 и т- Д- согласно (77) будут иметь порядок Avt ~ (Д/)|/2, (Ду,)2 ~ ДО Д^Д/ ~ (Д/)3'2, (Дцг)3 ~ (Д/)3/2
и т. д. Кроме того, далее предполагается, что функции f(k, f) и g (%, t) имеют все необходимые производные.
Чтобы получить простейшую разностную аппроксимацию уравнения (1), запишем это симметризованное стохастическое дифференциальное уравнение в форме Ито
4 дК
dt + g(Kt)d*v(t). (19.78)
Переходя к конечным разностям, из (78) и определения стохастического интеграла Ито (11) имеем
k!+1=^+h +41 (#11д'+gi (19-79) 4 \ ОК /{]
где приняты обозначения ft = [ (Хг, /г), gt — g (А.о 6), = 01
Можно показать, что разностная схема (79) аппроксимирует стохастическое дифференциальное уравнение (1) с точностью О((Д/)1/2).
202
19. Стохастические дифференциальные уравнения
Чтобы построить более точную разностную аппроксимацию урав-4+1
нения (1), заменим в (3) интеграл J f (X, т) di его прибли-Ч
женным значением по формуле прямоугольников, а для стохастического интеграла воспользуемся определением Стратоновича. Тогда, вместо (79) получим
A+k+r) Д/+g h+h+1, ±±££±1_)дУ! +
+ о((Д/)2). (19.80)
Обычно это уравнение неразрешимо явно относительно Хг+1. Поэтому произведем дальнейшие преобразования алгоритма.
Раскладывая функции / и g в ряд Тейлора в окрестности точки (Хг, /г), имеем
= + дхг ы + 4 (' -g-) (Д/)2 +
2 \ ok ji 4 \ tit ) i
("au) (АХг)2 Д/ +g; Дуг + —- f ДХ,Дог +
+ дмОг4-Л(Л^Л (ДХ)зди дх Д/ДУ +
2 \ dt 1 8 tW *’ 4 \&Kdt J 1 ‘
)/Мг)3л^ + 0((Д°2); (19:81)
Соотношение (81) позволяет последовательно получить различные разностные аппроксимации стохастического дифференциального уравнения (1). Подставляя в (81) разностную аппроксимацию ДХг с точностью О ((Д/)1/2) из (79) и учитывая члены порядка Д/, получим
^+1 = ^+7гА/+^Дуг + 4^ (49 (Ау<)2- (19.82) 2 \ ок ) i
Разностная аппроксимация (82) имеет точность О (Д/). В работе (631 экспериментально показано, что формула (82) действительно обладает более высокой точностью по сравнению с (79). Отметим, что если функция g не зависит от X, то формулы (79), (82) совпадают и имеют одинаковую точность О (Д/).
Подставив в (81) значение ДХ; из (82) и учитывая члены порядка (Д/)’/2, будем иметь
Xi-н = Хг + fi М + g,- Дог + 4 g,- 'j (Дог)2 +
Z \ Ok J|
Численные методы решения стохастических уравнений
203
W)3- (19-83)
4 |_ \ 0Л Ji 2. \ ОЛ^ //]
Соотношение (83) аппроксимирует стохастическое дифференциальное уравнение (1) с точностью О ((А/)3/2). Аналогично нз (81) и (83) можно получить разностную аппроксимацию (1) с точностью О ((А/)2). Из-за громоздкости получаемой при этом формулы приведем ее вид для частного случая g(k, f) = g(t). Когда функция g не зависит от X, разностная аппроксимация (1) с точностью О ((А/)2) имеет вид
Xi+i = Xj 4- fi № 4- gi Ay; + — Fgj ( 4- [~т~) ] A/At/j 4-
2 L \ дХ Ji \ д’ /j]
+ л/(л^2' (19-84)
2 \ оЛ /1 \ V* / i J о \ 0Л-4 / i
Дальнейшее повышение точности разностной аппроксимации уравнения (1) при помощи (81) получить нельзя, так как уже в (80) за счет применения формулы прямоугольников учтены только члены порядка (А/)2.
Для численного решения детерминированных дифференциальных уравнений широкое применение находят методы Рунге—Кутта 142], которые имеют точность до О ((А/)4). Однако непосредственное применение этих методов для решения стохастического дифференциального уравнения (1) невозможно вследствие недифференцируемости процесса п (/). Эту трудность можно обойти, если вместо (1) рассматривать уравнение
~=HKt)+g(Ktn(t), (19.85).
at
где (/) — нормальный широкополосный случайный процесс, у ко торого существуют все необходимые при выводе формул Рунге— Кутта производные (например, первые пять производных для метода Рунге — Кутта четвертого порядка). Так как уравнение (I) понимается в симметризованном смысле, то такая замена всегда возможна при условии, что время корреляции процесса £ (t) много меньше А/ (см. § 20).
Для решения уравнения (85) при тй^>А/ можно применять любые известные методы Рунге — Кутта (42]. Например, метод Рунге—Кутта четвертого порядка применительно к (85) дает следующий алгоритм:
klt = ft M + gt h А/,
= /г + -р) А/ + g (Хг 4-
204
19. Стохастические дифференциальные уравнения
k3i — tl + -Z-) + g
у it it J \ £ it /
ktl = f(Kt + ^з/> (; + A/) AZ + g (%z + ^з<> tt 4- A/) Si+1 Az,
^i+l — + ~ (^li + 2fe2i + 2^3/ + ^4i)- (19.86)
о
Здесь |г = £(({), ^н = Ц-^ЕуШ)Лг+1 = ^!+1)—коррелированные выборки случайного процесса 5 (t) в соответствующие моменты времени.
При исследовании статистической динамики методом Монте— Карло в (86) для некоррелированных выборок процесса £(() нужно положить g;AZ = \t — £i+1 AZ = A vit где А иг задается выражением (77). Это соответствует ступенчатой аппроксимации £ (if) = AVj/AZ на каждом отрезке t £ [it, Zi+1] постоянной случайной величиной [144]. Сходимость (86) доказывается при помощи разложения коэффициентов k2t, k3t, ki{ в ряд с последующим переходом к пределу.
Сходимость рассмотренных численных методов в среднеквадратичном обеспечивает убывание среднеквадратичной погрешности (среднего квадрата ошибки) при уменьшении шага дискретизации, т. е. дает возможность воспроизвести отклик системы (1) на входное воздействие п (Z) с заданной точностью. В ряде задач, когда требуется смоделировать случайный процесс с заданными статистическими характеристиками, а не воспроизвести отклик системы (1), можно воспользоваться другими определениями сходимости. Например, можно потребовать, чтобы первые г моментов распределения численного решения отличались от истинных не более, чем на заданную величину. При этом точность рассмотренных численных методов, очевидно, возрастет (например, схема (79) будет иметь точность О (А/)). В Приложении I рассмотрен численный метод решения стохастического дифференциального уравнения (I—40), который обеспечивает точное воспроизведение заданных статистических характеристик нормального процесса, но принципиально не позволяет воспроизвести отклик на входное воздействие (оно заменяется статистически эквивалентным).
В заключение отметим, что рассмотренные численные методы распространяются на многомерный случай. Для этого нужно записать исходное уравнение (1) в матричной форме и при проведении соответствующих выкладок пользоваться правилами действий с векторами и матрицами (см. Приложение I).
О коррелированное™ случайного воздействия
205
20. Область применения аппарата марковских процессов
Согласно теореме Дуба математический аппарат марковских процессов (в частности, уравнение Фоккера — Планка — Колмогорова) применим к линейным и нелинейным системам, описываемым стохастическими дифференциальными уравнениями вида (19.38), когда внешнее случайное воздействие представляет собой нормальный белый шум. Однако на практике весьма часто приходится иметь дело с нелинейными системами другого типа и внешнее воздействие обычно не является дельтокоррелированным случайным процессом.
Покажем, что область применения теории марковских процессов не ограничивается указанными системами, а она гораздо шире. В частности, внешнее воздействие не обязательно должно быть дельтокоррелированным нормальным случайным процессом, и соответствующие дифференциальные уравнения могут отличаться от (19.38).
О коррелироваиности случайного воздействия
Рассмотрим сначала на простейшем примере случай, когда воздействующий процесс не является белым шумом. Пусть процесс Х(/) задан линейным дифференциальным уравнением первого порядка вида (15.1)
А+сЛ = т X(0) = V (20.1)
at
Однако в отличие от (15.1) будем считать, что g (/) не белый шум, а нормальный марковский стационарный процесс с нулевым средним значением <£(/)> =0 и экспоненциальной корреляционной функцией
/а) = Мт) = о1е-₽|х|. t = *1- (20.2)
Покажем, что когда постоянная времени рассматриваемой системы тс = 1/а много больше времени корреляции тй = 1/р процесса £(/), т. е. при условии а << р, приращения случайного процесса Х(/) на примыкающих интервалах времени Д, удовлетворяющих неравенствам
тс = -»Д»тй = -±-, (20.3)
• а р
приближенно независимы, несмотря на то, что случайное воздействие £(/) не дельтокоррелированный процесс.
206
20. Область применения аппарата марковских процессов
Случайный процесс X (t) является нормальным, так как он получается в результате линейного преобразования нормального процесса £ (0- Для нормального процесса условие статистической независимости приращений совпадает с условиями их некоррелированности. Для оценки степени коррелированное™ приращений нужно найти нормированную взаимную корреляционную функцию между этими приращениями.
Решение уравнения (1) с указанным начальным условием имеет вид
t
К (t) = Ко е- “'Д e~af J е™ £ (s) ds. (20.4)
о
На основании этого решения находим среднее значение, корреляционную функцию и дисперсию процесса
/Пк(0 = <ЦФ=\>е~“(,
n=<(^(o-^(oi^a')-/nuni>=
°t г„-₽lTl , fl « IT! ( 1 I 0 \ „-a(f-H') „-а/-₽Г
— ~ [ с ——- с 1 .т I v —1 е
а2—РЧ а Д а/
t = f — t, (20.5)
= + (20.6)
Для стационарного состояния, которое устанавливается при t -> оо, эти характеристики соответственно равны
тл = 0, ^(т) = о?—!—(ае-31»1—ре-0'!’'), о£=—. (20.7)
а—р а(аД0)
Отметим, что в данном случае, в отличие от (14.2) и (15.1), процесс /Д) является дифференцируемым, причем дисперсия производной Х(/) в стационарном состоянии равна ох = аро(.
Возмем три момента времени
0 /j Д Т| Д 8 = /2 Д ^2» Tj, Т2, 8 0.
Вычислим нормированную взаимную корреляционную функцию между приращениями ДХх и AX2 процесса Х(/) на неперекрывающих-ся интервалах времени Tj и т2:
= АХг (Т1, Q = X (^ + тх) - X (О,
АХ2 = АХ2 (т2, /2) ~ (G Д тг) — (^g)*
О коррелированное™ случайного воздействия
207
Воспользовавшись формулами (5) и (6), в результате громоздких вычислений получим следующие выражения для взаимной корреляционной функции и дисперсий приращений
К(тг тг, е, = _ -&-)е-ах*-2а/,1(1-е-“^)Х
а2 — 02 (( а \ а/ j
X (1 —e-at9e-“s —(1 —е~₽х>)(1 —е-₽ь)е-₽в.
—[(1 — e~UXi) (1 — е~₽ь) е~р 1Х‘ + е> +
_|_(1 _е-ах*)(1 — е-₽х>)е-а(х«+в’]е-(а+₽’(20.8)
о2(т / )=_^L [1 _ _L +_L е-ах‘—е-₽х‘ +
v *’ 11 аг — рЦ а а
+ —(1 + 1Л(1_е-ах02е-2а‘‘-
2 \ а /
_(1 _ е~ах0(1—е~ВхОе_’а+Рн<], /=1,2. (20.9)
Очевидно, что для неперекрывающихся интервалов времени фиксированной длительности взаимная корреляционная функция приращений принимает наибольшее значение тогда, когда временные интервалы примыкают, т. е. при е = 0. Полагая е=0 и переходя к стационарному состоянию (^ -> оо), из (8) и (9) соответственно получим
а?
ХГ± (1 _е-аг,)(1_е-аъ)_(1—е-^>)(1—е-₽*.)1 (20.10)
L a J
О2 = О2(Т()= — (1—е-ох,)1. (20.И)
а2 —02 a J
Если считать интервалы т, « Д, i = 1, 2, то из условий (3) следуют неравенства ат, « аД < 1, 1. При этом формулы
(10) и (11) принимают простой вид
а? Д / 1 \ 2а? Д
*(Д,Д)«-----1_(ад_.2Л (20.12)
0 \ 0Д/ 0
На основании этих соотношений находим нормированную взаимную корреляционную функцию между приращениями случайного процесса h(f) на примыкающих интервалах длительностью Д
Л(Д)« М^_Д)=----иад_±)« 1 приаД«1«рД. (20.13)
а, а2 2 \ 0Д /
208
20. Область применения аппарата марковских процессов
Отсюда видно, что приращения случайного процесса Х(/) на неперекрывающихся временных интервалах длительностью и т2, имеющих порядок величины А, которая удовлетворяет условиям (3), практически некоррелированы и, следовательно, независимы.
Из формальной методики .доказательства теоремы Дуба (см. например, выражение (19.36)) следует, что одномерный непрерывный процесс является марковским, если случайные приращения процесса за малые последовательные неперекрывающиеся интервалы времени статистически независимы. Поэтому для временных интервалов А(^> А случайный процесс X(Z) приближенно можно рассматривать как одномерный марковский процесс.
Выше внешнее случайное воздействие £(/) предполагалось нормальным стационарным процессом с нулевым средним значением и экспоненциальной корреляционной функцией. Однако такая чрезмерная конкретизация процесса £(Z) вовсе не является обязательной; она была взята ради простоты вычислений. Все приведенные рассуждения останутся в силе и для других стационарных нормальных процессов £(/), лишь бы выполнялось условие (3) Можно высказать даже более сильное утверждение: полученный выше результат при соблюдении условия (3) будет справедлив для обычно встречающихся на практике случайных процессов |((), имеющих одно характерное время корреляции. Доказательство этого утверждения для нормального случайного воздействия £(/) сопряжено с кропотливыми и трудоемкими вычислениями. Мы ограничимся здесь нестрогими пояснениями.
Известно (301, что при выполнении неравенства Tc^>Tft имеет место известное явление нормализации: если воздействующий процесс £(/) с малым временем корреляции не является нормальным, то процесс Х(/) на выходе сильно инерционной линейной системы будет близким к нормальному. Поскольку для нормального процесса условие статистической независимости приращений эквивалентно условию их взаимной некоррелированности, то в данном случае с некоторым приближением сохраняют силу все приведенные выше вычисления и результаты.
Итак, можно сделать следующий окончательный вывод. Если случайный процесс с малым и одним характерным временем корреляции тй воздействуют на инерционную линейную систему с постоянной времени тс тй, то для временных интервалов А/ А, где
тс>А»тй, (20.14)
процесс на выходе линейной системы приближенно является марковским, и с указанными оговорками к нему применим математический аппарат марковских процессов (в частности, уравнение Фоккера— Планка—Колмогорова).
О коррелированности случайного воздействия
209
Найдем теперь для процесса Х(/) коэффициенты сноса и диффузии. Поскольку процесс Х(/) можно рассматривать как марковский лишь для временных интервалов Д/>Д, то коэффициенты а(Х, t) и b (X, /) нельзя вычислять непосредственно по формулам (11.10) и (11.11), в которых Д/->0. В рассматриваемом случае эти коэффициенты следует определить формулами
пП М <[Х (z Ч-А) —Л (0] I Л (0>
b(k t) = <(М' +А) ~М')121 М0> ’ д ’
где А удовлетворяет неравенствам (14).
Считая значение процесса X (/) = X в момент времени t фиксированным, запишем выражение для приращения процесса за интервал времени А
+ Д
X(Z-f-A) —Х = J [ — аХ (s) + g (s)J ds. (20.16)
/
Отсюда находим среднее значение условного приращения
'+Д
<[Х(<Ч-Д) — X] | Х> =—а § X(s)ds.
Коэффициент сноса равен
<[Х (' + Д) — XII Х> / а \ с
а(Х)=-------д-----—) X(s)ds=-aX. (20 17)
Здесь последнее равенство написано на том основании, что на временном интервале Д тс значение процесса X (s) практически не изменяется.
С учетом этой оговорки и воспользовавшись выражением (16), находим средний квадрат условного приращения
+ Л
<[Х (/+ А)—Х|а| Х> = $5 <1 -aX(S1)+ £(&!)] X
х I— aX(s2)+g(s2)]>ds1ds2 =
a X(s)ds? + t j
+ 55 Xj(s2 — sjdsj ds2 = X2(аД)2 + 2Д 5(J — ^(т)йт.
' о '
При Д>>тй верхний предел интегрирования можно приближенно положить равным бесконечности и в подынтегральном выражении
210
20. Область применения аппарата марковских процессов
пренебречь малым слагаемым т/^(т)/Д. Тогда с учетом неравенства аД < 1 получим
ос ОС
b (X) = аХ2 (аД) + 2 J (т) dx »2 J /?е (т) dx — 2о| xk. (20.18) о о
Из сопоставления выражения (17) с (15.5) и (18) с (15.6) следует, что формально при вычислении коэффициентов сноса и диффузии для рассматриваемого случая (1) можно пользоваться стандартными формулами (11.10) и (11.11),- нужно только в правой части уравнения (1) заменить реальный случайный процесс В (/) на фиктивный белый шум с корреляционной функцией
No С(»2 —0) 7
kn (^-Q = * , No = 4 J (т) dx. (20.19)
о
Следовательно, применительно к уравнению (1) остаются справедливыми все результаты§ 15 с заменой значения постоянного коэф-фициента b = на b — 2 Г /г? (x)dx.
z о
Если бы среднее значение воздействующего процесса 5 (0 было отлично от нуля «5 (/)> = /ng 0), то выражение для b (X) осталось бы прежним (18), а коэффициент а (X), как видно из (16), был бы равен
а (X) = —аХ
Отметим, что в интересующем нас аспекте случайный процесс, описываемый уравнением (1), не является характерным и был взят ради простоты вычислений. Дело в том, что на основании § 15 нормальный одномерный марковский процесс 5 (/) можно трактовать как стационарное решение стохастического дифференциального уравнения
4+ К = «(/). (20.20)
at
где п (/) — нормальный белый шум с корреляционной функцией <n (tjn (/2)> = 2о!Р6 (/2 - 4).
Уравнения (1) и (20), рассматриваемые совместно, определяют двухкомпонентный марковский процесс {X ((), £(/)}.
Применительно именно к уравнению (1) наш вывод состоит в том, что статистические характеристики процесса X (/) для временных интервалов порядка Д можно получить из анализа одномерного процесса X (/) с заменой £ (/) на фиктивный белый шум (19).
Предположим теперь, что в уравнение (19.1), вместо белого шума п (f), входит нормальный случайный процесс £ (/) с заданным энер-
О кор ре лированност и случайного воздействия
211
готическим спектром (корреляционной функцией). Такое положение встречается часто и объясняется тем, что реальные случайные воздействия практически всегда являются дифференцируемыми функциями времени из-за неизбежной инерционности всех систем, а белый шум и одномерные марковские процессы недифференцируемы.
Однако в данном случае процесс X (/), определенный дифференциальным уравнением
(К t)+ (20.21)
является одной из компонент многокомпонентного марковского процесса. Такое утверждение основано на том, что заданный энергетический спектр процесса Sj (со) практически всегда можно аппроксимировать с нужной степенью точности дробно-рациональной функцией вида
TiSir m<n’ <2оад
где Рт (х) и Qn (х) — полиномы
Рт (х) = М"’"1 - + Рт, (20.23)
Qn (х) = хп + аре""1. + ... + ап.
а;, рг — постоянные коэффициенты.
Нетрудно показать [52, 66], что нормальный процесс £ (/) с энергетическим спектром (22) можно получить при помощи линейного формирующего фильтра с постоянными параметрами, на входе которого воздействует нормальный белый шум п (/) со спектральной интенсивностью No/2. Дифференциальное уравнение фильтра имеет вид
<<гд1и+5 )= dtn dt'1-1 "be/
= + (20.24)
где производные от белого шума понимаются чисто формально, таи как он недифференцируем (см. § 14).
Перейдем от линейного дифференциального уравнения n-го порядка к системе п линейных дифференциальных уравнений первого порядка. Обозначим £ (/) = (/) и введем дополнительно (п — 1)
функций £2 (/), ..., (?) при помощи следующих равенств:
$ = ^(0..... =
(It #
212
20. Область применения аппарата марковских процессов
%^Мп-т+1(П + Тп-т'Ц0, ...» at
(0 + Тп-1«(П. (20.25)
at
Постоянные коэффициенты yn_m, Тп—! выберем таким образом, чтобы из уравнения (24) исключить производные белого шума п (/). Для этого подставим в (24) выражения производных функции l(t) через функции & (/) согласно (25). В результате получим
^4-а^^-Ь ... +oUn + Yn-m«(m)(/) +
+ (Tn-m+l + aYn-m) l> (0 + ... + (Tn-1 + al Vn-2 + ••• +
+ am-iYn-m)n'(t) + (a1yn-i + «2 уп-2+ ••• +amYn-m)n(t) ==
= ₽оП<я”(/) + ₽1П<я,-1)(0+ - +₽m-l«'W+₽m«(0. (20.26)
Приравнивая коэффициенты у одинаковых производных от п (/) в левой и правой части написанного равенства, получаем рекуррентную формулу для определения коэффициентов yh:
Тй=₽й+т-п— 2 “iYft-ь k = n — tn, n — m+ 1, (20.27)
При этом уравнение (26) принимает вид d k+m — n
2 “n+i-«^(0+Tn«(/).’ (20.28)
i=i
Система из n линейных дифференциальных уравнений (25) и (28) является частным случаем системы стохастических дифференциальных уравнений (18.1) и, следовательно, определяет п-компонентный марковский процесс.
Итак, уравнения (21), (25) и (28) совместно определяют (ц 4* 1) -компонентный марковский процесс. При этом вычисление локальных характеристик этого процесса по правилам Ито и Стратоновича дают один и тот же результат.
Ранее уже отмечалось что с ростом числа компонент сложность решения всех задач для марковских процессов прогрессивно возрастает. Поэтому всегда желательно уменьшение числа рассматриваемых компонент, тем более, что вспомогательные компоненты ((), ••» (() не представляют самостоятельного интереса.
Другие отклонения от теоремы Дуба
Укажем некоторые возможности применения аппарата марковских процессов к нелинейным системам, поведение которых описывается дифференциальными уравнениями, отличными от (19.1).
Другие отклонения от теоремы Дуба
213
В некоторых случаях уравнение реальной системы удается привести к виду (19.1) при помощи замены переменных. При этом следует иметь в виду, что марковские свойства случайного процесса сохраняются при невырожденных нелинейных безынерционных преобразованиях. Если марковский процесс X (/) подвергается преобразованию
Л (/) = G (X (/)), (20.29)
где G (X) — невырожденная однозначная функция, то случайный процесс Л (/) будет также марковским. Этот факт является очевидным и следует из основного определения марковских процессов. Отметим, кстати, что если на вход типового квантователя по уровню воздействует непрерывный марковский процесс, то проквантованный процесс на выходе квантователя не будет марковским, так как характеристика квантователя G (X) есть вырожденная функция. Если не удается свести уравнение системы к виду (19.1), то иногда на основании физических соображений можно применять приближенные приемы решения.
На примере линейного дифференциального уравнения (1) было показано, что конечное (не равное нулю) время корреляции случайного воздействия не исключает возможность применения аппарата марковских процессов для изучения поведения процесса X (/). Последнее правомерно при выполнении условий (14). Нелинейный характер исходного стохастического дифференциального уравнения системы также не является принципиальным препятствием для изучения процесса с помощью теории марковских процессов.
Эти факты дают основание надеяться, что при условиях типа (14) процесс X (/), заданный, например, дифференциальным уравнением
<20-з°)
at
где g (/) — стационарный нормальный процесс, будет приближенно марковским.
На основании физических соображений можно считать, что процесс X (/) является приближенно марковским для временных интервалов Д/ Д, если величина Д удовлетворяет почти для всех X и для всех по-разному определенных времен корреляции xh процесса £ (/) неравенством
min тс Д xft. (20.31)
Здесь min тс — минимальное значение характерной постоянной времени системы (30). Физический смысл левого неравенства (31) заключается в том, что рассматриваемая система должна быть сравнительно инерционной: координата X (/) за время Д изменяется незначительно и, следовательно, мгновенная скорость dKtdt при всех
214
20. Область применения аппарата марковских процессов
возможных t относительно мала. При этом приращение процесса к за «малый» интервал времени Д будет малым, что характерно для непрерывных марковских процессов. Правая часть неравенства (31) говорит о том, что приращения процесса на неперекрываклцихся интервалах сравнительно «большой» длительности Д будут практически независимыми.
Разумеется, что выполнимость условий (31) необходимо проверять применительно к каждой конкретной задаче, причем такая проверка не является тривиальной.
Если условия (31) выполняются и процесс 1 (/) приближенно является марковским, то коэффициенты сноса и диффузии следует находить по формулам [2, 67]:
o(X) = <f(X. I(/))> + J Kf’fJK x)dx, (20.32) о
6(X) = 2j<F(X, £(/ + -c))>dT. (20.33)
о
Здесь <F (X, I (/))> — среднее статистическое значение правой части уравнения (30) при фиксированном значении X; F (X, £ (/)) — флуктуационная составляющая правой части уравнения (30)
F(X, l(f» = F(k, £(/))-<£ (X, £(/))>, (20.34)
Kf'fx(.K т) — функция взаимной корреляции между производной от флуктуационной составляющей по X и самой флуктуационной составляющей в разные моменты времени
Kf’ ft(X, т)-/?(Х,
Е (( + ,» . (Ж /
(20.35)
Для функции F (X, (/)) при стационарном процессе £ (/) всегда выполняется условие симметрии во времени
ОО ОО
[ <А(Х, £(/+т))-£-?(Х, £(/))>d?=f (F(X, £(/)) X
о о
Х-^*?(ХЛ(Н-т))> dx. (20.36)
При этом
ОО
{ ё(/ + т))4-?(Х, Н0)>^ =
J аА
о
Другие отклонения от теоремы Дуба
215
I ок J 4 ал
о
В выражение для коэффициента сноса несколько упрощается
а (X) = <Е (X, 5 (/))> + -L . (20.32а)
Если вычисленные коэффициенты (32) и (33) подставить в (19.47). то дифференциальному уравнению (30) будет поставлено в соответствие уравнение (19.47). Оба уравнения будут иметь одинаковое уравнение Фоккера—Планка—Колмогорова и, следовательно, одинаковые одномерные плотности вероятности и плотности вероятности перехода. В этом смысле уравнения (30) и (19.47) можно назвать статистически эквивалентными. Процедура замены уравнения случайного процесса на статистически эквивалентное уравнение вида (19.1) оказывается полезной при решении конкретных задач.
Все результаты и качественные соображения, указанные выше для одномерных марковских процессов, за исключением симметрии во времени (36), с очевидными видоизменениями обобщаются на многомерные марковские процессы.
Так, например, пусть по аналогии с(30}задано нелинейное диф-ференциальное уравнение второго порядка
X = F(X, X, 5(0), (20.37)
где 5 (0 — стационарный нормальный случайный процесс с малым временем корреляции, точками сверху обозначены производные по времени.
Обозначим X = Хг. Тогда дифференциальное уравнение второго порядка (37) можно записать в виде системы двух дифференциальных уравнений первого порядка
х=х1( х1=/7(х, хь 5(0). •
При некоторых условиях, подобных (31), двухкомпонентнын процесс {X, X!} = {X, X} будет марковским, и соответствующее ему уравнение Фоккера—Планка — Колмогорова имеет вид [2]
4-/’(Х1'Х,0=-Х^-Р-<F>+f К
# дК J дк
Fx dt\P +
d2
™ I Jo
(20.38)
216
20. Область применения аппарата марковских процессов
Здесь через Д' обозначены корреляционные функции, аналогичные фигурирующим в (32) и (33).
В частности, применительно к стохастическому уравнению
аХ + ₽Х = f (X) + ф (£ (/)), (20.39)
где аир — постоянные коэффициенты, a f и ф — заданные функции, стационарное решение уравнения (38) имеет вид [2]
P,t Х) = Сехр
г к д
<ф(£)>*+
— Psi(X)Psi(X), (20.40)
где С — постоянная, определяемая из условия нормировки
P,t(K, 1, (20.41)
- оо N ? Т = J К[ф(В(0)Ф(В(* + т))И< (20.42)
— оо
Формула (40) показывает, что координата X (/) и производная к (/), образующие в один и тот же момет времени двухкомпонентный марковский процесс, заданный стохастическим уравнением (37), в стационарном состоянии статистически независимы, причем производная распределена по нормальному закону.
Разумеется, что приведенные формулы справедливы и для случая, когда % (/) = п (/) есть белый шум. Так, применительно к стохастическому дифференциальному уравнению
Х + рХ + /(^) = «(О- (20.43)
где п (/) —белый шум (19.2), формула (40) принимает вид [68]
Psi(X, Х) = ь
= СеХр(-^-Х8—\f№dx\ = PstW)PM. (20.44) \ /vo /vo J /
К'
Пример 1. Приведем конкретные результаты, получаемые по формуле (44), для трех частных видов функции f (X) [69].
1) Пусть fj (X) = kok 4- Л3Х8. Тогда
Ps< (X, Х) = Сехр(-Х^ехрГ--^-(&оХ2 + М4/2)1;
\ Л'о ) L л?0 j
2) При /2(Х) = f 2fe°— 'j tg f, —d<X<;d, получим
Другие отклонения от теоремы Дуба
217
Pst(X, Х) = С ехр Х2^ ехр vln cos =
„ I 20 . 2\ I лХ \V 166fe0 di
= С ехр------— X I cos—) , v=———
\ No J \ ?d ) л2 mN0
При фиксированных других параметрах плотность вероятности переходит в равномерную при d -> 0 и в нормальную при d -> оо;
3) Для f3 (X) = k0 th (btylmb, b, k0, tn> 0, получим
Pst (X, X) = C exp (—20X2/7VO) exp [—p. In ch (ЬХ)1 =
= C exp (—20X2/7Vo)exp tp.ln sch (bX)l,
p> = tfik0/b2mN0.
При b oo плотность вероятности стремится к нормальной.
Пример 2. Рассмотрим следующий частный вид дифференциаль-
ного уравнения (37):
X + ей (X, X) + f (X) = V& I (0, (20.45)
где £ (/) — нормальный стационарный широкополосный случайный процесс с нулевым средним значением, е — малый параметр.
Перейдем от одного дифференциального уравнения второго порядка к двум дифференциальным уравнениям первого порядка. С этой целью введем новую переменную (энергию)
%
Е = Х2/2 + и (X), u (X) = jj / (х) dx. (20.46) v
Дифференцируя первое выражение (46) по времени и подставив затем в правую часть X из (45), получим
£ = XX + Xdu/dX = X X—Х/(Х)= —еХй(Х, Х) + ]/ёХ£(О.
Это дифференциальное уравнение совместно с (46) определяет двумерный марковский процесс {X, Е}:
Х = /2(£—и),
£= —е/2(£ —и)й(Х, /2(£—и)) + /2е(£—u) %(t). (20.47)
Системе дифференциальных уравнений (47) соответствует следующее уравнение Фоккера—Планка—Колмогорова
1 f £ [<£-«)₽]- £ (Г Р) +
+ е— [(/2 (£ —и) й(Х, /2 (£—и) — N/4)P], (20.48)
218
20. Область применения аппарата марковских процессов
где
у j <£(/)£(/+ т)>Л. (20.49)
— 00
Если 8 мало, то из. второго уравнения системы (47) видно, что энергия медленно изменяется во времени. При этом время пребывания процесса X (/) в малой окрестности точки X будет обратно пропорционально скорости X = ]/2(Е — и). Поэтому при фиксированной энергии (даже в нестационарном состоянии) условное распределение будет иметь вид 12]:
Р (X| Е) = const ( I£—UWJ~1/2- «(Х)>Е, (20.50)
I 0, и(Х)^Е.
С учетом условия нормировки совместная плотность вероятности Р (X, Е) равна
Р(Х Е) = Р (Е) Р (X ] Е) = Р(Е)/2ф' (Е) УЕ—и (X), (20.51) где
Ф'(Е) = (1/2) J (Е —u(x)r1/2<te ф(Е)== J [E—u(x)]l/2 dx.
• . R(Ei R(E)
(20.52)
Здесь интегрирование ведется по области R (Е): {и (X) < Е}, -й второе выражение написано с учетом того, что на границе области (и (X) = Е) подынтегральная функция обращается в нуль
Подставив (51) в (48), получим
_______!_______— Р(Е) =____Zig) U
2ф'(£)]/£-« (X) ах \ ~]/2 ср'(Е) /
+ /2(£-“W)-
дЬ L 1/2 <р (£)
^P(g) ,£ A _Z_ / l/g^)P(g) \ ,20 53.
8ф' (£) УЕ—и (X) J 2 дР\ 2ф' (£) )’ < ' I
Обозначим
ф(Е)== —1— \ h(x, y2(E—u(x)))dx. (20.54)
1/2 У®
Другие отклонения от теоремы Дуба .
219
Проинтегрировав (53) по К во всей области R (£), получим
— Р(Е) = е —[Y
& ' дЕ [\ф'(£)
ЛР(£)]+еА
4 / 4
д2 Г <Р(Е) р дЕ* [«рЧЯ)
(20.55)
Полагая здесь дР (E)/dt — 0, находим стационарную плотность вероятности
Psi (Е) == const <р' (Е) ехр
£
—— f
N J ф (x)
Ei
(20.56)
Если ввести функцию F (E)t определив ее равенством dF/dE = ф (E)/q> (£), (20.57)
то совместная плотность вероятности (51) будет равна
Р,1 (К Е)~ -...,С0П-~ : ехр Г - 4 F (Е) ] . (20.58)
21/Е—а(Х) L N 1
Возвращаясь от переменной Е к первоначальной координате 1 согласно выражению (46) и учитывая, что якобиан преобразования равен К, получаем окончательное выражение стационарной плотности вероятности для К н X:
P,t(К М = 4 ехР [~4 F((^/2) + и W) 1 > (20.59) G L ™ J
где
С = J J ехр J F ((^/2) + и (х)) j dxdy.
При ft (X, X) = рХ, £ (0 = п (0 и 8 = 1 дифференциальное уравнение (46) переходит в (43). При этом формула (59) должна совпадать с (44). Это действительно так, поскольку в данном случае
Л(Х, Х) = РХ = Р /2(Е-и), ф(Е) = Рф(Е), х
f = p£ = p (Хг/2)— J f(x)dx . i/
Подставив это выражение функции F в формулу (59), приходим к (44).
220
20. Область применения аппарата марковских процессов
Понижение порядка стохастических дифференциальных уравнений с малым параметром *>
В общем случае фазовые координаты любой динамической системы, на которую воздействует коррелированный шум, могут быть представлены компонентами марковского процесса высокой размерности (21), (25), (28), Для упрощения анализа всегда желательно понизить порядок стохастических уравнений процесса, сохраняя основные черты рассматриваемых явлений. Выше был рассмотрен случай, когда уравнение (21), описывающее поведение системы, характеризовалось наличием одного малого параметра — времени корреляции тй процесса £ (/). При этом согласно (32а) локальные характеристики марковского процесса X (/) определялись соотношениями (19.42), Наличие других малых параметров дает иные возможности понижения порядка дифференциального уравнения.
Рассмотрим уравнение вида
+ ~ = (20.60)
аг at
где ц 0 — малый параметр, Е(/) — стационарное случайное воздействие с нулевым математическим ожиданием и корреляционной функцией (т). Будем постоянную времени нелинейной системы (60) характеризовать величиной тс и время корреляции процесса В (/) величиной ть:
Tc = min[— d-S^' ° \ ть = [^(0))-1 [ fe£(T)dT. (20.61)
к, t L ок j
Если корреляционная функция процесса В (0 характеризуется несколькими значениями постоянных времени, то в качестве ть следует брать наибольшее из них.
Процесс X (/), опясываемый уравнением (60), не является в тсч-ности марковским. Приближенно X (/) можно считать марковским процессом, если выполняется неравенство
тс>- max (р, Tfc). (20.62)
Приведем формулы для вычисления локальных характеристик процесса X (/) в общем случае, когда исходное уравнение в операторной форме записи имеет вид
(р)рХ = Zlf (X, Г) + й (X, /)« (01. (20.63)
*> Этот материал предоставлен нам В. Д. Разевигом. См. В. Д. Разевиг. Понижение порядка стохастических дифференциальных уравнений с малыми параметрами. — «Известия вузов СССР. Радиофизика», 1976, т. 19, № 8.
Понижение порядка стохастических уравнений с малым параметром 221
Здесь считаются заданными соответствующие начальные условия, р = d/dt — оператор дифференцирования, 5? — оператор преобразования Лапласа, Кц (р) — линейный оператор:
/Сц (р) = 1+ У (Н) PS НшКи(р)= 1. (20.64)
/=1 |»-*0
Уравнение (60) является частным случаем (63) при (р) = 1 4~ цр.
Для записи условных моментов (15) не требуется знать точного решения уравнения (63), достаточно найти его решение на малом интервале (/, / 4г ДО с точностью О (ДО, где
t » » Д » max (р, Tft), Д/ ~ Д. (20.65)
Обозначим импульсную характеристику звена (Кц (р)]-1 через Н (/). По определению,
Н (/) =
1
рКмJ ’
где — оператор обратного преобразования Лапласа^ Применительно к (64) имеем
(20.66)
H(t) = [°’ (20.67)
( 1 <>р.
Рассматривая правую часть уравнения (60) как внешнее воздействие, формально при помощи импульсной характеристики уравнение (63) при С§>тс можно записать в следующем виде:
А (t 4- At) = X (t) + Н (t 4- At—т) [/ (X (т), т)4-
t
+ £(Ш T)g(T)]dT. (20.68)
Здесь интеграл в правой части не является стохастическим, так как процесс 5 (t) имеет ограниченную дисперсию. Поэтому уравнение (68) можно представить в операторной форме
х = х0 -Ь Ф (х). (20.69)
Здесь для сокращения записи обозначено: х = A (t 4- ДО — текущее решение, х0 = А (/) — «начальное» условие, Ф (х) = X (х) 4" 4г Y (х) — линейный интегральный оператор
1 + Л/
Х(х) = $ + — т)/(х(т), т)(/т,
t + M
Y(x)= Н +M — x)g(x(x), x)l(x)dx.
222
20. Область применения аппарата марковских процессов
Приближенное решение операторного уравнения (69) будем искать методом последовательных приближений
X[/J = х0 + Ф (20.70)
где j = 1, 2, ... — номер приближения.
. В качестве нулевого приближения примем функцию, тождественно равную начальному условию xt°l = х0. Тогда в соответствии с (70) первое и второе приближения имеют вид
х[1] = х0 + Ф (х0). *[21 = х0 + Ф (х0 + Ф (*<>))• (20.71)
Раскладывая функционал (71) в ряд Тейлора в окрестности «точки» (функции) Хо и принимая во внимание два первых члена разложения, имеем
х[2] = х0 + Ф (х0) + Ф, (х0)Ф (х0) + ... (20.72)
Здесь интегральный оператор Ф( (х) имеет вид [145]:
(-|-Д(
ФДх) = Г + M — т) -т)- + —-* Е(х)1 dx = J дх дх
~ Хх (х) + Yx (Х).
При выполнении условия (65) можно показать, что функция X (х) растет не быстрее, чем Д/, a Y (х) не быстрее, чем VЫ в среднеквадратичном. Поэтому удерживая в соотношении (72) лишь члены порядка Д/, получим
х[21 = хв + X W + Y (х0) + Y'x (х0)У (Хо) + о (ДО- (20.73)
Можно показать, что следующие итерации xl3l, хС41 и т. д. имеют с точностью до О (&t) тот же вид, что и x[2L Следовательно, выражение (73) является приближенным решением уравнения (69) с точностью до 0 (Д/). Возвращаясь к исходным обозначениям, для приближенного .решения уравнения (68) получим выражение
t+bt
2 .(< + Д0 = Ц0 + Ж 0 $ /У(< +Д/—т)(/т + t
+ g(X, t) (j H (t + \t—x)£ (x) dx + t
t + Ы s
+ - - g(.K t) f + (H(s-u)dsdu + o(bt).
OX J J
t t
(20.74)
Понижение порядки стохастических уравнений с малым параметром 223
Подставляя (74) в определение коэффициента сноса (15), имеем {/-t-Ai
/(X,/) Г Н(!+&!—x)dx-f-
J
<+Л.' s
+ Э8(*? t) f H(t + M-s)^H(s-u)ki(s-u)dsdu .
дк J J
t ‘
(20.75)
Учитывая свойство (67) функции H (!) и неравенства (65), интегралы, входящие в (75), можно упростить:
1 + А
у J H(t + k — x)dx« 1, I
i + Л ’
J-J //(/ + & — s) j H(s—и) ki (s— u)duds « l i
« H (x) k* (x) dx.
о
В результате получим, что коэффициент сноса «эквивалентного» одномерного марковского процесса X (/) равен
а (К !) = НЪ t) + v^g (X, Г) ° . (20.76)
Z <7Л
где No задается соотношением (19) и
00
* = H(x)KUt)^. (20.77)
Nq j о
Подставляя выражение (74) в определение коэффициента диффузии (15), получим известное выражение
Ь(Ъ 0 = -pg2(K 0- (20.7В)
Из сопоставления (19.34) с (76), (78) следует, что уравнению (63) можно поставить в соответствие обобщенное стохастическое дифференциальное уравнение первого порядка (19.31). Пользуясь правилами перехода от обобщенных стохастических дифференциальных уравнений к симметризованным, получим, что случайный процесс, поведение которого описывается уравнением (63) с малыми параметрами, может быть приближенно заменен одномерным мар
224
21. Воздействие шума на простейшие колебательные системы
ковским процессом X (/), удовлетворяющим стохастическому дифференциальному уравнению первого порядка
= 0 +g(X, t)n(t), (20.79)
at \ Z J Z 0t
где n (t) — нормальный белый шум с нулевым средним значением и спектральной интенсивностью No /2.
Пример 3. Пусть корреляционная функция процесса | (/) имеет
ВИД
fe (т) = ехр (-----------------L1L .
' 4rft V )
Для передаточной функции Кц (р) = (1 + ррУ1 вычисления по формулам (66) и (77) приводят к результату v — -Hl + —1 ". Ана-z I т;&.1
логично для Кц (р)= ехр (цр) получим v = — ехр (——V Описанная методика понижения порядка уравнения (63) спра-
ведлива и при наличии нескольких малых параметров ц2, которые удовлетворяют условию (62). Например, для передаточной функции /<|Л (р) = (1 ф- Pjp)(1 + р,2р) из соотношений (66) и (67) следует v = Ц(1 + —)(1 + —)
Таким образом, значение коэффициента v зависит от соотношения между малыми параметрами р, и ть. Если то v = 0,5;
если то v = 0
21. Воздействие шума на простейшие колебательные системы
Воздействие шума на колебательный контур
Пусть на колебательный контур LCR (рис. 21.1) воздействует абсолютно стабильный гармонический сигнал
s (0 = A sin (a>t + <р0)
и аддитивный нормальный белый шум п (t) с нулевым средним значением и функцией корреляции
k (т) = No 6 (т)/2, (21.1)
где 6 (т) — дельта-функция.
Воздействие шума на колебательный контур
225
Дифференциальное уравнение для тока X (t) в индуктивной ветви колебательного контура имеет вид
X(/) + 2aX(/)4®gX(/) = - “0 [s(/)4n(/)] (a = R/2L, cog = l/LC),
(21.2) где точкой сверху обозначены производные по времени. Предположим, что контур обладает большой добротностью (Q=co0/2a^>l) и расстройка между частотой сигнала со и резонансной частотой контура <о0 мала, т. е. ______________
| со — соо | со0. г- I
Считая эти два условия выполненными, 1 /5^
решение уравнения (2) можно искать в ви- j ‘
де квазигармонического колебания. При Л
этом целесообразно перейти от одного диф-ференциального уравнения второго порядка —»—-Г
(2) к двум уравнениям первого порядка, опи- * сывающим поведение амплитуды (огибаю- рис 21, Колебательнь1Й щей) и фазы. При определении понятий амп- контур,
литуды и фазы колебаний, хотя и близких к гармоническим, но не являющихся строго гармоническими, имеется некоторый произвол [30, 70, 71].
Мы определим амплитуду и фазу колебаний соотношениями
X (/) = V (Z)cos (со/ + ср (/)), X (/) = — со]/ (Z)sin (со/ + ср(/)),
V(/)>0. (21.3)
Отсюда имеем
V2 (/) = (X2 + Х2/со2), ср (/) = —со/ — arctt’ (Х/соХ). (21.4) Продифференцировав эти равенства по времени, получим
1/= X (X + со2 Х)/со2 ]/, ср- — X (X-f-со2 Х)/со1/2. (21.5)
Если в эти уравнения подставить выражение X из (2), а затем воспользоваться равенствами (3), то получим точные дифференциальные уравнения для новых переменных V (/) и ср (/):
V = —а]/ + (сооЛ/2со)соз (ср — ср0) + (coo/co)n(/) sin (со/ + ср) 4-+ a]/ cos 2(со/ + ср) — (со§Л/2со) cos (2со/ + ср 4- Фо) —
• — [(со2 — со§) V/2co] sin 2(со/ + ср),
ср = (cog — со2)/2со— (Лсо§/2соУ) sin (ср — ср0) +
+ (coq/coV)n (Z)cos (со/ + ср) — а sin 2(со/ + <р) +
4- l(cog — со2)/2со] cos 2(со/ 4 ср) + (Лсоо/2соУ) sin (2со/ + ср4~ср0). 8 Зак. 1216
226
21. Воздействие шума на простейшие колебательные системы
В этих уравнениях возможны дальнейшие упрощения. Во-первых, в колебательном контуре, настроенном на частоту со0 и имеющем малое затухание, сопротивление конденсатора для гармонических составляющих удвоенной частоты 2ш очень мало и, следовательно, ток, обусловленный этими составляющими, протекает через конденсатор, а не через индуктивность. Во-вторых, различие между частотой сигнала со и резонансной частотой контура ®0 мало, т. е. |(со0— со)/® (<<1. Пренебрегая гармоническими составляющими удвоенной частоты и полагая а>0 ®, получим
V = —a.V 4- (®Л/2)соз (ср — ср0) + ып (7)sin (со/ 4- ср), (21.6)
ср = До—(<oA/2V) sin (ср — срй) 4- (®/И)/г (/) cos (со/ 4- ср),(21.7) где До = (®о — со2)/2® » со0 — со — начальная расстройка по частоте.
Система уравнений (6) и (7) является основной для последующего анализа. Отметим, что эти уравнения не могут быть решены в квадратурах даже в отсутствие шума (п (/) 0). Рассмотрим раз-
дельно несколько частных случаев.
Предположим, что шум отсутствует, т. е. п (t) = 0. Полагая в уравнении (7) ср = 0, находим стационарное значение разности фаз
Ф, — Фо = arcsin (2Ao|/s/co4). (21.8)
При этом стационарное значение амплитуды вынужденных колебаний, как следует из (6), будет равно
Vs = (cm4/2a)cos (cps — cpu), т. e.
К, = соЛ/2(а2 4- Ло)|/2. (21.9)
Рассмотрим случай, когда отсутствует гармонический сигнал (х (/) = 0). Определим огибающую и фазу для этого случая равенствами
А (/) = V (/)cos (®0/ 4- ф (/)), Л (7) = —<оо|/ (Z)sin (со0/ 4- ф (/)),
И(/)>0. (21.10)
Теперь вместо (6) и (7) получим систему уравнений
V = —aV 4- (Osin (со0/ 4- ср), (21.11)
ср = (<o0/V)n (Z)cos (®0/4- ср). (21.12)
Перейдем к вычислению статистических характеристик огибающей и фазы. Для этого нужно предварительно вычислить средние значения и корреляционные функции случайных процессов, входящих в правые части уравнений (11) и (12). Обозначим
«с (0 = п (Z)sin (со0/ 4- ср (/)), п2 (/) = п (/)cos (со0/ 4- ф(/)).
(21.13
Воздействие шума на колебательный контур
227
Если бы в этих выражениях фаза <р была фиксированной величиной, то средние значения и корреляционные функции случайных процессов п1 (/) и п2 (/) находились бы просто. Так как <п(/)> — О, то
<П1 (01 Ф> =<«1ф(0> = <«2 (О I ф> = (0> = °>
<«! (/)(t + т) I <р> = <п|ф (Z) /г|ф (/ + т)> =
= (п (t) n(t + т)> sin (cou t -f- <p) sin (co,, t + co, т + ф) =
— ~ k (x) [cos coo x —cos (2co., t + coo т -|- 2cp)|,
<n2 (t) n2 (t + T) I ф> = < И2ф (0 П'2ф (Z1 + т) > =
= ~ /г(т) |cos соо т-f-cos (2со„ t + со, х + 2ф)|,
I
</1о(Г (/) П|ф (Z+ х)> = -^-/г(х) [sin со,, х + sin (2со,, I + со,, т + 2ф)].
Опуская гармонические составляющие удвоенной частоты и учитывая (1), получили бы
<П1ф (0«1ф (Z + Т)> = </?2ф (/)л.2ф (t + Т)> = No8 (т)/4,
</г)ф (/Н-т)п2ф (/)> = 0. (21.14)
Однако в действительности эти выражения требуют корректировки Из уравнения (12) видно, что случайная фаза ф (/) получается в результате интегрирования белого шума п (/) и, следовательно, коррелирована с ним. -Так, например, в выражение для приращения фазы за некоторый промежуток т входит шум п (tY
Дф(х) = ф(С) —ф(£ —х) = соо j |п (s) cos (со,, s + ф(з))/V (s)| ds.
(21.15)
При нахождении коэффициентов сноса и диффузии для уравнений (И) и (12) нам потребуются условные средние значения и корреляционные функции процессов пг (/) и п2 (/). Вычислим их с учетом корреляционной связи между п (Z1) и ф (/) [72].
Возьмем достаточно малый интервал времени т<^1/а, чтобы одновременно выполнялись неравенства
||/(/)- |/(/-т)| < V{t), |Дф(т)| = |ф(/)-ф(/-т)|<1.
(21.16)
Это означает, что в течение времени х огибающая и фаза колебаний не успевают заметно измениться.
8*
228
21. Воздействие шума на простейшие колебательные системы
Ограничиваясь учетом первых членов разложения в ряд по Дф, т. е. полагая
sin ф (/) = sin [ф (t — т) + Дф (t)J « sin ф (I — т) +
+ Дф (t)cos ф (t — т), (21.17)
cos ф (/) — cos [ф (t — т) + Дф (т)] са cos ф (/ — т) —
— Дф (т) sin ф (t — т), выражения для пг (/) и (/) примут следующий вид:
П] (/) = п (t) sin (со0/ + ф (/)) = п (z')sin (со0/)созф (t — т) —
— п (/)Дф (r)sin ((o0/)sin ф (z1 — т) + п (/)cos (ш01) simp (t—т)
+ п (/)Дф (t)cos (со0/ )cos ф (t — т),
«2 (О = П (/)COS (о)(1/ + ф (f)) = п (Z)COS ((D0/)COS ф (t — т) — — п (г')Дф (t)cos (coo/)sin ф (t — т) — п (t)sin (cou/)sin ф (t — т) —
— п (/)Дф (т) sin ((oa/)cos ф (/ — т).
Заметим, что величины V (t — т) и ф (t — т), получающиеся в результате интегрирования белого шума п {t) с некоторым весом за «прошедший» промежуток времени, статистически независимы от «будущих» значений п (t). Такое утверждение неверно, если рассматривать случайные величины V (t + т), ф (t + т) и п (/) при т>0. Учитывая эту статистическую независимость, записываем выражения для условных средних значений процессов пх (/) и п2 (/) при фиксированном значении ф (t — т):
<П] (Z) |ф (t — т)> = (П|ф (/)) = (л(Z)Дф(т))cosroa/cos<p(/—т)—
— <л(/)Дф(/ — T)>sin co0z sin ф (t — т),
</i2 (/) j ф (/ — т)> = <n2q> (г)) = — </г (/) Дф (т)> cos cooZ sin ф (/—
—т) — <n (/) Дф (т)> sin w0/cos ф (t — т).
Поскольку ф (t — т) « ф (/),то
<п lq> (/)> = <п (/)Дф (t)>COS(w</ + ф (/)),
<«2q> (0> = — <« (ОДф (т)> sin + ф (/)). (21 18)
Для вычисления выражения </г (/)Дф (т)> воспользуемся уравнением (12), полагая в нем согласно условию (16) V (/) V (t — т), Ф (/) « ф (t — т):
<п(ОДф(т)>=<о0 С /2-^^cos(o)0r+ ф(/'))«
Т
е
— юо J cos (юоV + Ф ~~т)) dt'-
Воздействие шума на колебательный контур
229
Подставив сюда выражение корреляционной функции из (1) и пользуясь правилом интегрирования с дельта-функцией (III—6), получим
<п (0 Д<р (т)> = ~~~ cos (oj„ t + <р (/ — т)) «
«^cos((V + <P(0). (21.19)
Подставив это выражение в (18) и отбросив осциллирующие члены двойной частоты 2со0, получим
<П1Ф (/)> = со0Л/0/81/ (/), <п2ф (0> = 0. (21.20)
Введем центрированные случайные функции
Si (0 = (/) — <ni(p (/)>], £2 (/) = сопп, (0. (21.21)
Очевидно, что <|, (/)> = <|2 (/)> = 0. Если в отношении (/) и g2 (t) применить рассуждения, использованные при получении соотношений (14), то получим
(0|2 (/ + т)> = <5, (/ + т)?2 (/)> = 0,
<£, (/)£, (/ + т)> = <£, (/)£., (/ + т)> = coW (т)/4. (21.22)
Приведенные выкладки позволяют записать уравнения (11) и (12) в следующем упрощенном виде
V^_aV + ^N0/8V + ^(t), Ф = £,(0Ж (21-23)
где взаимонезависимые нормальные случайные функции Si (/) и (0 имеют нулевые средние значения и дельта-функцию корреляции (22).
Из (23) видно, что стохастическое дифференциальное уравнение для огибающей не зависит от фазы и его можно решать самостоятельно. Это уравнение полностью аналогично уравнению (19.50). Согласно (19.51) стационарная плотность вероятности огибающей определяется законом Релея
Р (V) = (W)exp (-VW), а2 = co§7Vo/8a = Nn/4RC,
. V>0. (21.24)
Таким образом, если на узкополосный колебательный контур воздействует широкополосный (белый) шум, то огибающая случайного процесса на выходе контура в стационарном состоянии имеет релеевскую плотность вероятности. Этим результатом можно воспользоваться на практике для моделирования релеевского процесса. Огибающую можно выделить при помощи амплитудного линейного детектора огибающей.
230
21. Воздействие шума на простейшие колебательные системы
Найти плотность вероятности фазы <р (fy, определяемой вторым уравнением (23), затруднительно.
Возвратимся к общему случаю, когда имеется сигнал и шум Применяя в отношении случайных процессов, фигурирующих в правых частях уравнений (6) и (7), те же рассуждения, которые использовались при выводе формул (20) и (22), можно привести исходные уравнения к следующему виду:
V = _aV + (<oA/2)cos (<₽ — <р„) + (orWu/87) + (t), (21.25)
q> = An —(<oA/2l/)sin (<p — <p0) + H,(/)/7, (21 26)
где g, (/) и g2 (/) — взаимонезависимые нормальные случайные процессы с нулевыми средними значениями и дельта-функциями корреляции:
<?! а + т)> = <h {t + т)> = o>W (т)/4. (21.27)
К сожалению, плотности вероятностей огибающей и фазы в этом случае найти не удается.
Анализ работы автогенератора при наличии шума
Для многих радиофизических задач представляет практический интерес вопрос о характере колебаний автогенератора с учетом собственных флуктуаций (шумы сопротивлений потерь и шумы элект-
ройных, полупроводниковых и других приборов) и внешних случайных воздействий (колебания температуры окружающей среды, случайные колебания напряжения источников питания, вибрации и т. д.).
Флуктуации амплитуды и частоты, обусловленные только собственными шумами автогенератора, принято на-
Рис- 21.2. Упрощенная схема автогенератора.
зывать естественными флуктуациями. Эти флуктуации принципиально неустранимы и определяют тот предел повышения стабильности частоты и амплитуды автогенератора, который не может быть превзойден.
Флуктуации амплитуды и частоты, обусловленные внешними случайными воздействиями, называются техническими флуктуациями- Эти флуктуации можно устранить мерами параметрической стабилизации (термостатирование, гашение вибраций и т. д.) и стабилизации питающих напряжений.
Несмотря на то, что в реальных условиях технические нестабильности значительно превышают естественные, ограничимся здесь рассмотрением влияния собственных флуктуаций (типа дробо
Анализ работы автогенератора при наличии шума
231
вого и теплового шума) на работу автогенератора, поскольку они представляют принципиальный интерес.
В дальнейшем будут определены статистические характеристики амплитуды и фазы, а также найден энергетический спектр колебания.
Уравнение генератора. Рассмотрим простейшую схему лампового генератора гармонических колебаний с колебательным контуром в цепи сетки лампы (рис. 21.2). Нетрудно убедиться, что дифференциальное уравнение генератора для напряжения X (/) между сеткой и катодом лампы имеет вид
LC — + RC — + к = М-^ — + F(t). (21.28)
dt? dt dk dt '
Здесь L, C, R — параметры колебательного контура, M — коэффициент взаимоиндукции анодной и сеточной катушек, /а (/) — нелинейная функция зависимости анодного тока лампы от напряжения на сетке, F (/) — внешнее воздействие на генератор.
Для упрощения формул будем считать, что сеточные токи отсутствуют и можно пренебречь анодной реакцией. Тогда ! Л = /'(Л), причем характеристику лампы на некотором участке можно аппроксимировать кубическим полиномом
/ч (А) = /„ 4- SX - ТХ\
Тогда уравнение (28) примет вид
X (Од X — 26 (I — 4.Х2/Лб) X 4- <ор Л (/).
Здесь точка сверху обозначает производную по времени, а>о = = 1/LC — собственная частота колебательного контура, 6 = — <£>о (5Л4 — RC)/2 — величина, характеризующая затухание в регенерированной линейной системе, Ао — [4(5Л4 —7?С)/ЗуЛ4Г^— амплитуда автономных колебаний генератора в отсутствие внешнего воздействия (см. ниже).
Рассмотрим здесь случай, когда под F (?) понимается приведенный к сетке эквивалентный собственный широкополосный флуктуационный шум элементов схемы генератора F (/) = £ (/). В дальнейшем будем трактовать его как нормальный белый шум. На основании часто применяемой методики измерения собственных флуктуаций радиоустройств (при помощи сравнения с дробовым шумом диода в режиме насыщения), функцию корреляции флуктуационного шума Ё (/) целесообразно определить формулой
<U/i)M^)> = ^06 (т)/2, Л/0 = 2с/5, г = Z2 — Л, (21.29)
где е = 1,6- 10~ 1”К — заряд электрона, /8 — эквивалентный ток диода в режиме насыщения.
232
21. Воздействие шума на простейшие колебательные системы
С учетом сказанного запишем уравнение генератора
X + Х = 26 (1 — 4Х2/А0) X + ? (/). (21.30)
Для изучения решения этого уравнения целесообразно перейти от одного уравнения второго порядка к двум уравнениям первого порядка, описывающим поведение амплитуды и фазы.
Определим амплитуду и фазу соотношениями
X = A cos (о)0/ + <р), X = —о)0 A sin (о>0/ + ф). (21.31)
Отсюда получим
А2 = (Х2 + а>о2 V), ф=—о)()/ — arctg (X/(on X). (21.32)
Дифференцируя эти выражения по времени, получим
А = X(X-f- coo Х)/о>о А, ф=—Х(Хф- «о X)/w0A2. (21.33)
Если в правые части написанных равенств подставить выражение (Х+ coo X) из (30) и затем выразить X и X через А и ф согласно (31), то придем к уравнениям
Д==6(1 —Д2/4о) +(o0S(Osin((o0Z+ ф) + /1(Д, ф, 0
(21.34)
Ф = ((о0/Д) | (/) cos ((оо t + ф) + /2(А, ф, /), где
Д (Л, ф, f) ~ —6А cos (2(о0/ + 2ф) + (6Л3Л4о) cos (4(о0/ + 4ф), f2 (А, ф, 0 = 6 (1 — 2A2/Ao)sin (2(о0/ + 2ф) —
— (6A2/Ao)sin (4(о0/ + 4ф).
Для дальнейших упрощений примем во внимание следующие два обстоятельства. В контуре, настроенном на частоту (оо и имеющем малое затухание, происходит эффективная фильтрация высших гармоник, и они не могут оказывать существенного влияния на процессы в генераторе. Предполагается, что собственный флуктуационный шум имеет малую интенсивность. Поэтому в уравнениях (34) в первом приближении можно опустить быстро осциллирующие члены fi (А, ф, t) и /2 (А, ф, /). Тогда получим
А = 6 (1 — А2/Ао)А + (о0£ (/)sin ((Bq/ + ф),
Ф = ((оо/А)5 (/)cos ((оо/ + ф). (21.35)
Из курса радиотехники известно, что влияние не учтенных нами высших гармоник сводится к некоторой поправке на частоту. Однако эта поправка является регулярной. Поэтому несмотря на то, что поправка на частоту, обусловленная высшими гармониками, пре
Анализ работы автогенератора при наличии шума
233
вышает флуктуации частоты, следует признать, что сделанное упрощение в наших целях является оправданным.
Уравнения (35) принято называть укороченными уравнениями лампового генератора. Следует указать, что они могут быть получены из уравнений (34) не только путем отбрасывания членов с высшими частотами, но и путем усреднения правых частей по времени за период То = 2л/ю0. При этом усреднению должны подвергаться лишь регулярные члены.
Из уравнений (35) легко находим стационарный режим работы генератора в отсутствие флуктуаций. Так, полагая в первом уравнении А = 0, § (/) = 0, находим = Ао. Аналогично, при § (t)= з= 0 из второго уравнения получим ф = 0, ф8г = 4)0 = const, т. е. фаза сохраняет начальное значение. При этом никакому значению начальной фазы нельзя отдать предпочтение. Поэтому ее практически нужно считать случайной величиной, равномерно распределенной в интервале (—л, л).
Таким образом, в стационарном режиме напряжение на контуре определяется формулой
X (f) = А о cos (<»(/ + <р0). (21.36)
Видно, что введенная ранее в рассмотрение величина Ао, действительно, представляет собой установившееся значение амплитуды напряжения на контуре.
Дальнейшее упрощение уравнений (35) позволяет перейти к системе уравнений, в которые собственные флуктуации £ (/) входят без комбинации с гармоническими сомножителями. С этой целью нужно повторить те же рассуждения и вычисления, которые позволили перейти от дифференциальных уравнений (11) и (12) к уравнениям (23). В результате получим
А = 6(1 — А’/Ло) А + (<о§ 7V0/8 А) + (/),
(21.37)
Ф = £2
где и (t) — взаимонезависимые нормальные случайные процессы с нулевыми средними значениями и дельта-функциями корреляции:
<?! (Мт (t + т)> = <?2 (/)|2 (t + Т)> = cog/VoS (т)/4. (21.38)
Перейдем теперь к решению уравнений (37).
Решение уравнений. Первое стохастическое дифференциальное уравнение (37) не содержит случайной фазы гр (t) и его можно решать самостоятельно. Найдем стационарную плотность вероятности
234
21. Воздействие шума на простейшие колебательные системы
амплитуды колебаний. Уравнение Фоккера—Планка — Колмогорова в данном случае имеет вид
_?_/>(А, /)=- -А. {(б (1 _ АЧАЪ) А + (соо ^b/8A)j Р (A, t)~ 01 (7/1
—Р(А, /)). (21.39)
Рис. 21.3. Стационарные плотности вероятностей генераторе при наличии флуктуационного шума.
Стационарная плотность вероятности Pst (А) определяется уравнением
— Р (А) = [-“-( 1 — Л.) А +±]р (А)
dA sa [«Ио к Л8 / л J eK ’ и равна
Pst (А) = СгА expl—х2(А/А0 - 2)(А/А0)2] =
= С0А ехр {—x2l(A/A0)2 - 1J2}, х = (26А8ЫЛ/О),/2- (21 40)
• оо
Постоянные Сопределяются из условия нормировки JPsi (A)dA = 1. о
Если в (40) перейти к безразмерной амплитуде х = А/Ао, то получим
Р6«(А) = [2Х/1/Л"ф(х/2')]^ехр (—х2^2—1)а), л>0. (21.41)
Анализ работы автогенератора при наличии шума
235
Графики этой плотности вероятности для нескольких значений параметра хг приведены на рис. 21.3. Наивероятнейшее значение безразмерной амплитуды равно
хт = [(1/2)(1+ГГнГг)]1/2.
Параметр х характеризует статистический разброс амплитуды колебаний. При увеличении х (уменьшении интенсивности шума Л'о) плотности вероятностей все больше концентрируются около значения х,п, которое в свою очередь стремится к единице. В пределе при х “* 00 плотность вероятности переходит в дельта-функцию 6 (х — 1). Следовательно, при выполнении неравенства
Х = (26^М^)’/г>1 (21.42)
флуктуации амплитуды колебаний будут малы, т. е.
<(Д (/) - Л0)г>< (21.43)
Применительно к рассматриваемой задаче, когда ,¥0 определяется собственными флуктуациями генератора, условие (42) обычно выполняется.
Перейдем к рассмотрению второго уравнения системы (37). Решение этого уравнения в общем виде затруднено из-за наличия в знаменателе правой части случайной амплитуды А (/). Однако при выполнении условия (42), т. е. при малой интенсивности шума, можно согласно (43) заменить А (/) на Ао. Тогда второе уравнение (37) примет вид
*Ф = (/)/Л0, (21.44)
где Ег (Z) — нормальный белый шум с нулевым средним значением и корреляционной функцией (38). Это уравнение с точностью до постоянного коэффициента совпадает со стохастическим дифференциальным уравнением (14.2), определяющим винеровский процесс. Поэтому все результаты § 14 для винеровского процесса распространяются на случайную фазу ф (/). В частности, ф (/) есть процесс с независимыми и нормально распределенными приращениями. Приращение фазы за интервал времени т
«+т/2
Дфт = Ф (/+ т/2) —ф (/— т/2) = (1/Д0) lz(s)ds (21.45)
Г —т/2
имеет нулевое среднее значение <Аф^> = 0 и дисперсию, равную о2(т) = <Дф^>=Т)т) Z>= о>§ А/0/4Л§ = 6ха/2. (21.46)
Плотность вероятности приращения фазы является нормально?! и имеет вид
/>(Дфх) = (1/оф(т) /2л)ехр(—Дфх/2о^(т». (21.4 7)
236
21. Воздействие шума на простейшие колебательные системы
Если значение фазы в начальный момент времени t = 0 равно Фо = ср (0), то полная фаза
<р = <р (Z) = <р04-(1/Л0) ga (s) cZs (21.48)
О
имеет среднее значение (<р> — <р0 и дисперсию
оДб = <(ф-<Ро)2> = £>Л (21.49)
Рис. 2L4. Характер изменения полной фазы ф(О во времени (а) и соответствующая реа^ лизация фазы $(/)» приведенной к интервалу (—л, л) (б).
Плотность вероятности полной фазы равна ’
Р(ф, /) = (l/Oq>(0K2:ri)exp[ — (ф — ф0)2/2Оф(01, — оо<ф<оо.
(21.50)
Полная фаза является нестационарным случайным процессом, так как плотность вероятности (50) явно зависит от времени.В начальный момент времени t — 0 плотность вероятности имеет вид дельтафункции 6 (ф—ф0), а затем с ростом t неограниченно расплывается по бесконечной прямой^ф. Если рассматривать множество идентичных генераторов, образующих некоторый ансамбль, и допустить, что при t — 0 все генераторы ансамбля имеют одинаковую начальную фазу ф0, то с ростом t фазы отдельных генераторов будут все более разбросанными. Следовательно, длительная «привязка» текущей фазы к начальной из-за наличия флуктуаций невозможна.
Из (46) и (49) видно, что дисперсия приращения фазы растет пропорционально времени. Следовательно, приращение фазы является нестационарным процессом и мгновенные значения приращения фазы могут превышать значения ±2л, ±4л и т. д. Примерный характер изменения фазы ф (/) во времени изображен на рис. 21.4, а.
Анализ работы автогенератора при наличии шума
237
Обычно наблюдается не сама фаза, а некоторая нелинейная функция от нее, в частности, cos (<р — ф0). На рис. 21.5 изображена многозначная функция cos (ф — <р0) и показан характер изменения плотности вероятности (50) во времени.
Флуктуации фазы вызывают случайный разброс частоты относительно ее номинального значения, причем практически нельзя
предложить какие-либо меры для устранения этого эффекта без существенного изменения принципа работы самого генератора (например, переход от ламповых генераторов к молекулярным). Позже будет указана количественная мера естественной нестабильности частоты колебаний генератора.
Таким образом, колебание автогенератора при учете собственных флуктуационных шумов, в отличие от (36), имеет вид
X (/) = A (Z)cos [<оо/ -> ф (/)],
—оо < ф < оо, (21.51)
Рис. 21.6. Функция COS (ф — Ф-) н плот-ность вероятности полной фазы.
где A (t) и ф (/) — случайные амплитуда и фаза, одномерные плотности вероятности которых даются формулами (40) и (50).
В практических задачах приходится рассматривать воздействие сигнала (51) на различные устройства (амплитудный, фазовый или частотный детекторы, фазовая или частотная автоподстройка частоты, счетчик числа нулей, коррелометр и др.). При этом нас будут интересовать разные статистические характеристики сигнала. Хотя возможно большое разнообразие практических случаев [73], отметим здесь следующие два.
В некоторых задачах является существенным, имеет ли приращение фазы сигнала значение (ф — ф0) или (ф — ф0) ± 26л, где k = 1, 2, 3 ... Примером может служить использование автогенератора в качестве эталона времени, когда не безразлично, изменилась ли фаза на (ф — ф0) или (ф — ф0) ± 26 л. В таких задачах нужно рассматривать полную фазу ф (/).
Наоборот, иногда (например, при амплитудном детектировании сигнала) безразлично, имеет ли приращение фазы сигнала значение (ф — ф0) или (ф — ф0) ± 26 л. В подобных задачах, когда не имеет значения изменение фазы на ±26л, часто оперируют с фазой Ф (/), приведенной к интервалу (—л, л). При этом считают, что возможные значения приращения фазы заключены лишь в интер-
233
21. Воздействие шума на простейшие колебательные системы
вале (—л, л) и реальная реализация случайной фазы ф(/), приведенная на рис. 21.4, а, заменяется на разрывную кривую, изображенную на рис. 21.4, б. Очевидно, что такая замена не скажется на поведении периодической функции с периодом 2л, например, на поведении cos (ф — ф„).
Рис. 21.fi. Представление полной фазы <р(/> в виде суммы двух разрывных процессов: приведенной фазы ф (О и случайной последовательности биполярных прямоугольных импульсов v (О*
Следовательно, полную фазу ф (/) можно представить в виде суммы двух разрывных процессов (рис. 21.6):
ф (0 = ф (/) + 2nv (/),
(21.52)
где v (I) — случайная последовательность биполярных прямоугольных импульсов, высота которых принимает только целочисленные значения.
Анализ работы автогенератора пра наличии шума
239
Положительные импульсы появляются в моменты времени, когда случайная фаза <p (t) пересекает снизу вверх уровни (2m + 1)л, где m — 0, 1, 2...а моменты появления отрицательных импуль-
сов соответствуют пересечениям ср (t) уровней —(2m + 1)л сверху вниз.
Всякий раз, когда случайная фаза ср (/), возрастая, пересекает уровень (2m + 1)л, часто говорят, что имеет место «перескок» фазы
Рис. 21.7. К вычислению плотности вероятности приведенной фазы.
за соответствующий уровень. Когда же фаза ср (/) в результате убывания принимает значение —(2m + 1)л, говорят о перескоке фазы за этот уровень.
При использовании приведенной фазы колебание генератора записывается в виде
Х(/)= А (/) cos [соо /-р ср (/)], —л^ср(/)^л. (21.53)
Из сравнения (51) и (53) видно, что при записи (53) отбрасывается целое число периодов ±2&л.
В соответствии с описанным способом замены полной фазы ср (/) на приведенную ср (/), можно найти плотность вероятности для приведенной фазы ср (/). Для этого нужно свернуть плотность вероятности (50) на интервал (—л, л) следующим образом (рис. 21.7). К части плотности вероятности, расположенной в интервале (—л, л), прибавив ее крылья, расположенные соответственно в интервалах 1(26—1)л, (2k + 1)л] и I—(2k + 1)л, —(2k— 1)л]. Воспользовавшись формулой (50), получим
/’(фД) =
—Ц— У ехр аф(01/2л
(ф —cp»4-2fen)3 2^(0
(21.54)
Рассмотрим предельный случай при оо. Так как при /->-оо дисперсия Оф (/) -> оо, то два соседних члена суммы, соответствующие значениям k и k ± 1, будут отличаться очень мало и суммирова
240
21. Воздействие шума на простейшие колебательные системы
ние можно заменить интегрированием. В результате предельного перехода получим
1
—, —л ср л.
2л
(21.55)
В результате приведения нормального нестационарного закона распределения (50) полной фазы к интервалу (—л, л) в пределе получается равномерная стационарная плотность вероятности (55). Именно это упрощение используется при оперировании с приведенной фазой особенно в тех случаях, когда интересуются одномерными статистическими характеристиками.
Формула (54) оказывается неудобной для последующих вычислений. Получим плотность вероятности приведенной фазы из решения уравнения Фоккера—Планка—Колмогорова. Запишем уравнение Фоккера—Планка—Колмогорова для плотности вероятности перехода р(<р, 11 <р0) применительно к стохастическому дифференциальному уравнению (44)
др (ср, 11 ф0)/д/ = (0/2) д2 р (ср, Нф0)/^Фа» —лсСгрСл. (21.56)
Найдем решение этого уравнения при начальном условии
/’(Ф.ИФо)=5(Ф—Фо)> —л<ф0<л, (21.57)
граничном условии
Р (л, /|ф0) = р (—л, /|ф0) (21.58)
и условии нормировки
5 Р(ф>МсРо)^Ф= (21.59)
— л V.
Граничное условие (58) соответствует описанному ранее методу преобразования полной фазы в приведенную фазу.
Будем искать решение уравнения (56) методом разделения переменных, т. е. в виде
р(ф,Йфо)=Ф(фИ(О-
Применяя обычную методику (см. § 12), получим
Т (0 = ехр ( — у2t), Ф (ф) = A cos У2у2/О (ф—фо).
Анализ работы, автогенератора при наличии шума
211
Граничное условие (58) будет удовлетворено, если V2y2, D = п, где п = 0, 1,2, ... — целое число, т. е. у2 = О/’2/2. Поэтому
оо
Р (ф, 11 Фо) = 2 лп ехр (— п2 Dt/2) cos п (ср- ср0). п = 0
При / = 0 должно выполняться начальное условие (57), т. е. б(ф~ Фо) =2 Лп cosn(^> — <р0).
П —О
Воспользовавшись известным разложением дельта-функции в ряд
Фурье в некотором интервале (—/, /) [37]
6(х —хи) = (1/2/) + (1//) У] cos[nn(x—х0)//], и=1
находим, что Ао = (1/2л), Ап — (1/л) при п — 1, 2, 3, ... .
Записываем окончательное решение уравнения (56) с указанными ранее условиями [74]
Р (ф> 11 Фо) = (1/2л)
1 + 22 ехр(— п2 Dt/2) cos п (ф—<р0) П=1
(21.60)
Отсюда при /-> оо получаем стационарную плотность вероятности (55). По формуле (10.14) находим двумерную плотность вероятности приведенной фазы в стационарном состоянии
Рг (Фъ фг) = (1 /4л2)
ОО
1 + 2 2 ехр[—п®1>(^—/х)/2] п== 1
X
где
Xcosn(cp2—<рх) , —Л^фг^Л,
Й = ф(^1), ф2 = ф(^)>
(21.61)
Укажем, что формулу (60) можно было записать сразу на основании (54), если учесть известное соотношение [4]
(2ло2)_1/2 yi ехр[ — (х + 2пл)2/2о2] = (1/2л) X П== — ОО
X 2 ехР(—л2 а2/2) cos пх,
п=* —оо
получающееся как результат «наматывания» прямой, вдоль которой расположена нормальная плотность вероятности, на окружность.
242
21. Воздействие шума на простейшие колебательные системы
Необходимо специально оговорить, что приведенные здесь формулы относятся только к фазе колебаний генератора, описываемой стохастическим дифференциальным уравнением (44). Их нельзя распространять на фазу узкополосного случайного процесса, о котором речь шла в п. 1.
Корреляционная функция и спектр колебания. Вычислим корреляционную функцию и спектр колебаний (51) и (53). Предварительно отметим, что случайная амплитуда A (t), заданная первым стохастическим уравнением системы (37), и случайная фаза <р (/), описываемая уравнением (44), статистически независимы, так как случайные воздействия (/) и Н2 (О, как указывалось ранее, взаимо-независимые белые шумы.
Вычислим сначала корреляционную функцию амплитудных флуктуаций. Для этого нужно знать одномерную и двумерную плотности вероятности случайной амплитуды А (/). Выше сравнительно легко была найдена лишь одномерная стационарная плотность вероятности амплитуды (40). Найти одномерную и двумерную плотности вероятности в общем случае затруднительно. При вычислении корреляционной функции воспользуемся методом линеаризации стохастического уравнения (37) в окрестности значения Ао. Метод линеаризации применим при малом уровне шума, когда выполняется неравенство (42). При выполнении этого неравенства флуктуации амплитуды
а (/) = 4 (/) - 40 (21.62)
малы (43). Подставив /!(/) = Ао + а (/) в первое уравнение (37), имеем
а = 6 И - (1 -a!AQf](A0 + а) + <5Л 0/4у2 П + а/А0) + (/).
Удержим в правой части лишь те члены, малость которых относительно а не превосходит первого порядка. Тогда вместо (37) получим линейное стохастическое уравнение
й 4-2fifl = Е, (ф (21.63)
При этом было учтено, что среднеквадратичное значение флуктуаций амплитуды Од имеет малый порядок х-1 (см. (64)).
Из уравнения (63) следует, что математическое ожидание амплитудных флуктуаций равно нулю {а (/)>== 0, а корреляционная функция согласно (15.34) определяется выражением
Ка (Л- 4) = ехр (—26 I т 1)11 — ехр (—46/)],
ой = Ло/8%2. (21.64)
Здесь гт^ — дисперсия флуктуаций амплитуды в стационарном состоянии, | т | = 1 /2 — (il, t = min (/ь /2).
Корреляционная функция и спектр колебания автогенератора
243
Из (64) при t -> оо получаем корреляционную функцию амплитудных флуктуаций в стационарном состоянии
k„ (т) = а а ехр (—2d | < |). (21.65)
Вычислим теперь корреляционную функцию фазовых флуктуаций колебания cos 1 ши( 4- <р (/)]:
ЛФ (II, = <cos |g)0Z, + ^(/iJlcos lojnZ2 + <p (Z2)]> —
— <cos I co,)/, + ip (/jUX cos + ф (Z^l). (21.66)
Воспользовавшись формулой (50), получим
<cos [wu ti 4- ср (/г)]> = cos|to„Z, + ф(Л-)| /3(Ф,С)с(ф =
— oo
= exp [ —o<p (t j/21 cos (co0 g + ф„).
Известно, что
cos (cou + q> (ZJ] cos [<o,/2 + ip(/2)| = -L {cos |ton (Z2 — /,) 4-
4-<p (Z2) —<p (G)J 4- cos | ш„ (z, 4-12) + <₽ Oi) -1- <p (z2) 1}
Пусть Z2 > Zj, т. e. t = Z2 — Zj > 0. Считая в формуле (47) г — = Z2 — II, найдем, что
<cos[w0 т 4-ф (Zj 4-т) — <p(/t)]> = cos[to„t4-
— оо
4- Дфт[ Р (Лфт) d (Лфт) = ехр [ — Оф (т)/2].
На основании (48) сумма
1 !i +
Ф (И) + Ф (* i + Т) = 2ф0 4- (2/Л0) $ g2 (s) ds 4- (1 Мв) L, (s) ds
0 I,
есть нормальный нестационарный процесс со средним значением 2ф0 и дисперсией, равной 4о^ (ZJ 4- о<£ (т). Поэтому
<cos [2to0Z! 4- toox 4- ф (ZJ 4- Ф l^i 4- т)1> = ехр (—20^ (ZJ—
— (1/2)о^ (т)1 cos (2to0Z) 4- to0T 4- 2ф0), г = Z2 — Zj > 0.
Выписанные соотношения позволяют получить корреляционную функцию фазовых флуктуаций колебаний генератора
Лф (Zt, Z) 4- г) = (1/2) ехр (—Dt/2){cos шот — ехр (—OZ1)l(osto0T4-
4- (1 —ехр (—Dl,))cos (2to(/i 4- ыог 4- 2ф0)]}, г = z2 — Zr(2l.67) Отсюда при Z|-> оо имеем
Лр (т) = (1/2) ехр (— D| т| /2) cos шот. (21.68)
244
21. Воздействие шума на простейшие колебательные, системы
Можно отметить, что хотя полная фаза ср (/) есть нестационарный процесс, однако корреляционная функция колебания cos [со0/ + ф (/)] при оо зависит только от разности временных аргументов, т. е. имеет такой же вид, как и для стационарного в широком смысле случайного процесса.
Нетрудно убедиться, что корреляционная функция колебания cos [ш0£ + ф (/)], в котором фигурирует приведенная фаза, также определяется формулой (68). Действительно, для приведенной фазы остается справедливым выражение (66), только теперь в нем нужно заменить ф на ф. На основании (55) имеем
Л
• <СО5(ш0^ + ф)> = -^- f COS (СО(1 Z; +ф)б/ф = 0.
2л J
—л
Воспользовавшись формулой (61), можем написать
<cos (со0 4 + фх) cos (со012 + ф2)> = ЭД cos (Шц Zj + — Л
+ ф() cos (со,, Z2 + ф2) Р2 (фп ф2) <j(p, с/ф2.
Зцесь в правой части будет отличным от нуля только одно слагаемое, соответствующее п — 1. Выполнив затем интегрирование, придем к формуле (68).
Следовательно, корреляционные функции колебаний cos (co0Z 4> + <р (Z)) и cos (со0 Z + ф (Z)) при t -> оо совпадают и определяются формулой (68).
Корреляционная функция колебания генератора (53) с учетом (62) имеет вид
Кк (*!, Q = <х (G) X (Z2)> = <[ Ло + a (G)] [А0 + а (Z2)]> х
X (cos (со0 tx + ф,) cos (со0 z2 + ф2)> = [ + ка (Zi, z2)| Ку (Z1( /2).
(21.69)
Для стационарного состояния согласно формулам (65) и (68) получим
h (т) = [ЛВ + ka (т)] (т) = (Л§/2) lexp (-D |т |/2) +
+ Ло2Ол ехр (—(26 + £)/2)|t|)]cos со0т. (21.70)
Зная корреляционную функцию, находим односторонний энергетический спектр колебания автогенератора
S (со) = 4 /г^(т) cos сотс/т = Si (со)S2 (со), со)>0, (21.71)
о
Корреляционная функция и спектр колебания автогенератора
245
где
J ехр ( —£)т/2) о
cos (со — со0) xdx — А о
D/2 (£>/2)2 + (со—со0)2
со О,
(21.72)
ОО
32 (со) — ад ехр [ — (26 + D/2) т] cos (со — co0)rdr = о
26 + 0/2
= Од -------------------------- ,
(26 + D/2)a + (co-co0)a
со
0.
(21.73)
Здесь было учтено, что величины D и 5 много меньше со0.
Рассмотрим более подробно характер спектра. Если флуктуационный шум отсутствует (g (/) = 0), то D = 0 и ад — 0. Полагая в (72) и (73) D = 0, ад = = 0 и воспользовавшись формулой (111-26), получим S (f) = Л§6 (f - f0)/2. В данном случае генератор генерирует гармоническое колебание (36), энергети-
ческиЙ спектр КОТОРОГО Рис. 2Г8. Составляющие энергетического спек-тра колебаний автогенератора.
представляется в виде ди-
скретной линии высотой Л§/2, расположенной на частоте /0. Энергетический спектр квазигармонического колебания, полу-
чающегося при наличии флуктуационного шума, симметричен относительно частоты со0, где он имеет максимум. Спектр состоит из двух слагаемых, первое из которых Si (со) обусловлено только флуктуациями фазы, а второе 32 (со) — флуктуациями амплитуды и фазы. Так как практически всегда b^>D, т. е. в (73) можно пренебречь D/2 по сравнению с 6 , то можно сказать, что второе слагаемое 32 (со) обусловлено в основном амплитудными флуктуациями.
Из формулы (70) видно, что дисперсия или полная мощность, содержащаяся в первом слагаемом, равна по-прежнему Л§/2 и значительно превосходит мощность а%/2, заключенную во втором слагаемом. Максимальная высота первого слагаемого равна Зх (со0) = = 2/1 о/О и значительно превышает высоту второго слагаемого, равную S2 (со) = aV25. Полная ширина первого слагаемого (на
246
21. Воздействие шума на простейшие колебательные системы
уровне 0,5 от максимального значения) равна Awy = D. Она значительно меньше ширины второго слагаемого Да»2 — 46 (рис. 21.8).
При рассмотрении характера энергетического спектра квази-гармонического колебания X (/) второе слагаемое S2 (со) в формуле (71), как содержащее незначительную мощность и более «широкополосное», часто не учитывают. При этом для спектра автоколебаний получим простую формулу
5(ю) =-------------- ш>0. (21.74)
' Оа-Н(со—соо)2
Итак, энергетический спектр колебания автогенератора из-за наличия собственных флуктуационных шумов превращается из дискретной линии в сплошной спектр, имеющий очень малую ширину Аш = Acoj = D.
Естественную нестабильность частоты генератора можно количественно характеризовать относительной шириной энергетического спектра
Дш/соо = Z)/coo. (21.75)
Обычно эта величина имеет порядок Асо/соо 10-1а. Различные методы экспериментального определения естественной нестабильности частоты автоколебаний описаны в работе [75].
Корреляционная функция радиосигнала со случайной фазовой манипуляцией
Вычислим корреляционую функцию радиосигнала вида
s (/) = Ло cos (со0/ 4- 6 (/) + <₽(/) + <р01. (21.76)
Здесь, как и в (2.53),
0(0 = У ^reetjo, rect((O = l’’
[о, /е£(г(,/(+1],
<р (0 — полная фаза автоколебаний генератора (44), статистически не зависящая от 0 (/), <р0 — случайная начальная фаза, не зависящая от 0 (/) и ср (/) и равномерно распределенная на отрезке I—л, л].
Мы не будем здесь конкретизировать характер случайной фазовой манипуляции 0 (/), считая лишь, что значения О, не зависят от моментов времени /у (в том числе и при j — i, i + 1). Сами же fl'j могут быть как дискретными, так и непрерывными случайными величинами, а моменты времени Л возможного изменения значений процесса 0 (t) могут следовать или через фиксированный интервал времени То или же могут описываться законом Пуассона (9.14). Следовательно, радиосигнал (76) является более общим, чем сигналы (2.53)
Корреляционная функция радиосигнала с фазовой манипуляцией 2<i-
и (9.10), а также сигнал примера 2 § 6; в нем дополнительно учтены неизбежные флуктуации фазы колебаний автогенератора ip (/).
Если повторить все рассуждения, приведшие при рассмотрении сигнала (2.53) к формуле (2.55), то для корреляционной функции интересующего нас сигнала (76) получим следующее выражение:
k' = (Re <ехр (ехр / (°*—+ Ф*~Фt)>е.ч>} =
= ('4'~ ) <екр <ехр 1 <0Т —еЛ>6 <ехр I (Фт —Ф/)><р}, (21.77) где обозначено <(д = <р tt + т), <р( = <р (/).
Отсюда видно, что выражение для корреляционной функции радиосигнала (76) с флуктуирующей фазой <р (/) отличается от соответствующих выражений для корреляционных функций сигналов вида (2.53) в отсутствие таких фазовых флуктуаций только наличием дополнительного сомножителя <ехр j 1<рт— ф/)><₽ Этот сомножитель представляет собой значение характеристической функции (ехр /и (<рх — ф*)><₽ приращения фазы за время т при и = I Так как приращение фазы имеет нормальную плотность вероятности (47), то характеристическая функция равна
г о.2. (т) и2 / Ота2 \
(exp/u(q>t — <р/)>ф = ехр I-------- =ехр^-------—) (21.78)
С учетом этой формулы и условия четности корреляционной функции можем написать
ka =(нНехр (—Г D ।Т । ) Re <ехр т) <ехр ; <0Т~ °*)>«ь
(21.79)
Последний сомножитель в правой части этой формулы применительно к частным вилам случайной фазовой манипуляции был вычислен ранее (см. с. 75).
Окончательный результат сводится к следующему. При наличии фазовых флуктуаций радиосигнала, описываемых чисто диффузионным процессом, правые части выражений для корреляционных функций (2.59), (6.31), (9.12) и (9.15) нужно помножить на ехр (—D | т | /2). При этом очевидным образом изменятся и выражения для энергетических спектров (2.62), (6.32) и (9.16).
248 22. Статистическая динамика синхронизируемого генератора и ФАП
22. Статистическая динамика синхронизируемого генератора и фазовой автоподстройки частоты
Явление синхронизации нашло широкое применение в радиофизике и технике. Приведем несколько конкретных примеров, показывающих практическое использование явления синхронизации.
В измерительных задачах физики часто применяются фазовые методы, при которых оценка той или иной физической величины производится на основе измерения разности фаз двух колебаний. Таким путем, в частности, была точно измерена скорость распространения электромагнитных колебаний. Этот же принцип используется в радиодальномерах, содержащих когерентный синхронный гетеродин.
Исследования ядерных реакций, проводимые на циклотронах, предполагают высокую стабильность параметров отклоненного пучка ускоренных ионов и частоты ускоряющего напряжения. Расстройка резонансной системы приводит к значительному снижению напряжения на дуантах. Для устранения этого необходимо автоматически подстраивать либо задающий генератор под собственную частоту дуантного контура, либо дуантный контур под частоту генератора. В качестве системы регулирования часто используют фазовую автоподстройку частоты.
При запусках искусственных спутников Земли и ракет чрезвычайно важным является знание параметров их орбит. Измерение параметров движения может производиться различными методами (интерференционный, доплеровский и др.), но для всех них характерно использование либо высокостабильного, либо синхронного генератора. Одним из основных элементов подобных устройств являются синхронизируемый генератор или системы фазовой автоподстройки частоты.
Для решения ряда радиофизических задач требуются высокостабильные сверхвысокочастотные колебания. Существующие клистронные и магнетронные генераторы, как правило, не обладают нужной стабильностью. Для повышения стабильности частоты таких генераторов их синхронизируют маломощными колебаниями от высокостабильных эталонных генераторов (например, кварцевых или квантовых).
В телевидении устройства синхронизации нашли широкое применение для синхронизации строчной и кадровой разверток. В системах цветного телевидения синхронизация необходима для восстановления в приемниках поднесущих частот.
Возможные применения устройств синхронизации
249
Из других применений устройств синхронизации можно указать системы службы времени, синхронное радиовещание, когерентную радиолокацию, некоторые виды фазовой радионавигации и др.
Явление синхронизации автоколебательных систем принадлежит к числу наиболее сложных задач теории колебаний вследствие многообразия и тонкости эффектов, наблюдаемых при синхронизации даже гармоническим внешним колебанием, а также вследствие принципиально нелинейного характера происходящих явлений.
Рис. 22.1. Взаимокорреляционный приемник.
Основы теории синхронизации были заложены в начале тридцатых годов работами Ван-дер-Поля, А. А. Андронова, А. А. Витта и др. [76].
В последние двадцать лет стал проявляться повышенный интерес к изучению влияния флуктуационных воздействий на процессы синхронизации, т. е. к статистической динамике процесса синхронизации. Одним из существенных толчков, стимулирующих и оправдывающих эти исследования, является следующий факт, хорошо известный в теории оптимального радиоприема: когерентные методы обеспечивают наибольшую помехоустойчивость приема сигнала на фоне аддитивного флуктуационного шума [30].
Схема оптимального (когерентного) приемника для приема детерминированного радиосигнала s (/) = Am sin (ш( + 0О) на фоне аддитивного флуктуационного шума п (/) приведена на рис. 22.1. Приемник содержит перемножитель, интегратор и пороговое устройство. На один вход перемножителя подается принятое колебание у (t) = s (/) + п (I), 0 «С t Т, а на другой — опорный сигнал s0 (/).
Если приемник и передатчик расположены в одном месте (радиолокация), то в качестве опорного сигнала s0 (t) на приемной стороне можно использовать колебания местного гетеродина или импульсы передатчика, задержанные линией задержки. Интенсивность колебаний гетеродина обычно настолько велика, что мешающими напряжениями, сопровождающими эти импульсы, можно пренебречь. Опорное напряжение будет совпадать по форме с принимаемым полезным сигналом (без учета искажений принимаемого сигнала). В данном случае важным является требование высокой стабильности частоты колебаний гетеродина (за время обработки Т фаза колебаний гетеродина не должна существенно изменяться).
250 22. Статистическая динамика синхронизируемого генератора и ФАП
Сложнее обстоит дело с формированием опорного напряжения в радиосвязи, когда передающее и приемное устройства пространственно разнесены. Считая фазовые флуктуации радиосигнала, возникающие при распространении радиоволн через турбулентную среду, медленными, здесь для формирования опорного сигнала иногда применяют синхронизируемый генератор, а чаще всего — различные схемы фазовой автоподстройки частоты (ФАП).
В последнее время на базе оптимальной нелинейной фильтрации марковских сообщений было показано [77], что ФАП является необходимым элементом оптимального приемника при более сложных видах радиосигналов и помех.
Получим стохастические дифференциальные уравнения, описывающие поведение синхронизируемого генератора и ФАП при наличии флуктуационного шума.
Уравнение синхронизируемого генератора [78|. Возвратимся к схеме автогенератора, изображенной на рис. 21.2. Оставляя в силе предположения, принятые ранее в § 21 п. 2, будем теперь считать, что в уравнении (28) внешняя воздействующая сила F (t) состоит из суммы синхронизирующего гармонического сигнала A m costa/ и флуктуационого шума £ (/):
F (t) = —[Am sin со/ 4- g (/)],
Тогда уравнение (30) примет вид
А + ®П = 2б(1— 4A.2/Ag)X.—Amft>gsinft>(—cogg(Z). (22.1)
Если перейти здесь к амплитуде и фазе вынужденных колебаний (21.31) и принять расстройку между собственной частотой автогенератора <о0 и частотой синхронизирующего сигнала со малой
|<о„ - со| = |Д0| « со0, (22.2)
то придем к следующей системе из двух уравнений
А = б (1 —Аа/А§)А + (соА m/2)cos<p + со| (/)sin (со/-Тф) +
+ Fj (А, <p, /),
ф = Ао — («А m/2A)sin ф + (со£ (t)/A)cos (со/ + ф) +
+ F2 (А, ф, t). (22.3)
Здесь До = (®о — <о2)/2со х соо — со — величина начальной расстройки по частоте,
Л (А, ф, t) = —6 A cos (2со/ + 2ф) + (6A3/Ao)cos (4со/ + 4ф) + + До A sin (2со/ + 2ф) — (coAm/2)cos (2со/ + ф),
Л (А, ф, /) = Д„ cos (2со/ + 2ф) + б (1 — 2A2/Ao)sin (2со/ +
+ 2ф) — (6A2/Ao)sin (4со/ + 4ф) + (coAm/A)sin (2со/ 4- ф).
Уравнение синхронизируемого генератора
251
Предположим, что генератор является слабонелинейной колебательной системой и колебания в нем близки к гармоническим. Это означает, что амплитуда А (t) и фаза ф (/) будут медленно изменяющимися функциями времени
A (t + т) — А (/) « Ло, <р (t + т) — <₽ (/) « 1 (22.4)
(т ~ Т = 2л/от),
где т — произвольный промежуток времени, имеющий порядок периода колебаний.
Чтобы эти условия «медленности» выполнялись, необходимо наложить, помимо неравенства (2), следующие дополнительные ограничения на параметры генератора и величины внешних воздействий:
б/от <<1, Лт/2Л0<<1,
ГТ
от; (/) cos (at + <р) dt
><А,. (22.5)
Первое из этих условий обеспечивает слабую нелинейность системы, второе—достаточную малость синхронизирующего сигнала и третье — малость флуктуационного шума. Совместное выполнение первых двух условий гарантирует применимость укороченных уравнений в отсутствие флуктуационных воздействий; третье условие по существу говорит о малой дисперсии фазовых флуктуаций, т. е. о выполнимости второго из неравенств (4).
Будем в дальнейшем считать, что флуктуационный шум g (/) имеет малое время корреляции и его в рассматриваемой задаче можно трактовать как нормальный стационарный белый шум с нулевым средним значением и дельта-функцией корреляции
(т) = Л/о6 (т)/2.
(22.6)
Тогда последнее из неравенств (5) можно записать иначе
со2 <| (/) £ (/')> cos [со/ + <р (0) cos [со/' + <р (f)J dtdf = о
= (от2 No/2) cos2[со/Н-ф (/)Jdt « от2 Л70 т/4 — aN0<^ Ао.
п
Следовательно, при выполнении условий (5) в уравнениях (3) можно опустить быстро осциллирующие члены и и ограничиться рассмотрением укороченных уравнений для амплитуды и фазы
А = 6 (1 — Л2/Л2)4 4- (co4m/2kos <р 4- соВ (/)sin (от/ 4- ф), Ф — До — (соЛ т/2Л)з1Пф + (со£ (/)M)cos (от/ 4- ф). (22.7)
'252
22. Статистическая динамика синхронизируемого генератора и ФАП
Для упрощения флуктуационных членов поступаем точно так же, как в § 21 п. 2 при переходе от уравнений (21.35) и (21.37). Тогда вместо (7) придем к следующей окончательной системе двух стохастических уравнений
А = б (1 — А21А"ь)А + (соЛ m/2)cos <р + (<о^0/8Л> +
ф = До —(coAm/2A)sin ф + WA, (22.8}
где (/) и £2 (/) — взаимонезависимые нормальные случайные процессы с нулевыми средними значениями и дельта-фу икни я ми корреляции
<Bi (< + т)^1 (0> = <?2 U + т)1а (/)> = со2Л'иб (т)/4. (22.9)
Уравнение ФАП [701. Прпп цип работы фазовой авто подстройки частоты в отсутствие помех можно уяснить на примере простейшей функциональной схемы (рис. 22.2). Гармонические колебания s (/) генератора сигнала (ГС) и sr (?) синхронизируемого (подстраиваемого) гетеродина (СГ) воздейству ют на фазовый детектор (ФД), на
Рис. 22.2. функциональна» схема фазовой автоподстройки частоты.
выходе которого получается напряжение, зависящее от разности фаз колебаний s (/) и sr (/). Это напряжение через посредство фильтра низкой частоты (ФНЧ) и управляющего элемента (УЭ) изменяет частоту синхронизируемого гетеродина, приводя ее к совпадению с частотой генератора сигнала. При этом устанавливается некоторая постоянная разность фаз между колебаниями генератора сигнала и гетеродина, обеспечивающая синхронную работу обоих генераторов.
Анализу процессов, происходящих в системе ФАП, посвящено много работ (подробную библиографию см. в [80, 122]). Исследование схемы ФАП даже в отсутствие случайных воздействий представляет собой довольно сложную задачу, связанную с решением нелинейных дифференциальных уравнений. Она еще более усложняется, если учитывать влияние помех. При этом в практических условиях работы ФАП имеют место как внешние помехи, так и флуктуации, органически присущие самим элементам схемы. В дальнейшем примем, что на фазовый детектор совместно с сигналом s (/) воздействует аддитивный внешний шум 5 (0-
При выводе дифференциального уравнения, описывающего поведение системы ФАП, сделаем следующие допущения: 1) все звенья ФАП, за исключением фильтра низких частот, являются безыиер-
Уравнение ФАП
253
ционными; 2) фазовый детектор представляет собой перемножающее устройство, т. е. имеет синусоидальную характеристику; 3) характеристика управляющего элемента в пределах рабочего участка является линейной; 4) аддитивный шум В (Z) можно рассматривать как нормальный белый шум с корреляционной функцией (6).
Пренебрегая амплитудными флуктуациями колебаний генераторов, можем написать
s (Z) = Ат cos Фо (Z) = Ат cos |co()Z +
sr (Z) = Л sin Ф (Z) = A sin [coZ + <р2 (/)]. (22.10)
Здесь Ат и А — постоянные амплитуды, со0 и со — средние частоты, (рг (Z) и ср2 (!) — случайные фазы колебаний. Если учитывать только собственные флуктуации генераторов, то случайные фазы <Р1 (Z) и <р2 (Z) будут определяться уравнением типа (21.44).
Обозначим коэффициент преобразования перемножителя через pi. Тогда напряжение на выходе перемножителя равно
ua (Z) = pi [s (Z) + В (Z)lsr (Z) = (р/2)ЛЛ m [sin (Ф — Фо) +
+ sin (Ф + Фо) + (2/Лт)В (Z)sin Ф (Z)l.
Полагая, что фильтр низких частот с операторным коэффициентом k (р) отфильтровывает комбинационные высокочастотные составляющие, на выходе фильтра получим напряжение
и (Z) = (p/2)AAmk (p)lsin <p 4- (2/4 m)B0 (Z)l, p = d/dt, (22.11) где
<p (Z) = Ф (Z) — Фо (Z) = (co — coo)Z + Ф (Z),
ф (Z) = <p2 (Z) — <px (Z), (22.12)
Bo (Z) = В (Z)sin [coZ + <p2 (Z)l. (22.13)
Согласно (6) функция корреляции Во (!) равна
(т) = <Во WU (t + т)> = А/об (т)/4. (22.14)
Если средняя частота синхронизируемого генератора линейно зависит от напряжения на входе управляющего элемента (например, лампы реактивного сопротивления), то
со = со2О — su (Z). (22.15)
Здесь со2О — средняя частота синхронизируемого генератора при и (!) = 0, т. е. при разомкнутой петле регулирования; s — крутизна линейного участка характеристики управляющего элемента.
Учитывая, что согласно (12)
РФ = рФ — рФ0
254 22. Статистическая динамика синхронизируемого генератора и ФАП
и подставив сюда выражения Ф (/) и Фв (/) из (10), а значение со из (15), получим
РФ = До —su (i) + pip, (22.16)
где До == со20 — со0 — начальная расстройка генераторов по частоте.
Подставив в (16) выражение и (/) из (11), имеем
РФ = До — \k (p)[sin ф + (2Mm)g0 (/)] + рф, (22.17)
где Д — полоса синхронизации (удержания)
Д = цхЛДт/2. (22.18)
Уравнение (17) полностью описывает процессы в системе ФАП при наличии внешних помех и собственных нестабильностей генераторов В дальнейшем эти нестабильности мы учитывать не будем, т. е. ограничимся рассмотрением уравнения
РФ = До — ДА (p)fsirnp + (2/Лт)£0 (/)J. (22.19)
Приведем три конкретных частных случая уравнения (19). Если считать фильтр низких частот идеальным, т. е. если его коэффициент передачи равен единице для низких частот и нулю для высоких, то k (р) = 1 и для разности фаз получим стохастическое дифференциальное уравнение первого порядка
ф = Д„ — Д sin ф — (2Д/Лт)5о (/). (22.20)
Схему ФАП, описываемую этим уравнением, будем называть ФАП первого порядка.
Когда фильтром низких частот является интегрирующая цепочка RC, коэффициент передачи k (р) = а /(а + р), а = MRC, и из (19) получим стохастическое дифференциальное уравнение второго порядка
<р + аф = а|Д„—Д sin ф — (2Д/Лт) £0 (/)| (22.21)
Соответствующую схему можно назвать ФАП второго порядка.
Если в качестве ФНЧ используется пропорционально-интегри-рующий фильтр, то
k (р) = V + (1 - v)/( 1 + Т2р), V = TJTt = а7\. (22.22)
Подставив (22) в (17) и введя обозначение
й = Д«— Д (1 — v)/(l + p/a)lsin ф + (2Mm)£0 (/)], (22.23)
из (19) получим систему двух стохастических дифференциальных уравнений первого порядка
ф = й — vA Isin ф-|- (2МГО)£О (/)],
Статистическая динамика ФАП
255
Й = —ccQ 4- аД0 — аД (1 — v)[sin ф +
+ (2/4m)ge(0J. (22.24)
Для двухкомпонентного марковского процесса {<p (t), Q (/)} по формулам (19.39) находим коэффициенты, определяющие уравнение Фоккера — Планка — Колмогорова,
аф — Q—уД sin <р, аа— —а(й—До-|- Д (1 —v) sin ф), = 2v2 Д2 No Лё2, bQa = 2 (1 —v)2 а2 Д2 No А 6<рй=2у(1-у)а2Д2Л/0Ло2. (22.25)
Сравнивая второе уравнение (8) с уравнением (20), заключаем, что они будут подобны друг другу, если в (8) заменить случайную амплитуду А на постоянную амплитуду Ао, что во многих практических случаях правомерно (см. ниже (33)). Разумеется, что ФАП является более гибкой системой, чем синхронизируемый генератор, поскольку схема ФАП содержит большее число независимых параметров, которыми можно варьировать по желанию. Поэтому в устройствах синхронизации преимущественное применение находят различные схемы ФАП, а не синхронизируемый генератор. При этом в таких устройствах наибольший практический интерес представляет точность слежения за фазой полезного сигнала. Поэтому отложим пока решение уравнений (8) и (20), а рассмотрим сначала качественную картину статистической динамики, т. е. качественную картину поведения разности фаз на примере уравнения (20).
Статистическая динамика. В стационарном состоянии (ф = 0) при отсутствии шума (£ (/) = 0) из (20) имеем Д sin ф = До. Следовательно, нормальный синхронный режим работы системы возможен лишь при условии Д0<Д. Так как синус — периодическая функция, то характерной особенностью системы (20) является то, что она при До < Д имеет счетное число состояний равновесия, из которых устойчивым состояниям соответствуют значения
Ф±* = arcsin (До/Д) ± 2&л (k — 0, 1, 2, ...), (22.26)
а неустойчивым
Ф±* = л — arcsin (До/Д) ± 2&л. (22.27)
. Качественно поведение системы при наличии шума будет следующим. Пусть имеется достаточно большой ансамбль идентичных систем, которые в начальный момент времени t = 0 имеют одинаковое фиксированное значение ф (0), например, ф (О) = фб = = arcsin (До/Д). Воздействующий шум £ (/) влияет на поведение системы двояким образом. Во-первых, из-за слабых шумовых воздействий значения ф (/) в разных системах с течением времени окажутся разбросанными в окрестности начального устойчивого со-
256 22. Статистическая динамика синхронизируемого генератора и ФАП
стояния равновесия фб. Во-вторых, достаточно интенсивные шумовые воздействия могут вывести систему из области притяжения к устойчивому состоянию равновесия фб, в результате чего система перейдет в окрестности соседних состояний равновесия <p±i, ф±? и т. д. С течение времени вероятности подобных переходов, которые
t=0
~6а -ча -2а 0 Ztt Ча 6а
Р-ъ Р-2 Р-1 Ро Pi Рг p's
-6а-Ча-2а 0 2а Ча 6а
Р-3 Р-2 P-т Ро Pf Р2 Рз
р
Рис. 22.3. Качественный характер изменения плотности вероятности полной фазы во времени при Дов0 и Д>Д0>0.
принято условно называть перескоками фазы, возрастают, причем система из состояния равновесия в свою очередь будет переходить в соседние состояния ф±(*+1), ф± 1) и т. д.
Обозначим через л (ф, 11 фб) условную плотность вероятности того, что система, имеющая в некоторый начальный момент времени значение <р = фб, через время t будет иметь значение разности фаз «р. Характер изменения этой плотности вероятности перехода для случаев До = 0 и До > О показан на рис. 22.3 [81].
При t — 0 плотность вероятности является дельтообразной: л (ф, 0|фо) = 6(ф — фб). Спустя некоторое время плотность вероятности перехода л (ф, 11 фб) будет мультимодальной функцией ф, причем моды (максимумы) будут расположены около устойчивых положений равновесия, отстоящих друг от друга на 2л. Центральный (ф = фб) максимум будет наибольшим, а боковые будут умень-
Решение уравнений в стационарном состоянии
257
шаться по мере удаления от центрального. Так как для л (ф, /|ф6) в каждый момент.времени должно выполняться условие нормировки
оо
л (<р, t | <р6) ^ф = 1,
— оо
то с течением времени происходит увеличение числа боковых мод, которое сопровождается соответствующим уменьшением центральной и близко к ней расположенных мод. В пределе при /-> оо функция л (ф, /|ф6) расплывается по всей бесконечной оси ф.
Различие между характером плотностей вероятностей перехода л (ф, /1 фб) при До = 0 и До > 0 состоит в том, что в первом случае боковые моды, симметрично расположенные относительно центральной, одинаковы, а во-втором — неодинаковы. При До > О для перехода разности фаз ф в сторону ее увеличения на 2л (например, из ф* в ф4+1) требуется шумовое воздействие меньшей интенсивности, чем для уменьшения на 2л (т. е. перехода из ф£ в Ф*_|). Поэтому число переходов в сторону увеличения разности фаз будет превалировать над числом переходов в сторону уменьшения разности фаз. Соответственно этому при До > 0 боковые моды, расположенные справа от центральной, будут превосходить аналогичные моды, расположенные слева от нее.
Необратимые уходы (перескоки) фазы на целое число периодов от исходного, первоначального положения равновесия возможны в обе стороны. Число таких перескоков за конечный интервал времени в разных направлениях всегда различно. Поэтому «средняя» частота синхронизируемого генератора (определенная за конечный интервал времени) не будет совпадать с частотой синхронизируемого сигнал^. Увеличение начальной расстройки и уменьшение отношения сигнал/шум приводит все к большему проявлению этого эффекта.
Выше говорилось о полной разности фаз. В § 21 п. 2 отмечалось, что в некоторых задачах можно оперировать с разностью фаз, приведенной к интервалу (—л, я). Плотность вероятности приведенной разности фаз получается путем «наматывания» прямой ф (рис. 22.3) на окружность.
Решение уравнений в стационарном состоянии. Найдем сначала стационарную плотность вероятности для амплитуды синхронизируемого генератора, определяемую системой уравнений (8). Так как в общем случае это сделать затруднительно, то ограничимся рассмотрением частного, но наиболее интересного случая, когда синхронизирующий сигнал имеет достаточно малую амплитуду, удовлетворяющую условию
б > соЛ т/2Л0
(22.28)
9 Зак ’216
258
22. Статистическая динамика синхронизируемого генератора и ФАП
При выполнении этого неравенства, во-первых, скорость установления амплитуды значительно больше, чем скорость установления фазы и, во-вторых, амплитуда вынужденных колебаний Лв в отсутствие флуктуационных воздействий мало отличается от амплитуды автономных колебаний Ао.
Чтобы убедиться в справедливости первого утверждения, нужно сравнить по величине коэффициенты при линейных членах в правых частях уравнений (8), поскольку именно они в основном определяют длительность переходных процессов. В уравнении для амплитуды коэффициент при линейном члене имеет порядок 8, а в уравнении для фазы — порядок ыЛт/2Л0. Следовательно, условие (28) действительно обеспечивает значительное более быстрое установление амплитуды, чем фазы.
Для проверки второго утверждения положим | (/) = 0. Тогда в установившемся режиме А = 0, ф = 0 и, следовательно, А = Ав, Ф = Фо- Пусть Лв = Ао 4- а, где а — поправка, обусловленная наличием синхронизирующего сигнала. Подставив это выражение для Ав в первое уравнение (8), разложив члены в ряд по а и ограничившись в разложении членами первого порядка, получим для а уравнение
—28а -4 (соЛ m/2)cos <р0 = 0.
Отсюда а = (йЛт/46)соз <р0. Из условия (28) следует, что поправка а будет малой (а<^А0).
Поскольку при условии (28) амплитуда меняется гораздо быстрее, чем фаза, то при каждом фиксированном значении фазы <р будет успевать установиться почти стационарное распределение по амплитуде. Это позволяет приближенно считать в первом уравнении (8) Ф = const и искать условную стационарную плотность вероятности Р (4 | <р) только с использованием первого уравнения, а не всей системы (8).
Из уравнения Фоккера—Планка—Колмогорова
д т> / я л \ д (Тя/ 1 Л2 \ , (л4т , и2/Vo 1
-P(A,t <р) —--- о 1------н------— соэфЛ------5- х
dt М Ц ( ) 2 8Д ]
ХР(Л,/|ф)-^ А.Р(ЛД|ф)}
при дР (Л, y)ldt = 0 находим стационарную плотность вероятности
Л«М1ф) = С1 Л ехр Г—1 — А2+~~- созф], Л>0.
L со2/Vo \ 2А$ / a>N0 J
(22.29)
Решение уравнений в стационарном состоянии
259
Вводя обозначения
X = (26Л §/co2/Vo)!/2, D = 4AmA/rnN0, (22.30)
эту плотность вероятности можно записать компактнее
Ле (А |<р) = Со (АМ0)ехр I—х2 (А'ЧАо — I)2 + D (4M0)cos<pl,
Л>0, (22.31)
где Со — постоянная, определяемая из условия нормировки.
Сравнивая формулы (21.40) и (31), замечаем, что в последней формуле фигурирует дополнительный член D (AM0)cos ф. В данном случае, как нетрудно убедиться, наивероятнейшее значение безразмерной амплитуды х = Л/Ло равно
*т = К1 /2) (1 + V 1+%~2 + x^Dcostp)]1 /2.
Дополнительный член обусловливает смещение наивероятнейшего значения безразмерной амплитуды на величину порядка х~2О cos<p = = 2Лтсо/6Л0, которая в силу условия (28) является малой. Поэтому для условной плотности вероятности амплитуды остаются практически применимыми кривые, приведенные на рис. 21.3.
Несколько позже мы найдем безусловный закон распределения амплитуды, а сейчас перейдем к решению уравнения для фазы.
Решение второго уравнения (8) затруднено из-за наличия в правой части членов, содержащих случайную амплитуду А (/). Однако для ряда практически интересных случаев можно упростить это уравнение. Предположим, что совместно выполняются неравенства
6 > аАт/2А0, %2 = 2642/wW0 > 1. (22.32)
При таких ограничениях на амплитуду синхронизирующего сигнала и интенсивность флуктуационного шума амплитуда вынужденных колебаний A (t) будет мало отличаться от амплитуды Ло автономных колебаний, т. е. будет выполняться неравенство <(Л — Л0)2> Ар. Оно позволяет заменить во втором уравнении (8) случайную амплитуду А (/) на постоянную Ао:
Ф = До — Д з!Пф + £2 (/)М0, А = (»Ат/2А0. (22.33)
С учетом разницы в обозначениях стохастические дифференциальные уравнения (20) и (33) полностью совпадают. В дальнейшем все вычисления будем проводить применительно к уравнению ФАП первого порядка (20). Все полученные ниже результаты будут справедливы и для синхронизируемого генератора; в этом случае нужно полагать £0 (/) = (Ат/2ДА0)£2 (/).
9*
260 22. Статистическая динамика синхронизируемого генератора и ФАП
Применительно к динамическому уравнению (20) с учетом (14) уравнение Фоккера—Планка—Колмогорова для плотности вероятности полной разности фаз имеет вид
др (ф, t)ldt = —д/дф[(Д0 — A sin ф)р (ф, t) —
— (Д2Л/ J2Am)dp (ф, 0/5ф]. (22.34)
Будем в дальнейшем интересоваться одномерной плотностью вероятности Р (ф, t) разности фаз, приведенной к интервалу —л
Ф С л. Чтобы решить эту задачу, заметим, что вследствие периодичности коэффициентов уравнения (34) по ф, если р (ф, /) есть решение при начальном условии ф = ф0, то р (ф + 2лп, t) должно быть решением при начальном условии Ф = Фо + 2лп, где п — произвольное целое число. Введем функцию [82]
P($,t) = 2 р (ф + 2лц, г).
П~ — оо
Так как каждый член этого ряда является решением уравнения (34), то сумма бесконечного числа членов будет также решением (34). Поэтому она должна удовлетворять уравнению Фоккера— Планка—Колмогорова
дР (ф, t)/dt — —д/д<р 1(Д0 — Д sin ф)Р (ф, /) —
— (Д2Л/ J2Am)dP (ф, /)/с?ф], —л ф л (22.35) при начальном условии
Р(ф, 0)= у 6 (ф —фу —2ли).
П м — ОС
Кроме этого, Р (ф, /) должна быть периодической с периодом 2л, так как
Р(ф + 2лт, 0= 2 Р(<р + 2л (т+п)Д) = р (ф 4-2л/с,/) = xs — СО £ = — со
= Р(Ф,/).
Следовательно, для нахождения Р (ф, t) можно решить уравнение (35) в интервале —л ф < л при начальном условии
Р (ф, 0) = 6 (ф — ф0), —л < ф0. < л, (22.36) при граничном условии
р (Л, /) = Р (—л, t) (22.37)
и условии нормировки
J Р(Ф,/)о!ф- 1. (22.38)
— п
Решение уравнений в стационарном состоянии
261
Хотя уравнение (35) линейно относительно Р, однако его решение осложнено нелинейностью переменных коэффициентов. Рассмотрим пока стационарное распределение, соответствующее условию дР (ф, t)/dt — 0. Из предыдущего качественного рассмотрения следует, что стационарное решение, если оио вообще существует, возможно только в пределе при оо. Обозначим стационарную плотность вероятности
Pat (ф) = ПшР(ф,/). (-►00
Для нее из (35) получим обыкновенное дифференциальное уравнение второго порядка
Д„ (ф)----j- (Фо-D sin Ф) Р„ (Ф)) = 0, (22.39)
dtp" dtp
где
D =2А^ /ДЛ/0, DJD = (А0/Д). (22.40)
Параметр D характеризует величину отношения сигнал/шум в полосе синхронизации, a Dn — величину относительной начальной расстройки.
Проинтегрировав (39) один раз по ф, имеем
dPst (ф)/Лр — (Do — Д 8Шф)Р3/ (ф) = const.
Решение этого линейного дифференциального уравнения первого порядка известно [39] и может быть записано в виде
{ф 1
1 +Сг ехр[—(Р0ф4-Осозф)]</ф ,
— Л ]
(22.41) где Со и Сг — постоянные интегрирования.
Из граничного условия (37) при оо имеем Pst (л) = Pst (—л). Это условие позволяет определить в (41) постоянную интегрирования Сг:
С1 = [ехр(—-2nD0)—1]
л 1
ехр [—(Doty-|-D cos ф)]г/ф .
—л
Подставив это выражение в (41), после несложных преобразований получим
Дм (ф) — С-1 ехР Ро ф + D cos ф) R ехр [ — (Do ф 4- D cos ф)] t/ф 4-w ф
4- ехр (—2nD0) ехр [—(Do ф 4- D cos ф)] t/ф
—Л
262
22. Статистическая динамика синхронизируемого генератора и ФАП
где С — новая постоянная. Если во втором слагаемом в фигурных скобках перейти к новой переменной интегрирования у = 2п + ф, то выражение для плотности вероятности запишется в более компактном виде
Ф-1-2Я
Pst (4?)'= С"1 ехр.(О(,,ф4г D cos ср) ехр |,—(Паф 4- D cos ф)] </ф.
ф
(22.42)
Применив условие нормировки* (38) для стационарной плотности вероятности. (ф)„ находим, постоянную С:
Л ф + 2л
С= ехр(Do<р4-Dcos<p)t/<p ехр( — Рпф — Осозф)|7ф.
— Л ф
Вместо ф введем новую переменную у = ф — <р. Тогда получим 2л я-
С = ^ехр( — Doy)dy ехр [2D sin (у/2) sin(<p4-7/2)1 d<p =
П —л
= 2л ехр( —D0Y)/0(2Dsin(y/2))rfy, о
где /0 (х) — функция Бесселя нулевого порядка от мнимого аргументам
Выразим С через табулированные функции. Для этого разобьем интервал интегрирования (0, 2л) на два подынтервала: (0, л) и (л, 2л), причем в первом подынтервале сделаем замену переменной х = (л — у)/2, а во втором х — (у — л)/2. В результате получим
л/2
С= 8л ехр( — nD0) ch(2Dex)/0(2Dcosx)dx==
о
л/2
= 8лехр(—nD0) cos(2«D0x) /0 (2D cos x)dx.
о
Воспользовавшись известным интегралом [191 л/2
(2аcosх) dx = (л/2) А+ц (а) Л-ц (а), о
Rev>—(1/2), приходим к выражению
С = 4л2 ехр 4- лDo) JiD, (D) /_iD, (D) = 4л2 exp (- hD0) | IlD. (D) |2,
(22.43)
•Решение/уравнений в стационарном еестоянии
263
где /±,ц (г)—табулированная -функция Бесселя мнимого эргу мента и мнимого индекса [83].
Подставив (43) в (42), получаем окончательную и основную фор мулу для стационарной плотности вероятности приведенной раз-
Рис. 22.4. Стационарные плотности вероятности приведенной разности фал в отсутствие начальной расстройки (До-0).
Hucia фаз
р / х = ехр (Р0<р+Deos <р) я/ 4л2ехр( — лР0)| l.D (D)|2
q>-f- 2л
X ехр(—£>oip—D cosip) dip,
ф
—л^ф^л. (22.44)
В частном случае, когда начальная расстройка (До = £>0 = 0). формула (44) существенно упрощается
отсутствует
Pst (ф) ~ ехР (Р cos ф)/2л/0 (£>), До — 0, —л ф л.
(22.45)
На рис. 22.4 приведены графики плотностей вероятностей (для нескольких значений параметра £>), построенные по формуле (45). Плотности вероятностей имеют симметричную форму с нулевым средним значением. По мере увеличения параметра D от нуля до бесконечности плотность вероятности изменяется от равномерной до дельтообразной.
264
22. Статистическая динамика синхронизируемого генератора и ФАП
Действительно, если отношение сигнал/шум мало (D<^1), то можно воспользоваться приближенными равенствами ехр (D cos<p) « » 1, /0 (D) х. 1. При этом из (45) получим
Pst (ф) ~ 1/2л, —л ф sj л, о,| = л/3, Шф =
= <ф> = 0. (22.46)
Здесь а]}, — дисперсия разности фаз.
Когда отношение сигнал/шум велико (D^>1) и, следовательно, обеспечивается точное слежение за фазой сигнала (ф 1), справедливы приближенные соотношения
cos ф « 1 — ф2/2, /0 (D) « ехр (О)/(2лП)'/2.
В данном случае плотность вероятности (45) переходит в нормальную
/’st (ф) = ехр ( —ф2/2оф)/(2ло2)1/2, o2 = l/D. (22.47)
В пределе при D -> оо эта плотность вероятности превращается в дельта-функцию
lim Р,((ф) = 6(ф).
D-+oo
Для промежуточных значений D дисперсию приведенной разности фаз при Do = 0 можно вычислить по формуле
$ Ф2Л,.ДфМФ-(^/3)+ 2 (-1)п1п(Р)/пг, (22.48) — л п — 1
которая получается на основании (45) с использованием разложения
ехр (± D cos ф) = /0 (D) + 2 jg (± 1)л ln (D) cos пф. п=1
Кстати, если воспользоваться этим разложением, то основную формулу (44) можно представить в виде [84]
n z х sh (л£>0) , г-, 1 о (D) ,
Pst (ф) ~---------------ехр (Р cos ф) - ’ +
П 2л* | JiDa (D) |* L О0
+ 2 У -—(Du cos пф — п sin mp)
— Л sj ф л.
(22.49)
При больших отношениях сигнал/шум (D;j> 1) из этой формулы можно получить более простое приближенное выражение [84]. Для этого нужно учесть следующие равенства [19]:
У (— 1)"cosПф/(п24-До) = (лchD^/2DoshnDo) — (l/2Do), n= 1
Решение уравнений в стационарном состоянии
265
У (— 1 Г*1 п sin пф/(па + Do) = л sh Da sh лО„, n=l
Uig.(£>)P = -shIlPo nD0 ln(D)
7§(Z)) + 2Dg (~i)nIn(D)/(n2 + Dl) , n=l
'/«(£>), |WO)|2~ lo(D). oo £)-*oo
Тогда из (49) получим приближенную формулу
РМ тАго ехР (^0 Ф + в cos ф), D>1,
2л/о (Р)
—л
Ф 7 л.
(22.50)
Мода этой плотности вероятности совпадает с первой точкой устойчивого равновесия фо = arcsin (До/А).
Формула (49) позволяет найти среднее значение и дисперсию Оф приведенной разности фаз в стационарном состоянии при наличии начальной расстройки (До ¥= 0)- Соответствующие формулы имеют вид __ тт » е
V nln лв "’ + Do2
(~V)k2nlk (D)'
X
/0(Р) /„(D)
п 4п ‘ п2—й2
ft=l (ft?* л) о$ = <(ф—пгф)а> = <ф2>—ml,
(22.51)
(22.52)
где
<Ф2> =
sh лР0 я I liDa (D) I’
l»(D) Do
л2 /о (P)
3
(-1)" In (D)
In (D)
+ 2Dolo(D)y
V „2(Я2+О2)
n== 1
n=l
(-1)'1 In (D) n2 + D2
л2
л2
n=l
(-1)4^ + ^) /fe(D)
2n2 + 4 2 (л2 —й2)2
/ k— 1
(ft n)
. (22.53)
3
Результаты вычислений среднего значения тф и стандартного отклонения оф представлены на рис. 22.5 и 22.6. Видно, что среднее значение и дисперсия фазойой ошибки растут с увеличением начальной расстройки по частоте, причем с приближением начальной рас
266 22. Статистическая динамика синхронизируемого генератора и ФАП
стройки к полосе синхронизации рост среднего значения замедляется, а дисперсии, наоборот, убыстряется.
Плотности вероятности (42) при наличии начальной расстройки для нескольких значений параметров Do и D были рассчитаны на ЦВМ в работе [78] и воспроизведены на рис. 22.7 и 22.8. При наличии начальной paccrpt йки плотности вероятностей остаются уни
Рис. 22.5. Зависимость среднего значения приведенной разности фаз от относительной начальной расстройки при различных отношениях сигнал/шум.
Рис. 22.6. Зависимость стандартного отыло-ненпя приведенной разности фаз от относительной начальной расстройки при различных отношениях сигиал/шум.
модальными, но становятся асимметричными. С увеличением начальной расстройки мода и среднее значение фазовой ошибки возрастают в сторону начальной расстройки. При этом дисперсия фазовой ошибки также увеличивается; она минимальна и равна (48) при Do = 0 и максимальном D.
На рис. 22.9 для D = 2 и нескольких значений Dg приведены плотности вероятности (42) и интегральные функции распределения фазовой ошибки
ф
Г(ф) = $ Pst (Ф) dq. (22.54)
— Л
Вычислим среднюю частоту синхронизируемого генератора в ста-ционарнсм состоянии. Известно, что в отсутствие флуктуационных Воздействий (т. е. при идеализации реальных процессов) частота колебаний генератора внутри полосы синхронизации совпадает с частотой синхронизирующего гармонического сигнала, а разность фаз между колебаниями равна постоянной величине <р = const,
Решение уравнений в стационарном состоянии
267
зависящей от параметров генератора, амплитуды синхронизирующего сигнала и начальной расстройки. При этом имеет место полная передача стабильности по частоте от синхронизирующего сигнала синхронизируемому генератору. Однако наличие даже малых флуктуационных воздействий нарушает эту идеализированную картину. Из-за шума, помимо небольших случайных колебаний фазы, возмож
Рис. 22.7. Стационарные плотности вероятности приведенной разности фаз при различных начальных расстройках (£>=•!, 0 = 3).
Рис. 22.8. Стационарные илотностя вероятности приведенной разности фаз при различных начальных расстройках (£> = 5, D —10).
ны срывы синхронизации: фаза может увеличиться или уменьшиться на период (на 2л), т. е. генератор может произвести лишнее колебание или же, наоборот, пропустить одно колебание. В результате средняя частота синх’ронизируемого генератора не будет совпадать с частотой сигнала.
Пусть N\ — среднее число скачков разности фаз на 2л в единицу времени в сторону ее увеличения, а Л/г — аналогичное число
268 22. Статистическая динамика синхронизируемого генератора и ФАП
скачков на 2л. в сторону уменьшения. Тогда средняя частота синхронизируемого генератора равна </> = f0 + (Nt — Nt) или
<®> = со0 + 2лбь Gi — Nt — Nt, (22.55) где Gt — разность среднего числа скачков разности фаз на 2 л в единицу времени.
Рис. 22.9. Стационарные плотности вероятности разности фаз (а) и соответствующие им функции распределения (6) при различных начальных расстройках.
Согласно (10) и (12) среднюю частоту колебаний синхронизируемого генератора можно определить соотношением
= <Ф (Ф = <Ф0 (0> + <Ф (0> = + <Ф Ю>. (22.56)
Как и ранее, не будем учитывать собственные флуктуации сигнала и колебаний генератора. Для нахождения величины <ф (/)> в стационарном состоянии воспользуемся уравнением (20):
<Ф> = (До —Д sin ф> = (Ао—д51пф)Рзг(ф)с1ф. (22.57)
— Л
Согласно определению (11.23) введем поток вероятности
G = (До — Д sin <p) Pst (ф) — (Д2А/0/2ЛтМР3< (ф)/йф =
= (Д/Д) [(Do— D sin ф) Psi (ф) - dPst (ф)/б/ф]. (22.58)
В стационарном состоянии, как это видно, например, из (39), поток вероятности постоянен и не зависит от ф. Причем он равен введенной выше величине Gji
G = G± = ^t — Nt. (22.59)
Решение уравнений в стационарном состоянии
269
Из (58) имеем
(До — A sin <р) Pst (ср) = Gf + (A/D) d P,t (cpVdcp.
Подставив это выражение в (57) и выполнив интегрирование с учетом условия (37), получим
<Ф> = 2лС1. (22.60)
Поток вероятности находим путем подстановки плотности вероятности (44) в (58):
Gj = Л/+ — Д/~ = A sh (nD0) 1(D) |-2/2л2D =
= Ао sh (jiD0) | llD, (D) Г2/2л2 Do. (22.61)
Следовательно,
(cd) — wu == Ao sh (nD0) | 1id„ (D) |-2/nD0. (22.62)
Рассмотрим три предельных частных случая этой формулы.
1. В отсутствие начальной расстройки (Ао = 0, Do = 0), независимо от величины D, имеем
<w> — соо = 0. (22.62а)
При совпадении частоты синхронизирующего сигнала с частотой колебаний синхронизируемого генератора шум не изменяет среднюю частоту колебаний. В данном случае, несмотря на наличие скачков фазы, ввиду полной симметрии (рис. 22.3) средние значения чисел перескоков фазы вперед и назад равны (A/t = Л/Г) и поэтому систематический поток вероятности отсутствует (G2 = 0).
2. Очень большим шумам, как видно из (40), соответствуют D -> 0 и Do -> 0. Используя известное равенство /0 (0) = 1, из формулы (61), получим
<со> = со0 + Ао — (£>20- (22.626)
Таким образом, влияние синхронизирующего сигнала на фоне очень интенсивного шума не сказывается и средняя частота колебаний генератора остается равной ее начальному значению со20.
3. Воспользовавшись асимптотическими представлениями функций Бесселя мнимого индекса и мнимого аргумента, можно показать, что в противоположном крайнем случае, при очень малых шумах (D -*• оо ), справедлива формула
( 0
<(О> — (Оо= {
((А2- А2)1/2
при | Ао | | А |,
при | Ао | >| А |.
(22.62b)
Эта формула описывает синхронизацию в отсутствие шума. Если начальная расстройка находится внутри полосы синхронизации, то имеет место синхронный режим работы. Когда начальная рас
270 22. Статистическая динамика синхронизируемого генератора и ФАП
стройка выходит за пределы полосы синхронизации, происходит частичное увеличение частоты колебаний генератора.
Более полные и содержательные результаты можно получить при помощи вычислений по формуле (62) с использованием таблиц [83]. На рис. 22.10 воспроизведены результаты, полученные таким
Рис. 22.10. Зависимость разности средних частот от относительной начальной расстройки До/Д при различных отношениях сигнал/шум D.
путем И. Г. Акопяном [78] для нескольких значений параметра D. Средняя частота синхронизируемого генератора всегда находится между собственной частотой генератора и частотой синхронизирующего, сигнала.
Рассмотрим несколько подробнее вопрос о числе перескоков разности фаз. Формула (61) определяет лишь разность среднего числа перескоков в противоположных направлениях. Результаты расчетов по формуле (61), выполненные В. С. Линдси [80], приведены на рис. 22.11. Чтобы найти величины N\ и А/p порознь, нужно привлечь дополнительные соображения. Можно воспользоваться аналогией с движением броуновских частиц в потенциальном поле [721 или же вычислить среднее время перехода из исходного устойчивого состояния равновесия в соседние [81] (см. также § 26).
Можно показать, что при умеренных отношениях сигнал/шум, когда скачки во времени описываются законом Пуассона, интересующие нас величины определяются формулой
= Д ехр (± л£>0) | liD0 (D) |~2/4л2 D. (22.63)
Зависимость средних чисел перескоков разности фаз в единицу времени в противоположных направлениях от отношения сигнал шум D приведена на рис. 22.12 для двух значений относительной начальной расстройки | До/Д | — 0 и 0,4 [80]. Заштрихованная об
Решение уравнений в стационарном состоянии
271
ласть определяет нормализованную разность средних чисел перескоков 2 (Nt — Nf)/&. Число перескоков растет более быстро при малых отношениях сигнал/шум.
Из формулы (63) и графиков,, видно, что в отсутствие начальной расстройки (До — 0) число перескоков в противоположных наирав-
Рис. 2211. Зависимость разности средних Рис. 22.12 Зависимость средних чисел пе-
чисел перескоков разности фаз в единицу рескоков разности фаз в единицу времени
времени в противоположных направлениях в противоположных направлениях от отно-от отношения сигнал/шум прн различных шения сигнал/шум.
значениях относительной начальной расстройки.
лениях в среднем одинаково, но отлично от нуля. При наличии начальной расстройки (До =/= 0) и фиксированном значении D всегда превалирует число перескоков в сторону знака начальной расстройки, причем оно всегда больше, чем число перескоков при До = 0 в одном направлении. Поэтому при заданном значении отношения сигнал/шум D наибольшая стабильность частоты синхронизируемого генератора достигается при Ао = 0.
Если перескоки в разных направлениях можно считать независимыми, то на основании формулы (63) находим среднее суммарное число перескоков в единицу времени
= дг+ + N~ = Д ch (лО0) | /1Do (О) |_2/2лг£) = cth (лОп) вг. (22.64)
До сих пор'рассматривались характеристики приведенной фазы Ф (/), которая имеет стационарное распределение. Согласно (21.52) полная (нестационарная) фаза равна
Ф (/) = ф (0 + 2nv (/), (22.65)
272 22. Статистическая динамика синхронизируемого генератора и ФАП
где v (/) — дискретная случайная величина, описывающая перескоки фазы и принимающая только целочисленные значения 0, ± 1, + 2, ... . Положительный знак соответствует перескоку на + 2л, отрицательный перескоку на — 2л. Среднее число положительных перескоков в единицу времени равно Л^, а отрицательных Л^г.
Наличие таких случайных перескоков обусловливает диффузионное расплывание полной фазы Ф (/). При некоторых правдоподобных упрощающих условиях можно найти коэффициент диффузии полной фазы.
Предположим (см. § 26), что перескоки фазы в противоположных направлениях взаимонезависимы, моменты перескоков в каждом направлении представляют простейший поток событий, описываемый законом Пуассона. Обозначим через п+ (т) и п~ (т) случайное число соответственно положительных и отрицательных перескоков полной фазы за интервал времени (0, т). Вероятность получения в этом интервале k перескоков равна
Р {n± = k} = (N± x)k ехр(—Aff т)/£1, k = 0,1,2, ...
Теперь выражение (65) можно записать иначе
Ф (т) = ф (т) + 2iiv (т), v (т) = п+ (т) — п~ (т). (22.66) Закон распределения случайной величины v (т), представляющей разность двух независимых пуассоновских законов, определяется известной формулой (см. (30.89)):
Р {v = m} = (N+/N-)m/2 ехр [ — (Л\+ + A\~) т] х
X/т(2т/ТТ+Л^), m = 0, ±1, ±2............ (22.67)
где 1 m (x) — функция Бесселя m-го порядка от мнимого аргумента.
Считая ф (/) и v (/) взаимонезависимыми случайными процессами, на основании (65) находим математическое ожидание полной фазы в момент времени т
<Ф (т)> = <ф (т)> + 2л (ЛЧ+ — #Г) т = <ф (т)> + 2л Git, а также дисперсию
Оф (Г) = о$ (т) + (2л)2 (N+ + Л\~) т = о2 (т) + (2л)2 т. (22.68)
При достаточно больших т дисперсия приведенной фазы ф (t) стремится к стационарному значению 0$. Поэтому
lim (т) = о^> 4- (2л)2 Л\ т.
Т-*оо
Приращение дисперсии полной фазы за интервал времени Т при больших т равно
lim [о2, (т-Ь Т)—(т)]=£)ф Г, £)ф = (2л)2 Л\. (22.69)
Т-*оо
Решение уравнений в стационарном состоянии
273
Коэффициент диффузии Оф, характеризующий размытие полной фазы Ф (/), равен
ОФ = 2 (A/D) ch (лО0) | IiDt (D) | ~2 = (2л )а cth (лО0) Gv (22.70)
Очевидно, что коэффициент диффузии для частоты f колебаний генератора будет равен Оф/ (2л)2.
На рис. 22.13 приведены графики, характеризующие зависимость коэффициента диффузии полной фазы от отношения сигнал/шум при нескольких значениях относительной начальной расстройки [80]. Коэффициент диффузии уменьшается с увеличением отношения сигнал/шум. При одинаковых других условиях коэффициент диффузии минимален в отсутствие начальной расстройки (До = 0) и увеличивается при увеличении начальной расстройки.
Возвратимся теперь к рассмотрению плотности вероятности амплитуды синхронизируемого генератора (31). Зная стационарную плотность вероятности для приведенной фазы (44), можно найти безусловную стационарную плотность вероятности для амплитуды ратора
Рнс. 22.13. Зависимость коэффициента диффузии полной фазы (среднего числа перескоков фазы в единицу времени) от отношения сигиал/шум при разных значениях относительной начальной расстройки.
вынужденных колебаний гене-
Л
Pst(A)= Pst (A, <р) Ps/(ср) dcp.
— Л
Если подставить сюда (31) и (44), перейти к безразмерной амплитуде х = А/Ай и обозначить ее плотность вероятности через pst (х), то получим
Л
(х) = Сх ехр [ — Х2(*2— !)2] $ ехр[Ц, cp + D( 14-x)cos ср] dtp х — Л
ф4-2л
X ехр(—Doip—Dcosip)dip, х>0, (22.71)
ср
где Сх — нормировочный коэффициент.
274 22. Статистическая динамика синхронизируемого генератора и ФАП
Проинтегрировать выражение (71) удается лишь в частном случае нулевой расстройки (£)0 = 0). В данном случае
Ф-Ь 2л
§ ехр (—D cos ф) dip = const,
ч>
(х\ = С х ехр Г — х2 (х2 — 1)4 /о (О (1 + х)1, х > О. (22.72) где /01г1 —функция Бесселя нулевого порядка от мнимого аргумента,
С-1— J х ехр [ — х2 (х2—I)2] /0 [0(1 +x)]dx.
Рис. 22.14. Плотности вероятностей безразмерной амплитуды вынужденных нолебзннй синхронизируемого генератора (Ро=О).
На рис. 22.14 приведены графики плотностей вероятностей pst (х) при Do = 0 и нескольких значениях параметров х2 и D [78].
О процессе установления разности фаз. Анализу различных характеристик ФАП в нестационарном режиме работы посвящено несколько работ [85—90]. С использованием обозначений (40) уравнение (35) принимает вид
^-Р(ф,т)=-1-/-Г/-Р(фд)-(Оо-081п<р)Р((р,т)1, (22.73)
or D оф [дф J
где т = /А — безразмерное время.
О процессе установления разности фаз
Численное решение уравнения (73) на ЦВМ для нескольких значений параметров Do и D при начальном условии
Р (ф, 0) = 1/(2л), — л sC ф fC л, (22.74)
было выполнено И. Г. Акопяном. Ниже кратко приведена часть полученных им результатов [85].
Предполагается, что синхронизирующий гармонический сигнал с равномерно распределенной начальной фазой вида (74) начинает воздействовать на ФАП или синхронизируемый генератор в момент времени т = 0. В процессе установления, т. е. с течением времени т, плотность вероятности приведенной разности фаз проходит все этапы эволюции от начальной равномерной (74) при т — 0 до стационарной (44) при т -► оо .
На рис. 22.15 изображены плотности вероятностей для пяти последовательных моментов времени при нулевой начальной расстройке по частоте (Do — 0) и двух значений отношения сигнал/ шум. Плотности вероятностей в этом случае при всех значениях т являются симметричными и унимодальными. При фиксированном значении т с увеличением отношения сигнал/шум плотности вероятностей все больше концентрируются около нулевой начальной расстройки.
Рис. 22.16 соответствует одному и тому же значению отношения сигнал/шум (D = 10) и двум значениям начальной расстройки. При наличии начальной расстройки плотности вероятности остаются унимодальными, но становятся асимметричными; асимметрия увеличивается с увеличением начальной расстройки.
Отметим, что в отсутствие шума (Z) -> оо ) после включения синхронизирующего сигнала плотность вероятности разности фаз в процессе установления изменяется от равномерной (74) вначале до дельтообразной в пределе Р (ф, оо ) = 6 (ф — ф8), где ф8 — стационарное синхронное значение разности фаз (например, ф8 = фо — = arcsin До/Д).
Весьма важной практической характеристикой процесса синхронизации при наличии шума, помимо плотностей вероятностей, является вероятность нахождения разности фаз в заданной окрестности ожидаемого синхронного значения ф8 на разных этапах установления.
Вероятность Рх нахождения текущей разности ф1з ф (т) внутри интервала (ф8 — е, ф8 + е), примыкающего к стационарному значению фазы ф8, определяется соотношением
Ф8 + е
РТ{|Ф— Фз|<е}= § Р(ф, т)с?ф. (22.75)
Ф8-«
276 22. Статистическая динамика синхронизируемого генератора и ФАП
В стационарном состоянии (т -> оо ) это выражение принимает вид Ф8 + е
Роо{|ф —Фв|<е} = 5 Л,«(ф)^Ф- (22.76)
<Ps-8
Степень завершенности переходного процесса при выбранном интервале (ф8 — е, ф8 + е) можно характеризовать отношением текущей вероятности (75) к ее стационарному значению
р, (т, е) = Рт{|ф — ф5| < {|ф — Ф8| < е}. (22.77)
Р(р,т)
Рис. 22.15. Нестационарные плотности вероятностей приведенной разности фаз при пуле** вой начальной расстройке по частоте.
О процессе установления разности фаз
277
Вероятности Рх {| ф — ф81 < е} приведены на рис. 22.17, а со' ответствующие им значения р (т, е) — на рис. 22.18.
Дополнительные сведения о статистических характеристиках ФАП в переходном режиме работы содержатся в 1901. В этой работе нестационарное решение уравнения Фоккера — Планка — Колмогорова (73) ищется в виде произведения двух функций
Р (<Р. т) = Р (ф, т) P»t (ф).
где Pet (ф) — стационарная плотность вероятности (44). В результате подстановки этого выражения в (73) получается дифференциаль-
Рнс. 22.16. Нестационарные плотности вероятностей приведенной рвзиостн фаз при наличии начальной расстройки (D»10).
ное уравнение в частных производных для функции F (ф, т). При этом количественные расчеты на ЦВМ для этого уравнения оказываются более простыми, чем для исходного уравнения (73).
Статистические характеристики ФАП второго порядка в стационарном режиме. Применительно к ФАП с интегрирующим RC-фильтром, описываемой стохастическим дифференциальным уравне
278 22. Статистическая динамика синхронизируемого генератора и ФАП
нием второго порядка (21), уравнение Фоккера — Планка — Колмогорова для стационарной плотности вероятности согласно (13.2) имеет вид
b Г; P*t ®)~~ (аЛ0—а<а—-аЛ sin ф) Pst (<р, о) —
дш2 а®
_<D ±/>еДф,(в) =0, (22.78)
Эф
Рис. 22.17. Вероятность нахождения разности фаз в заданной окрестности синхронного значения.
Рис. 22.18. Степень завершенности переходного процесса.
.Характ^ри-стики ФАП второго порядка
279
Решение этого линейного параболического уравнения в частных производных должно удовлетворять граничному условию
Pst (л, ю) = Pst ( — л, ш)
и условию нормировки
Л оо
§ J Pst (ф> ®) da dtp = 1, — л —ОО
Точное аналитическое выражение для решения уравнения (78), удовлетворяющего указанным условиям, удается получить лишь в частном случае нулевой начальной расстройки по частоте (До=О). Оно имеет вид [91J
п , . / а \ 1 /2 1 / аа>2 \
Pst Ф» ~ — --------ехр I----------Ь д) cos ф ,
‘ \ 2л6 / 2л/0 (D) 2ft
О = аА/Ь = 2А2т/^п. (22.80)
Отсюда интегрированием по <о и <р в соответствующих пределах находим одномерные стационарные плотности вероятности для разности фаз и разности частот
Pst (ф) — ехр (D cos ф)/2л /0 (D), — л ф л, (22.81)
Ря( (ш) = (сс/2лй)1/2 ехр ( — аю2/26). (22.82)
Формула (81) совпадаете формулой (45). Плотность вероятности для разности частот является нормальной с нулевым средним значением и дисперсией о^ = b/a — aA/D
Таким образом, если в момент включения синхронизирующего сигнала начальная расстройка по частоте была равна нулю, то средние частоты сигнала и синхронизирующего генератора в стационарном режиме работы ФАП совпадают, а дисперсия разности частот увеличивается при увеличении интенсивности внешнего шума и уменьшается с увеличением постоянной времени RC фильтра.
При наличии начальной расстройки по частоте можно искать решение уравнения (78) в виде бесконечного ряда по специальным полиномам 191 J. С учетом лишь первых двух членов ряда получается следующее решение
Л. (Ф, ~ А ( sh (л°о) I Ро, (D)I"2 ехР (—»®2/2(?) X
ехр (2nDo)
(о — а :--------- ехр (ZX ф + Deos ф) X
1 — ехр (2л£)0) г \ о-г -г/
Ф+2л |
X ехР(——Dcosip)di|>p ф J
где Do = a'A0/b = (До/Д)£>.
(22.83)
280 2.2. Статистическая динамика синхронизируемою генератора и ФАП
Нетрудно убедиться, что приближенная формула (83) переходит в точную (80) при нулевой начальной расстройке по частоте (Do = 0)«
Проинтегрировав выражение (83) по со и ср в соответствующих пределах, получим одномерные плотности вероятности для разности фаз и разности частот:
Лп (ф) = (1/4л2) ехр (лП0) | /ZOo (D) |~2 ехр (Ро q> + D cos <р) X
Ф + 2л
X § ехр( — О(|ф — О cos ф) t/ф,
ф
(22.84)
X
X | IiDa (D} |-2 1 ехр (_
2л£ )
(22.85)
На основании формулы (85) находим среднюю разность частот и дисперсию этой разности
<®> = До sh (л£>0) | /.о, (D) |-2/nD0. « Ь/а.
Зная совместную плотность вероятности Pst (<р, со), можно вычислить среднее число выбросов случайного процесса ср (/) в единицу времени, превышающих заданный уровень й:
ОО
Д/+(ф)== j co pst (<р = ф, co)dco.
о
Подставив сюда выражение (83) при ср — •& и выполнив интегрирование, получим
(«) = f_LV/2 [л<(ф =О) +
^2ла / L 4л а
sh лР0
I'ZD.W
(22.86)
При нулевой начальной расстройке по частоте (Do = 0) эта формула упрощается
Mi+ (ft) = (2&/ла)1>'2 ехр (D cos <р)/4л70 (D). (22.87)
С наличием выбросов связаны перескоки фазы, о которых говорилось ранее. Задавая конкретные значения О’ (например, О — ± л), можно вычислить среднее число перескоков фазы в единицу времени, характеризующее частоту нарушения синхронизации в системе ФАП (см. также § 28).
Уравнения Колмогорова—Феллера
281
23. Интегродифференциальные уравнения Колмогорова— Феллера
•
Рассмотрим одномерный дискретно-непрерывный марковский процесс и получим уравнения для плотностей вероятностей, аналогичные уравнениям Колмогорова для непрерывных (диффузионных) марковских процессов.
Начнем с простейшего случая — чисто разрывного (скачкообразного) процесса. Предположим, что поведение системы описывается следующей схемой. Пусть за малый промежуток времени (/, t -f-+ А/) случайный процесс X (/) с вероятностью I — q (К, /) А/ сохраняет прежнее значение и с вероятностью и (X, X', /) Д/ДХ' переходит из X в X", где X' < X" < X' + АХ'. При этом, конечно, предполагается, что
J и (X, X', t) dK' = q (X, t), (23.1)
так как сумма вероятностей сохранения и смены состояния должна равняться единице.
Ясно, что рассматриваемый процесс X (t) будет марковским. Чтобы получить уравнение для плотности вероятности Р (X, t), воспользуемся законом сохранения вероятности (11.25), записав его несколько иначе
IP (X, t + А/) — Р (X, f)] = g+ (X, t) —g~ (X, /), (23.2)
где g+ (X, t) и g~ (X, t) — приходящий и уходящий потоки изображающих точек в элементе фазового пространства АХ за малый промежуток времени А/.
Запишем выражения для этих потоков. Вероятность того, что изображающая точка находится в интервале ДХ, равна Р (X, t) ДХ, а вероятность того, что она выйдет из этого интервала за время Д/, равна q (X, t) &t (рис. 23.1). Поэтому
g- (X, t)=q (X, t) P (X, t) A/AX. (23.3)
Выражение для потокаg+ (X, t) получим путем следующих рассуждений. Вероятность того, что изображающая точка находится в каком-либо малом интервале АХ' (рис. 23.1), равна Р (X', /) ДХ', а вероятность ее перехода в интервал АХ за малый промежуток времени Д/ равна и (X', X, t) Atkk. Поэтому поток вероятности за малое время А/ в интервал АХ из произвольно взятого элементарного интервал! АХ' равен
АХ AZ Р (V, 0 и (X', X, t) СМ.
282
23. Интегродифференциальные уравнения Колмогорова —Феллера
Общий поток в интервал ДХ с разных уровнейX' будет определяться интегралом от этого выражения по всем возможным значениям X':
ОО
g+ (X, t)"= Ah At J P (X', t) и (X, X,-/) dX'. (23.4) — oo
Рис. 23.1. К вычислению потока вероятности.
Подставим (3) и (4) в (2), поделим обе части равенства на AKAt и затем перейдем к пределу при At 0. В результате для рассматриваемого скачкообразного процесса получим окончательное интег-родифференциальное уравнение
д
Р (X,/)=-<( (X,Z)P(X,/) +
+ J Р(Х',/)и(Х', X,/)dX'. (23.5)
— оо
Если рассматривать не только скач-
ки, но также и непрерывное изменение процесса X (/), то в правую часть равенства (2) нужно добавить поток из-за непрерывного изменения О (X, /) AAAt, где О (X, /) определено формулой (11.23). Следовательно, для дискретнонепрерывного процесса X (/) получим следующее интегродифферен-
циальное уравнение
dw
(X,/) ==, — <?(Х,/) Р (X,/) + J P(X',/)u(X',X,/)dX' — — оо
-4 {а(Х,/)Р(Х,/)]+ 4 ^IHM)P(X,/)|. (23.6)
мА 2 мА*
Уравнения (5) и (6), определяющие одномерные плотности вероятностей соответственно скачкообразного и дискретно-непрерывного марковских процессов, называются уравнениями Колмогорова — Феллера [1,92).
Если начальная плотность вероятности задана в виде дельтафункции: Р (X, /0) = 6 (X — Хо), то уравнения (5) и (6) определяют плотность вероятности перехода.
Если существует стационарная плотность вероятности Pst (X) и отдельные коэффициенты уравнения (6) не зависят явно от времени, то, полагая dPldt s 0, для Pst (X) получим более простое интегро-дифференциальное уравнение
V 1Ь М (Х)1 - 4 1а (М (М) -2 аА2 dk
Воздействие пуассоновских импульсов на интегрирующую цепочку 283,
ОО
—<?(Х)Р„(Х) + J (X') u (X'. X) dX' = 0. (23.6а)
—- оо
Основное уравнение (6) может быть обобщено на многомерные дискретно-непрерывные марковские процессы. В частности, применительно к двухкомпонентном.у марковскому процессу 31 (Z) = {Xj (/), Х2 (t)} оно принимает вид
d в
— pa,f)=—o(k.np(k.n+ j P(i\/)u(X',x,7Wi' — — оо
- 2 + V 2 ЛгМ-ОНМИ- (23.7)
где
oo
<7(1,0 = <7(%1,Аг,П= J u(X, X',()dX' = — oo
= m(Xt, X2, X',X', fldX'dX'
и функция и (x;, X2, Xb X2, t) имеет прежний смысл.
Известно, что рецептурных методов решения интегродифферен-циальных уравнений нет. Поэтому задача нахождения даже стационарного решения уравнения Колмогорова — Феллера вида (6а), как правило, оказывается довольно сложной, а в более общих случаях и вообще неразрешимой (см., например, пример 2 на с. 290).
Рассмотрим два конкретных примера.
Пример 1. Воздействие пуассоновских дельта-импульсов на интегрирующую цепочку RC [93]. Предположим, что нас интересует плотность вероятности для напряжения X (() на конденсаторе С (рис. 23.2), когда на вход интегрирующей цепочки RC воздействует
Mt)
Рис. 23.2. Воздействие пуассоновских дельта-импульсов на цепочку RC.
284
23. Интегродифференциальные уравнения Колмогорова — Феллера
случайный импульсный процесс 6 (t) — 2^^ (>— /<), где б (х) — i
дельта-функция, h — момент появления Гго импульса. «Амплитуды» импульсов At считаются взаимонезависимыми случайными величинами с плотностью вероятности W (А); моменты появления импульсов 6 статистически не зависят от амплитуд А^ и описываются законом Пуассона: вероятность появления п импульсов в интервале времени Т равна
pv (п) = (уТ)п ехр ( —vT)/n\, (23.8)
где v — параметр пуассоновского закона (среднее число импульсов в единицу времени).
Дифференциальное уравнение, определяющее напряжение на конденсаторе, имеет вид
— + аА = а V А,6(/ —tt), a=\[RC, t>t.. (23.9)
dt лвА
i
Пусть начальное напряжение на конденсаторе равно Ао при t = 0. Записываем общее решение этого линейного уравнения
nt
А(/) = Аоехр (—-аО + а Лехр[ — — ^)], t>ti, (23.10)
i =о
где nt — число импульсов, появившихся до момента времени t включительно.
Характер изменения процесса 5 (t) во времени показан на рис. 23.2. вертикальными линиями. Между дельта-импульсами происходит плавное уменьшение напряжения A (t), а в момент появления очередного импульса с амплитудой А, напряжение скачком увеличивается на величину аА/.
Плавный характер изменения напряжения между импульсами описывается уравнением d’kldt — — аА. Можно показать (см. §15, 19), что коэффициенты сноса и диффузии для этого уравнения равны: a (A, t) = —аА, b (A, t) = 0.
Возьмем малый интервал времени А/. Согласно (8) вероятность того, что внутри этого интервала окажется импульс, равна vAZ. Если «остаточное» напряжение на конденсаторе в момент появления импульса равно А, то для того, чтобы напряжение оказалось в «окне» (А', А' + АА'), импульс должен иметь амплитуду, заключенную в интервале (аА = X' — А, а (А + АА) = A' -J- ДА' — А), вероятность появления импульса с такими значениями амплитуды равна
а'~) Поэтому применительно к нашему случаю
и (А, А', /) А/ А А'=(v/a) W ( 'j М АА'.
воздействие пуассоновских импульсов на интегрирующую цепочку 285
По формуле (1) находим
g(X,/) = (v/a) 7 =
J к а / — оо
С учетом найденных выражений уравнение Колмогорова — Феллера (6) для рассматриваемого примера принимает простой вид
Ар(л, /) = а± [V(X, /)]_vP(X, /) + dt ok
+ (v/a) J P(K,t) W (^-)dX'. (23.11)
— oo
Отметим, что для линейного дифференциального уравнения функция и (X, X', /) находится просто, так как всегда можно записать решение типа (9). Иначе обстоит дело в случае нелинейных систем. Определение функции и (X, X', /) для нелинейных систем в большинстве случаев оказывается затруднительным (см. с. 293).
Решим интегродифференциальное уравнение (11) при помощи преобразования Фурье. С этой целью введем характеристические функции
0(Й,/) = J Р (X,/) е'аМХ, 0д(й) = J W(A)eiQAdA. (23.12) — оо — оо
Умножив обе части уравнения (11) на ехр (/ЙХ) и проинтегрировав по X в бесконечных пределах, получим следующее дифференциальное уравнение в частных производных для характеристической функции 0 (й, /):
— 0 (й, Z) =— а£1— 0 (й, /) + v [0д (ай) — 1] 0 (й, t). (23.13) д/
Положим
0 (Й, /) = ехр [Ф (Й, /)]. (23.14)
Тогда из (13) имеем
~ Ф (Й, t) + ай А ф (Й, t) =v[0Л (аЙ)— 1 ]. (23.15)
Общее решение этого неоднородного уравнения можно искать в виде суммы частного решения уравнения (15) и общего решения однородного уравнения
— Ф (Й, 0 -|- ай- Ф (Й, I) = 0. (23.16)
'286
23. Интегродифференциальные уравнения Колмогорова — Феллера
Допуская существование стационарного распределения, возьмем в качестве частного решения уравнения (15) функцию ТД (й), соответствующую стационарному состоянию и потому не зависящую от времени. Полагая в (15) дЧ/dt— 0, запишем решение
я
Tsj (й) = Tg( (0) + v § (1/х) [0Л (ах) — 1] dx. о
Из первой формулы (12) и равенства (14) следует, что всегда (в том числе и при t -> оо ) выполняется равенство 0 (0, t) = ехр [Т (0, 01 == 1. Поэтому (0) = 0 и
я
Т8( (Й) = v§( 1/х) [04 (ах) — l]rfx. (23.17)
о
При помощи замены переменной и = In й нетрудно убедиться, что общим решением уравнения (16) является произвольная функция F:
Т(Й, /) = /?(Йе-а<). (23.18)
На основании (17) и (18) записываем общее решение уравнения (15)
¥ (Q, 0 = F (Йе-«‘) + (Й). (23.19)
Конкретный вид функции F (•) определяется начальным условием. Действительно, согласно (14) и (12) «начальная» функция ¥ (й, 0) == = 4% (й) задается начальной плотностью вероятности Р (А, 0) = —Ро (%). В частности, если Ро (1)=6 (А — Ао), то 0О (й) = ехр(/ЙА0). При этом решение (18) дает характеристическую функцию для плотности вероятности перехода. Полагая в (19) / = 0, находим
F (Й) = То (Й) — ¥„ (Й). (23.20)
Таким образом приходим к общему решению уравнения (14)
¥ (Й, 0 = (Й) + 4% (Йе-“') - TsZ (Йе~а!). (23.21)
Согласно (14) теперь можем записать выражение для характеристической функции
0(Q — ехР ехр [T0(Qe а')[
expl^jQe-^)]
Qsi (Й) es, (Ue- а‘)
0U (Йе-“').
(23.22)
Подставив сюда выражение (17), получим
0 (Й, t) = ехр
я
Се— at
(1/х) [04 (ах) — IJdxl 0о(йе~а/).
Воздействие пуассоновских импульсов на интегрирующую цепочку 287
Перейдем здесь к новой переменной интегрирования у согласно равенству х = й ехр ( — ау). Тогда получим
0 (Й, /) = g (Й, /) 0О (Йе-а/), (23.23)
где
{t
v § [0д (айе-'ч')— 1] dy
о
(23.24)
Запишем окончательные выражения для стационарной плотности вероятности и двумерной плотности вероятности интересующего нас процесса A (t). Выше указывалось, что яри дельтообразном начальном условии (А) = б (А — А(„) выражение (23) дает характеристическую функцию плотности вероятности перехода л (А, /| Ао , 0) = л (A, 11 Ао). Беря обратное преобразование от (23), можем написать
л (А, /|А0) = —- С ^(Й,/)0о(Йе-“9е-^^Й. (23.25)
2л J
— оо
Заметим, что в данном случае
0О (й) = j б (А—Ао) e/£n dA = ехр ()ЙА0).
— ОО
Следовательно,
0п(йе-“')= J б (А —Ао) е~ e'QXdA = ехр (/ЙА0 е-а'). (23.26) — оо
Используя обозначение
Q(A,0 =2- J g(Q,f)e-iQ*-dQ (23.27)
— оо
и подставив (26) в (25), получим
л (A, 11 Ао) = Q (А — Апе-“', /). (23.28)
Если задана произвольная начальная плотность вероятности Ро (А), то одномерная плотность вероятности процесса А (/) находится по формуле
ОО
Р(А,/) = J P0(A0)n(A,/|A0)dAu =
— ОО
= J Po(Ao)Q(A-Aoe-“',OA.
(23.29)
288
23. Интегродифференциальные уравнения Колмогорова—Феллера
Отсюда видно, что Р (X, t) при /-> оо стремится к пределу, являющемуся стационарной плотностью вероятности Pat (Л), которая не зависит от начального распределения
Pst = Q (А, оо ). (23.30)
Воспользовавшись выражениями (12) и (27), запишем окончательное выражение для стационарной плотности вероятности
е— /ах^/Q х
X ехр jv
Я©
j W (Л) ехр (jQA е~аи) dA — 1 — 00
(23.31)
Если в качестве начальной плотности вероятности взять стационарную плотность вероятности Pst (Хо), то процесс А (/) при t > О будет стационарным. При этом двумерная плотность вероятности равна
Р2 (X, Х„, t) = Pst (Хо) Q (X - Хо е~“', /). (23.32)
Из (31) видно, что даже в рассматриваемом простейшем частном примере выражение для плотности вероятности оказывается довольно сложным. Получим более простое выражение для плотности вероятности в виде ряда Эджворта [30, 48] в частном случае Хо ~ =0 при t = 0, т. е. Ро (Хо) = 6 (Хо). Как следует из (29), теперь
Р (X, t) = л (X, t | 0) = Q (X, 0, (23.33)
причем^ (Q, t) согласно (27) является характеристической функцией-Ее всегда можно записать в виде ряда [30, 48]
g (Q, t) = ехр
(23.34)
где хп (/) — семиинварианты (кумулянты) процесса X (/).
Представим характеристическую .функцию амплитуд пуассоновских импульсов в виде ряда по моментам
©Л(й) =1+ 2 Мп = (А">= J AnW(A)dA, (23.35)
где Мп — начальный n-й момент амплитуды импульсов. Подставив (35) в (24) и выполнив интегрирование, получим, что в формуле (34) семиинварианты равны
xn W == (уапМп/ап) (1 — е~ап‘) — xn (1 — е-3"'),
xn = van~lMn/n. (23.36)
Воздействие пуассоновских импульсов на интегрирующую цепочку 289
Здесь через хп обозначены семиинварианты процесса X (/) в стационарном состоянии, т. е. при t -> оо .
Введем вместо X (/) нормированный процесс
П (/) = [X (/) - Х1 (/)] х2- >/2, х2 = (av/2) М2, (23.37)
который имеет нулевое математическое ожидание и дисперсию, равную единице. Для процесса т) (/) семиинварианты равны хх(/) = 0, х'(/)= 1 —ехр(— 2a/), х'(/) =
•= (a/v),/2 (23/2 Л18#ЗЛ43/2) (1 —е_3а<), (/) = х„ (1 —е-апГ),
x' = (a/v)''‘/2,-1(2"/2Aln/n/W^2), п^з. (23.38) Аналогично (34) характеристическую функцию нормированного процесса rj (/) можно записать в виде
g‘ (^, /) = ехр
оо
--L Q2 (1 -е-2^) + 2 (/Q)n 2^.
(23.39)
Если объединить члены одного порядка относительно a/v, то для плотности вероятности, соответствующей характеристической функции (39), получим ряд Эджворта
m t) = + ( 31 dx? ' и?') d* (x3(0)2 1 4' dx? 72 dx? 'r*”l
X ехр{—т)2/2[ 1 — ехр( — 2a/)]} {2л [1 —ехр( — 2а/)],/2}_,/2. (23.40)
В стационарном состоянии (при t -> оо ) эта формула упрощается
X ехр( — г)2/2)/]/Л2л, (23.41)
где семиинварианты х/, 3, определены формулой (38).
В формуле (41) экспоненциальный сомножитель ехр ( — па/2) быстро убывает с ростом г] и значения плотности вероятности ра, (г,) при больших т] оказываются малыми. Поэтому плотность вероятности pat (т]) будет близка к нормальной, если выполняется неравенство
х;/31 = (a/v)1 /2 (21/2 Л48/9Л13/2) j.
Обычно здесь коэффициент при (a/v)1/2, определяемый видом плотности вероятности W (Л) амплитуд пуассоновских импульсов, имеет порядок единицы. При этом условие близости плотности вероятности (41) к нормальной сводится к выполнению неравенства v/a = v£C> 1. (23.42)
10 Зак, 1216
290 23. Интегродифференциальные уравнения Колмогорова — Феллера
Это неравенство говорит о том, что стационарная плотность вероятности «проинтегрированных» пуассоновских дельта-импульсов будет близка к нормальной плотности (имеет место нормализация), если за интервал времени, равный постоянной времени системы (тс = RC), на нее в среднем воздействует большое число импульсов. Этот результат носит общий характер и относится не только лишь к рассмотренному частному примеру. Его следует рассматривать как следствие центральной предельной теоремы теории вероятностей.
Поясним это на рассмотренном примере. Из (3) видно, что каждый из дельта-импульсов (/—/;) создает на выходе интегрирую-
щей цепочки экспоненциальный импульс аД,ехр[—a (t — /,)], t> ti. Известно, что для линейных систем применим принцип суперпозиции. Поэтому результирующее напряжение X (/) по истечении от начала работы достаточно большого времени t RC является суммой всех таких экспоненциальных импульсов, появившихся до этого момента времени (рис. 23.2). При выполнении неравенства (42) эта сумма будет содержать большое число примерно одинаковых экспоненциальных импульсов, не успевших еще «затухнуть» к указанному моменту времени, причем амплитуды и моменты появления отдельных импульсов независимы. Эти условия как раз и обеспечивают применимость центральной предельной теоремы.
Пример 2. Воздействие пуассоновских дельта-импульсов на колебательный контур. Пусть на колебательный контур LCR (рис.21 1) воздействуют пуассоновские импульсы, описанные в примере I (с. 284), и нас интересует ток X (/), протекающий через индуктивность L:
^3+2а^+ ш*Х=ш*2Л6(г-/г),
a = R/2L, w2 = l/Z.C, />/,. (23.43)
Обозначим Xj (/) = X (/), Х2 (/) = cR-Jclt. Тогда вместо одного дифференциального уравнения второго порядка (43) получим систему из двух дифференциальных уравнений первого порядка:
V = ^2+ 2аХ2+ 0)2^ =
dt dt
= w? 2 4, б (t—tj, Oh. (23.44)
i
Двухкомпонентный процесс {Xt (/), X2 (/)} является марковским. По формулам (19.39) находим коэффициенты а, (X, t) и btj (X, /), учитывающие непрерывный характер изменения процесса X (/):
ах — Х2, — 2аХа — &)(jX1, = 0, i, j = 1, 2. (23.45)
Воздействие пуассоновских импульсов на колебательный контур
291
Из первого уравнения (44) следует, что координата Лх (/) = — (т) не испытывает скачкообразных изменений. Для опи-
сания характера скачков по координате Л2 рассмотрим уравнение
dX2/d/ = (o2 2 Дгб(/ — tt). i
Возьмем малый интервал времени ДА Вероятность того, что внутри этого интервала окажется импульс Д^&(/—AJ, равна vAA При наличии такого импульса координата Л2 получает скачкообразное приращение
с+д<
Д^(/Л) = ®§ j ДЛб(х—/ft)dx = (o§ Дй.
t
Следовательно, если «остаточное» значение координаты Л2 (О к моменту появления очередного импульса равно Л2, то для того чтобы координата оказалось в окне Ла, Лг + ДЛа, воздействующий импульс должен иметь амплитуду, заключенную в интервале (Дц = (Л2 — Л2) (оу2, А\ + ДД^ = (Ла + ДЛг — Л2) (Oq2). Вероятность появления импульса с такими значениями амплитуды равна W ((Лг — Л2) ®о2) (Оо 2 ДЛг. Поэтому для рассматриваемого примера
и (Л|, Л2, Л1, Л2, t) ДЛг =
= v(0o2 W ((Ла — Л2) (00 2)-6 (л;—Лх) Д/ДЛ(ДЛ^
Здесь дельта-функция б (Л( — Лх) отражает тот факт, что по координате Лх скачков нет. Теперь находим
<?(Лр Л2, t) = va>o2 W ((Ла — Л2)(0о 2)б(Л! — Лх) с?Л( dk2 = v.
— оо
(23.46)
С учетом найденных выражений (44) и (46) записываем уравнение Колмогорова — Феллера (7) применительно к нашему примеру
-^-Р(Л1, л2, /)=-^(Лр Ла, 0 +
ОО
+ v(0o2 [ Р(Л1; Л£, t)W f -^~^Л^-Л2-^-Р(Лр Л2, /) +
J \ ш2 /
—• оо
+ [(2аЛ2 + cog Л0 Р (Лр Л.а, 01- (23.47)
0Л2
В том частном случае, когда амплитуды всех импульсов одинаковы, т. е. W (Д) = 6 (А — Ао), интегродифференциальное уравнение 10*
292 24. Характеристики ФАП при воздействии шума и пуассоновских импульсов
(47) переходит в дифференциальное уравнение с запаздывающим аргументом по Л2:
--- Р ^2, t) — ----vP (^1> ^2> t) + VР (^1> ^2 Н" ®0 А<>> I)- dt
h, 0 + -^-[(2a^ + ®Ui)/’(^, 01- (23.48)
дкх дм
Попытка нахождения даже стационарного решения Pst (Хъ Х2) этого уравнения наталкивается на математические трудности, и сформулированная задача решается гораздо легче путем вычисления моментов случайных пуассоновских импульсов (см. пример 1, § 32), получающихся на выходе колебательного контура [10, 30, 94—95].
24. Статистические характеристики ФАП при воздействии нормального шума и пуассоновских импульсов
Возвратимся к анализу работы ФАП первого порядка (рис. 22.2). Однако теперь, в отличие от §22, рассмотрим другой, более общий случай, когда на входе ФАП первого порядка имеется сумма нормального шума £(/) и случайной последовательности дельта-импульсов
М0 = 2«ЛМ). (24.1)
i
Здесь at — случайные, взаимонезависимые «амплитуды» импульсов, имеющие известную плотность вероятности IF (а); — случайные
моменты появления дельта-импульсов, не зависящие от и описываемые законом Пуассона: вероятность появления п импульсов в интервале времени Т равна
/Мл) = -^т^ ехр(— vT), (24.2)
Л!
где v — параметр пуассоновского закона. Относительно нормального шума | (/) сохраним прежние допущения (см. (22.13) и (22.14)).
Задача вычисления статистических характеристик ФАП первого пордка в стационарном режиме работы при сформулированных условиях решалась Дж. Олсоном 196]. Оставляя в силе прежние соглашения (см. § 22) и повторив рассуждения, приведшие к уравнению
Воздействие пуассоновских импульсов на ФАП
293
(22.20), получим, что в данном случае поведение ФАП будет описываться стохастическим дифференциальным уравнением
-А ф = д0_ д sin (/)_£(/), (24.3)
где
U0=(^)sin[a>/ + T2(/)]2<W-M( ^>6. (24.4)
(0 можно трактовать как нормальный белый шум с функцией корреляции (22.14).
Г1о своему содержанию наша задача аналогична рассмотренной в § 23 и для решения ее в принципе можно воспользоваться уравнением Колмогорова — Феллера (23.6). Однако записать соответствующее уравнение Колмогорова — Феллера затруднительно. Это связано с тем, что стохастическое дифференциальное уравнение (3) является нелинейным и нельзя записать его решение в виде квадратур. Поэтому нельзя найти явное выражение для функции и (ф', ф, /), учитывающей скачкообразный характер изменения разности фаз из-за наличия дельта-импульсов. Отметим, что такое затруднение применительно к нелинейным системам носит, как правило, общий характер.
Опираясь на результат (23.41), укажем пока один частный случай, когда можно легко учесть наличие пуассоновских импульсов. Если импульсы следуют очень часто (выполняется условие v Д), то имеет место явление нормализации. При этом наличие пуассоновских дельта-импульсов будет эквивалентно дополнительному входному нормальному белому шуму со спектральной интенсивностью Sn (®) — v <а2>. Следовательно, при v Д будут применимы все ранее полученные результаты, относящиеся к ФАП первого порядка, нужно лишь в соответствующих формулах заменить (Ао/2) на (Л/о/2) + v<a2>.
Укажем другую особенность уравнения (3). Из-за наличия в правой части пуассоновских импульсов условие (11.9) теперь не выполняется. Поэтому марковский процесс ф (/) не является диффузионным и нельзя пользоваться обычным уравнением Фоккера — Планка — Колмогорова (11.16), а необходимо применять обобщенное уравнение (11.20):
оо
-^-Р(ф, /)= V (-1Г_1-^[Кп(ф, /)Р(ф, /)], (24.5) 01 -в п! 0фп
п= 1
где
Кп(ф, /) = Нт(1/Д/)<(Дф)'1 |ф>, (24.6)
294 24. Характеристики ФАП при воздействии шуми и пуассоновских импульсов
Дф(ф = {ф (£ + АО—«р (/)}|ф (О—условное приращение разности фаз за малый интервал времени А/.
Прежде чем перейти к вычислению коэффициентов Д'., (ср, /), несколько упростим форму записи импульсного шума £ (/). Так как 6 (/— /,) = 0 при t tt, то можем написать
С (0 = (2Д/Ат) 2 at sin [<о/; + ср2 (/г)1 6 (7 —4).
Если под ф2 (0 понимать собственные флуктуации синхронизируемого гетеродина, то согласно (21.55) приведенная фаза будет распределена равномерно в интервале ( — л, л). К такому же результату можно прийти путем физических рассуждений н в том случае, если на входе ФАП стоит селективный линейный фильтр, настроенный на частоту сигнала f0 = соо/2л и имеющий достаточно большую полосу пропускания А/, исключающую наложение выходных импульсов 197]. С учетом сказанного выражение для £ (/) можно записать иначе
t (/) = (2Д/Ат) sin Х< S(<-Д). (24.7)
т
Здесь а,, х,,-6, — взаимонезависимые случайные величины, причем X; распределены равномерно в интервале ( — л, л).
Так как математические ожидания Ee (t) и sin X/ равны нулю, то из стохастического уравнения ФАП (3) следует, что
Ki (ф) = Д1 (<р, /) = До — Д sin <р. (24.8)
Для н О 2 из (3) имеем
K„w = lim дг & а/
In — m
(24.9)
Очевидно, что при п — m = 0 второе математическое ожидание в правой части (9) равно единице. При п — m > 0 вследствие статистической независимости случайных величин а,, X; и 4 его можно представить в виде
М„_т <(51П Xi)'1-m >
где
^n— m
6 (t — tt) dt
(24.10)
Обобщенное уравнение Фоккера — Планка — Колмогорова
295
Для рассматриваемых пуассоновских импульсов вероятность появления в малом временном интервале А/ двух и большего числа импульсов пренебрежимо мала по сравнению с вероятностью появления одного импульса, которая согласно (2) равна v\t. При наличии внутри А/ одного импульса случайная величина xn_m равна единице, а в отсутствии импульса равна нулю. Вероятности этих' несовместных исходов равны соответственно vA/ и 1 — vkt. Поэтому = vA/. Учтем, что
Qh = <(sin Xl)*>
Л
= -^~ f sin* = 2л J
—п
2~к Г (k + 1) Г-8 + 1 j, k — четное,
О , k—нечетное,
(24.11)
где Г ( • ) — гамма-функция.
В результате подстановки выписанных выражений в (9) имеем
( п/ п. \
7<п (ф) = lim (— 2&/Ат)п v 2 [ )A1n_mQn_mx
I т=о \ т /
£о (т) dr
5о(т) dr
(24.12)
Если воспользоваться известными выражениями многомерных моментов нормального. процесса через корреляционную функцию [30] и учесть формулу (22.14) для функции корреляции белого шума |0 (/), то можно убедиться, что первое математическое ожидание в правой части (12) равно единице при т = 0 и равно пулю для т >
1 при А/->0. Второе математическое ожидание при А/0 отлично от нуля и равно No /4 только при /1 = 2.
Таким образом приходим к следующим окончательным выражениям для коэффициентов Кп (ф):
Ао — A sin <р, п= 1,
(2AMJ2[vM2Q2 + (A/0/4)], п = 2,
0, п 3, нечетное,
(2А/Ат)п vMnQn, 4, четное.
(24.13)
Видно, что коэффициенты Кп (ф) не зависят от времени и являются периодическими функциями аргумента ф.
296 24. Характеристики ФАП при воздействии шума и пуассоновских импульсов
Полагая в (5) дР /dt — 0, для стационарной плотности вероятности получим следующее уравнение:
~~ [ (------s'n Ф^ P»t (ф) 1 = —-— Pst (ф) +
dtp |Д D D rfq)2
™ d2^ '
+r (24J4)
ц = 0 dtp
где параметры D и Do определены формулой (22.40),
r = v/A, G, = (A/4m^(p!)-2<a2^>. (24.15)
Стационарная плотность вероятности приведенной разности фаз, если она существует, не зависит от начальной плотности вероятности. Поэтому нужно искать решение полученного уравнения (14), удовлетворяющее только условию периодичности (22.37) и условию нормировки (22.38):
Рв((-л) = Рвг(л), S Pe,(<P)flf<P = l. (24.16) — Л
Учитывая, что коэффициенты уравнения (14) являются периодическими функциями ср с периодом 2л, решение можно искать в виде ряда Фурье
ОО
Pst (ф) = 2 Ck k—---------------оо
оо
Cft=-L [ Pg( (ср) е"zi<p dcp. (24.17)
2л J — оо
Так как Psi (ср) есть действительная функция аргумента ср, то, очевидно, будет выполняться равенство
C_ft = a, (24.18)
где звездочкой сверху обозначена комплексно-сопряженная величина. Кроме этого, из условия нормировки (16) следует, что
Со = 1/2л. (24.19)
Подставив в (14) выражение плотности вероятности Pst (ср) из (17) и равенство sin ср = [ехр (/ср) — ехр (— /ср)]/2/, после дифференцирования и приведения подобных членов получим
0° .
У eM-^C^-Cb-J + C,, [-^- + /-^-A + r(l =0, , I “ \ и и II
к = — оо J J
(24.20)
Стационарная плотность вероятности
297
где обозначено
4 = )2h<q2u) =1+ (24.21)
Если здесь поменять местами порядок суммирования и операцию математического ожидания, то, воспользовавшись представлением функции Бесселя первого рода нулевого порядка Jа (х) в виде ряда [19], можем написать
dk = <J0(2aAAMm)>. (24.22)
Следовательно, для коэффициентов dk получаем формулу
dh= J Jn(2akMArn) W(a)da. (24.23)
— со
Так как | JQ (х) | 1, то | dk | 1. Кроме этого, Ja (0) = 1 и
поэтому d0 = 1. Преобразование (23) тесно связано с преобразованием Ганкеля нулевого порядка [47], при помощи которого для могут быть получены аналитические выражения при наиболее распространенных видах плотностей вероятностей 1Г (а) [96].
Поскольку функции ехр (/fecp) линейно-независимые, то из (20) для коэффициентов Ск следует уравнение в конечных разностях ftCft+1 + 2Cft[-g-+/-^^ + r(l -d^-kC^O. (24.24)
Таким образом, решение дифференциального уравнения неограниченного порядка (14) сводится к решению разностного уравнения второго порядка (24), что существенно упрощает задачу.
Для получения решения уравнения (24) необходимо задать два граничных условия. В качестве одного из них, очевидно, может быть использовано равенство (19). Второе граничное условие следует из свойств коэффициентов Фурье. Так как плотность вероятности не имеет особенностей типа дельта-функций, то
limCA = 0. (24.25)
С учетом равенств (18) и (19) уравнение (24) можно привести к виду
Ck+l = Cft_t-2Cft [А + / Jk + 2_ ц _ dh)]. (24.26)
Чтобы найти плотность вероятности P,t (ср), нужно решить систему уравнений (26) с граничными условиями (19) и (25) при k > 1. При этом следует иметь в виду, что коэффициенты Ch являются комплексными числами.
.298 24. Характеристики ФАП при воздействии шума и пуассоновских импульсов
Получить аналитическое решение уравнения (26) с граничными условиями (19) и (25) затруднительно. Для численного решения на ЦВМ можно воспользоваться известным методом прогонки [97] либо процедурой, предложенной в [96]. Укажем последний способ, так как он не требует запоминания массивов дополнительных значений констант.
В силу линейности системы уравнений (26) значение Cfto при произвольном k = k0 линейно связано с т. е.
= а*0 Сг + Р$о, где коэффициенты и не зависят от С\.
Задаваясь произвольными значениями Ci и Ci и решая два раза систему (26), можно найти два значения Ск„ и Ск„. Тогда из (27) получим
(24.27)
„ _ci-C'i R _C[C'i-C'iCi , p*„ — — — •
U i — С/ ] G j U j
Следовательно, приближенное значение C1( которое согласно (25) обращает в нуль при достаточно большом kQ на основании (27) равно
= C'^-Ci Cia)/(C'ko-Ci). (24.28)
Величина С\° при увеличении kQ в пределе стремится к истинному значению С\. Подобная процедура сравнительно просто реализуется на ЦВМ.
После того, как коэффициент Ct будет найден с требуемой степенью точности, остальные коэффициенты Cft, 1 < k kQ — 1, легко определяются из (26). Эти значения коэффициентов затем подставляются в (17) и таким образом определяется плотность вероятности Pst (ср). Для проверки работоспособности алгоритмов можно воспользоваться ранее полученным частным результатом (22.45), дающим Pst (ф) при До = г = 0.
Уравнение (14) можно свести к интегродифференциальному уравнению Колмогорова — Феллера (см. §23.6). Если подставить выражение для (ф) из (17) и воспользоваться вторым равенством (21), то нетрудно убедиться, что
00 .2ц 00
2Gu-£37^(q’)=-Pst(T)+ У Chdh^. (24.29)
ц=( k=— со
Сумму в правой части этого равенства можно представить в виде
е^ =
00
J Pst(x)F(<p—x)dx,
— ОО
(24.30)
Уравнение Колмогорова—Феллера
299
где
F (ф) = 2 d* eik9' k = —>00
(24.31)
С учетом выражений (29) и (30) из (14) получаем уравнение Колмогорова — Феллера
[("о—sin<p'jPs((Cp)l = -l. -JLp (ф)-ь
aq> [\ D / JO dqr
+ r — ЛЛф)
Pst (x) F (q—x) dx
(24.32)
Отметим, что введенная нами функция F (<р) определяется неоднозначно, так как при любом целом k можно использовать любую функцию F (<р), удовлетворяющую соотношению
00
dft= /?({р)е_//еч|б1ф.
— оо
(24.33)
Например, можно использовать функцию F (<р), являющуюся обратным преобразованием Фурье от dh по непрерывному индексу k, т. е.
00
F (ф) = dh еМф dk.
— 00
(24.34)
Для решения интегродифференциального уравнения (32) с условиями (16) требуется знание аналитического выражения F (ф), получить которое из (31) затруднительно. Однако соотношение (34), совместно с выражением (23) позвол яют найти эту зависимость для широкого класса плотностей вероятностей W (а). Несмотря на это решить уравнение (32) не удается. Поэтому ограничимся рассмотрением некоторых частных случаев.
Предположим, что пуассоновские импульсы имеют большие амплитуды, т. е. плотность вероятности W (а) сосредоточена в окрестности больших значений а. Учитывая асимптотическое соотношение lim Jo (х) = 0, из (23) получим, что d0 — I и 4 я 0 при k Ф 0. Ж*** оо
Из (31) следует, что в этом случае F (ф) « 1, и уравнение Колмогорова — Феллера (32) упрощается
~7~ [("7Г—sin = TV ~ТТ Р“ ~гР>1 ‘
d(p |_\ и / J £> 2л
(24.35)
300 24. Характеристики ФАП при воздействии шума и пуассоновских импульсов
Видно, что в данном асимптотическом случае стационарная плот ность вероятности Pst (ф) вообще не зависит от характеристик амплитуд импульсов.
Получить аналитическое решение уравнения (35) затруднительно. Результаты решения описанным выше численным методомна
Рис. 24.1. Стационарная плотность вероятности разности фаз при наличии белого шума и больших пуассоновских импульсов.
ЦВМ для нескольких значений параметра г при D 0 = — 0 и D = 10 приведены на рис. 24.1 [96].
Если в дополнение к большим амплитудам импульсов принять, что отсутствует аддитивный белый шум (Л'о -> 0, D = 2/ШДМ0 -> ->оо ), то (35) переходит в линейное дифференциальное уравнение• первого порядка -у- 17"7?---simp') Р8((ф)] +
dtp [ \ U / J
+ = (24.36)
Решение этого уравнения всегда ратурах. Оно оказывается особенно
может быть записано простым при Do = 0:
в квад-
Pst (ф) = Г 7е (<Р/2) ’ - f [ctg (Ф/2)]Г rf<p, 2л | sin ср | J
I ч> I
| cp | n. (24.37)
Для целых значений г отсюда получим: при г = 1
Pst (ф) = — Insin (| ф | /2)/2ncos2 (ф/2), при г = 2
р (ф) = (1ф1~Л)15‘ПФ1 । ।
3i 4л cos4 (ср/2) ncos2(<p/2)
IФI л,
|ф|^ л.
(24.38)
(24.39)
Отметим, что плотность вероятности Ps( (<р) при г = 1 не ограничена, а при г = 2 ограничена.
Результаты, аналогичные приведенным выше, для ФАП второго порядка, когда на нее воздействует сумма нормального шума и пуассоновских импульсов, получены численными методами в работе [98].
25. Уравнения Фоккера—Планка—Колмогорова для смешанных процессов 20t
25. Обобщенные уравнения
Фоккера— Планка — Колмогорова для смешанных процессов
Рассмотрим смешанный двухкомпонентный случайный процесс {X (/), 0 (/)}, у которого одна компонента {X (/)}—непрерывна, а другая {0 (/)} = k = 1, К — дискретна. В общем случае эти компоненты могут быть зависимыми и не марковскими. Тем не менее для вероятности перехода такого двухкомпонентного процесса можно ^получить уравнение типа Фоккера — Планка — Колмогорова
Обозначим двумерную условную плотность вероятности смешанного процесса через
Ph (X, /|Х, Y) = Р (X, /| X) Р (0 (0 = 0Й | Y). (25.1)
При этом величина Ph (X, /| X, Y) равна вероятности одновременного выполнения условия X (/) £ (X, X + dX) и 9 (/) = 0Й при некоторых дополнительных условиях X и У. В частности, условия X и Y могут иметь следующий вид:
Х= {0(0 = 0/ X (/„), 0 (/0) = 0г), ______________________________ (25.2) r = {X(U 0(У=0(}, I, / = 1, К.
Условие X является более полным (ограничительным), чем условие Y
При таком задании условий введем специальное обозначение совместной условной плотности вероятности
Ро (X,/|Хо, (0)=Р(Х. /|0(О=^;Х(4), е (/0) = 0/р {0 (0 =
= 0;|Х(/О), 0(/o) = 0J. (25.3)
В общем же случае эти условия могут включать в себя как различные связи между компонентами смешанного процесса и его предыдущими состояниями, так и зависимость данного процесса от других случайных процессов и некоторых параметров.
Согласно известному правилу полной вероятности для условной плотности вероятности смешанного процесса Pj (X, t 4- Д/1] X, Y) можем написать соотношение
г к
РДХ, f + Д^Х, У) = J 2 t + Х)Р(М, ЛХ)Х г 4=1
X Р {0 (t + М) = 0; 10 (() = 0Й; Y} Р {0 (t) = 0ft |У) dX'. (25.4) Написанное соотношение можно рассматривать как обобщение уравнения Смолуховского (10.8).
302 25. Уравнения Фоккера—Планка—Колмогорова для смешанных процессов
Аналогично тому, как это было сделано в § 11 п. 1, представив Р (X, t + А/| X', t, X) в виде преобразования Фурье от характеристической функции, разложив под знаком интеграла характеристическую функцию в ряд Тейлора и почленно проинтегрировав, получим выражение вида (11.6):
п = 0
(25.5) где
тп (X', t-, X) = < {[X (I + А/) — X (/)]" | X', /; Х}>. (25.6)
Сумму произведений вероятностей дискретной компоненты 0 (/), входящей в (4), можно представить в следующем виде:
к
2 Р{0(/ + АО = ^|0(/) = ^; Y} Р{0(О = А1П =
4 = I
К
= Р {9 (0 = 1 Y} + 2 А/ (0 Y) Р {0 (0 = | Y}. (25.7)
4=1
Здесь
AhJ (/; Y) = Р {0 (/ + АО = ^ | 9 (0 = Y } - 6Й,, (25.8) где
g (1 при k = j, h> ( 0 при k=£j.
Подставив (5) и (7) в (4), получим
РДХ, / +Д/|Х, Г) = ?ДХ, t\X, У)+ y^-g-[OTn(X,0X)X I
К
ХР,(М|Х. У)]+ 2 А; (О ПРЙ(Х, t\X,Y), (25.9)
4=1
где «коэффициенты» тп и Ah;- определяются соответственно формулами (6) и (8).
Предполагая существование предела и осуществляя предельный переход при А^-^-О, получим обобщение уравнения (11.7) на смешанный процесс
ИХ,п= У (МЬ. О Х)А(Х, /IX,Г)] +
О/ П\ рА»’*
п~ I
Независимые компоненты
303
+ £ ah}(t\Y)Ph(K t\X,Y). (25.10)
*=i
Коэффициенты этого уравнения определяются по формулам
КАК К X) = liin (1/Д0({[А(/ + Д/) — Л.(ОГ I к К Х}>, (25.11)
ahj(f, Г) = 11т (1/Д/)[Р{0(/ + ДО-^|6(/)-^; Г}-6ЛУ]. (25.12) д/-»о
Отметим, что предел при Д/ -> 0 можно брать справа или слева. В том случае, когда Д/-> 0+ (предел справа), получается прямое уравнение, а при -> 0~ (предел слева)—обратное уравнение. В дальнейшем везде используется прямое уравнение.
Выбирая в основном уравнении (10) соответствующим образом условия X и Y, можно получить различные частные случаи, например, уравнение для плотности вероятности перехода смешанного марковского процесса, у которого компоненты не являются марковскими. Рассматривая независимые компоненты, можно получить уравнения для условных плотностей вероятностей и вероятностей немарковских процессов. Рассмотрим последний случай.
Для независимости компонент рассматриваемого двумерного процесса нужно допустить, что взаимонезависимы как сами компоненты {X} и {0}, так и условия X и Y. В этом случае сомножители в правой части (1) будут независимыми. Подставив (1) в (10) и разделив результат на Р (А, г'|Х)Р{0 (/) = 0ДУ}, после элементарных преобразований получим
t\X)- 24г^[/<п(М; Х)Р(А,/|Х)]}р-ЧА,/|Х)= ^=1
au(f, Г)Р{0(О = МГ}|х
X(P{0(/) = I /})-* = const. (25.13)
Р{0(/) = <ЫП + 2
Так как равенство (13) должно выполняться при произвольных А и 0, то правая и левая части его для сохранения условия нормировки должны быть тождественно равны нулю.
Следовательно,
4- р (A, t1X) = V [Кп (х, t- X)P(\,t\ X)].
dt ni d№
n~ 1
(25.14)
(25.15)
304 25. Уравнения Фоккера — Планка — Колмогорова для смешанных процессов
Если условия X и Y имеют сложный вид, например, в X входит значение 0 (/') в предшествующий момент времени t' < t, а в Y входит значение A (f), то процессы A (t) и 0 (t) в отдельности будут немарковскими, хотя написанные уравнения, похожие на уравнения для марковских процессов, останутся в силе.
Полагая в (14) X = {Ао, (0), придем к известному уравнению (11.7) для непрерывного процесса А ((). Если непрерывный процесс А, (Z) является марковским, то коэффициенты Кп не зависят от X и, кроме этого, коэффициентами Хп при и 3 в диффузионном случае пренебрегают. При этих условиях с учетом обозначений (10.2), (11.10) и (Н.П) уравнение (14) переходит в уравнение Фоккера — Планка — Колмогорова (11.1):
-^-л(А, (|А0, (0) = -^-[а(А, г)л] + ^--^-[ЦА, 0 л]. (25.16) dt дх 2 д№
Если Y = {0 (/0) = •&,}, то дискретный процесс 0 (Z) является марковским. Введя обозначение лгу (/0, /) = Р {0 (Z) = Фу | 0 (/0) = = Фг} и учтя независимость коэффициентов ahi от Y, получим уравнение (6.7) для дискретного процесса 0 (Z):
, к
— л,7 (^ 0=2 ahi^ (25 17)
6=1
В данном случае величина ahj (t) Ы равна вероятности перехода дискретного процесса 0 (() за малое время А/ из состояния 0 = = в состояние 0 = при k j, причем
akdt)=~^ahj(t). (25.18)
Когда обе компоненты А (() и 0 (t) являются по отдельности марковскими процессами, но не обязательно независимыми, коэффициенты akj могут также зависеть от «возраста» А. При этом основное уравнение (10) можно записать в виде
дРДА, (|Ао> tQ; Y) /dt— й[^(А, f, Х)Р/]/дк +
+ (l/2)d2[/(2(A, t-, Х)Ру]Ж2+ 2 ам(А, f, Y)Pjt j=Y~K.
k=i
(25.19)
Применительно к условной совместной плотности вероятности, определенной равенством (3), уравнение (19) примет следующий конкретный вид:
дрг;(А, Z| Ао, ta)ldt— — д [/^ } pt} (A, 11 Au> /0)]/5А +
+ (l/2)a2[K2iJ^.(A, (|А0>/0)]/аА2+ 2 ah)Pih{Kt\K>t0), (25.20) 6=1
Фазовое пространство двухкомпонентного процесса
305
где
Кп,} = lim (1/Д0<{[Х (/ + Дг)—X (OF 10 (< + ДО = Ai -* О
k(t), e(0 = W, (25.21)
afty= lim (1/ДО [Р {0 G + ДО = <b IX (О, 0(0 = ^} — 6W]. (25.22)
Д£->0
Ранее было показано (см. (6.12) и (11.16)), что формулы вида (16) и (17) остаются в силе не только для вероятностей перехода, но и для абсолютных вероятностей состояний. Аналогичный результат справедлив и для смешанного марковского процесса {X (0, 0 (0}-Поясним его вывод следующими рассуждениями.
Отметим, что согласно (12) вероятность сохранения состояния 0 = '0; при заданном X в течение малого интервала времени Д/ приближенно равна Р{0 (t + Д/) — | Qft) — ®]} « 1 +
+ aj}(k, t) &t. Поэтому суммарная вероятность перехода за Д/ из состояния 0 = Оу в любое другое возможное состояние 0 = = А /, равна
1 — [1 + аи (k, t) Д/1] = — ai} (X, /) ДА
Фазовое пространство рассматриваемого двухкомпонентного марковского процесса схематически можно представить в виде К прямых, соответствующих разным допустимым значениям дискретного процесса 0 (г1). Выделим на прямой, соответствующей 0 — = Оу, малый интервал ДХ.
Приращение вероятности за малое время Д/ на элементарном интервале ДХ равно сумме двух слагаемых: 1) потока вероятности [Gy (k, f) — Gj (к + Ikk, г1)] из-за непрерывного движения при условии отсутствия скачка и 2) разности приходящей и уходящей вероятности из-за скачков. Запишем эту разность.
Обозначим через Ру (к, t) Кк вероятность нахождения изображающей точки на прямой 0 = Оу в элементарном интервале \к. На этот интервал возможны скачки с различных прямых 0 — k /. По закону умножения вероятностей вероятность, поступающая на выделенный элемент \к из-за скачков с какой-либо прямой flft, равна произведению вероятности Рй (к, t) ДХ нахождения изображающей точки в соответствующем элементе длины ДХ прямой на вероятность ahJ (к, f} Д/ скачка Ой -> Фу. Поэтому суммарная вероятность, поступающая со всех прямых Oft, k /, очевидно, равна
к
ДХД/ ^;(Х. 0Pft(^ 0.
fe=i p
По тем же соображениям вероятность, убывающая с выделенного элемента ДХ на прямой Оу, равна — Пуу (X, t) Р} (к, t) ДХ.
303
26. Достижение границ одномерным марковским процессом
Воспользовавшись законом сохранения вероятности (11.25), можем написать
[Р;(М + ДО—РАЪ t)-G,(k + bk /)] Д/ х
х[1-а/7(А,/>д/] + дад/ 2 akA^ t)Pk(Kt)-
А’= 1 (* 9* /)
-[-ая(А, /)Р7(А, 01 ДАД/.
Поделив обе части этого равенства на ДАД/ и переходя к пределу при Д/ -> 0, ДА-> 0, с учетом (П.23) получим
^-РДА, /)=—^-[а(А, /)Р,(А, 01 Н
01 Oh
+ 4 1Ь (К 0 Р, (К 01 + У akj (А. 0 Р> (*. О- . (25.23) £ Ohr
R = I
Если процессы А (А) и 0 (А) независимы, то совместная вероятность равна произведению вероятностей каждого из процессов:
Р, (А, 0 = Р(А. 0ру(0, (25.24)
где Р (А, /) — одномерная плотность вероятности процесса А(0, pi (0 — вероятность состояния 0 = Фу.
Подставив (24) в (23) и разделив результат на Р (А, /) р} (t), получим систему из двух самостоятельных уравнений, совпадающих с (11.16) и (6.12).
Решение уравнения (20) применительно к задаче о воздействии случайного телеграфного сигнала на интегрирующую цепочку подробно рассматривается в [77].
26. Достижение границ одномерным марковским процессом
Аппарат теории марковских процессов позволяет анализировать работу систем так называемого порогового типа, нормальная работа которых обеспечивается лишь в том случае, если воздействующий на них процесс или какой-либо характерный параметр этой системы не выходят за допустимые пределы.
В качестве конкретных радиотехнических примеров можно указать задачу о возбуждении и срыве автоколебаний в генераторе под влиянием шумов, задачу о срабатывании триггерных схем от помех, задачу о срыве автоматического слежения за информацион
Вероятность достижения границы
307
ным параметром сигнала из-за случайных воздействий в автодальномере, фазовой и частотной автоподстройках. Аналогичные задачи возникают в других областях науки и техники, когда нормальная работа системы возможна лишь при условии, что какой-либо параметр (или группа параметров) находится в пределах установленных допусков. Примером может служить большинство задач теории надежности.
Сюда же можно отнести некоторые вопросы анализа устойчивости систем, имеющих два или более устойчивых стационарных состояний. В отсутствие случайных возмущений система, находясь в одном стационарном состоянии, не может перейти в другое без каких-либо внешних воздействий. Наличие даже малых случайных возмущений приводит к тому, что система начинает совершать малые флуктуационные колебания вблизи одного из стационарных состояний и время от времени переходит из одного состояния в другое. Естественно, что при рассмотрении подобных систем возникает вопрос о вычислении вероятности таких переходов или же о частоте смены различных состояний.
Методы решения подобных задач впервые были развиты в работе советских ученых Л. С. Понтрягина, А. А. Андронова и А. А. Витта [105]. В ней были получены уравнения для вероятности и моментов времени первого достижения границы динамической системой, поведение которой при наличии случайных возмущений описывается системой п стохастических дифференциальных уравнений первого порядка. В дальнейшем эти методы успешно использовались и развивались для решения конкретных задач в работах советских и зарубежных ученых.
Вероятность достижения границы одномерным марковским процессом
Пусть непрерывный одномерный стационарный марковский процесс X (0 в начальный момент времени t — 0 имеет фиксированное значение А (0) = Ао, находящееся внутри интервала (с, d), т. е. начальная плотность вероятности является дельта-функцией
Р (А,, 0) = Ро (А) = 6 (А — Ао), Ао G (о. d). (26.1)
Нужно найти вероятность pCld(t,Jt0) того, что случайный процесс, имеющий начальное значение Ао, в течение времени t > 0 достигнет границ интервала (с, d}, т. е. достигнет либо границу с, либо границу d.
Вместо вероятности достижения границ pc d (t, Ао) можно интересоваться вероятностью
qc.d (t, К) = 1 - Ре.л (А М (26.2)
308
26. Достижение границ одномерным марковским процессом
Рис. 26,1. Достижение границ (с, d) из начальной точки X через промежуточное состояние £ в момент т.
недостижения границы с или d марковским процессом, имеющим начальное значение Хо. Другими словами,
9c,d ('. М = Р {с < X (/) < d, 0 < t < Т}, Хо е (с, d), (26.3) где Т = Т (с, Хо, d) — случайный момент времени первого достижения границы с или d.
Следуя в дальнейшем изложении работам [105, 106], введем плотность вероятности р (£, /; Хо) перехода за время t из точки Хо в интервал (5, 5 + d|) для реализаций процесса, ни разу не коснувшихся границы с или d. Для наглядности можно говорить не о реализациях процесса, а о траекториях движения частиц, первоначально (при t = 0) сконцентрированных в точке X = Хо. Эта модель позволяет достаточно наглядно интерпретировать полученные результаты.
Вероятность того, что частица, выйдя из точки Хо, ни разу не достигнув
границы с или d, будет ко времени t > 0 находиться в какой-либо внутренней точке интервала (с, d), о одной стороны, равна d
1 — Рс,а (Л ^о)> а с другой—\р (£, /; Хо) dg. Поэтому d
t; X0)dS + pc d(t M=l- (26.4)
Вероятность рс d (t + т, Хо) того, что достижение границ (с, d) произойдет за время t + т, равна сумме двух вероятностей; вероятности рс Л (т, Хо) достижения границ за время т и вероятности того, что за время т границы не будут достигнуты, а это достижение осуществляется за оставшийся промежуток времени t. Эта вторая вероятность равна
а
т; h)pCtd(t, l)dl.
С
Действительно, так как достижение границ происходит за время t + т, то в течение предшествующего промежутка времени т частица с вероятностью р (£, т; Хо) переходит из начального положения Хо
Вероятность достижения границы
309
в некоторую внутреннюю точку £ £ (с, d), а затем из этой точки В за время t достигает границы с или d (рис. 26.1).
Следовательно, можно написать
d
Pc.d U + т, Хо) = pcd (т, Хо) + jp (g, т; Хо) рсЛ (t, |) dg. (26.5)
Чтобы из этого соотношения получить дифференциальное уравнение для вероятности pc d (t, А,о), разложим стоящую в (5) под интегралом вероятность ра d (t, |)в ряд Тейлора в окрестности точки А,о. Тогда получим
d
Ре, d (? *1” Ч \>) = Pc, d (Ч Н~ Рс, d(C \>) Р (=> Ч ^о) "Г
С
d
+ gPc.d(4 M [(g-^pd, т; X0)dl + Щ J
c d
2 J
c
d
+ I d3Pe,rf[G Xo+vU-Ч)] C (|_- (|1 T; у 0 < v < 1.
3? dAj J
c
a
Заменяя согласно (4) во втором члене в правой части Jp(g, т;
С
\>)dg на 1 — pCid (t, А.о), вычитая из обеих частей pCtd (t, А,о) и разделив результат на т, имеем
Pc.d(^~F't, Ч) — Pc.dl^, ^о) _ Pc, d (т. ^о) ।
Т т с. d >
d
+ — <3Pc,rfJ- —} 3 -h) P (g, ч 4) dl +
т oX0 J
d
d2pa’^’ Xo) f(g-VP(^ 4 K)dl +
2т J
c
d
I ^Pc.dt^i ^o + v(S—^o)] C (g_^3 x
31 т dXii J
c
Xp(g. c; 0<v<l. (26.6)
310
26. Достижение границ одномерным марковским процессом
Сделаем теперь некоторые допущения относительно плотности вероятности р (|, т; А.о). Вообще говоря, плотность вероятности р (£, т; Хо) не равна плотности вероятности перехода л(|, г | А,о, 0), введенной в § 10, так как при определении р (£, т; Ха) из рассмотрения были отброшены те частицы, которые до момента г успели достигнуть границ (с, d). Однако, имея в виду дальнейший предельный переход к т-+ 0, мы не будем делать различия между ними, основываясь на том допущении, что при очень малых т и Ло =£ с или d вероятность достижения границ мала, так что
lim— pCt й(т, Хо) = 0. (26.7)
t->-0 т
Иначе говоря, считаем, что для достижения границ из точки А.о, не совпадающей с этими границами, требуется некоторое конечное время и поэтому при т -► 0 практически отсутствуют частицы, достигнувшие границ (с, d). Поэтому с учетом (11.8) можно положить
а
lim — т; KJdl =
т->0 I J с d
= limfl-L л (1, т| = (26.8)
С
Коэффициенты Кп (KJ'' не зависят от времени потому, что процесс предполагался стационарным (однородным по времени).
Переходя в (6) к пределу при I-+0 и учитывая соотношения (11.10), (11.11) и (7), окончательно получим основное (первое) уравнение Л. С. Понтрягина 1105]
=a(X0)-^-pc.d(/, Ч) + -р(^)-^гРс.^ <26-9)
О’ мА»у “ OA»q
Укажем начальные и граничные условия для полученного дифференциального уравнения в частных производных. Для всех значений А.о, находящихся внутри интервала (с, d),. вероятность достижения границ гари t = 0, очевидно, равна нулю, т. е.
Рс.а (0. *о) = 0. c<X0<d. (26.10)
На границах интервала, т. е. при Хо = с и А.о = d, вероятность достижения границ для любого t равна единице, т. е.
Pc.d ('. У = Ре,а (*. - !•
(26. И)
Вероятность достижения границы
311
Это означает, что при Ко = с и Ко = d граница достоверно будет достигнута уже при t = 0. Кроме этих условий, обычно должно выполняться соотношение
limpc d(/, \)) = 1 (26.12)
t-+x>
выражающее тот факт, что вероятность пересечь границы когда-нибудь за достаточно большое время равна единице.
Обязательное выполнение условий (10) и (11) физически следует из того, что одномерный марковский процесс недифференцируем, т. е. производная марковского процесса имеет бесконечную дисперсию (мгновенная скорость процесса бесконечно велика). Однако частица с вероятностью единица смещается за конечное время на конечное расстояние. Поэтому скорость частицы все время меняет знак, и движение происходит в противоположных направлениях. Если частица находится на некотором конечном расстоянии от границ, то она не может их достигнуть мгновенно — условие (10). Наоборот, если частица находится вблизи границ, то она обязательно пересечет их — условие (11).
Отметим, что аналогично решаются задачи о вероятности выхода либо только через левую границу с, либо только через правую границу d, либо о вероятности невыхода из допустимой области (с, d). При этом уравнение (9) остается в силе, а изменяются лишь краевые условия. В частности, для вероятности qcd (t, Хо) того, что траектория рассматриваемого марковского процесса в течение времени t будет находиться внутри интервала (с, d), дифференциальное уравнение и соответствующие начальные и граничные условия будут иметь вид
9С, d *о) ~ а (Ю ~z:— 9с, а Ю +
Ot
+ тЬ{Кп}~£тЯс Л(' (26 13)
9с.а(°Ао) = 1, c<X„<d, (26.14)
9с.а^с) = 9с.аК.<П =0. (26.15)
Полные вероятности рс (Хо) и pd (Хо) первого достижения границы с или d соответственно определяются решением стационарного уравнения (9) при надлежащих граничных условиях. Например, вероятность pd(X0) того, что за сколь угодно большое время частица из первоначального состояния Ло попадет в состояние d (а не с), есть решение уравнения
V b (М Sr Pd(h) + а (Хо) Pd (^) = 0 (26.16)
312
26. Достижение границ одномерным марковским процессом
при условиях
р,, (с) = 0, р,( (d) = i. (26.17)
Решение уравнения (16) с граничными условиями (17) может быть получено в виде
J ехр [—<р (х)] dx
= ------------------(26.18)
J ехр [ — <р (х)j dx
С где
Ф (X) = J dx. (26.19)
Отметим, что pd (Хо) < 1 при с < Ко < d.
Наконец, можно интересоваться вероятностью достижения границы марковским процессом, начальное значение которого — случайно. В этом случае сначала решается задача для фиксированного начального значения Хо, а затем производится осреднение по всем возможным значениям Хо. При этом, если начальное значение Хо распределено на интервале (q, dj до (с, d) с плотностью вероятности Ро (Хо), то по теореме сложения вероятностей полная вероятность достижения границ end определяется соотношением
d
^.d(O = $Pc,d(t х0)Рдх0)А,+ с
+ [Р{с1<^0<с1 ( = 0} + P{d<A1)<d1, 1 = 0}].. (26.19а)
Для определения вероятности недостижения границы одномерным марковским процессом можно указать довольно общий способ, состоящий в решении уравнения (13) с начальными и граничными условиями (14), (15) методом разделения переменных [37]. Вероятность достижения границы далее легко определяется из соотношения (2). Применять метод разделения переменных непосредственно для решения уравнения (9) с начальными и граничными условиями (10), (11) нельзя, так как в этом случае граничные условия (11) будут неоднородными и соответствующая система собственных функций может быть неортогональна [107].
Представим искомое решение уравнения (13) в виде
Яс. d (Л U = Т (!) Л (U.
Вероятность достижения границы
313
Применяя обычную процедуру разделения переменных, для функций Т (0 и Л (Хо) получим следующую систему уравнений:
— Т(/)+у2Т(/) = 0, (26.20)
dt
-L ММ Л + а (Ьо) - Л (М + V2 Л (М = 0. (26.21)
Решение уравнения (20) имеет вид Т (/) = ехр (—у2/).
Предположим, что может быть найдено общее решение уравнения (21)
А (М) = (Хо, у) Ч- СаЛ2 (М у)-
Для определенных постоянных Сг и С2 из граничных условий (15) следует система алгебраических уравнений
CjAj (с, у) + С2Л2 (с, у) = 0. (26.22)
CiAj (d, у) + С2Л2 (d, у) =0.
Так как нас интересует нетривиальное решение этой системы, то должно выполняться условие
Ai (с, у) Л2 (d, у) — Aj (d, у) Л2 (с, у) = 0. (26.23)
Условие (23) выполняется при некоторых значениях у — уА, которые называются собственными числами. Таким образом, (23) можно рассматривать как алгебраическое уравнение для определения собственных чисел у&. Это уравнение называется характеристическим.
Кроме того, из (22) следует связь между постоянными Сг и С2. Например,
С2 =----Сг. (26.24)
Л2(с, у)
Таким образом, в зависимости от уА, собственные функции Л (М у) с точностью до постоянной будут иметь вид
Aft(MYfe) = A1(X0,Vfe)---11(/’ П!-ЛНММ- (26.25)
(с. Ya)
Суммируя по всем k, для вероятности qrd (t, Хо) получим
<7с,а {t, М) = S Ck ЛА (К, уА) ехр ( —yl f). (26.26)
k
Постоянные Сц определяются из начальных условий (14) с ис‘ пользованием ортогональности собственных функций ЛА.
314
26. Достижение границ одномерным марковским процессом
Умножая обе части последнего равенства на Лй (Ло, уА) и интегрируя по всем значениям А,0( имеем
d
J Лл (^о. Ул) А)
ch = -£--------------. (26.27)
J A j (Ко, Ул) A) С
Следовательно, если может быть найдено общее решение уравнения (21), то для вероятности qc d (t, Кв) из (25) — (27) получается аналитическое выражение.
Однако даже в самых простых случаях характеристическое уравнение (23) для определения собственных чисел будет трансцендентным. И хотя ряд (26), как правило, довольно быстро сходится (т. е. можно учитывать лишь несколько первых членов этого ряда), для определения нескольких наименьших по абсолютной величине собственных чисел требуется численное решение (23) на ЦВМ. Кроме этого, не всегда можно найти общее решение уравнения (21). Поэтому применение численных методов непосредственно для решения уравнения (13) на ЦВМ в некоторых случаях может оказаться более эффективным.
Пример 1. Для иллюстрации применения метода разделения переменных в задаче об определении вероятности невыхода марковского процесса за заданные границы рассмотрим простой пример. Пусть требуется найти вероятность невыхода за границы (—Л, h) винеровского процесса и (t), поведение которого определяется стохастическим дифференциальным уравнением
v(t) = n(l), (26.28)
а/
где п (/) — нормальный «белый» шум с нулевым средним значением и дельта-функцией корреляции (см. § 14). В этом случае а (Хо)=0, b (Ко) = No/2 и уравнение (21) принимает вид
Общее решение этого уравнения
где собственные числа согласно (23) равны
(k = 0,1,2,...).
Вероятность достижения границы
315
Из соотношений (25), (27) следует
Aa(^>YJ = cos^- (k^,l,2,
(О, k=2n (n = 0,1,2...).
Подставляя найденные значения собственных чисел, собственных функций и постоянных в (26), получим
<7-Л.Лил)=—у c°s [(2«+1)]х
л 2л 4-1 . 2/г
п=0 1 L J
X ex р Г - -° (2п+‘-)-2 ла Д. (26.29)
[ 16Л2 J
Отметим, что для произвольных границ (с, d) аналитическое выражение может быть получено простой заменой переменных
М'Л) = ? *-е d-c (26.30)
Полная вероятность достижения границы/» согласно (18) равна
Ph (^о) ~ 1 —P-h (\)= —тт— •
2/3
Наконец, если начальное значение Хо — случайно и равномерно распределено на I—Л, А], то можно вычислить безусловную вероятность (не зависящую от Хо) пребывания в заданной области
?-л,л(^)= (М ~
—/1
= -*^- V —J. —ехр[- t
л« £ (2n+D2 L 16Л2
Пример 2. В качестве второго примера рассмотрим поведение системы фазовой автоподстройки частоты (ФАП) первого порядка с синусоидальной характеристикой дискриминатора при воздействии на входе системы гармонического сигнала с амплитудой А и аддитивного белого шума п (/), которая описывается нелинейным стохастическим дифференциальным уравнением первого порядка (22.20)
^- = Д0 — A sin —•j-h(Z). (26.31)
316
26. Достижение границ одномерным марковским процессом
Как указывалось в § 22, система (31) имеет счетное число состояний равниъесуя, из которых устойчивым состояниям соответствуют значения фазового рассогласования
ф* = arcsin 2/гл, (26.32)
д
а неустойчивым
Ф* = л— arcsln-^2-± 2/гл (k— 0,1,2, ...). (26.33)
д
Когда имеет место переход из окрестности какого-либо устойчивого состояния равновесия в соседние состояния устойчивого равновесия, принято условно говорить о перескоках фазы ф (/) 181J. Под срывом слежения (синхронизации) понимают выход координаты ф (/) за границы (ф'11, фо) соседних состояний неустойчивого равновесия. При этом предполагается, что начальное значение фазового рассогласования ф0£[ф"_1, фо1.
Вычислим вероятность слежения и отсутствие перескоков фазы в системе (31), в зависимости от произвольного значения фазового рассогласования ф0. Эта зависимость позволяет, в частности, учесть случайный характер величины ф0, что часто встречается на практике. Обычно принимают, что ф0 равномерно распределена на заданном интервале.
Для системы (31) коэффициенты сноса и диффузии марковского процесса ф (t) определяются выражениями (22.34):
а (ф) = До — Д sin ф, b = №0Д2/2Д2. (26.34)
В этом случае первое уравнение Понтрягина для вероятности (6 Фо) нахождения к моменту времени t траектории марковского процесса ф (/) внутри интервала (фн ф8) имеет вид
Яш,. (6 Фо) —FTTT ф- (К Фо) +
о/ D оф j
_|-дsin ф(Д —— фДК Фо)> (26.35)
\ Ы / Оф0
где
D = 4 Л2/Л/0Д = 2Д/Л, Dn = Д„£)/Д. (26.36)
Соответствующей заменой переменных в (35) можно убедиться, что значение (t, ф0) не зависит от того, в окрестности какого устойчивого состояния равновесия рассматривается задача достижения границ, т. е
?<Pi. (6 Фо) — х иш. ф, ± inn (6 Фо db 2&л).
(26.37)
Вероятность достижения границы
317
Поэтому при вычислении вероятности слежения можно ограничиться рассмотрением достижения точек неустойчивого состояния равновесия, ближайших к <р6, т. е. положить
'>1 = <pLi = —л—arcsin (Do/D), ф2 = Фо —л—
—arcsin (Do/D). (26.38)
Рис. 26.2. Зависимость вероятности слежения от начального значения фо и времени при D-l, £>o/D-0.
Аналогично, при исследовании вероятности отсутствия перескоков фазы можно ограничиться точками
<Pj = ф! 1 = arcsin (Do/D) — 2л,
Ф2 = ф! = arcsin (Da/D) + 2 л. (26.39)
Таким образом, задача сводится к нахождению решения уравнения (35) с начальным условием
<7ф|. Ф,(°»фо)= 1, Фх<Фо<Ф2 (26.40)
318
26. Достижение границ одномерным марковским процессом
и граничными условиями
?Ф1. ф, (С<Р1)= ?<₽!, Ф1 Фа) ~ 0» t~>0. (26.41)
Получить аналитическое решение уравнения (35) с начальными и граничными условиями (40), (41) не удается. Результаты числен* ного решения на ЦВМ [108] представлены на рис. 26.2 — 26.7.
Рис. 26.3. Зависимость вероятности слежения от начального значения н времени при D-l, Do/D —0,75.
На рис. 26.2, 26.3 показаны двумерные зависимости вероятности слежения р = а/ф^ ф» (/, ср0) для значения отношения сигнал/шум D = 1 при относительных начальных расстройках по частоте Do/D = 0 (рис. 26.2) и Da/D = 0,75 (рис. 26.3). Из рисунков видно, что симметричная по ср0 в отсутствие начальной расстройки поверхность становится несимметричной при ее наличии, а вероят* ность слежения уменьшается.
Вероятность достижения границы
319
На рис. 26.4, 26.5 сплошными кривыми изображены графики зависимости вероятности слежения р — v’ (t, <р6) от времени t при условии, что первоначально система находилась в устойчивом
Рис. 26.4. Зависимость вероятности слежения от времени при различных отношениях сигнал/шум.
Рис. 26.5. Зависимость вероятности слежения от времени при различных начальных рае-стройках.
положении равновесия. Пунктиром представлены значения вероятностей слежения, усредненных по случайным равномерно распределенным на рассматриваемом интервале начальным ошибкам по фазе <р0. Из рисунков видно, что учет случайного характера начального рассогласования по фазе приводит к заметному уменьшению вероятности слежения. Аналогичные зависимости вероятности отсут
&20
26. Достижение границ одномерным марковским процессом
ствия перескоков фазы p = qv>_ (t, ср о) показаны на рис. 26.6, 26.7.
Применительно к квазикогерентным системам радиоприема сигналов на фоне шума полученные данные позволяют определить ве-
Рис. 26.6. Зависимость вероятности отсутствия перескоков фазы от времени при различных отношениях сигнал/шум.
Рис. 26.7. Зависимость вероятности отсутствия перескоков фазы от времени при различных начальных расстройках.
роятность нарушения синхронного режима работы приемного устройства. Пользуясь ими, можно также указать вероятность отсутствия случаев так называемой обратной работы в системах фазовой телеграфии.
Связь уравн. Понтрягина с уравн. Фоккера — Планка — Колмогорова 321
Связь уравнения Понтрягина с уравнением Фоккера — Планка — Колмогорова
Решение задачи о вычислении вероятностей ped (t, л0) или qcd (^ М можно получить несколько иначе, базируясь на прямом и обратном уравнениях Фоккера—Планка—Колмогорова. Из соотношений (2), (4) следует, что
а
Qc,d(t^0) = \p(l,t\ (26.42)
С
Напомним, что р (£, /; Хо) есть плотность вероятности перехода из первоначальной точки Хо £ (с, d) в какую-либо внутреннюю точку интервала (с, d) для тех траекторий процесса % (/), которые до момента времени t ни разу не достигли границ и, следовательно, находятся внутри интервала в любой предыдущий момент времени. Для этих траекторий справедливы прямое и обратное уравнения Фоккера — Планка — Колмогорова, которые применительно к рассматриваемому однородному во времени одномерному процессу имеют соответственно вид
|p(UM=-^(OM)] +
ot ot,
+ y-^-[^)p(U; Ш (26.43)
~ ~р (?, К) = а (М -А- [р (1, /; Ml +
01 O&Q
+ М- (26.44)
Поскольку нас интересуют вероятности pc d (/, Хо) и qcd (t, Ао) как функции начального состояния А.о при фиксированных конечных значениях процесса (с или d), то представляется естественным для нахождения этих вероятностей воспользоваться обратным уравнением (44). Действительно, из соотношения (4) после интегрирования (44) по £ получим уравнение Понтрягина (9). Можно поступить иначе: сначала найти решение (44) при поглощающих граничных условиях
р& t-, c)=pft,f, d) = 0 (26.45)
и начальном условии
р (I, 0; %0) = 6 (g - %0), (26.46)
а затем воспользоваться соотношением (4).
И Зак. 1216
322
26. Достижение границ одномерным марковским процессом
Можно также вычислить вероятности (/, Хо) и d (/, Х()) при помощи решения прямого уравнения Фоккера—Планка — Колмогорова. Действительно, пусть найдено решение прямого уравнения (43) при начальном условии (46) и поглощающих граничных условиях
р (с, t\ Хо) = р (d, t; Хо) = 0, (26.47)
Граничные условия (47) следуют из того, что необходимо исключить из дальнейшего рассмотрения те траектории процесса Л (/), которые хотя бы один раз вышли за границу отрезка [с, d] к моменту времени t. Для этого необходимо запретить этим траекториям возвращаться внутрь интервала (с, d) после того, как они впервые вышли за его пределы. Так как одномерный марковский процесс недифференцируем, то его траектория, подходя к границе, успевает бесчисленное множество раз пересечь ее. Поэтому в граничных точках (?. = с и К = d) при решении задач о достижении границ одномерным марковским процессом необходимо поместить поглощающие экраны (см. также § 27).
Вероятность qc d (t, ба) вычисляется интегрированием по формуле (42), а вероятность pCfd (t, Zo) того, что границы будут достигнуты за время от 0 до /, определяется согласно формуле (4).
Отметим, что решение уравнения Фоккера — Планка — Колмогорова с граничными условиями (47) позволяет при помощи (4) найти вероятность достижения заданных границ неоднородным марковским процессом 1 (/), у которого коэффициенты сноса и диффузии зависят от времени.
Если одна из границ, например с, является отражающей, то вероятность pd (t, f.o) достижения границы d может быть также получена из решения прямого уравнения (43) с начальным условием (46) и граничными условиями
p(d,i; Хо) = 0, -t-p(?,Z;X0) | =0. (26.48)
ОЛ0 I
К0~с
Поясним происхождение второго условия (48). Пусть в некоторый момент времени t0 — At0, принимаемый за начальный, частица оказалась на границе с. Тогда за последующий небольшой интервал времени Д/о частица, отразившись от экрана с, с вероятностью а может переместиться вправо на малую величину ДХ0 ~ (AZ0) z« и с вероятностью (1 —а) может остаться на границе. Можно убедиться, что
Р (I, t; с, ta — Д/о) = ар(I, t\c — ДХ0, Zo) +
+ (1 — a)p(L t\ с, t0)
Связь уравн. Понтрягина с уравн. Фоккера — Планка — Колмогорова 323
ИЛИ
— -^-А/0 = аГр — АЧ +
v/o 1 \ дЛ-о / Хо = с
+ (ДМ2] + (1-а)р.
2 V дЦ
Отсюда имеем
\ дК К=с dta ДЛо 2 \ дЦ ) 0
Переходя в последнем выражении к пределу при Д/о -> 0 и учитывая, что Л2.о ~ (А/ц)1/2, придем ко второму условию (48).
Таким образом, из решения прямого уравнения Фоккера — Планка — Колмогорова может быть найдена вероятность выхода из области, одна из границ которой является отражающей. Кроме того, в некоторых случаях оказывается проще решить уравнение (43) с граничными условиями (47), чем решать непосредственно уравнение Понтрягина (9). Для этого иногда можно воспользоваться известным нестационарным решением (43) в неограниченной области. Чтобы проиллюстрировать эти положения, рассмотрим два примера.
Пример 3. Пусть, как и в примере 1, требуется определить вероятность невыхода за границы (—/г, Л) траектории винеровского процесса v (/), поведение которого описывается стохастическим дифференциальным уравнением (28) (см. § 14).
В этом случае условная плотность вероятности Р (и, /| у0) на неограниченном интервале v£(—сю, сю) является фундаментальным решением прямого уравнения Фоккера — Планка — Колмогорова
— = —— , (26.49)
dt 4 до1
т. е. решением уравнения (49) с начальным условием
Р (v, 0 | v0) = 6 (v — t»0)
и граничными условиями
Д(МЮ|р-±« = о.
Согласно (14.20) оно имеет вид
/wl”") = тй-ехр[-'
(р—Pq)3 Not
Чтобы построить решение прямого уравнения Фоккера — Планка — Колмогорова (49) с граничными условиями (47), зная фундаментальное решение для бесконечно удаленных границ, воспользуемся известным математическим методом отражения [37].
324
26. Достижение границ одномерным марковским процессом
Предварительно заметим, что после замены переменных и — — (v 4- А)/2 задача сводится к нахождению решения уравнения
др"(и, t; ий) _ N'a д*р(и, /; ий) 59)
dt 16 ди* ( )
с начальным условием
р (и, 0; ы0) = 6 (и — и0) (26.51)
и граничными условиями
р (0, /; иа) = р (А, ы0) = 0. (26.52)
Фундаментальное решение в новых переменных записывается в виде
г, / j । \ 1 Г —U,,)2 "I
Р (и, Л м0) = ——==- ехр-------*---— .
v 1 °' гуллго/ ч W J
Помещая положительные источники в точках 2nh + и0 и отрицательные источники в точках 2nh — и0 (эти точки являются зеркальными отражениями точки и0 относительно границ отрезка [0, А]), представим искомое решение уравнения (50) с граничными условиями (52) с помощью ряда
_ °°
р(н,/;и0)= [Р (u,t\2nh +и0) — Р (и, t\2nh—u0)]. (26.53)
п— —ОО
Это можно сделать, так как уравнению (50) удовлетворяет любая функция Р (и, t | и0 + С), где С — произвольная постоянная. Нетрудно убедиться, что ряд (53) удовлетворяет также начальным (51) и граничным (52) условиям.
Согласно формуле (42) вероятность невыхода к моменту времени t траектории винеровского процесса v (/) за границы (—Л, Л) равна л
q-h.h{t,v0')= jj p^tw^dv.
—h
Предварительно вычислим значение интеграла
Л оо Л
u0)du = -—^=- У Г{ехр Г —1-
j 2У^0' L 1
- ехр Г - -(и-2nh±u-°)2- 1Ы = -L у (фГ______(2п-1)_Н-«0 1
4ЛМ JJ 2^(1 2УЛ'О4 I
flszs — ОО J
_ ф Г (2/1—1)й—ЦО 1)
L 2У^< JJ ’
где Ф (г) — интеграл вероятности.
Связь уравн. Понтрягина с уравн. Фоккера — Планка — Колмогорова 325
Переходя в последнем выражении к старым переменным, получим
(t г,\— 1 V f(T) Г <4«—1) Л 4-1 фг (4и-3)й-о01
—оо
(26.54)
Хотя полученное выражение (54) по форме отличается от (29), можно показать [37], что они эквивалентны.
Пример 4. Рассмотрим одномерный марковский процесс, поведение которого описывается стохастическим дифференциальным уравнением
=—аХ-|-п(/), (26.55)
dt
где п (t) — нормальный белый шум. В этом случае прямое уравнение Фоккера —- Планка — Колмогорова для плотности вероятности Р (X, /| Хо) имеет вид
= а . (26.56)
dt dk ' 4 дМ
Решение уравнения (56) с начальным условием Р (%, 01 Л.о) = = 6 (X — Хо) в неограниченной области — оо < X < оо представляет собой хорошо известную нормальную плотность вероятности (15.26). Чтобы определить вероятность невыхода к моменту, времени / траектории марковского процесса за границы (—с, с), нужно решить уравнение.(56) с тем же начальным условием и нулевыми граничными условиями на концах интервала. Будем искать это решение методом разделения переменных. В данном случае, применительно к процессу (55), решать уравнение (56) этим методом проще, чем непосредственно уравнение Понтрягина (9).
Заменой переменных т = at, х — k/о (о2 = Af0/4a) уравнение (56) приводится к виду
^-=2!±_ + х —+Р, - /i<x</i (Л = с/о). (26.57)
дт дх2 дх
Требуется найти функцию Р (х, т|х0), удовлетворяющую уравнению (57), начальному условию
Р (х, 0 | х0) = 6 (х — х0) (26.58)
и граничным условиям
Р (—Л, т | х0) = Р (h, т | х0) = 0. (26.59)
326
26. Достижение границ одномерным марковским процессом
Будем искать решение в виде
Р (х, т | х0) = J Л (т) xi (х). (26.60)
i= 1
Применяя обычную процедуру разделения переменных, для функций Ti и Xi получим
Tt (т) = ехр (—Y/ т), (26.61)
4^+x^-+(Vi + l)X( = 0. (26.62)
dx2 dx
Общее решение (62) при ограниченных значениях h согласно 119] имеет вид
Xt = ехр [Clt DV1. (х) + C.2i (-x)], (26.63)
где Dy (г) — функция параболического цилиндра.
Поступая далее аналогично п. 1, для определения собственных чисел у; получим характеристическое уравнение
О|(й)—ПИ—Л) = 0- (26.64)
Собственные функции ф( определяются соотношением
Ф, = ехр [ Dyi (х) О¥. (_ft)-Dy. (—х) Dyt (й)]. (26.65)
Таким образом, будем иметь
Р(х,т| х0) = 2 С;ф,-(х)ехр( — Yjt). (26.66) i~ I
Постоянные Ci определяются из начального условия (58). Для этого умножим обе части последнего равенства на фг (х) и проинтегрируем по х при т = 0 по всем х £ [—Л, hl. Так как функции фг ортогональны, то получим
Ci = __, (26.67)
J ф'<(х)с!х
—л
Вероятность нахождения к моменту времени t траектории процесса X. (/) внутри границ интервала (—с, с), ни разу его не покинув, можно получить обратной заменой переменных в соотношении
л
д_ЛЛ(т,х0)-^ J P(x,x|x0)dx. (26.68)
—h
Результаты конкретных вычислений, полученные в [109] и приведенные в [66], показывают, что ряд (66) довольно быстро сходится и хорошо аппроксимируется несколькими первыми членами.
Плотность вероятности времени первого достижения границ
327
Плотность вероятности времени первого достижения границ
Если существует плотность вероятности wCid (/, Хо) времени первого достижения границ (с, d), то, по определению,
&c.d (*, Ч) = Pc.d (Л М = — <7c.d (t, Ч) =
d р(?,/;Х0Ж с
(26.69) .
Продифференцировав обе части равенства (9) по t, получим, что дас d (t, Хо) удовлетворяет дифференциальному уравнению
dwc,d (t, Хр) b (Xo)
д' 2
+ a(X0)--c'rf(/-^
(26.70)
d2 ®c,d (t. M
с начальными и граничными условиями
и»с, d (0, Ло) = 0, с < Хо < d, (26.71)
№c.d(/, C) = №c.d(/, d) = 6(/). (26.72)
Задача получения решения уравнения (70) при условиях (71) и (72) является математически весьма сложной даже для простейших видов коэффициентов сноса и диффузии а (Хо) и Ь (Хо).
Как уже отмечалось, все приведенные выше выражения справедливы для траекторий марковского процесса X (/), который можно интерпретировать как движение частицы между двумя поглощающими экранами в точках с и d. При этом достижение границы означает, что достигнута либо граница с, либо граница d. Можно также найти вероятностные характеристики достижения из точки Хо какой-либо определенной границы (например, с) в момент времени I так, что другая поглощающая граница до этого момента ни разу не достигалась.
Обозначим через Wcfd (t, Xfl) плотность вероятности времени первого достижения поглощающей границы с раньше, чем границы d. Аналогично обозначим d (t, Хо) плотность вероятности времени первого достижения поглощающей границы d раньше, чем границы с. Для них остается в силе уравнение (70) и начальное условие (71). Так как предполагается, что к моменту времени / другая граница не достигалась, то граничные условия (72) нужно заменить на
Wc,d (t, с) =0, Wc.a(t, d) = 6(ty, (26.73)
Wc,d(t, c) = 6(/), №^d(/,d) = 0. (26.74)
Аналогичным образом можно определить d (t, Хо) и рё, d (t, Хо).
В случае, если граница с является отражающей, для плотности вероятности по-прежнему остается справедливым уравнение (70)
328
26. Достижение границ одномерным марковским процессом
с начальным условием (71). Граничные условия в этом случае согласно (48) примут вид
wCid (t,d) = 6 (/), 4 I =0. (26.75)
ОЛ-о |
Наконец, можно интересоваться распределением времени первого достижения границы, когда движение происходит на полуинтервале, ограниченном поглощающим экраном. Этот случай получается из рассмотренных выше предельным переходом прис-»-оо или d-^-oo. При этом допускается возможность того, что траектория марковского процесса может никогда не достигнуть поглощающей границы. Следовательно, для плотности вероятности wc. a М условие нормировки может иногда не выполняться:
00
^e.d(/,X0)d/<l. (26.76)
о
В этом и проявляется различие между плотностью вероятности р (|, /; л0) и обычной плотностью вероятности перехода л (£, 11 Хо,О).
При решении линейных уравнений в частных производных типа (70) удобно воспользоваться преобразованием Лапласа по переменной t. При этом исходное уравнение в частных производных, содержащее пространственную координату 70 и время /, преобразуется в обыкновенное дифференциальное уравнение относительно переменной А.о.
Обозначим преобразование Лапласа от плотности вероятности wc. а (С Ч времени первого достижения границ
и>с,й(8До)= (С М ехр(—st)dt. (26.77)
о
Применим преобразование Лапласа к обоим частям уравнения (70) с учетом начального условия (71). В результате получим обыкновенное линейное дифференциальное уравнение второго порядка
1 , , , d2w' d (s, Хо) dw* d (s, Ao)
T -----+ a -----=swc,d (s, %0), c< \ <d.
(26.78)
На основании (77) из (72) в случае, когда обе границы с и d являются поглощающими, находим граничные условия
Wc,d(s, c) — w*Ctd(s, d)— 1. (26.79)
Аналогично, из (73) и (74) для плотностей вероятности времени первого достижения из точки Ао либо границы с, либо границы d
Плотность вероятности времени первого достижения границ
329
так, чтобы другая граница до этого момента времени не была достигнута, имеем
Wc,d (s, с) = 0, w^d (s, d) = 1; (26.80)
№c7d(s, c)= 1, Wc,d (s, d) = 0. (26.81)
Напомним, что плотности вероятностей Wc, d (t, Xo) и d (/, Xo) не обязательно должны быть нормированы к единице.
Если одна из границ, например с, является отражающей, то уравнение (78) по-прежнему определяет преобразование Лапласа от плотности вероятности времени первого достижения границы d из точки Хо. Граничные условия согласно (77) и (75) имеют вид
<d(s,cf)=l, Хо) I =0. (26.82)
Jl —с л-о — с
Если считать, что частица, достигшая границы с, остается на ней в течение случайного времени тс, имеющего плотности вероятностей у ехр (— утс), и лишь затем перескакивает в некоторую случайную точку X (с < X < d), имеющую плотность вероятности Р (X) (см. § 11), то решение уравнения (78) также позволяет найти плотность вероятности времени первого достижения границы d из начальной точки Хо [НО]. Поскольку время первого достижения границы d из точки с равно сумме случайной величины тс и времени первого достижения границы d из случайно распределенной точки X, то в данном случае вместо второго равенства (82) граничным условием будет выражение
d
Wc,d (s, с) = -Д— f Р (X) Wc, d (s, X) с/Х. (26.83)
У + s J
c
Условие, аналогичное (83), можно написать и для более сложного закона распределения случайного времени пребывания на границе с.
Получить решение уравнения для преобразования Лапласа от плотности вероятности времени первого достижения границ обычно удается в тех же случаях, что и решение уравнения (21). Однако даже для простых видов коэффициентов сноса и диффузии ие всегда удается найти обратное преобразование Лапласа.
Прежде чем перейти к рассмотрению конкретных примеров, отметим одно полезное свойство изображения w*c, d (s, Хо), которое позволяет найти моменты распределения времени первого достижения границ
оо
р Нп
Tn(cA0,d)= tnwc>d(t, l0)dt = (— 1)" lim — w'c,d(s, Xo). (26.84) J s-*o dsn
330
26. Достижение границ одномерным марковским процессом
Кроме этого, полную вероятность достижения границы с при условии что граница d не будет достигнута, можно определить на основании решения уравнения (78) с граничными условиями (81) по формуле
/’с(Ч) = (s,X0) = lim pc,d (/До). (26.85)
$-►0 t-*oo
Аналогичное соотношение имеет место для вероятности pd (%<,)
Пример 5. Рассмотрим внутри интервала (—h, h), на границах которого помещены поглощающие экраны, траектории процесса v (/) (6], описываемого стохастическим дифференциальным уравнением
-^ = р + п(0, (26.86)
где п (/) — нормальный белый шум.
В этом случае уравнение (78) запишется в виде п2 d2 w* h h dw" h ,,
% + = (26.87)
£, UU(j Uv’p
Общее решение уравнения (87) определяется выражением
wLh,h (s, vn) = Ае?< °" + Bev> (26.88)
где корни характеристического уравнения _-(iTV(x2+2a2s 71.2- 52 •
Отметим, что для арифметических значений корней Vi (s) < 0 < 7а (s) ПРИ * > 0, 71(0) = —у2(0) = 0 при р>0, ог
(26.89)
71 (0) = 0, (0) = 2 | р | /а2 при ц 0. (26.90)
Для определения произвольных постоянных А кВ из граничных условий (79) получим систему алгебраических уравнений
ЛеТ’|Л + Ве^Л= 1.
Проделав соответствующие выкладки, имеем
eVi’o sh у2 Л+eTs’o sh Vi Л
f26-9»
В общем случае ц =/= 0 найти обратное преобразование от (91) не удается. Однако из (91) при помощи (84) можно получить среднее
Плотность вероятности времени первого достижения границ
331
время достижения границ
2цв0 1
Л ch —----t>0 sh—----Ле
Л (- Л, po h) =-----------------7-7------------. (26.92)
Mh-^-
B частном случае (ц = 0) обратное преобразование Лапласа от (91) может быть найдено. Так как при этом из (91) следует
(s, v0) = ch u0/ch Л, (26.93)
то обратное преобразование Лапласа дает [111]
^-л.л(Л ^о)=-^г 2<— 1)"(п +т)СОЗ[('г+"2') “тЧ Х в = 0 ' / L\ / J
Г ( ,1V х ехр —( п +— 1
л2 а2 2й2
(26.94)
Проинтегрировав (94) по t, нетрудно получить выражение для У-ь.ь (t> vo), совпадающее с (29).
Среднее время достижения поглощающих границ (—h, h) ви-неровским процессом при ц = 0 согласно (84) и (93) определяется выражением
h^-vl a2
Для преобразования Лапласа w-h, л (s, f0) от плотности вероятности времени первого достижения границы h раньше, чем границы— Л, также справедливо (88). Произвольные же постоянные А и В согласно (80) определяются из системы алгебраических уравнений
Тj ( h, v0, h) —
(26.95)
Ле-’*'1 + = 0, Ле^>Л + Ве?*А — 1.
Проделав соответствующие выкладки, получим
eV,o, — V,h _ ev,B„ - V.h
w-h'h(s, v0) =
(26.96)
2sh (у3 — У1)Л
Согласно (85) полная вероятность достижения границы h равна е2цЛ/а_е—2цв»/с
Ph ~ 2sh (2|1й/а2)
При ц — 0 формула (97) совпадает с (31).
(26.97)
t
332
26. Достижение границ одномерным марковским процессом
Пример 6. Рассмотрим на интервале (—h, h) процесс (86) и пусть в точке — h помещен отражающий экран, а в точке h — поглощающий. В этом случае общее решение уравнения (87) по-прежнему имеет вид (88), а постоянные А и В согласно (82) определяются системой уравнений
Ле^Л + Ве^Л = 1; ^Ае-М +у2Ве-^Л =0.
Проделав соответствующие выкладки, имеем
wLh.h (s, и0) =
y2eV1°0—v‘h — ev«°o-Vi*
?2 _ Vie-m-[v,)'>
(26.98)
Как и в предыдущем примере, найти обратное преобразование Лапласа от (98) в общем случае (р #= 0) не удается. При р = 0 из (98) следует
W-h,h (s, РО) = c_h.^+^-V2s/-°J.. (26.99)
ch (2ЛД/2s/ а)
Обратное преобразование Лапласа от (99) имеет вид
°о
w-h.h(t,vo)=-^- V (—1)«//1+--И cos 17п +-М X 4/i2 -Ай \ 2 / \ 2 /
п=о ' / l\ /
х " (7Г0о~'] ех р[~ (п +-)’—<]• (26.100)
2ft J к L \ 2 / 8йа J
Вероятности р-н, л (/, п0) и <7-л. п (t, v0) можно получить из (100) интегрированием по переменной t.
При помощи (84) можно определить среднее время до поглощения. Так, при р — 0 из (99) имеем
7\( — h,v0, h) ==.Л2~(А + Р°12- . (26.101)
4а2
Выражение для Т\ ( — h, v0, h) при р #= 0 не приводится из-за его громоздкости.
Пример 7. Рассмотрим винеровский процесс, когда движение происходит на полуинтервале (—оо, /г). Предполагается, что в точке h помещен поглощающий экран. В этом случае преобразование Лапласа от плотности вероятности времени первого достижения поглощающей границы h получается из (78) предельным переходом при с — оо. Можно показать, что
аУ-оо.л(а, п0) = ехр[у2(и0 —Л)]. (26.102)
При р — 0 может быть найдено обратное преобразование Лапласа от (102). Оно дает
W-Xlh (/, v0) = г-з/2 ехр Г - ]. (26.103)
2а у л L 4а21 J
Плотность вероятности времени первого достижения границ
333
Отметим, что в данном случае приз = 0 выражение (102) определяет полную вероятность поглощения ph (и0) в точке h из первоначального положения и0 < h:
Pft(fo) = f 1 п при |Л>О, 104)
I ехр[2(о0—Л)|ц|/ста] при ц<0.
Из (104) следует, что при положительном сносе или его отсутствии (р 0) поглощение за сколь угодно большое время обязательно произойдет. Если же снос направлен в сторону от экрана (ц < 0), то существует отличная от нуля вероятность того, что поглощение не произойдет. При этом нарушается условие нормировки плотности вероятности времени первого достижения границы h.
Для среднего времени достижения границы h из (84) и (102), используя (90), получим
Г; ( —оо, о0, Л) =приц>0, (26.105) н
71 ( — оо. р0, А) = ехр[2(о0—А) | р |/ст2], р<0. (26.106)
IНI
Таким образом, в (106) второй сомножитель учитывает тот факт, что вероятность поглощения при ц < 0 отлична от единицы. Отметим, что с вероятностью 1 — ехр [2 (с0 — h) | р |/ст2] среднее время в этом случае обращается в бесконечность, т. е. Т\ (—оо, о0, Л) является условным средним.
Пример 8. В качестве последнего примера рассмотрим винеровский процесс (86) на интервале (О, А). Пусть в начале координатной прямой помещен экран, при попадании на который частица остается на нем в течение случайного времени т0, имеющего распределение у ехр (—ус0), а затем перескакивает в некоторую случайную точку v(0<v<A), имеющую плотность вероятности Р (о). Граница h по-прежнему считается поглощающей.
В этом случае для определения постоянных А и В общего решения типа (88) нужно использовать граничные условия (83)
Л
и>6, /1 (S, А) = 1, иуо.л (s, 0) = —— I Р (о) w'o h (s, v) dv.
У + s J
Полагая для простоты Р (v) = 1/А, т. е. считая плотность вероятности Р (и) равномерной, отсюда получим систему уравнений
Ле’*Л + Ве^А= 1,
А 1
Y(ey-ft-l) 1 + в L у(е**-1) '
334
26. Достижение границ одномерным марковским процессом
Таким образом, для преобразования Лапласа от плотности вероятности времени первого достижения границы h имеем
.Vi»o VieV2°o
Wo.h (S, v0)
v2e
v2 e?1/1 — vi eVa/1
где введены обозначения
Y (eVl>1—1)
v - I | Y(e^-D
2 Y2ft(Y+«) '
V1 1 ?M(y+s) ’
При p = 0 из (107) следует
®o.h(s. v0) =
------ZH___- (ft—v0)~|/2s _cb Vq~|/2s 1 h (y4~ s)~|/2s a a J
sh^ a
sh£k^ +----y^_
° ft (? + s)"|/2s
о
I —ch----
a
(26.107)
(26.108)
(26.109)
Найти обратное преобразование Лапласа даже от (109) не удается. Можно показать, что ®5, h (0, v0) = 1, т. е. поглощение за сколько угодно большое время обязательно произойдет.
Для среднего времени до поглощения при ц = 0 после довольно громоздких вычислений, с учетом (84) и (109), получим простую формулу
7’1(O>Vo^) = ±vi[2+ -^(/1 + Зи0) уп За2
(26.110)
Обозначим среднее значение случайного времени пребывания на границе в начале координат < т0 > = Т — 1/у. Тогда из формулы (110) следует, что при увеличении среднего времени пребывания на границе среднее время до поглощения также увеличивается, причем влияние второго члена в квадратных скобках, учитывающего интенсивность процесса а2, уменьшается. При 7=0, когда граница в начале координат становится отражающей, из (НО) имеем
7\(0, А) =
(ft— »о) (ft 4~30q)
3a2
(26.111)
В то же время из формулы (101) примера 6 заменой переменных Хо ~ (с’о + Л)/2 можно получить выражение для среднего времени до поглощения винеровского процесса при р = 0 на границе h, когда в начале системы координат помещен отражающий экран
Т\ (0, х0, h) = -1^1 . (26.112)
a2
Отличие выражений (111) и (112) объясняется различным характером отражения от границ, помещенных в начале координат. Для от
Моменты времени первого достижения границ
3.35
ражающей границы, рассмотренной в примере 6, частица, попавшая на нее в момент времени t, в следующий момент окажется на малом расстоянии До ~ (ДZ)1''2 от границы. Для границы, рассмотренной в данном примере, частица, оказавшаяся на ней в некоторый момент времени t, при т0 = 0, в следующий момент окажется в некоторой случайной точке интервала (0, /г), распределенной по равномерному закону.
Интересно отметить, что среднее время (112) совпадает с (95), т. е. среднее время до поглощения при движении на интервале (О, /г), в начале которого помещен отражающий экран, равно среднему времени до поглощения при движении частицы между двумя поглощающими экранами в точках (—й; й) (см. § 9),
Моменты времени первого достижения границ
Получить аналитическое решение первого уравнения Понтрягина удается лишь в самых простых случаях. Поэтому на практике часто ограничиваются вычислением одномерных моментов времени первого достижения границ, в частности, среднего значения и дисперсии.
Вероятность того, что первое достижение границ произойдет за время между t и t + dt, равна wc_ d (t, Xo) dt, если соответствующая плотность вероятности (69) существует. Поэтому одномерные моменты времени первого достижения границ определяются выражением
Tn^Tn(c,K0,d) =^t»wetd(l,k0)dt (n = l,2...). (26.113)
о
Умножив обе части уравнения (70) на е'Я( и интегрируя затем по t от 0 до оо, получим следующее дифференциальное уравнение для характеристической функции 0Ct d (i fi, Xo):
-iQe^ = ±b(X0)-^^- + a(X0)^- (26.114)
4b UA() WAq
где
Oc,d (tQ, M = $ e,a( (Л 4) dt. (26.115) о
Уравнение (114) позволяет найти одномерные моменты времени первого достижения границ. Для этого воспользуемся известным представлением характеристической функции в виде ряда по моментам
®c,d = 1 + У Тп (с. К d). (26.116)
Л!
п = 1
336
26. Достижение границ одномерным марковским процессом
Подставив (116) и его производные^ в (114) и приравняв члены при одинаковых степенях i‘Q, получим цепочку линейных дифференциальных уравнений второго порядка с переменными коэффициентами
V b (М + а (Хо) = -nT’n-i. (26.117)
uAq
Уравнения (117) позволяют последовательно при п — 1, 2, (То = 1) найти моменты распределения времени первого достижения границ. Эти уравнения должны решаться при соответствующих граничных условиях, причем по физическому смыслу все моменты Тп должны быть неотрицательными величинами, т. е.
Тп (с, Хо, d) > 0. (26.118)
Граничные условия для уравнений (117) получаются на основании свойства (84) из (79), (82) и (83). Так, если границы с и d поглощающие, из (79) следует
Тп (с, с, d) = Тп (с, d, d) = 0. (26.119)
Если одна из границ, например, с является отражающей, то из (82) получим
Tn(c,d, d) = 0,
dTn (с, Хо, d)
I =°-
Хо = c
(26 120)
Наконец, если граница с такова, что частица, попав на нее, остается на ней в течение случайного времени тс, имеющего плотность вероятности у ехр (—утс), а затем перескакивает в некоторую случайную точку i, распределенную по закону Р (X), то из (83) имеем
Тп (с, d, d) = 0, Тп (с, с, d) —
-^\P(V)Tn-MdK
V V
с
(26.121)
где
т! (п—т)! ’
Поясним происхождение второго условия (121). Из формулы (83) после n-кратного дифференцирования по $ следует
dn , . dn -----Wc d (s, c) =----------- dsn ' K ’ dsn
d
—L JP(X)<d(s, X)dX c
(26.122)
Моменты времени первого достижения границ
3.37
К правой части последнего равенства применим известную формулу n-кратного дифференцирования произведения двух функций
— («(s) v (s)) = 2 с- и (s) v (s) . (26.123)
Для отдельных сомножителей суммы (123) справедливы соотношения
dm у _ (— О'ГСут! dsm y+s (? + s) ’
d d
rfn-m p r* r ^n-m 1
j ₽ (4 (, ч Л _ J p (Ц [ ш;.а (s. м] <a.
c c
Подставляя эти соотношения в (123) и (122), умножая обе части (122) на (—1)п и переходя к пределу при s —0, на основании (84) получим второе условие (121).
Если начать решение уравнений (117) с п = 1, то последующие моменты Тп выразятся через предыдущие Тт (т<.п). В частности, при п — 1, 2 из (117) имеем
vW ^ + й(^0) J?L + I = o- (26.124) 2 • aAj аЛо
-^-Ь(Ч) ^-+й(М-^р-+2Л = 0. (26.125)
* uA^ uAq
После нахождения решений уравнений (124) и (125) можно вычислить дисперсию времени первого достижения границ
D (с, Хо, d) = Т2 (с, Хо, d) — Т1 (с, Ч d). (26.126)
Если выразить из последнего равенства Т2 (с, k0, d) и подставить в уравнение (125), то с учетом (124) получим дифференциальное уравнение непосредственно для дисперсии времени первого достижения границ
Tfe(Xo)lJ + a(Xo)^ +fe(M^r)3 = 0’ (26,127)
Решение уравнения (127) нужно искать при соответствующих граничных условиях, которые следуют из (119) — (121).
Отметим, что уравнение (124), следующее из основного уравнения (9), впервые было получено Л. С. Понтрягиным [105]. В отличие от уравнения (9), будем называть уравнение (124) вторым уравнением Понтрягина.
Система линейных дифференциальных уравнений (117) решается сравнительно просто, так как при помощи замены г — dTnld'k0
338
26. Достижение границ одномерным марковским процессом
каждое уравнение сводится к линейному уравнению первого порядка
-^6(Х0)^- + п(Х0)г=-/гТп_1. (26.128)
Z uAq
Решение (128) может быть записано в квадратурах
г (А,) = = е - Гл — С 2nTn~1(l?’ е<№) dy
° dh [ J b (у)
(26.129)
где функция ср (у) определяется соотношением (19), А — постоянная, которая определяется из граничных условий.
Из (129) и граничных условий (119) в случае, когда обе границы (с, d) являются поглощающими, получим
Тп (с, Хо, d) = Вп j e-w^dx—2п j e_<₽w х
С с
„ с Тп-Х(с,у, d)*^ ,
X 1 п 14 и’ ’---------dydx,
J Ь{у)
(26.130)
Гп-1 (с. У. d) ev(y> b(y)
d
dx
c
dydx
/1=1, 2, ..., 70= 1.
(26.131)
Если одна из границ, например с, является отражающей, то из (129) и (120) имеем d х
Тп (с, Хо, d) = 2п f ev(x) f - n--1 (с’ y'-d} eW) dydx. (26.132) J J b ((/)
Xo c
Так как согласно (129) dT,JdXQ < 0 для всех с < Хо < d и dTrJdht = 0 при Хо = с, а из (117) следует, что <727\'Ш-о < 0 при Хо = с, то максимальное значение функции Тп (с, Хо, d) в этом случае достигается при Хо = с.
Формулы (130) и (132) позволяют последовательно, начиная с п = 1, определить все моменты времени первого достижения границ из произвольной начальной точки Хо. Так как аналитические выражения этих моментов будут громоздки и интегралы, как пра-
Моменты времени первого достижения границ
339
вило, не выражаются через известные функции, вычисления удобно проводить на ЦВМ.
Когда плотность вероятности начальной координаты Хо является не дельтообразной (1), а некоторой функцией Ро (Хо), где Хо € 1<а, dL] о [с, d], то согласно (19а) можно вычислить усредненные по начальному значению Хо моменты времени первого достижения границ
d
Тп (с, d) = ^Tn (с, Хо, d) Ро (М dk0. (26.133)
С
Чтобы определить моменты распределения времени первого достижения какой-либо одной границы при условии, что другая граница ни разу не достигалась, можно поступить следующим образом.
Обозначим через
Тп (Хо, d) = Jtn др^^'-о}- dt = Ч) dt о о
одномерные моменты распределения времени первого достижения границы d при условии, что граница с не достигалась. Отметим, что в определении условных моментов распределения времени первого достижения границы d плотность вероятности Wc,a (t, Хо) ненор-/ОО \
мированна (f Wc a (t, Хо) dt<. 1), так как существует конечная ве-\о ’ /-
роятность достижения границы с раньше, чем d.
Продифференцировав уравнение (9) по времени и умножив обе части равенства на tn, после интегрирования по t (см. также § 27) получим, что условные моменты Тп (Хо, d) являются решениями уравнения (117) с граничными условиями (119). Однако в этом случае То (Хо, d) — pd (Хо), где pd (Хо) удовлетворяет уравнению (16) с граничными условиями (17). Так как уравнение (117) линейное и Pd(^o) == 1 — Ре (^о)> т0 Тп К> d} — Тп (с, Хо) Тп (Хо, d).
Пример 9. Вычислим среднее время и дисперсию времени первого достижения поглощающих границ нормальным марковским процессом (55) (см. пример 4), для которого
a (%0) = — аХ0, b = NJ2, <р (г) = — г2/2 о2. (26.134)
Здесь ст2 — стационарное значение дисперсии процесса X (/), равное
& = V0/4a, (26.135)
340
26. Достижение границ одномерным марковским процессом
Подставляя соотношения (134) в общую формулу (130), для среднего времени первого достижения поглощающих границ (с, d) получим
Л (С, хо, d) = J^L а
f Гф(г/)_ф/'_М1е*'/2^ + к О' О J J [ \ О /J
Х0/а
с/а
+ j (t Л.f Гф(у)_ф(±)1е»-/2^ А
\а o/JL \ ° / J ( а °
К/а
где Ф (г) — интеграл вероятности, г
J(zv г2) = ^ exp(y2/2)dy.
(26.136)
(26.137)
В частном случае, когда Хо = 0 и границы расположены симметрично — с = d = h, из (136) имеем
7\(—Л, 0, Л) =
[2Ф(г/) — \]&2!2dy. (26.138)
Аналогично (130) из (127) можно получить общую формулу для дисперсии времени первого достижения поглощающих границ
2 еф(г) dzdx х
D (с, Хо, d) = 2
e<₽(z) угс[х *
d
e-<p ix)
К
d
(j e-p w dx
(26.139)
Здесь согласно (129) имеет вид
— е-Ф (z) dz
(26.140)
где Bj определяется из соотношения (131) при п. = 1.
Моменты времени первого достижения границ
311
Результаты численных расчетов по формулам (136), (139) среднего времени и дисперсии времени первого достижения поглощающих симметричных границ (—h, ti}, в зависимости от положения начальной координаты Хо и для различных значений самих границ, представлены на рис. 26.8, 26.9. На этих рисунках сплошными линиями
изображено среднее время, а пунктирными — дисперсия времени первого достижения границ.
Пример 10. Рассмотрим вычисление среднего времени и дисперсии времени первого достижения поглощающей границы d, если граница с = 0 является отражающей. Пусть марковский процесс Л (/) описывается стохастическим дифференциальным уравнением
di 4Л
(26.141)
Для такого процесса коэффициенты сноса и диффузии определяются соотношениями
а(Х)=-?Х+^-, 6 = М>/2, 4k
(26.142)
342
26. Достижение границ одномерным марковским процессом
а одномерная стационарная плотность вероятности является релеев-скоп (см. § 19).
Вводя новую переменную х = Х/а (а2 — из (19), получаем
Ф (х) = in х — х2/2. (26.143)
Подставив соответствующие величины в формулу (132), имеем
О, а
а/о
— ^ = — f — (е*’/2 — \)dx. а / у J х
К/о
(26.144)
Формуле (144) можно придать вид более удобный для проведения вычислений. Так как
d
х2 \ , 1
— \ах= —
2 2
* 1
где Ei (х) = f- ехр (z) dz при х > 0 — модифицированная интегральная показательная функция [112], то из (144) следует
(26.145)
Для модифицированной интегральной показательной функции справедливо следующее представление в виде ряда
Ei (х) = С + 1п х + У -i— , k\ k
I
(26.146)
где С — 0,5772 — постоянная Эйлера.
Подставив (146) в (145), получим удобную для вычислений формулу
т /0 2д_ d У... 1 у 1 17 d2 V / У"]
1 \ ’ о ’ а ) 2у /г1 А [( 2а2 j \ 2<j2 / ] ’
k == I
(26.147)
Для дисперсии времени первого достижения границы d, когда граница с является отражающей, из (127) с учетом (129) имеем
d i
D (с, Х.о, d) = 8 J е-<₽ w J е-ф Xq о
о е<Р<1Р Т2
-у— dy dzdx. (26.148) -с
z
Моменты времени первого достижения границ
343
После подстановки (142), (143) в общую формулу (148) для дисперсии времени первого достижения поглощающей границы ре-леевским процессом получим
/X d \ 2 ‘р0 С ег*/2
D(0, ~t’ = V J ^y-J^yd-^^dzdx. (26.149)
Xo / 0 0
Аналогично тому, как это было сделано при выводе (147), преобразуем (149) к виду, удобному для проведения вычислений. Для этого представим второй интеграл в (149) в виде суммы двух интегралов
J = jy e-z^2(l-ez’/2)2dz=J_L(e-i‘/2 — i)t/z + о о
р 1
+ Д_(ег’/2_1)Й2 = У1 + у (26.150)
о
Второй интеграл J2 в (150) вычислялся при выводе (147). Поэтому остается вычислить только Полагая для простоты нижний предел в Jх равным с, имеем
Л = jy (e-z!/2 — l)dz = jy e-z!/2 dz—In у = С с
= — Ге1 ( — — 1-Ei (—— 'll —In —, (26.151)
2 L \ 2 У \ 2 7J с ’ v '
г t
где Ei (г) — §-dt (z < 0) — интегральная показательная функ-— ОО *
ция 1112J, для которой справедливо представление в виде ряда
Ei(z) = C + ln(-z)+ 2 z<0. (26.152)
*=i
Подставив (152) в (151) и положив с = 0, получим
у =_1_ у —!—(— — .
1 2 61 k \ 2 У
*=1
Из последнего равенства и результатов вычисления J2 следует
, j. v —*_[('_______£LV+/^_V1= у 1
2 k\k [С 2 У “ГС 2 У J (2п)!2п С 2 }
(26.153)
344
26. Достижение границ одномерным марковским процессом
Последнее равенство написано на основании того, что для нечетных степеней k члены суммы обратятся в нуль. Таким образом, подставив (153) в (149), имеем
( \ 2/1
<*/О оо I -- 1
£> f 0, — )=— f — е*,/2 V А,- £ > dx. (26.154)
\ а о ) J х (2n) I 2п
К/о пз='
Так как ряд (153) сходится равномерно, в выражении (154) можно поменять местами порядок суммирования и интегрирования, т. е.
D f 0, \ о
После замены t = хг!2 отсюда следует
е^/2о’ / Xg V I 2а2 )
(26.155)
В частном случае при Хо = 0 из (155) получим
(26.156)
Ряд (156) довольно быстро сходится, так как при достаточно больших п член в квадратных скобках становится приблизительно равным ехр (—d2/2o2). На рис. 26.10, 26.11 представлены вычисленные по формулам (147) и (155) значения среднего времени и дисперсии времени первого достижения поглощающей границы релеев-ским процессом.
Пример 11. Рассмотрим винеровский процесс (28) на интервале (О, Л). Пусть в начале системы координат v = 0 помещен экран, при попадании на который частица остается на нем в течение случайного времени т0, имеющего распределение у ехр (—ут0), а затем,
Моменты времени первого достижения границ
345
в отличие от примера 8, перескакивает в определенную точку рх, например v^—h/2. Граница h по-прежнему является поглощающей. Требуется определить среднее время первого достижения границы h из начальной точки у0 £ [0, h].
Подставляя значения a (v0) = О, Ь = о2 в формулу (129), после интегрирования получим
Л (0, v0, h) == A (v0 — h) — (v§ — /i2)/o2. (26.157)
Рис. 26.10. Среднее время первого достижения поглощающей границы релеевским процессом.
Рис. 26.11. Дисперсия времени первого достижения границы релеевским процессом.
Значение постоянной А необходимо определить из граничного условия (121), которое в данном случае принимает вид
h
7\(0, о, П) = ^Р(Х)Тг(О, к, h)dk + о
h
+ — [ P(X)dX = T1fo, — , h} + --
У J \ 2 / V
о
(26.158)
При написании последнего равенства было учтено, что Р (X) = = 6 (х----(157) и (158) имеем А = h/2a2 — 2/yh.
Таким образом, для среднего времени первого достижения границы h получим простое выражение
Т1(0, v0, /l) = 0-vJ)[_A±^_ + Al. (26.159) L zo" ул j
346
26. Достижение границ одномерным марковским процессом
Пример 12. Вычислим среднее время и дисперсию времени до срыва слежения и перескока фазы в системе ФАП первого порядка, рассмотренной ранее в примере 2. В этом случае формулам (130), (131) можно придать следующий вид:
Фо, Ф8) = 2п£> Bn J ехр[—ф(х)] dx— I ф>
Фо *
— ехр[ —<р(х)] [exp<p(z/)] \п~
Ф1 ф<
Tn-i (Ф1, у, <h)dydx
(26.160)
где
ф, X
J ехр [ — <р (х)1 J [ехр <р (i/)l Лп-’Тп-1 (фь У, <Psl dud*
о __ Ф1________________Ф1_______________________________________
П
j ехр [ — <p(x)J dx Ф<
Ф (х) = Dox + D cos х
Для среднего времени 71! (ф1], <р', <р') первого достижения ближайших устойчивых состояний равновесия из первоначального устойчивого состояния в (2, 81} получено аналитическое выражение
ДЛ(ф-ь Фб. ф1) = 4-7^У=бт1/^(Р)|2, (26.161) 1 + ехр(2лР0)
где Ilv (г) — функция Бесселя мнимого индекса и мнимого аргумента.
Получить аналитические формулы для более высоких моментов затруднительно. Более того, не удается получить аналитического выражения для среднего времени 7\ (ф^, ф0, Фх) первого достижения ближайших устойчивых состояний равновесия из произвольной начальной точки ф0 £ [ф^, фД Значение зависимости моментов от произвольного начального рассогласования по фазе представляется важным, так как часто на практике точное начальное значение фазовой ошибки неизвестно. В том случае, когда начальное значение фазового рассогласования равномерно распределено на интервале (фх, фа), для усредненных значений моментов имеем
ф.
ЛЛфр Фа) =--------!-- j ЛДФх, Фо- Фа)^Фо- (26.162)
ф2—ф1 J
Ф1
Моменты времени первого достижения границ
347
По формулам (160) и (162) были проведены вычисления [108] на ЦВЛ\ первых двух (и = 1,2) моментов времени первого достижения границ (ф1( ф2) из произвольной начальной точки <р0. Вычисления проводились для различных значений/) и£>0. Границы ф1 и <р2 при анализе срыва слежения выбирались в соответствии с (38), а при анализе перескоков фазы — в соответствии с (39).
В таблице 26.1 представ-
лены результаты вычислений среднего времени 7\=7\(ф"_, ф', ф") и стандартного отклонения о = Д'/2(ф11, ф', ф") времени до срыва слежения из первоначального устойчивого состояния равновесия ф' и их усредненных в соответствии с (162) по случайному начальному фазовому рассогласованию значений Тс, ос. На рис. 26.12 показаны кривые, характеризующие зависимость среднего времени до срыва слежения от отношения сигнал/шум D для различных относительных расстроек по частоте (аналогичный характер имеют кривые стандартного отклонения о). Видно, что значение порога D, т. е. значение отношения сигнал/шум, ниже которого среднее время до срыва слежения
Рис. 26.12. Зависимость среднего времени до срыва слежения в системе ФАП первого порядка от отношения сигиал/шум D при различных относительных начальных расстройках по частоте
начинает резко убывать, за-
висит от начальной расстройки по частоте. Для значений 0 DJD 0,5 при D 2 зависимость среднего времени и стандартного отклонения от отношения сигнал/шум может быть ап-
роксимирована простыми эмпирическими формулами, так как в логарифмическом масштабе она имеет характер, близкий к линейному. Зависимости 7\ (ф!1( ф0, Фо) и ° (ф\> Фо> Фо) от произвольной начальной ошибки по фазе ф0 и отношения сигнал/шум D для значений DlD = G и £)о/£) = О,75 характеризуют нормированные к максимальному значению кривые на рис. 26.13, 26.14. Из анализа кривых рис. 26.13, 26.14 и данных табл. 26.1 следует, что при больших отношениях сигнал/шум (D 2) с большой степенью точности выполняется равенство 7\ (ф^, ф', Фо)=ст (ф-n Фо> Фо)1 Эт° 03‘ начает, что при таких отношениях сигнал/шум распределение вре-
348
26. Достижение границ одномерным марковским процессом
Таблица 26,1
ПЛ 0,406 3,570 6,070 8,983 12,55 16,97 22,48 29,36 37,98 о □о ОС 00 со сч со
=0.75 Л Д 0,370; 3,421 6,259 9,491 13,36 18,06 23,83 30,97 СО СТ) СО 50,88 64,68
<3 о" 0,412 3,782 6,335 9,245 12,80 17,20 22,68 29,54 38,12 48,90 62,43
< 0,347i 3,540 6,328 9,341 12,89 17,18 22,43 28,93 37,01 01 ‘Li 59,74
<1 е 0,43з1 6,361 16,02 33,57 67,25 132,4 259,3 506,9 992,0 1944 3817
Од сГ II Т, А 0,470, I 6,621 16,82 34,88 69,01 134,6 261,7 9*609 995,0 1947 3821
D„/D ос Д 0,423! 6,349 15,99 33,41 66,85 131,6 257,7 504,1 987,1 1935 3802
< 0,355 5,521 14,35 00‘0£ 59,86 117,8 231,3 СО ю СО СО СТ) □о 1760 3474
1 0,442 10,12 47,35 173,2 608,8 2138 СТ) 3 2776-10 9516-10 3390-102 1210-103
ю СЧ сэ II Г1 д 0,523 10,83 48,72 175,1 611,2 2141 7552 2776-10 9516-10 3390-102 sOI-OlZl
а!’а < Q 0,485 106*6 46,62 ' 1‘IZI 603,2 2123 7502 2662-10 9473-10 3377-102 1206-103
< 0,360 8,194 39,33 147,0 526,4 1878 SIZ9 2403-10 8613-10 3088-102 eOI-8011
<ГЛ 0,445 12,36 97,58 699,4 5036 3656-10 гч О S сч 1964-103 1443-10’ ыэ О СЧ СО О 7825-10»
О II < 0,536 13,25 99,10 701,6 5039 3661-10 2677-102 1964-103 1443-10* 1062-10» «0 О lO сч оо
< о* 0,430 12,03 95,78 9*069 4990 3635-10 S0I•I99Z а иО СТ) 1477-10* 1058-10» 7795-1О6
< Q 0,361 9,784 79,29 588,8 4354 3223-10 2387-102 1768-Ю3 1309-10* 901-696 7185-10»
o' сч СО СО t"* 00 СТ) О
Моменты времени первого достижения границ
349
Таблица 26.2
ю о* II Q Q < CC-j-^-COC-S-N со ю оо о со -« <5 со t** сч U3u3~""«----co * •‘CMCTi^'CMC^TfQiCn — —<оо»— —• СЧ СО М* Л ф со
< —"СЧСЧС><0<0чр(0аочриЭ U3 гр О О — Ш О ао b* из СП ------- - * сч - — с-. го о ас сл —« р- s- сч —. —. — СЧСОСОгр^ОС'-ОЗ —
< 1 о (to сл ас -- сч о г>- —- OJ ас сч о счсчизсчсласизсчг^г^ иЗгр - -СЧГ-.<>>ОЗасСЛСЧСПО — 00 — — СЧСЧ<ОгР<оЬ* —
< СЧ гр СП 00 — — СО гр о СЧ СО ао из гр из оз сч s> ас ас со СЧСЧ»-"*--.-- • « С о N — S со — — Tf «р*- — — — СЧСЧСОгриЗф
Л сГ II Q 4 >< (to SO-^OCM-SCn о о — сч ► - - - о СП — U3 • - -U3U3C4U5U5U3 — -гр—«госчгросграс^Осч — — СО из — СЧ г- СП — со s
ООиЗгрГ«-СЧСОСЛ s- — s- ао " " " - ао ао о СП ~ — со о гр из из сч " ь* из оо со из сл из ас из сч - — СО(О-СЧГ"СЛ — cos
< /to" гр ОС СП О СО СЧ — со гр — СО гр " " " - со СЧ S- U3 " - " О из О СЧ — Г* гр " СО 00 U3 — — СЧ СЧ из — СЧ — — СЧ U3 — СЧ гр ОС — СО из
< ас о ас из — * * - * s- сч СЧ " " " - ас s* о из со — "Ослизассчграссоосиз — — — COU3 — СЧгрСЛ — СО
Од сч о" II Q Q /to CQ М W 90 « о о о о о ао — оо ф — — — ** —- — Г- ОС " СЛ гр из * "СЧиЭСЧиЭСЛиЗ — •счсчсо — — гр — ао^со — СЧ СП со — гр — из — Ф СЧ
< М в» «0 «0 г» о о о о о — {£> СЛ U5 — « « « — ао оо N. " из — • • • • ’ 05 * - aCS-.COU5O5U3 — из » из S О — — гр — со Ф о — сч сп со - гр — из — <5 сч
< 4° е» n «о «о <t О о о о о Гр S S co — — — — из Ф 00 * Гр со • из " - СЛ^Г^ФООФгр "О — 0COU3C4U3U5S-O — СЧ СО СЧ — со — гр — из СЧ
< N 05 п г- О О о о — to СП гр Гр — — 8 S- - о" 8 2 спиэоао "’РОР.СПОфиЗСЧф- — ^миз — U3C4S-C4O3CO —
О II Q Q я я со V л ® е» О о о о о о о СЧ СО СЧ — —' — — — — ** СЧ Гр * гр о "ОООСЧиЗСЧСЛСЧГ'- "ОООгрОСОспСПаС — из — СЧ СЧ - — из со СЧ СЧ —
< 4," е» ©» со из е г- __ о о о о о о о СОСО— — — — — -И — — ср из * о ...... СП " из — О СЧ из СЧ СП СЧ S" " о гр о со со сл ас — из — со СЧ - — S- из со СЧ СЧ —
< (to в» « « Л «0 1» _ о О О О о о о- ос Ф Ф " ао О • из "Гр«-.С0гРС0СЗС>гриЗ "U3S*0»S*COtOrpU3 00cO «сч — — ао из гр со сч — —
< 1ь,° М «0 л « о о о о о о СЧ аО из из 05 со " " Гр • • • • • сч "трс>-гри5г«-и5гр{ПСЧ _с 3: 2 g 8 8 8 2 - 2 ”
Q 1«сч(.огтизиэг-аоозо о
350
26. Достижение границ одномерным
марковским процессом
Рис. 26.13. Зависимости среднего времени и стандартного отклонения времени до срыва слежения от начальных расстроек по фазе при Do/D=O.
Моменты времени первого достижения границ
351
менн достижения границ (ср"_ п ср") из начального устойчивого состояния равновесия ср' подчиняется экспоненциальному закону.
Все эти выводы справедливы также для среднего времени 7\ = Tt (cpLj, ср', ср') и стандартного отклонения ст времени до перескока фазы, результаты вычислений которых сведены в табл. 26.2. Зависимость Т1 и ст от произвольной начальной ошибки по фазе и отношения сигнал/шум D для относительных начальных расстроек по частоте DJD = 0 и D0ID = 0,75 иллюстрируют нормированные к максимальному значению кривые на рис. 26.15, 26.16. Из сравнения данных табл. 26.1 и 26.2 следует, что равенство
Л (фДь <Ро, ф!) = 27\ <cpLIt срб, Фо), которое ранее считалось справедливым при любых отношениях сигнал/шум, приближенно выполняется только для значений отношения сигнал/шум, больших порогового (Z) > 2).
Уравнение восстановления.
Определение длительности процедуры последовательного анализа
Ранее отмечалось, что все приведенные выше результаты остаются справедливыми и в том случае, когда существует только одна поглощающая граница. Обозначим рс (t, Хо) и wc (t, Хо) соответственно вероятность и плотность вероятности времени первого достижения границы с. Очевидно, что
шс(/, Ао) =
’ Ит wc,d(t, Ао) d ~>оо
, d-+ —тэо
при А(|>с,
при
(26.163)
Можно получить простое соотношение, связывающее wc (t, Хо) с плотностью вероятности перехода л(£, /|А0, 0). Действительно, пусть А = £ — любое значение X, большее с. Для непрерывного марковского процесса X (/) можно «рассортировать» реализации А (/), проходящие в момент времени t через интервал (1, I + d В), по моментам времени т (рис. 26.17), в которые они впервые пересекают заданный уровень с (Хо < с < £). При этом
л(£, 11 Хо, 0)= ^л(5, t\c, т)щДт, X0)dT. (26.164)
352
26. Достижение границ одномерным марковским процессом
ksA
-1,6 -0,8 0 0,8 1,5 p/ir -1,6 ~0,8 0 0,8 1,8 р/п
Рис. 26.16. Среднее время и стандартное отклонение времени до перескока фазы при £>о/£“О,75.
Уравнение восстановления. Длительность последовательного анализа 353
Соотношение (164) называется уравнением восстановления. Для однородного во времени процесса X (/) справедливо равенство
л (Н, /|с, т) = л (£, t —
—т|с, 0). (26.165)
Свойство (165) позволяет решить интегральное уравнение (164) при помощи преобразования Лапласа
л*(£, s|A,0) = л* (|, s| с) х
XWC(S, Хо). (26.166) Здесь
Рис. 26.17. К выводу уравнения восстановления.
л*(;, s | у) = л(£, /| у) ехр (— st)dt о
— преобразование Лапласа от плотности вероятности перехода.
Из формулы (166) для преобразования Лапласа от плотности вероятности времени первого достижения границы с имеем
W'c (S
Ч) =
Л (Е, s|X0) л* (g, s| с)
х0<с<а
(26.167)
Если приведенные выше рассуждения корректны, то правая часть равенства (167) не должна зависеть от Можно показать [113, 114], что для преобразования Лапласа от плотности вероятности перехода выполняется соотношение
d^)={
vffiu(y)
V (у) U (g)
при у^1, при 1/<£,
(26.168)
где и (%0) и v (Ао) — два линейно-независимых решения уравнения (78), для которых и (оо) = v (оо) = 0.
Подставив (168) в (167), окончательно получим
Wc (S, Х„) =
« (Х0)/и (с) ц(%„)/ц(с)
при Х0^с, при Хо с.
(26.169)
Отметим, что формулу (169) можно также получить непосредственно из решения уравнения (78).
12 Зак. 1216
354
26. Достижение границ одномерным марковским процессом
Из (130) следует рекуррентная формула для моментов распределения времени первого достижения единственной границы с
с X
Т^с, Ха)^2п [ - f Ps1(y)rn^(c y)dydK (26.170)
J D (Л.) Р«./ (Л.) J
— ОО
где Pst (X) — стационарная плотность вероятности процесса X (/). При наличии двух границ (с, d) уравнения восстановления б)дут иметь вид
we(l, — Хо) + а (т, X,,) wc (t — т, d)dx, (26.171) b
wd(t, l0) = wZ'd{t, X(l) + ^wc; rf(T, K0)wd(t—x, c)di. (26.172) о
Здесь, например, w,~d по-прежнему обозначает плотность вероятности времени первого достижения границы с при условии, что другая граница^ не достигалась. Второе слагаемое в (171) определяет плотность вероятности достижения границы с при условии, что раньше пересекалась граница d. Отметим, что в отличие от предыдущих разделов при выводе уравнений восстановления дости ксние границ не означает поглощения частицы.
Уравнения восстановления (171) и (172) решаются при помощи преобразования Лапласа, которое в данном случае дает
w.(s X,) = ид '/ (>, X.,) + щЛ (s Х.,)ил (s d)
XJ Wtr d (s, XJ + l£)<dd (s X„) Wj (s c) (26 173)
Рассматривая (173) как систему алгебраических уравнений относительно ад. a (s, Хо) и Wc'*d (s, Хо) из (173) с учетом (169) получим
» ч (Х„)и(с) —о(Хо)и(с)
<1 (S. Хо) =-------------------- ,
и (d) о(с) — v (d) и (с)
wc. d (S, Лц)-----—-------------------,
и (d) v (с) —и (d) и (с)
w'c. d (S, Ч) = w°. *d (s, Xn) + W- d (s X„).
(26.174)
(26 175)
(26.176)
Отметим, что соотношения (174) и (175) можно также получить из решения уравнения (78) с граничными условиями (80) и (81).
Рассмотрим применение методов, связанных с достижением границ марковскими процессами, к задаче теории обнаружения [115, 116]. Пусть по принятой реализации £ (/) аддитивной смеси сиг-
Уравнение восстановления. Длительность последовательного анализа 355
нала с шумом требуется определить, содержится ли в ней детерми-вированный сигнал s (/), характеристики которого предполагаются полностью известными. Другими словами, требуется выбрать одну из двух альтернативных гипотез Но : £ (/) = п (/) (сигнал отсутствует в течение времени наблюдения) или i (/) = s (/) + п (/) (сигнал присутствует). Аддитивный шум п (!) предполагается нормальным и белым, т. е.
<»(/)) = О, < п (t) п (! + т) > = 1У„ о (т)/2.
В этом случае отношение правдоподобия 130] имеет вид
Отношение правдоподобия (177) показывает, насколько более вероятна гипотеза Н} по сравнению с Но при данной реализации £ (!)
Обозначим через а вероятность ошибочного принятия гипотезы //j, в то время как на самом деле справедлива гипотеза До, а через 0 вероятность принятия На при справедливости Ht. Вальд [33] построил процедуру последовательных испытаний, при которой значение отношения правдоподобия (177) в каждый момент времени сравнивается с двумя пороговыми величинами
А = (1 - 0)/а, В = 0/(1 - а). (26.178)
Испытания заканчиваются принятием решения Нъ если в неко-« торый момент времени L (!) А, и Ни, если L (!) С/ В. При В< L (!) А испытания продолжаются. Очевидно, что при а < */2, 0 < */2 имеет место соотношение А > В.
Таким образом, время принятия решения при описанной процедуре последовательного анализа является случайной величиной. Представляет интерес вычисление распределения длительности процедуры последовательного анализа и его моментов. Можно показать, что среди всех возможных процедур обнаружения процедура последовательного анализа минимизирует среднее время, необходимое для принятия решения при заданных вероятностях ошибок а и 0. В теории обнаружения а называется вероятностью ложной тревоги, а 0 — вероятностью пропуска цели.
Рассмотрим случайный процесс
т
и (!) = in L (Т) =[ [2l(!)s(!)-s\t)\di. (26.179)
No J
0
12*
356
26. Достижение ераниц одномерным марковским процессом
Так как экспонента—монотонная функция, то достижение границ А или В процессом L (/) эквивалентно достижению процессом v (/) границ
с = In В, d = In А. (26.180)
Поскольку £ (/) представляет собой нормальный процесс, то v (/) также является нормальным. Покажем, что v (/) является ви-неровским процессом с независимыми приращениями. Действительно, производная по времени процесса w (/) при наличии сигнала (гипотеза равна
-^ = 4-ls2(0 +2s (Z)h(/)|. (25.181)
и/ ^*0
В отсутствие сигнала (Но)
— ~-l — s2 (.t) + 2s (I) п (I)]. (26.182)
dt
Стохастические дифференциальные уравнения (181) и (182) определяют неоднородный марковский процесс с коэффициентами сноса и диффузии
a (v, ± s2 b (/) = 2s2 (O/-Vo. (2.183)
Для него справедливо уравнение Фоккера — Планка — Колмогоров.
JZ. = qz . (26.184)
s2 (0 dt dv2 dv
Заменой переменных
T = -^-js2(^)^ (26.185)
0
уравнение (184) приводится к виду
dP _ 1 Г д2 Р дР 1
dx 2 [ dv2 dv J
Решение последнего уравнения записывается в форме
P(v, т|ц0) =
1 (
.......ехр ]/2лт..I
(t>—1>0 т Т/2)2
2т
Некоторые смежные вопросы
357
Отсюда следует, что процесс v (/) является винеровским процессом с независимыми приращениями и имеет плотность вероятности перехода
, ’(О—т П
*~x±-----.. j
2 [г (г)— t(01
л (У, г | х, I) = 1 ----- ехр
/2л [т (г)—т (/)]
(26.186) В формуле (186) знак плюс соответствует отсутствию, а знак минус — наличию сигнала в принятой реализации £ (/).
Таким образом, задача о нахождении распределения длительности процедуры последовательного обнаружения детерминированного сигнала на фоне белого шума свелась к задаче достижения границ (с, d) нестационарным винеровским процессом v (/). В [1151 показано, что (186) справедливо для более общего случая обнаружения на фоне гауссовых помех с дробно-рациональной спектральной плотностью. В этом случае т (/) определяется более сложным путем.
Некоторые смежные вопросы
Со случайным временем Т (с, Хо, d) пребывания траектории процесса в интервале (с, d), если начальная точка находилась внутри этого интервала, тесно связано распределение наибольших абсолютных значений М (t, Хо) марковского процесса X (/):
М (/, X0) = sup | А, (т) |, Х(0) = \(. (26.187)
о < т < t
На основании определения функции распределения FM(t, Я|л0) случайной величины М (I, Ао) через вероятность соответствующего события можем написать
FM (Л Я|*о) = Р {М (/, М < Н} =
= Р {Т (- Н, Ао, Н) > t} = 1 - р-н.н (t, Хо). (26.188) Определим размах или величину осцилляций марковского процесса А (/) соотношением
R(t, A0) = sup А(т)— inf А(т), Х(0) = Хо. (26.189)
О s:: т < t 0 < X < /
Можно показать [114], что плотность вероятности w (/, 7?|Х0) величины осцилляций определяется выражением
^0
w(t, шо)= f |--5^r(l-Pc,<t(t V)L dc- (26-190) J L oaoc Jd=c-t-R
о -R
358
26. Достижение границ одномерным марковским процессом
Существование производной под знаком интеграла в (190) следует из существования плотности вероятности процесса X (/) по с и d, так как для любого 6 > 0 имеет место равенство
Pc+i.d(t, \) — pc.d(t, Х,,) = Р{с + 5<Х(()<с, X(t)<J, 0<tCNM- (26.191)
Взяв от обеих частей равенства (190) преобразование Лапласа,
получим
гл* ($,
Л(»
/?|Х0) = ~ j
K„-R
dddc
de. (26.192) d=e+R
Здесь было учтено соотношение (69) и то, что преобразование Лапласа в (190) может быть выполнено под знаком интегрирования и дифференцирования. Заменим в (192) переменные с, d на новые переменные с, R (где R = d — с). При этом
52ffi»c‘ d(s, Хо)
dddc
d = c-j- R
wc. c + u(S, X„)---—— w'C'C + u(S, 4).
OK*
(26.193)
Подставив (193) в (192), для преобразования Лапласа от плотности вероятности величины осцилляций имеем
w* (s, R' М =
К
C-R
е+д(8. м
dcdR dR2
С учетом граничных условий (79) выражение (194) можно также записать в более удобном для использования виде
>.<,+ «/2 w*(s,R\h)=------Д7Д- f я (s. X)du. (26.195)
s dR2 J -т- . " + -х-
В качестве иллюстрации применения полученных формул рассмотрим простой пример.
Пример 13. Найдем распределение величины осцилляций випе-ровского процесса (86), у которого ц = 0 и а = 1. В этом случае согласно (30) и (93) преобразование Лапласа от плотности вероятности времени первого достижения границ (с, d} имеет вид
ch Г 1/2s Г Оо —1
Гос. d (S, Vu) = —'—. (26.196)
ch ^V2s -—j
Некоторые смежные вопросы
359
Подставив (196) в (195) и выполнив интегрирование, получим
»•(». (26.197)
Отметим, что для винеровского процесса плотность вероятности величины осцилляций не зависит от начального состояния иа Обратное преобразование от (197) дает
/?|ц>) =
ж Г 2л2/(^-|- 1/2)2 -I ехр — ------------------
У I w I
л2 dR- (*+1/2)2
= —У (-ip-1 fe’expf — (26.198)
У2л/ \ 2/ /
Для моментов распределения размаха колебаний винеровского процесса из (197) в этом случае следует
Rn(t> уо) = ^ I v0) = Cnt’^2, (26.199)
о
где
Сп =--------------- [ г" Г — th г 1 <fe. (26.200)
Г(п/2+1) J [ d*2 ]
о
В частности, для первых двух моментов величины осцилляции ии-нероьского процесса имеем
(t, Ц>) = /8//л и R2 (Z, ou) = М 1g 2.
27. Достижение границ многомерным марковским процессом
Уравнения Понтрягина
В принципе известен метод решения задач о первом времени достижения границ и для многомерных марковских процессов. Пусть некоторая замкнутая область «слежения» Q многомерного пространства имеет границу Г и у — часть этой границы. Интерпретируя многомерный марковский процесс X = {А,. Л2, .... ХЛ;) как координаты случайной точки в рассматриваемой многомерной области,
360
27. Достижение границ многомерным марковским процессом
обозначим через ру (/, 1) вероятность того, что случайная точка, находящаяся в начальный момент времени t = 0 в положении X внутри области й, в течение времени t впервые выйдет из £2 через часть границы у. Предполагается, что область Q выделена таким образом, что любой выход за ее пределы приводит к нарушению нормальной работы системы, поведение которой описывается рассматриваемым многомерным марковским процессом.
Обобщая рассуждения п. 3 § 26 на случай М > 1, получим, что вероятность ру (t, Z) определяется решением уравнения в частных производных [105,:
Уравнение (1) следует решать при начальном условии
r\(0, X) = о, * с Й\Г (27.2)
и граничных условиях
Ру (t, М -“= 1, X € v: (27.3)
Pv (/, Z) = 0, К € Г\у. (27.4)
Начальное условие (2) следует из того, что частица при / = 0 находится внутри области й. Граничное условие (3) означает, что выделенная часть границы у достигнута уже при t = 0, а условие (4) для точек, принадлежащих остальной части границы, означает, что достижение границы произошло уже при t = 0 (частица вышла из области), но заведомо не на у. При этом предполагается, что траектории многомерного марковского процесса X (/) могут выходить из области й через любую точку границы Г. Рассмотрим подробнее условия, при которых выполняется последнее предположение [102, 103].
Пусть М-мерный марковский процесс описывается системой стохастических дифференциальных уравнений
м
= К) dVj{t) 0=1,2..........М). (27.5)
/=1
где Vj (/) — независимые винеровские процессы, у которых
(/) > = 0; (Ц (Z2) — Vj (/,)] [щ (Z2) — v/t (Zj)] > =
= bjk\t2 - /i|, (27.6)
6,-fe — символ Кронекера.
При записи (5) в интегральной форме стохастические интегралы понимаются в симметризованном смысле [57]. В этом случае производные dv} в (5) приближенно могут быть заменены широко
Уравнения Понтрягина
361
полосными гауссовскими процессами, что позволяет более корректно описывать при помощи М-мерных марковских процессов поведение реальных радиотехнических устройств (см. § 19).
Ограничиваясь далее рассмотрением однородных марковских процессов, на основании определения симметризованных стохастических интегралов из (5) для коэффициентов сноса и диффузии однородного марковского процесса X (/) получим
м
ММ=А(М+{ 2 (27.7)
м btAV= 2 gtkWgjkW- (27-8)
Обозначим через 1 = {/ъ .... 1м} — внешнюю нормаль к границе Г области О, где lt (i = 1, 2, ..., М) — направляющие косинусы внешней нормали. Выделим из Г регулярную часть границы Г для уравнения Понтрягина (1). По определению [103, 117, 118], точка принадлежит к регулярной части границы Х£Г, если выполняется одно из следующих условий:
1) матрица диффузии В = [bi} (X)] не вырождена в направлении, нормальном к границе, т. е.
м
2 6М(Х)Л(Х)//(Х)=#О;
t, /=1
(27.9)
2) матрица диффузии вырождена в направлении внешней нормали к границе, но выполняется неравенство
м г м
< = 1 / = 1
dbjj (X) а,
/,(Х)>о.
(27.10)
Согласно (8) матрица диффузии В является неотрицательно оп-м
ределенной, т. е. S bi}XiXj > 0, для любых вещественных
U-1
х1У .... хм- В тех случаях, когда матрица диффузии не вырождена всюду в области Q, дифференциальное уравнение в частных производных (1) является параболическим. В противном случае, если матрица В вырождается хотя бы в одной точке области Q, оно относится к ультрапараболическому (эллиптико-параболическому) типу 1117].
Условиям (9), (10) можно дать простое физическое объяснение. Действительно, если матрица диффузии В вырождается в направ
27. Достижение границ многомерным марковским процессом
лении внешней нормали к границе, то выполняется равенство
м
У = 0. (27 11)
i. i= t
Учитывая, что коэффициенты диффузии bi} (1) связаны с коэффициентами стохастических уравнений (5) зависимостью (8), соотношение (11) эквивалентно выполнению условия
м
2&Ж(М = 0, < = 1 2. .... Л1. (27 12)
/=|
Последние равенства означают, что в направлении, нормальном к границе области й, шумовое воздействие типа белого шума отсутствует. Поэтому нормальная к границе компонента процесса X (/) является дифференцируемой, что позволяет однозначно определить направление движения случайной точки вблизи границы Г. Принимая во внимание известную аналогию (см. §11) между уравнением Фоккера — Планка — Колмогорова и уравнением диффузии, рассмотрим нормальную к границе области Й компоненту вектора потока
М | /14 I
(G, I) = У fli(K)P-4 У Л(К),
2 oKi
/ = I 7 )
где круглые скобки, как обычно, означают скалярное произведение. Последнее равенство с учетом (12) приводится к виду
(G. 1) =
0. (X) —L
dt>u (М
(27.13)
Р(Х. 0 6 (>-)
Если нормальная составляющая потока (13) в некоторой точке X £ Г положительна, а матрица В вырождается, то в этой точке частицы двигаются по направлению внешней нормали, т. е. выходят из области й. В противном случае, если (13) отрицательна, частица движется внутрь области Учитывая, что Р (К, t) 0, из (13) следует условие (10) регулярности границы Г для уравнения Понтрягина. Оно означает, что при вырожденной матрице диффузии частица может покинуть область Й только через регулярную часть границы Г.
Если матрица диффузии не вырождена в некоторой точке границы области Й, то согласно (12) составляющая М-мерного марковского процесса, нормальная в этой точке к границе, недифференцируема. Поэтому, если частица попадает в окрестность этой точки границы, она обязательно ее пересечет независимо от направления потока. Этим объясняется условие регулярности границы (9).
Уравнения Понтрягина
363
Возвращаясь к граничным условиям (3), (4) для уравнения Понтрягина (1), из сказанного можно сделать вывод, что в общем случае эти условия должны быть заменены на
*6?ПП
pv(/, X) = 0. X f Г\ у.
(27 14'
(27.15)
Таким образом, прежде чем решать уравнение Понтрягина (1), при помощи (9), (10) нужно выделить регулярную часть границы Г, через которую случайная точка может покинуть область й. На регулярной части границы задаются краевые условия (14), (15). На остальной части границы Г\Г значение pv(/, X) определяется в процессе решения задачи.
Если интересоваться выходом случайной точки из области й через часть регулярной границы у П Г не в течение определенного времени t, а в течение всего времени, следующего за начальным моментом, то нужно перейти к пределу при /-> оо. В этом случае следует положить
lim — pv (t. X) 0.
dt
При этом уравнение (1) для ру (t, X) = ру (X) принимает вид
(27.1G)
Уравнение (16) следует решать с граничными условиями (14), (15). Отметим, что если матрица диффузии не вырождена, уравнение (16) является эллиптическим.
В том случае, когда у совпадает с Г, функции р-р (/, X) и рр (X.) обращаются в единицу вдоль всей границы Г и, как нетрудно про верить, решением уравнения (16) является р-р (X) = 1. Это означает, что вероятность случайной точки выйти из области й где-либо и когда-нибудь равна единице.
Получим теперь дифференциальные уравнения для моментов распределения времени первого достижения интересующей нас части у регулярной границы Г из первоначального положения X = {Xj, .... Х,и}. Моменты распределения, если они существуют, определяются равенством
Т'ЛЪ *) = J о
01
(27 17)
364
27. Достижение границ многомерным марковским процессом
Здесь под Тп (у, X) понимаются условные моменты распределения времени первого достижения выделенной части у регулярной границы, полученные при условии, что поглощение произошло именно на у, а не на Г\у. Поэтому в определении (17) плотность вероятности
Ру (?, X.) в общем случае не нормирована, т. е.
lim ру (t, Х)< 1.
Предполагая существование соответствующих производных, продифференцируем уравнение (1) по t, затем умножим обе его части на tn и проинтегрируем по t от 0 до оо. Тогда получим
X) ..дТп(у,1)
—’— dt= 2 —г,—
,=1 дЬа
j а/2
V b (Х) »^п(у.Х) i =з I J
(27.18)
о
-"j
о
и так как ру (оо, X)
Согласно предположению о существовании (17) будем считать выполненным условие
lim/"-^ (<Д)=0. (27.19)
t —> ао dt
В этом случае с учетом (19) имеем
да dt I
о
, др., (t, X)
dt = -пТп_, (у, X), (27.20)
= ру (X), a py (0, X) ~ 0, то
То (У, X) = ру (X). (27.21)
Таким образом, подставив (20)' в (18), получим рекуррентную систему дифференциальных уравнений в частных производных для определения моментов распределения времени первого достижения части у регулярной границы f"области Q вида
_L у . ^Tn(Y, X) &Гп(у. X)
2 + (2d а«(?с) 0Х2 “
= — пТп_х (у, X), п = 1, 2..... (27.22)
Уравнения Понтрягина
365
Здесь, в отличие от п. 4 §26, Т(1 (у, X) определяется соотношением (21). В частном случае при у = Г из (14) следует, что То (Г, X) = 1.
Уравнение (22) следует решать при граничном условии
Тп(ъ Ml =0, (27.23)
к ег
которое следует из (17), и из того, что на Г согласно (14), (15) величина ру (I, X) не зависит от времени.
Отметим, что получить аналитическое решение уравнений (1) и (22) для большинства практически интересных задач, как правило, не удается даже в двумерном случае. При М^З затруднительным становится и получение решения на ЦВМ.
Пример 1. При измерении угла вращения плоскости поляризации полезного сигнала статистическая динамика устройства слежения может быть описана [80] системой стохастических дифференциальных уравнений
-^-=—cos х2) sin Xj + пг (t), (27.24)
dt
~ =—(Л2 cos %i) sin x2 + n2 (/). (27.25)
dt
Здесь Xj (/) — угол поляризации полезного сигнала, х2 (/) — ошибка слежения за фазой несущей, пг (t) и п2 (/) — независимые нормальные белые шумы, у которых
<«i (0> = <«г (0> = °.
<П1(0«1(< + т)> б(т), <п2(/)п2(/ 4-т)>=--^ 6(т). (27 26)
Уравнения (24), (25) определяют двумерный марковский процесс х (/) — {xj (/), х2 (/)} с коэффициентами сноса и диффузии
а2 (х) = — (Xj cos х2) sin xlt а2 (х) = — (Л2 cos х2) sin х2,
Ьи = ЛЦ/2, Ь12 = Ь21 = 0, b22 = N2/2. (27.27)
Выделим на плоскости (хь х2) область Q: {| хг | л, |х2| л} и будем интересоваться первым выходом изображающей точки за границу этой области. В данном случае всюду в области Q согласно (27) выполняется условие (9). Поэтому вся граница является регулярной и изображающая точка может покинуть область Q через любую часть границы ГГ : {.^ = ± л, х2 = ± л}. Вероятность Ру (I, х) того, что случайная точка, находящаяся при t = 0 в по
366
27. Постижение границ многомерным марковским процессом
ложении х f Й, в течение времени / выйдет из области через часть границы у, удовлетворяет уравнению
Фу(', *) __ A*’i &pv(t,x) N2 d*pv(t, х)
dt “T ~7x* +*4 ^2
dp,, (t, x) dp„ (t, x)
— (A cos x2) sin xx —-------(A cos xj sin x- —------. (27 28)
d*i dx2
Если нас интересует первый выход изображающей точки, например, через часть границы у : {х2 = ± л}, уравнение (28) следует решать с граничными условиями
pv ((, х) | = 1, ру ((, х) | — 0. (27 29)
Ха = ±Л *! = ±Л
Если нужно определить вероятность выхода случайной точки из области Q через любую точку границы Г, то вместо (29) нужно брать рг (/, х) | = рг (/, х) | = 1 (27.30)
г, = ±л г, = ±л
В любом случае, вне зависимости от у, решение уравнения (28) должно удовлетворять начальному условию (2).
Среднее время первого достижения части границы у согласно (22) удовлетворяет уравнению
Л'1 d* Tj (у, х) N2 cW Т, (у, х) , . , dljly, х)
4 dx* 4 dx* 2 dxt
— (A, cos xL) sin x2 — — Py(x) (27.31)
dx2
с граничными условиями
/\(у. X) I =т1(у,х)| =0. (27.32)
Ч = ± л х, = ± л
Здесь pv (х) — стационарное решение уравнения (28) с граничными условиями (29). Если у = Г, то, очевидно, р-р (х) = 1.
Пример 2. Статистическая динамика системы ФАП второго порядка, у которой в качестве фильтра нижних частот используется интегрирующая цепочка RC, описывается [91] нелинейным стохастическим дифференциальным уравнением второго порядка
^-+ а + аЛ sin <р = аА°+ «(/), (27.33)
где п (t) — нормальный белый шум с < п (/) > = 0 и < п (/) п (t + + т) > = Nu б(т)/2, а = 1/RC, гр (/) — разность фаз синхронизируемых генераторов, До — средняя расстройка этих генераторов по частоте, А — полоса удержания схемы ФАП, т. е. максимальная раз
Уравнения Понтрягина
3&7
ность частот генераторов, которую может компенсировать цепь управления (см. § 22).
Обозначив ср (?) = х, (t) и dy'df -= х2 (/), уравнение (33) можно записать в виде
dx-Jdf — х2 (t),
dx„ >df — кА,, — ax, — a A sin x, + n (/). (27.34)
Для CH' T-Mi.i ФАП второго порядка особые точки (точки устойчивого или неустойчивого состояния равновесия) расположены при Ф = Xj = ± пп (н = О, 1, 2, ...) [82]. При четных значениях п они являются точками устойчивого состояния, а при нечетных — неустойчивого Аналогично примеру 2 § 26, под срывом слежения за фазой сигнала на входе системы ФАП будем понимать первое достижение координатой Xj (/) ближайших точек неустойчивого со-состояния равновесия. Так как и в этом случае характеристики срыва слежения не зависят от того, в окрестности какого устойчивого состояния равновесия первоначально находилась система, срыв слежения можно отождествить с первым достижением процессом Xj (I) точек ( —л, л). При этом начальное значение xt £ [— л, л]. Такое определение срыва слежения за фазой сигнала (нарушения синхронного режима работы системы ФАП) совпадает с [1191.
Так как максимальная расстройка по частоте х2 (/) для сохранения нормального режима работы системы не должна превышать полосы удержания А, срыв слежения произойдет также при достижении координатой х2 (/) значений ± А-
Выделим на фазовой плоскости (х,. х2) область й:
|х,1 еб А}. Под срывом слежения в системе ФАП второго порядка, таким образом, будем понимать первый выход случайной точки за границу Г : {xj = ± л, х2 = ± А}.
Уравнения (34) определяют двумерный марковский процесс х (/) = {хх (/), х2 (/)} с коэффициентами сноса и диффузии
a; (х) — х2, a2 (х) = aAn — ах,— аД sin х1т Ьп — ЬУ2 ~ 0.
b22 = Nn/2. (27.35)
Из (35) следует, что условие (9) выполняется только на части границы 1 при х, = ± А. На другой части границы, при хг = — ± я, матрица диффузии вырождается. При Xj = л, х2> 0 их, = — л, х, < 0 справедливо условие (10), поэтому регулярная часть границы в данном случае имеет вид
Г : {х, л, х2 > 0; х, = — л, х2 < 0; х2 = ± А}. (27.36)
368
27. Достижение границ многомерным марковским процессом
Вероятность срыва слежения рр (/, х) = рр (/, хи х2) ПРИ условии, что в начальный момент времени t — 0 система находилась в состоянии (хь х2) £ й, удовлетворяет уравнению
дРг х> л/ Рт U’ х) дРг <z> х)
-4—=4° —4—+х* -4—+ dt 4 dx% dxi
dPr(t, x)
4- (аД0—ах2—aAsinxJ------------ (27 37)
dx2
Уравнение (37) следует решать при начальном условии (2) и граничных условиях
Рр(Л х±, х2 = ± Д)= 1,
Рр (/,*! = л, х2 > 0) = pp (t. Xt — —л, х2<0) = 1. (27.38)
Моменты распределения времени до срыва слежения Тп (*i, х2) в системе ФАП с интегрирующим фильтром могут быть найдены из решения уравнения
No д^ТпМ , , А А . . дТп(х) .
—° ----т5-2- + («До— ах2— аД sin хг) —+
4 dx2 dx2
+ х2-^^ = -пТ„_1(х) («=1,2............ Т'й=1) (27.39)
dxi
с граничными условиями
Тп (Х1г х2 = ± Д) = (*! = л, х2 > 0) =
= Тп (Х1 = - л, х2 < 0) = 0. (27.40)
После того, как найдены решения уравнений (37), (39) рр (t, х) и Тп (х) в зависимости от произвольного начального состояния х, можно найти их усредненные по случайному начальному состоянию значения (см. § 28).
Связь с уравнением Фоккера — Планка — Колмогорова
Решение задачи о первом выходе неоднородного многомерного марковского процесса X (/) из заданной области Q может быть получено при помощи прямого уравнения Фоккера — Планка — Колмогорова. Повторяя рассуждения § 26, аналогично (26.4) получим
Pr(t, X)=l-$p(g;Z; K)dl. (27.41)
й
Здесь р (|, /; X) — плотность вероятности перехода за время t из точки X в интервал (£, | + dQ для реализаций процесса, ни разу
Связь уравн. Понтрягина с уравн. Фоккера — Планка — Колмогорова 369
не покидавших область Q. Очевидно, что р (|, f; X.) удовлетворяет прямому уравнению Фоккера — Планка — Колмогорова
, м
-- р (I, f, Ь) = - У (§, t) Р (I, t- Ml +
01 —i
+ 4- У 1^(1, t)p&, f, М] (27.42)
2 г,‘7Х1
с начальным условием
р(§,0;Х)= П8&Ч). (27.43)
Так как интегрирование в (41) проводится только по значениям принадлежащим области Q, то можно не запрещать траекториям марковского процесса Z (/) выходить за пределы этой области. Нужно только обеспечить условия, при которых траектория процесса, которая к моменту t хотя бы один раз вышла за пределы Q, не могла вернуться внутрь области. Повторяя рассуждения предыдущего раздела этого параграфа (см. также § 13), можно показать, что возвратиться внутрь области й траектория процесса может только через част1- Г* границы Г. По определению ПОЗ, 117, 118], точка £ принадлежит Г*, если выполняется одно из следующих условий:
(27.44)
(27.45)
Чтобы исключить возможность возвращения внутрь области Q траектории процесса, которая хотя бы один раз вышла за ее границы, уравнение (42) следует решать с граничным условием
Р& t; М|=°-И г*
(27.46)
Граничное условие (46) физически означает, что на границе Г* отсутствуют траектории, ни разу за время t не выходившие за пределы области й. Отметим, что при помощи решения уравнения (42) с граничными условиями (46) может быть найдена вероятность первого выхода из области й для неоднородного марковского процесса, если на некоторой части Г заданы условия (13.28).
370
28. Срыв синхронизации в системах ФАП второго порядка
28. Срыв синхронизации в системах ФАП второго порядка
Уравнение для моментов распределения времени до срыва синхронизации в оптимальных системах ФЛП второго порядка
Рассмотрим статистические характеристики срыва синхронизации в оптимальной системе ФАП второго порядка, предназначенной для слежения за фазой полезного сигнала s (/) = Ао cos [а0 t + ф (/)]. Предполагается, что поведение случайной фазыф (/) описывается системой априорных стохастических дифференциальных уравнений
d'^ldt = о? -г (/), dmldt = — уы + пт ((), (28.1)
где п,|, (/) и п№ (() — взаимонезависимые нормальные белые шумы с известными статистическими характеристиками
< гц, (() > = 0, < пу (О (t + т) > = /V* б (т)/2,
( пт(П > = 0, < п,„ (0 пю (I + т) > = Na б (т)/2.
Система уравнений (1) позволяет учесть флуктуации фазы и частоты полезного сигнала за счет различного рода нестабильностей задающих генераторов и эффекта Доплера [1201. Принятое колебание на входе системы ФАП имеет вид
ИО = s (0 + п ((), где п (I) — аддитивный нормальный белый шум, у которого
< п (Г) > = О, ( п (/) п (t + т) > = Nof> (т)/2.
В этом случае синтез оптимального следящего устройства методами марковской теории оптимальной нелинейной фильтрации аналогично [121] приводит к следующей системе уравнений для опенок флуктуирующих параметров
= ***1 (i) sin [Ип '+ч’*(01’
—усо*— £фмI(Z) sin [®„( + ф* (()]. (23.2)
/*0
Здесь стационарные значения коэффициентов матрицы апостериорных кумулянтов определяются выражениями [771:
h* = <У Г+ Л + 2(7 - 1), (28.3)
^0
Срыв синхронизации в оптимальных системах ФАП второго порядка 371
= °+G ~ 1 + L + 2G)’ (28-4)
где приняты обозначения
£ = G=l/WZf5). (28.5)
2у« На V 2-у* М, ' '
Уравнения (2) совместно с равенствами (3)—(5) полностью определяют структурную схему и параметры оптимального следя-
Рис. 28.1. Структурная схема оптимальной системы ФАП второго порядка.
щего устройства. Оно представляет собой систему ФАП, у которой управление частотой подстраиваемого генератора осуществляется при помощи двухканальной цепи обратной связи (система ФАП с пропорционально интегрирующим фильтром). Коэффициенты передачи цепей определяются не только априорными характеристиками флуктуаций фазы полезного сигнала, но и интенсивностью аддитивного шума. Апостериорная неточность слежения за фазой может быть вычислена по формуле (3).
Структурная схема синтезированной системы ФАП представлена на рис. 28.1, где приняты следующие обозначения: — амплитуда колебаний на выходе подстраиваемого генератора (ПГ), которая при наличии на входе системы полезного сигнала совпадает с Ао; р, S— постоянные известные характеристики перемножите.™ и управляющего элемента (УЭ); Т2 = 1/у — постоянная времени интегрирующей цепочки фильтра нижних частот (ФНЧ); и Ка> — коэффициенты передачи ФНЧ
*\ W * \ О) — ~‘ •
372
28. Срыв синхронизации в системах ФАП второго порядка
Предполагается, что в отсутствие напряжения на управляющем элементе собственная частота подстраиваемого генератора равна центральной частоте полезного сигнала <о0, т. е. средняя расстройка генераторов по частоте отсутствует.
С учетом обозначений рис. 28.1 уравнения (2) можно записать в виде
j. 2Д, I Г Ао . / f ф ., , / 1
= 01*---1 0 s,n (ф* - гр) + п (0 ,
Ш /Vo 1 i * j
“= — YW*— ‘'Г П (^1 • <28'6)
u/ Nq [ 2 J
Здесь было учтено также, что произведение принятого колебания и сигнала подстраиваемого генератора можно представить в виде [821:
Е(/) A, sin («,,/ + А*) = A>IA> cos (ы0/ + гр) +
+ л(/)| sin (ю„ / + А*) ~ А^-у sin (гр* — ip) + п (/)j. (28 7)
При выводе (7), как обычно, отброшено слагаемое с двойной частотой [82, 121].
Статистическая динамика систем ФАП обычно описывается в координатах
Ф (/) = гр* (/) - гр (/), Q (/) = А (/) — w (/), где ф (/) — разность фаз, a Q (/) — разность текущей оценки и истинной частоты полезного сигнала. Вычитая из (6) соответствующие уравнения системы (1), получим
п 2Д^ г I До . Л] .
= “-----—^М> ~51Пф+ «(/) — «4,(0,
и/ /v(J L - J
—Vй —1 ~ 51Пф + «(/)!—««,(/). (28.8)
(К /V (j [ 2 J
В операторной форме записи систему уравнений (8) можно представить в виде
РФ = -- ——К (р) [sin ф + /г]----— пю —п$, (28.9)
тЛф L До J с+т
где передаточная функция и постоянные времени пропорционально интегрирующего фильтра определяются соотношениями
А (р) = -1+а7 \ у г [ + PTi
Л=—. (28.10)
V
Срыв синхронизации в оптимальных системах ФАП второго порядка 373
В отсутствие флуктуаций уравнение (9) совпадает с основным уравнением системы ФАП (см., например, [122]) при нулевой начальной расстройке средних частот полезного сигнала и подстраиваемого генератора. При этом полоса удержания системы ФАП и параметр фильтра равны
А = ''4° (fe4><a _ Л _ У^м да 11)
УЛ'о + Y^-ф-ф
С учетом равенств (10), (11) уравнения (8) можно записать в виде
— = Я—mA [sin ф + — n(t) — dt L 40
^7 = —уЯ—y(l —m) A [sin ф + — n (/)! —na (t). (28 12)
dt [ 4o J
Стохастические дифференциальные уравнения (12) совместно с равенствами (10), (11) полностью описывают статистическую динамику оптимальной системы ФАП второго порядка при наличии флуктуаций фазы и частоты полезного сигнала и аддитивного белого шума. Они определяют двумерный марковский процесс (ф, Я), для которого коэффициенты уравнения Фоккера — Планка — Колмогорова равны
аф = Я—mA sin ф, aQ=—уЯ—уА(1—т)з'тф,
2т2 Д2 п 2m (1 — т) Д2 уД0
“~7Г+г ------
2(1-т)2Д2у2Д0
(28.13)
Под срывом синхронизации в системе ФАП второго порядка будем понимать, во-первых, достижение координатой ф (/) точек неустойчивого состояния равновесия системы и, во-вторых, достижение координатой Я (/) значений, равных полосе удержания системы А (см. также пример 2 § 27).
Для системы ФАП с пропорционально интегрирующим фильтром особые точки расположены при ф = ± лп (п = 0, 1, 2, ...) 182]. При четных значениях п они являются точками устойчивого состояния равновесия, а при нечетных п— точками неустойчивого состояния равновесия. Соответствующей заменой переменных в уравнении Понтрягина (27.1) с коэффициентами (13) аналогично примеру 2 § 26 можно показать, что распределение времени до срыва синхронизации в системе ФАП второго порядка не зависит от того, в окре-етности какого устойчивого состояния равновесия рассматривается
28. Срыв синхронизации в системах ФАП второго порядка
срыв слежения. Поскольку обычно представляют интерес минимальные ошибки по фазе, будем в дальнейшем рассматривать первое условие срыва синхронизации как достижение координатой ф (О точек (—л, л) (см. также 1119]). При этом предполагается, что начальное значение ф0 € (—л, л).
Второе условие, при котором также происходит срыв синхронизации, вытекает из того, что максимально возможная расстройка по частоте, которую может компенсировать цепь управления системы ФАП, равна полосе удержания системы 11221.
Таким образом, под срывом синхронизации в оптимальной системе ФАП второго поряда будет пониматься первый выход траектории двумерного марковского процесса (ф, Й) за границы области Г : {IФI л> |Й|^Д}. В данном случае уравнение (27.22) относительно л-го момента Тп (ф0, Йо) распределения времени первого достижения границы области из начальной точки (ф0, й0) имеет вид
1 .
'Aw»
&Тп , h 32 Тп ,
2 + 7 7Z г
оф о 3<р0
з-
^а9^+ав>^=-пТп_1 (п=1,2, ...) (2^ 14)
дфо дайр
Здесь коэффициенты уравнения (14) определяются соотношениями (13).
Рассмотрим определитель матрицы диффузии двумерного марковского процесса (ф, й)
det В — Ар*р Ajq — Арп-
(23.15)
Подставляя в (15) соотношения (13), получим
det В =
\|>(1-т)2 Л2т2 N(j
А2
Д’ 4 •
Очевидно, что det В О, причем знак равенства имеет место только при одновременном выполнении условия — Na = 0. Из теории уравнений в частных производных известно, что при det В > 0 уравнение (14) относится к эллиптическому, а при det В = 0 — к параболическому типу. Ограничимся в дальнейшем случаем, когда либо N^, либо А<„ отлично от нуля, т. е. будем учитывать флуктуации фазы или частоты полезного сигнала. В этом случае det В > 0 всюду на плоскости (ф0, й0) и, кроме этого, на всей границе области Г выполняется условие (27.9). Последнее означает, что вся выделенная граница области Г является регуляр
Срыв синхронизации в оптимальных системах ФАП второго порядка 3/5
ной для уравнения (14) и, следовательно, То (ф0, £20) = 1. При этом граничное условие (27.23) примет вид
Т'ДФ,,. Qo) | = 7\(ФИ,Ц>) | =0 («=1 2, ...). (28.16)
Фо=±Л И0 = ±Л
Эллиптическое уравнение (14) в совокупности с граничными условиями (16) образует классическую краевую задачу Дирихле. Так как для коэффициентов вида (13) аналитически решить эту задачу не удается, будем искать решение численными методами.
Переходя в (12), (16) к безразмерным величинам, с учетом (13) получим
— | —+ £)ф ^n + |(l-2La+ +
2л2[р^2 дхг nf,p дхду [ 2р | дуг
1 cfz
Н---(ц — znsinnx) — — [у + (1 —-m)sinnx] х
зф ' дх
Х^=-пгп_у (п= 1. 2, .... г,= 1), (28.17)
d'J
гп(± 1, у} = гп (х, ± 1) = 0. (28.18)
Здесь гп (х,у) = упТп(х,у)— безразмерные функции; х = = ф0/л — безразмерное начальное значение ошибки по фазе; у = Qo/A — нормированное начальное значение расстройки по частоте; р = Л */2y/V0 — отношение сигнал/шум в полосе пропускания интегрирующей цепочки; 8 = у/А — отношение ширины спектра флуктуаций частоты полезного сигнала к полосе удержания системы ФАП; Dq, D;n — безразмерные параметры, которые характеризуют интенсивность флуктуаций фазы и частоты полезного сигнала и задаются соотношениями
= Л/и,/2у О(1> = Л4>/4у’ = оД/у'2; (28.19)
Оы = Л/т/4у— стационарное значение априорной дисперсии флуктуаций частоты.
Для расчета параметров оптимальной системы ФАП второю порядка из (3), (4), (11) и (19) имеем
А = 2рОф, G = /4рОи + 2рИф. A = yG, |3=1/G,
m = (K 1 + А Д 2G- 1)/6. (28.20)
Таким образом, задание трех априорно известных параметров р, Dl(, и D,„ полностью определяет характеристики срыва слежения за фазой полезного сигнала в рассматриваемой оптимальной системе ФАП Неточность слежения за фазой на основании (3), (20) может быть оценена но формуле
/?фф = т/2р0. (28.21)
376
28. Срыв синхронизации в системах ФАП второго порядка
Рассмотрим возможные начальные условия работы системы ФАП второго порядка, т. е. начальные значения <р (0) = <р0 и Q (0) = Qo. При этом можно выделить три основных случая:
1. До некоторого момента времени, принимаемого за начальный (t = 0), система ФАП была выключена (сигнал на выходе перемно жителя отсутствовал), хотя на вход системы поступала аддитивная смесь полезного сигнала и шума. Такой случай характерен, например, для начала работы ФАП в системах радионавигации, в которых радиомаяки излучают полезный сигнал постоянно. При этом со* (/) = 0 для всех t <7 0, так как напряжение на выходе пропорционально интегрирующего фильтра до начального момента времени отсутствует. Предполагая, что флуктуации частоты полезного сигнала к началу работы системы ФАП имеют стационарное распределение, из (1) получим, что Qo представляет собой случайную величину, распределенную по нормальному закону
Pst. (Йо) = ехР ((28 22) У ^<0 \ /
Начальное значение разности фаз ф0 является случайной величиной, равномерно распределенной на интервале (—л, л), т. е.
Pst (Фо) = 1/2л. (28.23)
2. До некоторого момента времени, принимаемого за начальный, полезный сигнал в принятом колебании % (/) отсутствует, т. е. Ао = 0 при / <7 0, и до начального момента времени на вход работающей системы ФАП действует только шум n(t). Этот случай характерен для симплексной связи, когда полезный сигнал на входе приемника появляется с некоторой задержкой, которая может иметь довольно большую величину. Предполагая, что под действием шума за время отсутствия полезного сигнала в системе ФАП установится стационарный режим работы, из второго уравнения системы (8) при Ао = 0 получим, что Qu представляет собой случайную величину, распределенную по нормальному закону
<28'24>
V 2яа22о \ 2айу 4у уЛГ0
Начальное значение разности фаз будет по-прежнему равномерно распределено на интервале (—л, л).
3. Если в случае 1 начальное значение со (0) = 0 (это возможно, например, когда система (1) описывает полезное сообщение, которое в начальный момент может отсутствовать), то при t = 0 разность фаз будет равномерно распределена на интервале (—л, л), a Qo = 0.
После того как из уравнения (17) с граничными условиями (18) найдена двумерная зависимость гп (х, у), можно получить усред
Срыв синхронизации в обычных системах ФАП второго порядка
377
ненные по случайным начальным значениям координат величины моментов для рассмотренных случаев начала работы системы ФАП.
Усредненное по случайному начальному фазовому рассогласованию значение л-го момента распределения времени до срыва синхронизации в безразмерных переменных х, у запишется в виде
1 г
Zn{y) = ynTn{y) = — гп(х, y)dx. (28.25)
Из формулы (25) непосредственно следует решение поставленной задачи для случая 3. Для первых двух случаев начальных условий работы системы ФАП выражение (25) необходимо еще осред-нить по случайной величине начальной расстройки по частоте.
Уравнение для моментов распределения времени до срыва синхронизации в обычных системах ФАП второго порядка
Рассмотренная выше оптимальная система ФАП была синтезирована в предположении, что априорное поведение случайной фазы полезного сигнала, его параметры и отношение сигнал/шум точно известны. Одним из следствий такого полного априорного знания является, в частности, отсутствие средней расстройки по частоте у полезного сигнала и подстраиваемого генератора оптимальной системы ФАП.
Между тем, на практике такой полной априорной информации, как правило, не имеется. В таких случаях создаются по существу неоптимальные системы ФАП. Кроме того, даже при наличии полной априорной информации в ряде случаев приходится использовать неоптимальные схемы, так как оптимальные не удается практически полностью реализовать. Поэтому исследование срыва синхронизации в неоптимальных системах ФАП второго порядка представляет значительный интерес тем более, что подобные устройства синхронизации находят широкое применение в системах измерения параметров орбит ИСЗ, телевидении, когерентной радиолокации, некоторых видах фазовой радионавигации и др. [82].
Исследование неоптимальных систем ФАП представляется важным еще и потому, что с его помощью можно определить степень критичности синтезированных оптимальных схем к изменениям параметров входного сигнала. Последнее обстоятельство связано с тем, что реализованные оптимальные схемы работают, как правило, в условиях, несколько отличающихся от расчетных. Очевидно, что эти отклонения не должны приводить к значительному ухудшению качества работы системы.
Пусть на вход системы ФАП (рис. 28.2) поступает аддитивная емесь 1(f) полезного сигнала s(t) = Ао cos [оз0/+ ф (/)] —
Ж Срыв синхронизации в системах ФАП второго порядка
= Ао соз Фо (О со случайной фазой ф (О и белого шума п (t) с известными статистическими характеристиками.
Сигнал на выходе подстраиваемого генератора имеет вид
nUj р.) Л. sin (Pj (/) = Ai sin lwurt + ф1 (/)], (28.26)
где
®in = ®, — Sw (7);
Рис. 28.2. Структурная схема типовой системы ФАП.
со, — средняя частота колебания подстраиваемого генератора в от-сутств ie управляющего напряжения.
Обозначим
Ф (/) = Ф, (/) — Фо (/) = (®|н. -
- ®„) t + ф, (0, (28.28)
Ди = — ®(|. (28.29)
Параметр Ди характеризует среднюю расстройку частот полезного сигнала и подстраиваемого генератора; <р (/) — разность фаз. Отметим, что ф(() совпадает с обозначением, принятым в предыдущем разделе, только при t|)j(Z) = 0 и ®t = ®u, т. е. при отсутствии собственных флуктуаций фазы подстраиваемого генератора и средней расстройки по частоте.
При анализе рассматриваемой системы ФАП сделаем обычные допущения:
— все звенья системы ФАП, за исключением фильтра нижних частот, являются безынерционными;
— фазовый детектор представляет собой перемножающее устройство, т. е. имеет синусоидальную характеристику;
— характеристика управляющего элемента в пределах рабочего участка линейна;
— амплитудными флуктуациями сигналов можно пренебречь.
В этом случае поведение системы ФАП описывается следующим дифференциальным уравнением [79]
32L=4O-SII«)_J!* , (28.30)
d/ сП dt '
где и (/) — сигнал на выходе фильтра нижних частот с коэффициентом передачи К (р).
Аналогично предыдущему, произведение принятого колебания и сигнала на выходе подстраиваемого генератора можно представить в виде
g(Z)zl1Snil®m Z + ФДО] ~ -Л10Л° [sin(P‘+~T~ п(о] •
Срыв синхронизации в обычных системах ФАП второго порядки
379
С учетом последнего соотношения из (30) получим
р<р= Д„ —Д/( (р) [sin ср + п ] + рф, —рф. (28.31)
L Л» j
где Д — полоса удержания рассматриваемой схемы ФАП
А = AtAoiiS/2. (28.32)
Пусть фильтр нижних частот представляет собой пропорционально интегрирующий фильтр, для которого
/<(р) =
1 + Л/-
1 + 7 2 р
•^ = Т, (28 33)
/ з / з
Возможная реализация подобного фильтра показана на рис. 28.3. Отметим, что оценочное значение отклонения частоты полезного сигнала от известного значения «0в этом случае пропорционально напряжению (t) на конденсаторе 1121], причем
(/1 (/) = __ (1)*/5. (28.34)
%-(#+/№
Ряс. 28.3. &<т-г»кная реализация пропорционально интегрирующего фильтра.
Для и; (/), как нетрудно убедиться, справедливо дифференциальное уравнение
+ у/л = у (1 —m) — [sin ф + .-^- л (/)] . (28.35)
Л S । Д„ |
Собственные флуктуации фазы подстраиваемого генератора за счет естественных нестабильностей согласно 176] описываются стохастическим дифференциальным уравнением
d^Jdt = л,,,, (/), (28.36)
где (() — нормальный белый шум с известными статистическими характеристиками <гц, ,(()> = 0, <П'|;, (0'Ц, + т)> = 6 (т)/2.
Относительно флуктуаций фазы полезного сигнала предположим, что они складываются из двух независимых случайных процессов
Ф (0 = (0 + Фз (0-
Здесь ф2(0 — недифференцируемая компонента флуктуаций фазы полезного сигнала, поведение которой описывается стохастическим дифференциальным уравнением
dty^dt — (/), (28.37)
где (/) — нормальный белый шум с известными статистическими характеристиками. Компонента ф2 (/) описывает естественные нестабильности фазы генератора передатчика и влияние распространения радиоволн через турбулентную среду. Отметим, что (36), (37) больше дифференцировать нельзя.
380
28. Срыв синхронизации в системах ФАП второго порядка
Другая компонента флуктуаций фазы полезного сигнала ф3 (/) предполагается дифференцируемой, т. е. ее первая производная имеет конечную дисперсию. Она описывает, например, флуктуации фазы полезного сигнала за счет эффекта Доплера. Обозначив dty3/dt = ® (/), можно написать
d(f>/dt-\-y(f> — п^, (/), (28.38)
где п^, (/) — некоторый случайный процесс с известными статистическими характеристиками.
Подставляя (36), (37) в (31), с учетом (38) получим [2 л
sinq> + — п + Пц,, —Пц> —(о, ^0 J
(28.39) ри= —7® +
Если время корреляции процесса п^:> (/) сравнимо или превышает характерные постоянные времени 7\ и Т2, то для описания статистической динамики системы ФАП при помощи теории марковских процессов необходимо увеличить число измерений по сравнению с двумя координатами <р, со системы (39). Для процессов, имеющих дробно-рациональную спектральную плотность, это всегда возможно (см. [55]). Если время корреляции процесса (/) много меньше постоянных времени 7\ и Т2, то переход от (39) к стохастическим дифференциальным уравнениям может быть совершен без увеличения размерности по известным правилам [2] аналогично тому, как это сделано в [91] (см. § 20).
Ограничимся в дальнейшем рассмотрением практически важного частного случая, когда (/) == (/), где (/) представляет
собой стационарный белый шум с известными статистическими характеристиками. При этом флуктуации фазы полезного сигнала будут описываться системой уравнений (1).
Обозначим
Й(/) = До — SU1(t) — ®(/). (28.40)
Из (34) следует, что й (/) представляет собой текущую разность частот полезного сигнала и подстраиваемого генератора. При До = 0 обозначение (40) совпадает с принятым в предыдущем разделе.
Используя введенное обозначение й (/), из системы (39) с учетом (35) получим
^ = й —Дт fSin<р4- —п(о| + Пг|>. (0—МО.
(28.41)
~ = уД0—уй—уД (1 — гп) [sin <р + -^-п (/)] — (/). Ut Дл
Срыв синхронизации в обычных системах ФАП второго порядка
381
Система дифференциальных уравнений (41) полностью описывает статистическую динамику системы ФАП второго порядка с учетом естественных нестабильностей генераторов и флуктуаций фазы полезного сигнала. Стохастические дифференциальные уравнения (41) определяют двумерный марковский процесс (<р, Q), у которого коэффициенты уравнения Фоккера — Планка — Колмогорова задаются соотношениями
«ф = Q—mA sin <р, = уД0—уА (1 —m) sirup—yQ,
2^ Д2^ JV У 2т(1-т)Д2 7У0
+ -------AS-----•
bQQ = 2(I-'”)2 А2 Y2 Л'о + V<0 ' (28.42)
2
Сопоставляя систему стохастических дифференциальных уравнений (41) с (12), заметим, что рассмотрение оптимальных и неоптимальных систем ФАП второго порядка можно объединить в общий случай, когда исследование срыва синхронизации сводится к решению задачи первого достижения границ области Г : {| ср | л, |Q| А} двумерным марковским процессом (<р, Q), который определяется системой стохастических дифференциальных уравнений (41).'
При Пф, (/) = 0 и Ао = 0 из (41) следуют уравнения (12), в которых параметры Дит задаются соотношениями (11).
При исследовании типовой системы ФАП предполагается, что постоянная времени фильтра нижних частот равна Т2 = 1/у, где у — ширина спектра флуктуаций частоты полезного сигнала. Остальные параметры неоптималыъой системы ФАП обычно выбираются на основании следующих соображений [80].
Чтобы оптимизировать переходный процесс по длительности и обеспечить отсутствие значительного перерегулирования, необходимо выполнить условие
— 0 = у/Д. (28.43)
Так как уменьшение параметра 0 ведет не только к уменьшению шумовой ошибки системы, но и к сокращению полосы захватывания, а полоса захватывания не должна быть существенно меньше полосы удержания А, то целесообразно ограничить величину 0. Обычно принимают
0 > (0,1 4- 0,25). (28.44)
Шумовую ошибку (дисперсию ошибки по фазе) можно вычислить по формуле
АА Д у+т2Д o'- 1
а2=-4—J-Z----------+ =-----——+p2Da. (28.45)
4Д( y-f-отД Д 8рр Р + 'тг
28. Срыв синхронизации в системах ФАП второго порядка
Отметим, что соотношение (45) получено методом линеаризации и потому справедливо лишь при достаточно больших отношениях сигнал/шум.
Моменты распределения времени до срыва синхронизации можно найти из решения уравнения Понтрягина (14) с граничными усло-еиями (16). Повторяя рассуждения предыдущего раздела, можно показать, что при А/ц,,, А/ц, или отличных от нуля, это уравнение является эллиптическим. Относительно безразмерных функций гп = УпТп (х, у) в безразмерных переменных х = ср0/л и у = Йо/Д с учетом (42) оно примет вид
+ + 4-
2л- [ р^ ф' Д дН 1фр dxd.j
1(1 —m>2 о>п 1 । , х <^п ,
+—---------4-0* D I __L + __ ((/-msni nt) -2- 4-
I . 2p j dtp dx
+ [—— (/ — (1 — m) sin лх] = — mH_lt (n I, 2, .... - I),
I A J
(28.46)
2n(± M) = zn(x,± l) = 0. (28.47)
Здесь коэффициент Оф, = А/ф,/2у характеризует интенсивность флуктуаций фазы подстраиваемого генератора; До/Д — относительная средняя расстройка по частоте. Остальные параметры определяются аналогично предыдущему.
Для типовой системы ФАП второго порядка при фиксированных Р, Д, m из (46) следует, что даже при р оо моменты распределения времени до срыва слежения конечны. Их величина определяется интенсивностями флуктуаций фазы и частоты.
Повторяя рассуждения предыдущего раздела с учетом (35) и (40), получим те же три случая начальных условий работы системы ФАП. При этом <р0 случайна и во всех случаях равномерно распределена па (—л, л). Для начального значения Q() имеем:
I. й0 — случайная величина, распределенная по нормальному закону с
<П0> = До и оф„ = AU4y. (28.48)
2. Qo — случайная величина, распределенная по нормальному закону с
<Ч> = Ди и аа0-= 2^-+-42(1~ст)2 . (28.49)
4у 2р
з. п0=Д0.
После того так из уравнения (46) с граничными условиями (47) найдены двумерная зависимость (х, у), можно получить осред-
Чнс.^чный метод решения урссчекия в частных проие.аодных 383
ценные по случайным начальным значениям координат величины моментов для рассмотренных случаев начала работы систем ФАП. Осредненное по случайной начальной ошибке по фазе значение п-го момента распределения времени до срыва слежения определяется соотношением (25). Из этой формулы непосредственно следует решение задачи для случая 3. Для первых двух случаев начальных условий работы системы ФАП осредненные по случайной величине начальной расстройки по частоте значения среднего времени и стандартного отклонения времени до срыва слежения могут быть найдены по формулам
ТЛ= j г, (у)(28.50) — 1 -1
уо;= jj V Z2((/) —Zj (z/)Ps(, (y)d//. (28.51)
Злее i ФАП
' — 1, 2 для соответствхloiiiero случая начала работы системы и
У2ло< [ 2а) J
of=52Dm, (28.52)
о1 = РгОаЧ-(1-ш)2/2р. (28.53)
Из формул ('52), (53) следует, что при увеличении отношении сш кал,'шум (р -> оо) осредненные в соответствии с (50), (51) значения среднего времени и стандартного отклонения времени до срыва синхронизации будут одинаковыми для разных случаев начала работы системы ФАП. Отметим также что обычно выполняются условия 3о1 < Зо2 < 1. При выполнении этих условий с вероятностью, близкой к единице, начальное значение рассогласования по частоте находится в пределах полосы удержания системы.
Поскольку аналитическое решение уравнения (46) с граничными условиями (47) получить не удается, будем искать решение численными методами.
Численный метод решения дифференциального уравнения в частных производных эллиптического типа
Как показано выше, исследование характеристик срыва синхронизации в системах ФАП второго порядка сводится к решениюэллип-тического дифференциального уравнения в частных производных вида
А + 2S + С — + D (х, у) — + G (х, у) — = F (х, у), дх- дхду ду‘ ' дх ду
(28.54)
384
28. Срыв синхронизации в системах ФАП второго порядка
где А, В, С — постоянные известные коэффициенты; D (х, у), G (х, у) kF (х, у) — заданные функции.
Решение и (х, у) уравнения (54) должно удовлетворять граничным условиям
и (zb Pi> у) = и (я, ~Ь р2) = 0. (28.55)
Покроем область Q : {|х| Ра, |у| р2} прямоугольной сеткой
при помощи прямых
х=-И1 + //г(/ = 0,1...Л/; =
v ( 7 (28.56)
z/=- p2 + z/(i = 0, 1.Л1; М =
где h — шаг по координате х, I — шаг по координате у.
Заменим производные в уравнении (54) центральными разностными отношениями
& и ui,j+i—2uij + “i,j-i
дх2 k2 ’
и ui+l,j+l— “i-1,7+1 — Ш+1,7-1 +»i-l,/-l
дхду 4hl
д2 и _ Щ+1, 7 —2“i,; + »i-i,7
ду2 Р ’
ди _ цг,;'+1 —ди _ Ш+i — ц1-1,} /2g 57)
дх 2А ’ ду 2' '
Здесь uit j = и (—р, + jh, — р2+ И) — значение искомой функции в узле (/, /).
Подставив (57) в (54), получим разностную аппроксимацию исходного дифференциального уравнения эллиптического типа
;,7 ui+u-i + j ui+1 j-\-C3i j ui+lj+i 4- С44 j
A~C5t j Uf j + Сби ui.j+\ + i.j ui-u-i + j ui_l j 4-
+ C9;iytz;_M+1 = O;J (1 = 1,2,...,Л1—I; /=1,2,...,1V-1),
(28.58) где коэффициенты определяются соотношениями
Cl;j = — ХВ; X = ///1; C2fj = 2С + lGtj, СЗМ = ХВ; C4i(/= = 2ХМ — KlDij; C5tj = — 4№А — 4С; C6i>} = 2ХМ + + UDtj, C7i } = XB; C8G; = 2C — /Gi<y; C9tiJ = — KB-,
= WFu- (28.59)
Численный метод решения уравнения в частных производных
385
Граничные условия (55) примут вид
Hi,о = uliN =0 (i = 1, 2...........М — 1), (28.60)
uOj = uM,j = 0 (/ = 1, 2, .. , N — 1).
(28.61)
Соотношения (58) — (61) в совокупности дают неявную разностную схему решения поставленной краевой задачи (54), (55). Эта схема устойчива при любых значениях шагов h и I [44]. Априорные оценки точности разностной аппроксимации (58) дают известное [431 значение порядка О (Л2 + /2).
Обозначим вектор-столбец искомых значений в некотором £-м слое через
«м
Ui,2
(28.62)
В матричных обозначениях из соотношения (58) с учетом (60) и (62) получим
Р4Ц+1 - RiUz + ChU,-! = 5г (i = 1,2.........M - 1), (28.63)
где Pi, Qi и R| — квадратные матрицы, размером (N — 1) X X (N — 1), и вектор-столбец S4 имеют вид
Рг =
~С2гд
С1<,г
СЗгд 0
С2г 2 C3i>2
Ri =
--С5гд
-C4i,2
Cl i,x/-2 0
— C6; Д
—C5i>2
C21:n-2 Cli,7V-i
0 — C6j2
Qi =
~С8;д С7г,2
— C4Z> n-2 0
С9гд
С8г,2
— С5; jv—2
—C4i>w_1 0 C9Z 2
— C6f jv_2 — C5jjv_i_
C7f N—2 C8j N-2 о
C9jw_2
CSi,N-l -
13 Зак. 1216
386
28, Срыв синхронизации в системах ФАП второго порядка
(28.64*
Разностное уравнение (63) согласно (61) следует решать с граничными условиями
С„ = Сл< = 0.
(28.65)
Для численного решения разностного уравнения (63) с граничными условиями (65) воспользуемся известным методом матричной прогонки [971. Для этого представим искомое решение в виде
Ц-j = E,-Uf + Н; (1 = 1,2............М), (28.66*
где Е,- и Н, — некоторые матрицы и векторы.
Подставив (66) в (63) для определения матриц Е, и векторов 11(, получим рекуррентные формулы
E;+J = IR, - Q,EJ-1 Р,;
Н;+1 = [R, - QfEJ-' (QiH; - SJ (i = 1, 2........M — 1). (28.67)
Так как Ua = 0, при i = 1 из (66) имеем
Е, = Н, = 0. (28.68)
Формулы (67), (68) позволяют последовательно при i = 1, 2, ..., М — 1 вычислить матрицы Ег и векторы Н,. После того как значения матриц и векторов будут вычислены для всех значений t, по формуле (66) с учетом (65) могут быть найдены значения U( (i= = М —1, ..., 1). Вычисления по формулам (67) можно вести до тех пор, пока матрицы R, — Q,E; остаются невырожденными, что обычно имеет место на практике. Процесс решения уравнения (63) методом матричной прогонки устойчив по отношению к случайной ошибке округления при выполнении условий
II К-' Р,- || + 1| Rr1 Q; ||< 1 (i = 2,.... Л1 — 2), ||RrlPi||<l, || Rm1-, Qm-! || < 1, (28.69)
где || • || означает норму матриц.
Условия (69) также обычно выполняются. Проверку выполнения этих условий можно организовать в процессе вычислений. Отметин, что при реализации описанного алгоритма на ЦВМ необходимо организовать запоминание значений матриц Е, и векторов Н( для всех 1=1, 2, ..., М — 1.
В качестве простого примера рассмотрим численное решение описаннным методом классической краевой задачи Дирихле для уравнения Пуассона
дх? дуг
1, (28.70)
Среднее время и дисперсия времени до срыва синхронизации
387
с граничными условиями
и (± 0,5, у) = и (х, ± 0,5) = 0. (28.71)
Приближенное значение решения (70), (71) в центре квадрата, полученное описанным методом на ЦВМ «БЭСМ-4» за 2 мин при М = М = 20 (I = h = 0,05), будет и (0, 0) = 0,0735. Точное же значение решения в этой точке и (0,0) = 0,0736 [42J. Отметим, что при М = М = 10 приближенное решение и (0,0) = 0,0730 получается менее, чем за 30 секунд машинного времени.
Приведенные оценки свидетельствуют о высокой точности и эффективности метода матричной прогонки для решения краевой задачи Дирихле для уравнения в частных производных эллиптического типа.
Среднее время и дисперсия времени до срыва синхронизации в системах ФАП второго порядка
Описанный алгоритм численного решения дифференциального уравнения в частных производных был использован для вычисления среднего времени и дисперсии времени до срыва синхронизации в оптимальных и неоптимальных системах ФАП второго порядка. По формулам (59), (64) — (67) применительно к уравнению (46) с граничными условиями (47) была составлена программа для ЦВМ, которая позволяет найти безразмерные моменты zv (х, у), г2(х, у) и вычислить согласно (25), (50), (51) их усредненные по случайным начальным ошибкам по фазе и частоте значения.
При анализе срыва синхронизации в оптимальной системе ФАП второго порядка параметры р и т вычислялись согласно (20) ио заданным значениям р, Dq и Da. При этом в (46) принималось Оц,, = До = 0. Отсутствие средней расстройки частот полезного сигнала и подстраиваемого генератора приводит к тому, что в данном случае гп (х, у} = гп ( —х, —у). В качестве иллюстрации на рис. 28.4 показана двумерная зависимость среднего времени до срыва синхронизации от начальных значений координат системы при = 0, йш = 1 и р = 1. Видно, что эта зависимость имеет довольно сложный характер, особенно при начальной расстройке по частоте, близкой к полосе удержания системы.
Некоторые результаты вычислений значений среднего времени у Т (0,0) и стандартного отклонения уст (0,0) времени до срыва синхронизации в оптимальных системах ФАП второго порядка приведены в табл. 28.1—28.2. Вычисления проводились для различных коэффициентов интенсивности флуктуаций фазы йф и частоты йш полезного сигнала и при разных отношениях сигнал/шум р. В этих же таблицах даны оптимальные по критерию минимума среднего квадрата ошибки 13*
388
28. С рте синхронизации в системах ФАП второго порядка
Таблица 28.1
Параметр Значение параметра при ^(i)= 1 °
Р=1 2 4 6 8 10
р 0,5 0,3536 0,25 0,2041 0,1767 0,1581
tn 0,618 0,559 0,5 0,4666 0,4435 0,426
7 7 (0,0) 3,048 12,42 56,61 144,5 343,0 776,1
70(0,0) 2,672 11,67 55,58 143,5 342,0 775,1
7Т(0) 2,319 9,941 48,66 127,3 306,7 701,3
7 0(0) 2,587 11,50 55,12 142,6 340,2 771,5
7Т1 1,909 9,360 47,93 126,1 304,3 696,4
7 Тг 1,798 9,038 47,42 125,4 302,8 693,2
7 0, 2,490 11,38 55,02 142,4 339,9 771,0
7О2 2,456 11,31 54,95 142,3 339,7 770,7
значения параметров системы ФАП, вычисленные по формулам (20), и осредненные в соответствии с (25), (50), (51) значения среднего времени и стандартного отклонения времени до срыва синхронизации уТ (0), уа (0), у TY у Т2, yult уо 2. На рис. 28.5, 28.6 показаны зависимости среднего времени до срыва синхронизации уТ (0,0) от отношения сигнал/шум при различных значениях Dy и Dm. Из данных таблиц 28.1, 28.2 и кривых на рис. 28.5, 28.6 следует, что при увеличении интенсивности фазовых или частотных флуктуаций среднее время до срыва синхронизации в оптимальных системах ФАП второго порядка уменьшается. При отношениях сигнал/шум р 5 зависимость среднего времени до срыва
Таблица 28.2
Значение параметра при
р=| 2 1 < 1 6 8 10
Р 0,3536 0,25 0,1768 0,1443 0,125 0,1118
m 0,5586 0,5 0,4435 0,4120 0,3904 0,3741
у г (0,0) 2,508 7,464 20,44 42,69 84,58 162,3
7 а(0,0) 2,153 6,853 19,70 41,92 83,79 161,5
у 7(0) 1,866 5,898 17,21 36,87 74,29 144,3
7 а (°) 2,095 6,764 19,53 41,60 83,24 160,6
7 71 1,532 5,527 16,84 36,30 73,35 142,8
7 72 1,415 5,272 16,55 35,88 72,64 141,5
7 °1 2,011 6,687 19,47 41,52 83,12 160,4
702 1,973 6,628 19,42 41,46 83,03 160,2
Среднее время и дисперсия времени до срыва синхронизации
389
синхронизации для рассмотренных интервалов изменения и Da может быть аппроксимирована простой эмпирической формулой, так как в логарифмическом масштабе она имеет характер, близкий к линейному. Таким образом, пороговое отношение сигнал/шум,
ниже которого среднее время до резко убывать, можно принять равным р = 5.
Отметим, что согласно [123] это значение отношения сигнал/ шум совпадает с оценкой границы применимости метода гауссовой аппроксимации для сигнала с фазовой модуляцией. Этот результат служит качественным подтверждением вывода о том, что наблюдаемые отклонения апостериорного распределения от гауссового объясняются срывом слежения за фазой полезного сигнала.
Зависимость от отношения сигнал/шум стандартного отклонения времени до срыва синхронизации и осредненных значений моментов носит аналогичный характер. Осреднение по случайным начальным ошибкам по фазе и расстройкам по частоте приводит к заметному ухудшению характеристик срыва выполняются соотношения
срыва синхронизации начинает
Рис. 2S.4. Зависимость среднего времени до срыва сиихроиизацни в оптимальной системе ФАП второго порядка от начальных координат.
синхронизации. При этом обычно
Т (0,0) > Т (0) > 7\ > Т2,
о (0,0) > ст (0) >ст! > ст2. (28.72)
Для отношений сигнал/шум р 5 при Da 9 и 1
с достаточной для практики степенью точности выполняется равенство среднего времени у Т (0, 0) и стандартного отклонения у ст (0,0) времени до срыва синхронизации в оптимальных системах ФАП второго порядка. С учетом асимптотических оценок [80, 124, 125] это означает, что при таких отношениях сигнал/шум вероятность срыва синхронизации в течение заданного времени, если в начальный момент система находилась в состоянии <р0 = Йо =» 0, может быть найдена по формуле
Р (/) = 1 — ехр \~t!T (0,0)].
(28.73)
:®о
28. Срыв синхронизации в системах ФАП второго порядка
На рис. 28.7 показаны зависимости уТ (0,0), уТ (0) и у7\ от отношения сигнал/щум р при = 100 и = 0. Анализ кривых, представленных на рис. 28.5, 28.7, и данных табл. 28.1 — 28.2 показывает, что при увеличении интенсивности флуктуаций частоты полезного сигнала значение отношения сигнал/шум, при
Рис. 28.5. Влияние интенсивности флуктуаций частоты на среднее время до срыва синхронизации в оптимальной системе ФАП.
Рис. 28.0. Влияние интенсивности флуктуации фалы на среднее время до срыва синхронизации в оптимальной системе ФАП.
котором Т (0,0)о (0,0), увеличивается. С инженерной точностью (6 5%) это равенство выполняется для 9 < Da 25 при р 10
и для 25 <ZDa 100 при р > 20. На рис. 28.8 приведены нормированные к максимальному значению кривые зависимости среднего времени до срыва синхронизации, осредненного в соответствии с (25) по случайным начальным значениям ошибки по фазе, от начальной расстройки по частоте при Da = 100 и £>ц, = 0. По виду этих кривых может быть определена полоса захвата оптимальной системы ФАП второго порядка по критерию среднего времени до срыва синхронизации. При увеличении интенсивности флуктуаций частоты полезного сигнала полоса захвата оптимальной системы ФАП уменьшается. Это означает, что для обеспечения требуемой надежности
Среднее время tr дисперсия времени до срыва синхронизации
391
Таблица 28.3
Параметр Значение параметра при Dw==l. Лв/Л=0, М»=0.25
Р—1 2 | 1 ! в 8 10
<у Т (0,0) 3,148 9,044 33,12 78,05 145,4 233,6
у о (0,0) 2,636 8,163 31,86 76,60 143,8 232,0
ТТ(0) 2,226 6,958 27,59 67,25 127,5 207,2
уо(0) 2,528 8,013 31,52 75,98 142,9 230,6
yi\ 2,137 6,728 26,85 65,65 124,7 202,7
У Т2 1,687 6,048 25,74 64,08 122,7 200,2
уа{ 2,507 7,965 31,40 75,76 142,5 230,1
уа2 2,378 7,804 31,19 75,51 142,2 229,7
Таблица 28.4
Параметр Значение параметра при 0^=1, ^=0,4, ДиМ=0, р=/п=0,25
2 4 6 8 10
Y Т(0,0) 2,974 7,958 24,94 50,88 83,80 121,4
у а (0,0) 2,478 7,126 23,77 49,55 82,37 119,9
у7'(0) 2,102 6,072 20,41 42,91 71,80 105,0
Y«(0) 2,381 6,992 23,48 49,05 81,64 118,9
У Л 2,019 5,873 19,87 41,90 70,22 102,8
у т2 1,594 5,281 19,05 40,90 69,08 101,5
У 01 2,360 6,950 23,38 48,90 81,42 118,6
Y о2 2,240 6,809 23,23 48,72 81,23 И 8’,'4
Таблица 28.5
Параметр Знач.чпк и >. aMt'ipa при
Д„/Д= 0.25, 0=/и=-О,25
4 6 8 10
у7'(О,0) 3,118 8,745 29,02 61,56 105,0 157,9
у а (0,0) 2.622 7,906 27,84 60,32 104,3 189,9
У 7(0) 2,215 6,741 24,26 53,46 93,61 143,5
у о (0) 2,508 7,747 27,54 59,87 103,7 182,5
у7( 1,973 6,060 22,05 48,92 85,97 132,1
у 7'2 1,577 5,426 20,94 47,34 83,96 129,7
Y 2,447 7,592 27,14 59,14 102,6 176,6
у «2 2,319 7,413 26,88 58,81 102,2 175,4
392
28. Срыв синхронизации в системах ФАП второго порядка
Рис. 28.7. Среднее время до срыва скнхроннзацнн в оптимальной системе ФАП.
связи оптимальные приемники в ряде случаев должны включать специальные устройства поиска по частоте.
При анализе срыва синхронизации в неоптимальной системе ФАП второго порядка среднее время и стандартное отклонение времени до срыва синхронизации вычислялось при заданных значениях Р, tn, D(i), Dy для различных отношений сигнал/шум. При этом, так как согласно (46) характеристики срыва синхронизации зависят только от суммарной интенсивности собственных флуктуаций фазы генераторов, значение D^, можно отдельно не рассматривать.
Некоторые результаты расчетов среднего времени и стандартного отклонения времени до срыва синхронизации в типовых системах ФАП второго порядка и их осредненные в соответствии с различными условиями начала работы системы ФАП значения представлены в табл. 28.3 — 28.5. На рис. 28.9, 28.10 показаны зависимости среднего времени у Г (0,0) от отношения сигнал/шум р при отсутствии средней расстройки генераторов по частоте (До =0)для различных значений фазовых и частотных флуктуаций иИш. Значения Р и tn в соответствии с (43), (44) принимались равными Р = ш =0,25. Из приведенных таблиц и графиков следует, что при увеличении интенсивности флуктуаций фазы и частоты среднее время и дисперсия времени до срыва синхронизации в системах ФАП второго порядка уменьшается. По сравнению с оптимальными системами ФАП в данном случае зависимость среднего времени до срыва синхронизации для рассмотренных интервалов изменения и D(:, может быть аппроксимирована простой эмпирической формулой с меньшей точностью и при более высоких отношениях сигнал/шум. При этом следует иметь в виду, что эти формулы будут применимы лишь до некоторых определенных значений отношения сигнал/шум, поскольку, как это следует из результатов п. 2, моменты распределения времени до срыва синхронизации при р -> оо в данном случае конечны.
Наличие средней расстройки частот полезного сигнала и подстраиваемого генератора приводит к тому, что Т (х, у)^= Т (—х, — у). В качестве иллюстрации на рис. 28.11 (Ао = 0) и 28.12 (Ао/А =
Среднее время и дисперсия времени до срыва синхронизации
393
==0,75) представлены двумерные зависимости среднего времени до срыва синхронизации от начальных значений координат системы при = 0, Da — р — \,$ = т = 0,25. Видно, что наличие средней расстройки частот приводит как к общему уменьшению значения среднего времени до срыва синхронизации, так и к заметной
деформации двумерной поверхности, что еще больше усложняет возможность ее аналитической аппроксимации. На рис. 28.13 построены графики зависимости среднего времени до срыва синхронизации из начального состояния <р0 = Qo = 0 от отношения сигнал/шум при = 0, Da = 1, р = т — 0,25 для различных средних расстроек по частоте. Из приведенных кривых следует, что возрастание средней расстройки частот полезного сигнала и подстраиваемого генератора приводит к значительному ухудшению характеристик срыва синхронизации.
Зависимость среднего времени до срыва синхронизации от значения параметра т пропорционально интегрирующего фильтра при = До/Д = 0, Da = 1, р = 0,25 для различных отношений сигнал/шум характеризуют кривые на рис. 28.14. Из анализа приведенных кривых следует, что при заданных интенсивностях флуктуаций фазы и частоты полезного сигнала и фиксированном параметре Р для каждого значения отношения сигнал/шум существует
394
28. Срыв синхронизации в системах ФАП второго порядка
оптимальное значение параметра фильтра, при котором среднее время до срыва синхронизации максимально. Это значение параметра m в общем случае не совпадает с (20) или (43), что объясняется другими критериями оптимизации, использованными при выводе этих формул.
Рнс. 28.9. Среднее время до срыва синхро- Рис. 28.10. Влияние интенсивности флук-низании в системе ФАП с пропорциональ- туаций частоты сигнала,
но интегрирующим фильтром.
Увеличение интенсивности флуктуаций частоты полезного сигнала при неизменных значениях остальных параметров приводит к тому, что среднее время до срыва синхронизации становится очень мало и не может быть увеличено за счет повышения отношения сигнал/шум. На рис. 28.15 показаны зависимости среднего времени до срыва синхронизации от отношения сигнал/шум при Da = 100, Ао — Dy = 0, tn — 0,25 для разных значений отношения ширины спектра флуктуаций частоты к полосе удержания системы ФАП. Из анализа приведенных кривых следует, что при сильных флуктуациях частоты полезного сигнала для обеспечения заданных характеристик срыва синхронизации необходимо уменьшать параметр | (увеличивать полосу удержания системы). Это, в свою очередь, приводит к уменьшению полосы захвата системы ФАП.
Среднее время и дисперсия времени до срыва синхронизации
395
Анализ зависимостей среднего времени до срыва синхронизации в типовых системах ФАП второго порядка от отношения сигнал/шум (рис. 28.9, 28.10, 28.13 и 28.15) при различных значениях параметров системы и интенсивностей флуктуаций фазы и частоты позволяет сделать вывод, что пороговые значения отношения сигнал/шум
Рнс, 28.11. Зависимость среднего времени до срыва синхронизации в отсутствие средней расстройки по частоте.
Рнс. 28.12. Зависимость среднего времени до срыва синхронизации от начальных координат системы при наличии средней расстройки по частоте.
для рассмотренных случаев лежат в пределах 2 С/ р С/ 10. Особенно наглядно пороговый характер этой зависимости выражен на рис. 28.15.
На получение результатов, приведенных в одной из табл. 28.1 — 28.5, затрачивалось около 20 мин машинного времени ЦВМ «БЭСМ-4». При расчетах полагалось У = М = 20 (h = l = 0,1), что обеспечивало точность вычислений до трех значащих цифр, Контроль точности вычислений проводился путем расчетов при меньших значениях шагов (до h = I — 0,05). Отметим, что точность вычислений ухудшалась по мере увеличения отношения сигнал/шум и интенсивности флуктуаций фазы и частоты полезного сигнала. Ухудшение точности вычислений по мере увеличения отношения сигнал/шум объясняется тем, что среднее время до срыва синхронизации с ростом отношения сигнал/шум начинает превышать время
396
28.Срыв синхронизации в системах ФАП второго порядка
ГТ(0,0)
Рнс. 28.13. Влияние расстройки по частоте на характеристики синхронизации.
Рнс. 28.14. Зависимость среднего времени до срыва синхронизации от параметра m пропорционально интегрирующего фильтра.
Рис. 28.15. Влияние отношения полосы удержания системы ФАП к ширине спектра флуктуаций частоты на характеристики синхронизации.
В ' 20. ,40 00 р/
Среднее время и дисперсия времени до срыва синхронизации
397
переходных процессов. Это, в свою очередь, приводит к тому, что среднее время до срыва синхронизации все меньше зависит от начальных значений координат системы, т. е. функция 7\ (ф0, Qo) становится постоянной почти во всей области (ф0, й0), резко изменяясь на ее границе. Аналогичные эффекты имеют место и при увеличении интенсивности флуктуаций полезного сигнала (см., например, рис. 28.8). Чтобы и в этих случаях получить приемлемую точность вычислений, необходимо уменьшать значение шагов h и /, т. е. увеличивать расходы машинного времени. Особенно резко время вычислений возрастает при уменьшении шага h, что связано с увеличением размеров обращаемых матриц. Например, при контрольных расчетах со значениями шагов h = I = 0,05 затраты машинного времени вычисления среднего и дисперсии времени до срыва синхронизации для заданного отношения сигнал/шум составляли около 40 мин.
В тех случаях, когда затраты машинного времени не позволяют получить точного решения уравнений (17), (46), оценка среднего времени до срыва синхронизации в системах ФАП второго порядка может быть найдена известными приближенными методами [80, 102], справедливыми при достаточно больших отношениях сигнал/шум. Следует иметь в виду, что эти методы не учитывают возможности потери слежения за частотой полезного сигнала в рассматриваемых системах ФАП и их применение до сих пор ограничивалось случаями отсутствия флуктуаций фазы и частоты генераторов.
29. Общие сведения о случайных точечных процессах
Во многих областях естественных наук, в технике и экономике часто возникают задачи, требующие статистического описания последовательности событий, возникающих в отдельных точках пространства или в отдельные моменты времени. В простейшем одномерном случае последовательность случайных событий, происходящих во времени, можно характеризовать случайными моментами времени их появления tlf t2, t3, ..., на временной оси /. Такую последовательность событий часто называют случайным потоком (или просто потоком). Геометрически случайный поток можно изобразить в виде случайно следующих друг за другом точек на оси времени (рис. 29.1, а). Случайный поток можно также назвать случайным точечным процессом, так как реализации такого процесса представляют собой случайную последовательность точек.
Укажем несколько конкретных примеров.
398
29. Общие сведения о случайных точечных процессах
1. Пусть имеется дифференцируемый случайный процесс £(/), и
нас интересуют пересечения этого процесса снизу вверх с горизонтальной прямой на уровне с (рис. 29.2). Последовательность таких точек пересечения на оси времени будет представлять собой случайный точечный процесс.
2. Известно, что при работе электронных ламп электроны вылетают из нагретого катода в случайные моменты, что является одной из главных причин наличия дробового шума анодного тока. После-
довательность моментов вылета различных электронов из катода есть случайный точечный процесс.
- . X -X---------------И-----X--»
О tl tl t} tn tn^i t
Рис. 29.1. Случайный точечный процесс.
Рис. 29.2. Пересечения случайного процесса с горизонтальной прямой.
3. Будем фиксировать моменты отказов разных элементов какого-либо сложного устройства (например, ЦВМ), содержащего много элементов. Тогда получим поток отказов, являющийся случайным точечным процессом.
4. Последовательность заявок (посетителей, неисправных приборов и т. д.), поступающих в ремонтные мастерские на обслуживание, есть также случайный точечный процесс.
Выше приведены простейшие примеры точечных процессов, когда каждое событие определялось указанием лишь одной координаты— момента времени появления. Конечно, в конкретных задачах обычно встречается более сложная ситуация. Например, при рассмотрении дробового шума важно знать импульс тока, наводимого вылетевшим электроном на аноде; он зависит от случайной начальной скорости электрона. При анализе случайного потока в виде прямоугольных импульсов, помимо начала появления, нужно также знать его длительность и высоту. При изучении потока грозовых разрядов или землетрясений, помимо указания момента начала грозового разряда или землетрясения, важно знать продолжительность и пространственные координаты (высоту, широту и долготу). В этом направлении возможны различные обобщения случайных точечных процессе з.
Рассмотрим одномерный случайный поток в виде неразличимых точек на оси времени (рис. 29.1, а). Обозначим через N (t) случайное число событий (точек), появляющихся в полуинтервале (0, /].)
Одномерный случайный поток
399
Значения N (t) изменяются на целое число только в моменты времени i = 1, 2, 3, ... Поэтому N (/) можно рассматривать как случайный процессе дискретным временем. Очевидно, что реализациями случайного процесса N (/) являются целочисленные, неотрицательные и неубывающие ступенчатые функции вида, приведенного на рис. 29.1, б. Для таких процессов во многих случаях оказываются применимыми многие результаты теории дискретных случайных процессов с непрерывным временем (см. § 6).
Укажем, что многие важные результаты в теории случайных точечных процессов принадлежат советским ученым А. Я Хинчи-ну [126] и Ю. К. Беляеву (см. дополнение к переводу книги [127]).
В последующем ограничимся изучением в основном целочисленных и ординарных точечных процессов.
Случайный процесс У (Z), определенный на полубесконечном интервале 0 < / < + оо, называется целочисленным, если N (/) может принимать только целочисленные неотрицательные значения, причем положим
У (0) = 0. (29.1)
Случайный процесс У (Z) называется ординарным, если вероятность наступления более одного события на любом малом интервале времени А/ есть величина более высокого порядка малости, чем А/:
Р {N (t + А/) - У (/) > 1} = о (А/). (29.2)
Иначе говоря, ординарный поток есть поток относительно редких событий; в нем практически исключается тесная группировка или совпадение событий (наложение точек).
Можно указать два тесно связанных между собой метода описания случайных точечных процессов [8, 128] Первый из них базируется на рассмотрении целочисленного случайного процесса У (/) (рис. 29. 1, б), а второй — на анализе случайной последовательности точек во времени (рис. 29.1, а).
Случайный точечный процесс можно описывать вероятностями
Pk (nlt 1,; ...; nk, Xft) = P {я, < It.nft < (29.3)
совместного наличия nt точек левее i = 1, k. Очевидно, что эти вероятности неотрицательны, удовлетворяют условию
Ph (пг, 1,; ...; nh, Хй) Ф 0, (29.4)
только если п2 ... nh при Xj <1 Х2 <7 ••• "С и нормированы
£ PA(n1,X1;...;nft,M=l. (29.5)
nU П9» • • ?i О
400
29. Общие сведения о случайных точечных процессах
Вместо вероятностей Рк можно пользоваться вероятностями выпадения точек на отдельных полуинтервалах at <Z t bp.
m (at, bj] = M (bi) — N (at), bt > at. (29.6)
Введем вероятность
Pk (mlt alt bp, m2, a2, b2; ...; tnk, ak, bh) =
= P {tn (at, bt) = mt, i = ТД} (29.7)
совместного выпадения пгъ ..., mk точек в полуинтервалах («i, bj, ..., (ak, Ьк].
Между вероятностями Рк и рк существует очевидная связь. Если полуинтервалы (at, bil, i — 1,2.....k расположены последо-
вательно (ах <Z bx a2 < b2 ... ak <Z Ьк), to
a^br, ...;mk,ah,bk)= 2 ni+
Л1 Яд
+ mu 6X;...; nh, ak; nh + mh, bh). (29.8)
Если же полуинтервалы примыкают друг к другу, то
Pk ('«г. alt bp, ...;пгк, ah, bk) =
I k \
= 2*\+i("o, Q1> По + лчЛ; ••••>«0 + 2 . (29.9)
"• \ i= 1 /
где ht — bt = ai+l, i = 1, 2, ..., k.
Если число точек n0, выпавших до начала первого полуинтервала фиксировано, то вероятности Pft+X(no, ах; п0 + тх, Хх; ...
k
...’, и0 + 2 mt> ^h) можно выразить через pk (mlt alt m2, Хх, h2,...\ mh, Кй_ь X^/a если точками, выпавшими до не интересоваться вообще, то указанные два способа описания точечных процессов можно считать эквивалентными.
Вероятности ph (my, аъ b^, пг2, а2, Ь2, ...; пгк, ак, Ьк) позволяют определить два важных частных вида случайных точечных процессов: стационарных процессов и процессов с независимыми приращениями (значениями).
Стационарным точечным процессом называется случайный поток точек, для которых вероятности рк с произвольным индексом k не изменяются при сдвиге всех полуинтервалов (at, bt], i = 1, 2..k,
по оси времени t на произвольную величину А:
Pk (tnt, alt bi, tn2, a2, b2, ...; mk, ak, bk) = pk (mi, ax + A, + A; m2, a2 + A, b2 + A; ...; tnk, ak + A, bk + A). (29.10)
Одномерный случайный поток
401
В частности, для стационарного точечного процесса должно выполняться равенство
Pi (tn, a, b) = Pi (tn, а + A, b + А).
Полагая здесь А = — а и обозначая т = b — а, можем написать
Pi (m, a, b) = р (tn, т). (29.11)
Это выражение показывает, что в стационарном точечном процессе вероятность наступления некоторого числа событий в течение заданного отрезка времени т зависит только от величины этого отре|-ка, а не от его расположения на оси времени.
Случайный точечный процесс, для которого при неперекрываю-щихся полуинтервалах времени (ait Ь(], i = 1, k, выполняется соотношение
k
pk (tnlt ch, bi\ tn2, a2, b2; tnh, ah, bh) = П (mb ait bt), (29.12) i=l
называется процессом с независимыми приращениями (значениями). Равенство (12) выражает тот факт, что вероятность наступления со бытий в полуинтервале (at, btl не зависит от того, сколько раз и как появлялись события вне этого полуинтервала. Поэтому условная, вероятность появления тг событий на полуинтервале (a,, bt] при любом предположении о наступлении событий до at совпадает с безусловной вероятностью. В связи с этим иногда, вместо независимости приращений, говорят об отсутствии последействия, отождествляя эти два термина.
Из сказанного следует, что полное статистическое описание ординарного точечного процесса с независимыми приращениями достигается заданием вероятности рА (гщ, ait bi), Если в дополнение к этому процесс является и стационарным, то для статистического описания процесса достаточно указать вероятность р (т^, bt — сц).
Случайный точечный процесс, удовлетворяющий трем условиям: ординарности, стационарности и независимости приращений, называется простейшим или пуассоновским процессом (см. § 30). Он играет фундаментальную роль в теории случайных точечных процессов и является основополагающим для формирования ряда других, более сложным точечных процессов.
Рассмотрим второй метод описания случайных точечных процессов, базирующийся на изучении различных случайных величин, характеризующих расположение точек на оси времени. Предварительно введем два определения, которые потребуются в дальнейшем. Прямым временем возвращения т+(/') называется величина отрезка времени от некоторого момента времени /' до момента появления первого события после /' (расстояние от /' до первой точки справа — рис. 29.3). Применительно к теории надежности величину
4р2
29. Общие сведения о случайных точечных процессах
т+ можно назвать остаточным временем жизни, так как т+ является оставшимся сроком службы элемента, используемого в момент времени f. Обратным временем возвращения т~ называется длительность временного интервала от момента появления последнего события до f (расстояние от С до первой точки слева — рис. 29.3). Если до момента f не было точек, то по определению время т~ принимается равным В терминах теории надежности т~ является возрастом элемента, используемого в момент
Рис. 29.3- К определению прямого <+ н обратного г- времен возвращения.
Пусть правее начала отсчета времени 4, принимаемого за нуль, выпали точки с координатами 4» 4. ..., t„, ... Введем интервалы между соседними точками
т4 = tt — t “ 1, 2, 3, .... (29.13)
являющиеся неотрицательными случайными величинами. При произвольно выбранном начале отсчета времени интервал Т] = = 4 — т+ (t0) есть прямое время возвращения. Если с вероятностью единица число точек потока, выпавших на конечном интервале, конечно, то поток можно считать заданным, когда заданы n-мерные плотности вероятностей i|jb (ть т2, ..., тп), так что выражение грп (тъ т2, .... тп) </т1 ... dxn с точностью до величии высшего порядка малости по равно совместнымвероятностям нахождения тг в интервалах (т,-, + dxt) при i = 1, п; п « 1, 2, ...
Вместо плотностей вероятностей фв (tj, .... тв) можно указывать плотности вероятностей 'FB (4, 4. •••, tn), я == 1, 2, 3, ..., характеризующие случайные координаты точек, выпавших правее начала координат.
Между плотностями вероятностей фв н 44 имеются очевидные соотношения:
%, (4. 4. •••» tn) ~ 'I’n (4, 4 4, •••» 4 4-i). (29.14)
Фп (Т1, Т2, ..., тв) = Тв (ть Tj 4- т2, ..., Tj + тя + ... + т„).
Отметим, что выражения для плотностей вероятностей и 44 даже в случае стационарного точечного процесса вообще говоря будут различными, когда начало отсчета времени выбрано произвольно и когда за начало отсчета взята какая-либо из выпавших точек (см. с. 413).
Выше указывалось, что оба метода описания случайных точечных процессов (при помощи целочисленного случайного процесса N (t)
Одномерный случайный поток
403
и последовательности случайных величин хь i = 1, 2, 3, ...) тесно связаны между собой (129]. Действительно, если N (t) есть число точек, выпавших в полуинтервале (0, /], т. е. до t включительно, и ti —координата i-й из выпавших точек (/j < t2 < ... < tt <Z ...), то Л/ (/) = 0 тогда и только тогда, когда Xj = х+ > I, и N (t) <Z п тогда и только тогда, когда xt -f- т2 -f- ... + xn > t. Поэтому
P {N (t) = 0} = P {x, > /}, (29.15)
P {N (/) < n} = P (Xj + x2 + ... + xn > /},
n = 1, 2, 3, ...
Следовательно, если известно распределение целочисленного случайного процесса N (/), то теоретически можно найти одномерные и многомерные плотности вероятностей случайных величин <1, т2> тз, и наоборот.
Укажем, что можно предложить и другие методы описания случайных точечных процессов [2], преимущество которых состоит в том, что они применимы как к одномерным, так и многомерным процессам. Однако в дальнейшем они нам не потребуются.
В некоторых практических задачах полное описание случайного точечного процесса при помощи совместных вероятностей (3), (7) или многомерных плотностей вероятностей (14) может быть заменено более грубым, но зато и более простым указанием одномерных вероятностей, а также отдельных параметров (числовых характеристик) процесса. Во многих случаях необходимость такого упрощенного описания диктуется также возможностями экспериментальных исследований и проверок. Часто бывает очень сложно, а иногда и практически невозможно получить экспериментальным путем многомерные вероятности, и поэтому ограничиваются определением лишь некоторых интересующих параметров.
На пути упрощенного статистического описания случайных точечных процессов имеются разнообразные возможности [6, 127, 130]. Перечислим здесь те характеристики, которые будут изучаться в дальнейшем:
1. Математическое ожидание числа событий Н = < N (/) > в полуинтервале (0, /] и высшие моменты Л/ (/) (в частности, дисперсия).
2. Плотность событий v (t), определяемая формулой
|jm (29.16)
Л-.0+ д/ dt
3. Распределение времени /Л, при котором произойдет k-e событие.
4. Распределения прямого х+ и обратного х- времени возвращения.
404
30. Пуассоновские процессы
В дальнейшем мы рассмотрим сначала простейший, пуассоновский точечный процесс, а затем его обобщения в виде процессов восстановления.
30. Пуассоновские процессы
Характеристики простого пуассоновского процесса
Рассмотрим более подробно, чем в § 29, простейший или, иначе, пуассоновский процесс точечных событий на оси времени (рис. 29.1, а) и некоторые его обобщения.
Целочисленный пуассоновский точечный процесс {N (/), 0 t <Z 4* оо) определяется тремя свойствами [126].
1. Он ординарен, т. е. вероятность наступления более одного события на любом малом интервале времени А/ имеет более высокий порядок малости, чем А/. Поэтому для него выполняются соотношения
Р {N (t + А/) — N (/) = 1} = P{N (А/) = 1} =
= vA/ + о (kt), (30.1)
Р {N (t + А/) — N (t) > 1} =
= Р {W (А/) > 1} = о (АО, (30.2)
где v — некоторая положительная величина, имеющая размерность, обратную времени. Физический смысл ее выяснится позже. Следствием этих двух соотношений является равенство
Р {N (t + ДО — /V (0 = 0} = Р {W (ДО = 0) =
= 1 — vAZ + о (kt). (30.3)
2. Процесс стационарен, т. е. его статистические характеристики не изменяются при сдвиге всех точек вдоль оси времени на произвольную, но одну и ту же величину А.
3. Он имеет независимые приращения (значения) на неперекры-вающихся интервалах времени (отсутствие последействия).
Отметим, что согласно определению (29.2) для целочисленного процесса М (0 принимается
АГ (0) = 0. (30.4)
В предыдущем параграфе указывалось, что полное статистическое описание целочисленного процесса AZ (Z), удовлетворяющего трем перечисленным свойствам, достигается заданием вероятностей
Характеристики простого пуассоновского процесса
405
р (k, т) наличия k точек в интервале длительностью т. Введем для этой вероятности другое обозначение
Ph (т) = р (k, т) (30.5)
и получим для нее аналитическое выражение.
Пусть N (t) есть случайное число точек (событий) в полуинтервале (0, Л. Тогда на основании теорем сложения и умножения вероятностей для А/ > 0 можем написать
Pk(t + &t) = P{N(t + M) = k} = P{N(t) = k,N(bt) = Q} + k
+ Р{М (/) = *-!,М(Д/) = 1} + 2 P{N(t) = k—i, N(\t) = i} = > 2
= Р{М(0 = *}Р{М(Д/)=0|М(0=*}4-Р{М(0 = k
= k— l}P{N(bt) = l\N(t) = k—1}+ 2 P{^(t)-
=k—i} P {N (Д0 = i IN (t) ^k-i}=Ph (t) P {N (AZ) = 01 M (0 = k} + k
+ Ph-1(t)P{N(^ = l\N(t)=k-l}+ 2 Pft-<(0/’{^(A0 = Z>2
= /|М(П=*—/}. (30.6)
Соотношение (6) справедливо для любого точечного процесса. Третье специальное свойство пуассоновского процесса (независимость приращений) позволяет в выражении (6) заменить условные вероятности на безусловные:
Р {N (М) = i\N (t) = k — i} = Р {N (А/) = i},i = ОД-Полагая в выражении (6) интервал А/ достаточно малым и пользуясь свойствами рассматриваемого процесса (1) — (3), можем написать Pft (/ + AZ) = Pft (0 (1 - vAO + vPh_x (0 А/ + о (ДО. (30.7) Переходя здесь к пределу при А/ -> 0, для вероятностей Pft (0 получим дифференциальное уравнение
^-Pft(0+vPft(0 = vPft_1(0, * = 0,1,2,... (30.8)
at
В уравнении, соответствующем k = 0, нужно полагать Р_х (0 = 0. Дифференциальные уравнения (8) должны решаться при физически очевидных начальных условиях
Ро (0) = 1, Р* (0) = 0, k = 1, 2, 3, ... (30.9)
Решение линейных дифференциальных уравнений первого порядка с постоянными коэффициентами (8) можно получить несколькими методами. Можно, например, находить решения последователь
406
30. Пуассоновские процессы
но, начав с k = 0, а затем для k = 1, k = 2. и т. д. Так, полагая k — 0, получим
Р„ (/) = e~v', t > 0. (30.10)
Подставив этот результат в уравнение (8) при k = 1, получим
Pj (f) = vte-”, / > 0. (30.11)
Проделав последующие вычисления, придем к окончательной формуле, получившей название закона Пуассона,
= e-v', k = 0,1,2,... (30.12)
kt
Из формулы (101 следует, что вероятность отсутствия точки на малом интервале времени А/ (удовлетворяющем условию v А/-<;!) приближенно равна
?0(A/)« 1—vAz + yv2(A/)2...,
что согласуется со свойством закона Пуассона (3). Аналогично, из (11) получаем
?! (А/) = vAZ— т2 (AZ)2 Ц--^- v3 (А;1)3—..., vAZ 1.
Этот результат совпадает с (1). Кроме этого, отсюда следует, что
v = lim . (30.13)
М -» о Az
Закон Пуассона можно получить более коротким путем при помощи производящей функции вероятностей (см. Приложение 11)
ОО
G(z,/)=2 Pft(Z)A (30.14)
k=0
Умножим обе части уравнения (8) на zk и затем просуммируем их по k от 0 до оо. Тогда с учетом тождества ?_х (/) = 0 получим
оо оо оо
2 Pft (0 = - V 2 г* ?й (/) + V 2 ** ?д-1 (О k = 0 fe = 0
или
^-G(z,/)= — vG(z, 0 + vzG(z,0- (30.15)
При ж>бом фиксированном г это есть линейное дифференциальное уравнение первого порядка. Начальное условие для него следует из (9) и (14):
G (г, 0) = 1.
(30.16)
Характеристики простого пуассоновского процесса
407
Решение уравнения (15) имеет вид
G (г, I) = А (г) ехр (—vt + vtz).
Из начального условия (16) находим произвольную «постоянную» А (г) = 1. Следовательно,
G {z, t) — ехр (—vt) ехр (v/z). (30.17)
Раскладывая второй экспоненциальный сомножитель в правой части в степенной ряд, имеем
G(z,/) = e-v -^7-г*- (30.18) ft=0
Приравняв почленно правые части выражений (14) и (18), придем к закону Пуассона (12).
Ради краткости последующих математических записей обозначим
Рис. 30.1. Закии Пуассона.
к = vt (30.19)
и запишем закон Пуассона в следующем виде
ift
pft(X) = —k = 0,1,2,... (30.20)
k\
Графики закона Пуассона для нескольких значений безразмерного параметра X приведены на рис. 30.1. Если к < 1, то рк (к) имеет наибольшее значение при k = 0. При Х> 1, но не равном целому числу, pJ( (X) имеет наибольшее значение при k = 1X1; если же X есть целое число, то наибольшее значение будет при k = X и k = X — I. Известно, что при X -+ оо закон Пуассона стремится к нормальной плотности вероятности.
Нетрудно проверить, что для закона Пуассона справедливы следующие функциональные соотношения
kph (X) = Xpt_, (X), k\ph (X) - X"ptt(X). (ЗО.2П
Начальные моменты закона Пуассона
М,
S k'P^
ft = 0
(30.22)
равны
Mt = X, = X + X2, М9 = X + 3 Хг + Xs, = X + 7Х2 + 6Х3 + X4. (30.23)
408
30. Пуассоновские процессы.
Другие моменты более высокого порядка можно вычислить, пользуясь одной из двух рекуррентных формул
Мп+1 = Шп + X тп = К V { Mn_j. (30.24) Л /То V/ /
Центральные моменты
оо тг= k = 0 равны
т2 — о2 = К, т3 = X, т4 = X + 3V. (30.25)
Высшие центральные моменты закона Пуассона могут быть подсчитаны по рекуррентной формуле
mn+1 = Xnmn_i + X-A- тп. (30.26)
ал.
Все кумулянты (семиинварианты) закона Пуассона равны X. Много других конкретных сведений о законе Пуассона содержится в [131].
Из (23) и (25) следует, что для рассматриваемого закона Пуассона математическое ожидание и дисперсия равны друг другу
= о2 = Z. = vt. (30.27)
Оказывается [131], что среди всех экспоненциальных плотностей вероятностей вида а (х) ехр (Ах )/Ь (Л) только для закона Пуассона (для которого а (х) = 1/х!, b (Л) = ехр (еЛ), Л — In X) имеет место равенство (27). Поскольку математическое ожидание Мг определяет среднее число точек, выпавших в полуинтервале (0, /], то параметр
v = MJt (30.28)
можно трактовать как среднее число точек, приходящихся на единичный интервал времени. Поэтому v часто называют интенсивностью процесса.
Изучим теперь статистические характеристики временных интервалов между различными точками. Сначала найдем функцию распределения времени появления /г-й точки
= (30.29)
Рассмотрим типовую реализацию рассматриваемого целочисленного процесса N (/), изображенную на рис. 30.2. Из рассмотрения рисунка можно прийти к заключению, что существует однозначное соответствие между значениями целочисленного процесса N (г) и моментами появления точек. В частности, события {th < /} и {N (0 > k—1} являются статистически эквивалентными (имеют равные вероятности), так как одно из них осуществляется тогда и
Характеристики простого пуассоновского процесса
409
только тогда, когда происходит другое. Поэтому можем написать р {th < 0 = Р{Н (0 > k~ 1} = 1 — Р {N (0 < k — 1}. (30.30)
Если ввести функцию распределения закона Пуассона
/М«) = 2 -vLe~'". (30-31)
*=о
то предыдущее равенство примет вид
Рис. 30.3. Примеры распределения Эрланг* (V-1).
О Т/ fy is t tw t
Рис. 30.2. Типовая реализация целочисленного процесса /V(O.
Fth (0 = I — Fn (& — I), k—l,2, 3,... (30.32)
Наоборот,
^(0=1 — ^г/+1(0, t = 0, l,2,... (зо.зз)
Отметим, что формулы (32) и (33) справедливы для любого целочисленного процесса {М (t), 0 t <_ +оо), если принято N (0) = = 0. Применительно к закону Пуассона формула (32) дает
Лч(г) = 1-е-*' (30-34)
/ =о
Отсюда, беря производную по времени t, получаем плотность вероятности времени th появления 4-й точки:
^(0 =
d dt
— fe-v' Г1 4-v/ + d/ I
+ ±(v/r + ...+
1
(*— 1)!
= ve—vf j ot> _L
--------(v/)*-2 + !-------(vt)*-1 *— 1 — vt —
(Й-2)! 4 ’ (k— 1)! v
1
(ft—2)1
(ft-i)!
•МО
30 Пуассоновские процессы
Таким образом, плотность вероятности времени появления А-й точки определяется формулой
№ft(/) = ve-'"(v/)*-i/(A—1)1, k =1,2,3,...; />0. (30.35)
Эта плотность вероятности известна как гамма-распределение (с параметрами k и v) и как закон Эрланга (см. (85)). Вид плотностей вероятностей Wh (t) для малых значений k показан на рис. 30.3. Воспользовавшись формулой (35), нетрудно найти среднее значение и дисперсию времени th появления k-ro события:
= klv, о2 (th) = А/v2. (30.36)
Покажем, что последовательность временных интервалов между соседними точками пуассоновского процесса есть независимые и одинаково распределенные случайные величины с экспоненциальной плотностью вероятности
W (т) = ve~VT, т > 0. (30.37)
Обозначим интервалы между точками (рис. 30.2) через
Tj = /1 — 0, xh = th — k = 2, 3, 4, ... (30.38)
Согласно третьему определяющему свойству пуассоновского про-гесса (независимость значений на неперекрывающихся интервалах появление событий после любого момента времени tn, п = 1,2, 3,..). не зависит от того, сколько и как появлялись события до и при tn. Поэтому последовательность случайных величин {xh, k = 1, 2, 3,...} является независимой.
Для произвольного т > 0 события {тп > т) и {N (ln-i т) — — N (tn-i) = 0} статистически эквивалентны, так как осуществление одного из них достоверно влечет осуществление другого. Поэтому
Р (тп > т) = Р {N (tn^ + т) - Л/ (/„_,) = 0} =
= P{N (т) = 0} = evt.
Па основании этого равенства находим функцию распределения интервалов
F (т) = Р {тп т} = 1 — e~vi, т 0. (30.39)
Следовательно, плотность вероятности временных интервалов между соседними точками является экспоненциальной
W (т) = F (т) = v e-VT, т^0. (30.40)
dt
Характеристика простого пуассоновского процесса
411
Среднее значение и дисперсия интервалов между точками равны <xh> = 1/v, <j’ (тЛ) = 1/v’, k = 1, 2,3, ... (30.41)
Из сравнения выражений (36) и (41) следует, что
Ол> = a2 (/Д = ka2 (Tfc).
1г
Такой результат является закономерным, так как th = Jp, гле z=i.
— независимые и одинаково распределенные случайные величины.
Докажем теперь обратное утверждение. Пусть имеется последовательность независимых случайных величин z1( z2, ..., zh, ..., имеющих одну и ту же экспоненциальную плотность вероятности
рп (z) = р (z) = ve~vz, z > 0. (30.42)
Организуем случайный точечный процесс следующим образом (рис. 30.4). Стартуя от произвольной начальной точки t = 0, расставим точки в моменты времени
h = Д. <2 = *! + г2...... th = Zr + z2 + ... + zh, ...
Можно утверждать, что полученные точки распределены ио закону Пуассона с параметром v.
Чтобы доказать наше утверждение, необходимо показать, что вероятность Pk (/) иметь k точек в полуинтервале (0, т] дается законом Пуассона (12).
Предварительно приведем несложные математические сведения 1132]. Используя известный интеграл
ОО
Г e/Qx е —vx _ ---1-- , V > 0, (30.43)
J V— /й
о убеждаемся, что плотности вероятности (42) соответствует характеристическая функция ОО оо
Ф (й) = fe/Six р (z) dz = v f ехр (/Qz—vz)dz ——. (30.44) J J v—jQ
о 0
Дифференцируя (k — 1) раз обе части равенства (43) по v, получим,
что характеристической функции
ф (Q) = (у!(у — jQ))k (30.45)
соответствует плотность вероятности
Р(/) =—t^0. (30.46)
(Л-1)!
Все рассматриваемые случайные величины zh независимы и имеют одинаковую плотность вероятности (42). Поэтому характеристи
412
30. Пуассоновские процессы
ческая функция их суммы равна произведению характеристических функций (45) и соответственно плотность вероятности случайной величины tk дается выражением (46).
Учтем, что случайные величины th и zk+i также независимы, так как zlt z2, .... Zh не зависит от zh+x- На этом основании совместная плотность вероятности tk и zh+1 дается произведением их плотностей вероятностей
Р (t) р (z) — v I)* е~ vt v e~vz, t^O, г^О.
Рис. 30.6. Прямое т+ и обратное времена воз-вращения.
Н----х-------------------х-----
о ' tl
Рис. 30.4. Формирование точечного процесса нз случайных величин
Чтобы в полуинтервале (0, т] было ровно k точек, должны совместно выполняться два неравенства
/й < т и /А+1 = th + гА+1 > т.
Поэтому искомая вероятность должна определяться следующими условиями: Ph (t) = Р {/й<т, th + zh+1>x} = Р {th<x, zh+1 >x—tk}=
X co
= f dt f — tk~x e~ v/ ve-VJ dz =
J J , (*-1)1
0 T — t
= fe~v(T_/)----—----tk-1e~vt dt = -^^-
J (*—1)1 *1
о
Таким образом, утверждение доказано.
При помощи аналогичных рассуждений можно показать, что количество точек в неперекрывающихся интервалах независимо.
Следовательно, два термина: 1) точечный процесс является пуассоновским и 2) интервалы между соседними точками процесса — независимые случайные величины с одинаковой экспоненциальной плотностью вероятности (40) по существу являются эквивалентными.
Интересно заметить, что если конструировать случайные точки th как указано выше, используя независимые случайные величины Zi с одной и той же общей плотностью вероятности р (г), и сделать дополнительное предполжеппе, что расстояние от произвольной
Характеристики простого пуассоновского процесса
413
взятой точки f до следующей точки t} есть случайная величина, не зависящая от того, что происходит вне интервала (f, t,), то отсюда следует, что плотность вероятности р (z) должна даваться формулой (42). Это объясняется тем, что указанное выше дополнительное предположение требует выполнения равенства
Р (z|Z4 > f) = р (z — t').
Оказывается [1321, единственной функцией, удовлетворяющей этому равенству, является экспоненциальная функция вида (42).
Для полного статистического описания пуассоновского точечного процесса вычислим плотности вероятностей прямого т+ и обратного т" времен возвращения (рис. 30.5).
Возьмем произвольный момент времени t'. Пусть tn есть случайная координата первой точки рассматриваемого потока справа от t' и — координата последней точки слева от f. Тогда
= tn — t', т" = f — tn_t. (30.47)
Покажем, что плотности вероятностей этих случайных величин определяются соответственно формулами
(т) = v e~VT, w~ (т) = v e~VT, т^О. (30.48)
Действительно, пусть т > 0. Два события {т+ < т} и {Л/ (/' -ф-т)— — Л/ (f) ^1} = {/V (т) 1} = 1 — {Л/ (т) = 0} статистически иден-
тичны, н вероятности их равны
F+ (т) = Р {т+ < т) = 1 — Ро (т) = 1 — e-VT, т > 0. (30.49)
Продифференцировав это выражение по т, придем к первой формуле (48). Аналогично доказывается вторая формула (48).
Плотности вероятностей (48) совпадают е (40), т. е. статистические характеристики прямого и обратного времен возвращения такие же, как и для интервалов между соседними точками пуассоновского процесса. Иначе говоря, ничего не изменится, если на рис. 30.5 считать, что в f находится точка пуассоновского процесса. При этом плотность вероятности ш+ (т) будет равна условной плотности вероятности случайной величины т+ в предположении, что в f имеется точка процесса. Именно этот факт разъясняет приводимый ниже результат (50).
Рассмотрим случайную величину х = т+ ф т~ = tn — tn^r. Поскольку случайные величины т+ и т_ независимы и одинаково экспоненциально распределены, то плотность вероятности их суммы будет определяться выражением вида (46) при k = 2:
w (х) = v2xe~vx, х 0. (30.50)
Эта плотность вероятности отличается от (40) и, как нетрудно проверить, совпадает с плотностью вероятности случайной величины
414
30. Пуассоновские процессы
(tn+i — t') = т+ + тп+1. Различие между формулами (50) и (40) объясняется тем, что первая из них допускает возможность наличия точки процесса в ('.
Приведем еще одно свойство точечного процесса Пуассона, характеризующего его как чисто случайный процесс.
Пусть {N (Z), / 0} есть пуассоновский точечный процесс с ин-
тенсивностью V. Предположим, что во временном полуинтервале (0, Л имеется k точек, т. е. 7V (Т) = k. Тогда /г случайных моментов времени < /2 < ... < th, при которых осуществляются события,
।
h-::—: :-|—Х-+-Х-4—х-Ф-х—t—х—t-x-1-X-i->-
G~tg Г/ tm-1 Г
Рнс. 30.6. Разбиение полуинтервала (0, Т] на подынтервалы.
имеют такую же совместную плотность вероятности, как и лирядко-вая статистика k независимых случайных величин uit и2, , uh, распределенных равномерно в полуинтервале (0, Л. Говорят, что последовательность У1, о2> •••> есть порядковая статистика, соответствующая случайным величинам и1г и2, ..., uh, если о, есть наименьшее значение среди Uj, u2> •••> «hi v2 есть второе наименьшее значение среди и2, ..., uh и т. д., так что ик есть наибольшее значение среди «1, и2, ..., uh-
Для доказательства ] 10, 133] разобьем полуинтервал (0, Л на М примыкающих подынтервалов точками to, t\, ..., t'u (рис. 30.6), не связанными с временами событий t{. Пусть t'o = 0, t'M — Т, Am= = t'm — tin-i, m = 1, 2.....M. Очевидно, что
м
T = Дт. (30.51)
m = l
Обе значим число событий, оказавшихся в подыинтервале hm — = (/m-i, tm], m — 1, 2, ..., Al, через km. Ясно, что при принятом предположении
м
k= %km. (30.52)
<п= I
Запишем выражение для условной совместной вероятности наличия km событий в подынтервале hm длительностью Дт, m =
= 1, 2, ..., М, при условии, что во всем полуинтервале (0, Т] имеется k событий
Р {N (Д2) = ku N (Д2) = k2.....N (Дл,) = kM | N (Т) = k}=
= Р {N (Д1) = klt N (Д2) = k2, ..., N (Дм) = kM,
Характеристики простого пуассоновского процесса
415
N (Т) = k}/P {N (Т) = k} = P{N = klt N (A2) =
= k2, /V (Am) = kM}/P{V (T) = k\. (30.53)
Здесь последнее равенство написано на том основании, что последовательность событий {N (Am) = km} вследствие равенств (51) и (52) включает в себя событие {N (Т) — k}.
Поскольку рассматриваемый процесс имеет стационарные и независимые приращения, то
P{N(Al) = k1, Л/(А2)=Х.....ЛДАм) = Ы = П P{N(bm) ^km).
m = I
В каждом из подынтервалов число событий распределено по закону Пуассона, т. е.
P{N(bm) = km} = P,, т(Ат) = ^ДМ1д е—X
(vT)k
P{N (T) = k} = Ph (T) = -t-L e~v7\ я!
Поэтому
P {N (AO = kit N (A,) = k2.........N (Am) = kM ( N (T) = k} =
ft (vAm)*m д f(vT)* — vt]—1 e-v(A'+ д’+ - +Лт)
II С ГМ | С I —-
1 |_ /г! J e vZ
Допустим далее, что подынтервалы Am взяты настолько малыми, что каждый из них практически может содержать лишь одну точку процесса.Тогда будет k подынтервалов, имеющих одну точку процесса, и М — k подынтервалов, не содержащих точек. Для первых k подынтервалов (Лт)'т = Ат и km\= 1, а для остальных М — k подынтервалов. (Am)*m — А„ = 1 и = 0! = 1. Следовательно, фигурирующее в (54) произведение будет содержать только k сомножителей, соответствующих тем подынтервалам, которые имеют по одной точке процесса. Перенумеруем заново эти подынтервалы так, чтобы подынтервал содержал i-ю порядковую точку процесса tt. При этом условная совместная вероятность (54) становит-ся условной совместной вероятностью событий {it g hi}, i = 1, k-Таким образом,
k
P{h € € h2, 6 /zh|(V(T) = ^ = -tL ПАо (30.55)
1 K
416
30. Пуассоновские процессы
где предполагается 0 < < /2 < ... < Т.
Покажем теперь, что формулой (55) описывается и последовательность случайных величин у2, •••, vh. По условию каждая из случайных величин иг распределена равномерно в полуинтервале (О, Т]. Поэтому условная плотность вероятности имеет вид
(ut | (V (Т) = k) = МТ,
0<Ui^T, 4=1, 2.k.
(30.56)
п точек
к точек
t'o
t’
-X---1
Т
Рис. 30.7. Случайное расположение точек в полуинтервале (0, Г].
Так как по предположению все случайные величины ut независимы, то их условная совместная плотность вероятности равна произведению отдельных плотностей вероятностей:
fk («1, и2. иА| Л/ (Г) =
= k) = MTk, OCut^T,
I = 1, 2, ... k.
При организации порядковой статистики vlt v2, ..., для случайных величин u1( «2, •••, u-k учтем, что имеется k возможностей выбора величины V! среди ult u2, ..., (k — 1) возможностей выбора v2 из оставшихся величин и1г и2, > щит. д. Следовательно, существует k! равновероятных и несовместных способов образования величин Up и2, ..., vh из ut, и2, ..., uh. Поэтому условная совместная плотность вероятности для случайных величин иь и2, ..., uh дается выражением
ph(oi, v2, .... vh\N(T) = k) Ос^Т, 4=1.2............k. (30.57)
7 h
Теперь случайные величины vt можно рассматривать как времена появления точечных событий, и, повторив предыдущие рассуждения, придем к следующему выражению для условной совместной вероятности
Р {^i € ^1, /2 6 й2, .... th £ hh | N (T) — k} —
f CC k- k- T-I
J i" J J pk ••• dlfr | I A;.
hh h,h, i=l
(30 58)
Из совпадения формул (55) и (58) следует идентичность статистических характеристик пуассоновского точечного процесса и порядковой статистики независимых случайных величин, равномерно распределенных в полуинтервале (О, Т\.
Характеристики простого пуассоновского процесса
417
К полученному результату можно прийти другим, более простым н коротким, но менее строгим путем, базирующимся на том, что при определенных условиях биномиальное распределение переходит в пуассоновское[132|.
Допустим, что случайным и независимым образом во временном полуинтервале (О, Т] размещено п точек, причем вероятность какой-либо точке оказаться на отрезке т — t' — t'o (рис. 30.7) равна
р = %/Т.
Нас интересует вероятность Ph (т) того, что на отрезке т окажется ровно k п точек.
Выражение для Ph (%) можно получить, применяя рассуждения, используемые в классической задаче о повторении испытаний. Пусть С?] есть эксперимент размещения одной единственной точки в полуинтервале (0, 74 и — событие, что точка попадет в интервал т; вероятность такого события равна р — %/Т. Считается, что эксперимент С\ повторяется п раз. Известно 130), что при оговоренных условиях вероятность Ph (т) того, что на отрезке т будет находиться k точек, определяется биномиальным законом
Ph (т) — Р) Pk <ln~k, q=\—p. (30.59)
j
Предположим, что n> 1 и %/Т1. При этих условиях для значений k порядка п%/Т биномиальный закон хорошо аппроксимируется законом Пуассона
exp(-nT/7’)«-^e-vr, v=^. (30.60)
Если п -> оо, Т -> оо, п/Т -> v, то формула (60) становится не приближенной, а точной. Этим завершается доказательство.
В общем случае случайные события во времени не являются простым пуассоновским точечным процессом. В качестве итога перечислим физические условия, при которых точечный процесс будет пуассоновским.
1. Точечный процесс {N (t), 0 t < °о} будет пуассоновским при выполнении условий 1, 2 и 3, сформулированных в начале параграфа.
2. Если %h есть расстояние между £-й и (k — 1)-й точками процесса, то случайные величины должны быть независимы с общей плотностью вероятности (40).
3. Расстояние от произвольно взятого момента времени (' до следующей случайной точки tj является случайной величиной, не зависящей от того, что происходит вне интервала (/', tj) и имеющей экспоненциальную плотность вероятности вида (42).
14 Зак. ! 2 16
418
30. Пуассоновские процессы
4. Полное число событий tt в полуинтервале (О, Т\ равно п, каждое из них равномерно распределено в этом интервале. Тогда число точек k в интервале т имеет пуассоновское распределение с параметром m/Т. Сказанное является точным при п —> оо и Т ->
—> ОО.
Обобщения процесса Пуассона
Известно много различных обобщений процесса Пуассона. Здесь будет рассмотрено несколько таких обобщений, а именно:
1) пуассоновский процесс в нескольких измерениях,
2) неоднородный пуассоновский процесс,
3) обобщенный пуассоновский процесс,
4) сложный процесс Пуассона.
Пуассоновский процесс в нескольких измерениях. Иногда приходится иметь дело с пуассоновским процессом в нескольких измерениях, например, в трех. При этом, если через N (До) обозначить число событий в некотором элементе объема До, то условия (1) — (3) при До -> О заменяются на следующие:
Р {N (Ао) = 1} = vAo + о (До), (30.61)
Р {N (До) > 1} = о (До), (30.62)
Р {N (До) = о} = 1 — vAo + о (До). (30.63)
Кроме этого, предполагается, что число событий в нелерекрываю-
щихся объемах есть взаимонезависимые случайные величины При этих условиях можно показать, что число событий в объеме о имеет распределение Пуассона со средним значением vo.
Неоднородный пуассоновский процесс. Пуассоновский процесс называется неоднородным, если его функция интенсивности зависит от времени v (0. Наоборот, если v (t) = v = const для всех 0 то пуассоновский процесс называется однородным. Функция интенсивности v (0 может быть детерминированной или случайной.
Неоднородный пуассоновский процесс определяется следующими условиями. Целочисленный случайный процесс {N (0, 0 t <; < оо} имеет независимые, но нестационарные приращения, причем для него условия (2) и (4) остаются прежними, а условия (1) и (3) принимают вид
Р {N (t + Д0 — N (0 = 1} = v (0 М + о (At), (30.64)
Р {N (I + Д0 — N (0 = 0} = 1 — v (0 At + о (Д0. (30.65)
Для получения закона распределения можно применить ту же методику, что и выше в п. 1. Разобьем, например, полуинтервал вре-меми (0, t + ЛИ на два примыкающих подынтервала (0, /] и (0
Обобщения процесса Пуассона
419
/+ ДИ и учтем, что приращения процесса на этих подынтервалах есть независимые случайные величины. Тогда можем написать
Р {/V (/ + АО = 0} = Р {N (0 = 0} =
= Р {N (/ + ДО - N (0 = 0}.
Воспользовавшись условием (65) и сохраняя прежнее обозначение (5), отсюда получаем дифференциальное уравнение
at
решение которого при начальном условии Ро (0) = 1 имеет вид ( t \
— v(t) di I (30.66)
о /
Естественно, что при v (0 = v = const эта формула переходит в (10).
Аналогичным путем получаем дифференциальные уравнения для вероятностей Ph (i) = Р {N (f) ~ k}, 1, рассматривая различ-
ные частные случаи получения P{N (t + А/) = k}:
k
P{N (t + bt) = k} = 2 P{N(t) = i}P{N(t + bt)— N(t) = k—i}.
i—0
С учетом условий (2), (64)—(65) отсюда получаем систему рекуррентных линейных дифференциальных уравнений первого порядка, позволяющую последовательно находить вероятности Ph (/): 4puo+v(/)pft(o=v(o^-i(a (зо.б7)
at
Общее решение этой системы дается выражением (\.. / t \
^v(T)di| ехр I — f v(t)di I А?>1 (30.68)
J / I J j
0 / \ 0 /
Эта формула называется неоднородным законом Пуассона; при V — const она переходит в обычный закон Пуассона (12). Укажем, что ее можно было получить иначе, в частности, при помощи производящей функции вероятностей или при помощи преобразования шкалы времени. Если, например, ввести новую переменнуюs (/) как строго возрастающую функцию времени t, причем s (0) = 0, то вероятность наличия события в полуинтервале (s, s + As] приближенно равна v(()As^. Если наложить ограничение v (0 dt/ds = 1, т, е.
s (0 = J v b)di,
14’
420
30. Пуассоновские процессы
то в новой шкале времени мы будем иметь однородный пуассоновский процесс с постоянной функцией интенсивности, равной единице. Возвратившись затем к первоначальной переменной t, придем к формуле (68).
Отметим, что для неоднородного процесса Пуассона выполняется соотношение, аналогичное (27): среднее значение и дисперсия равны друг другу и даются формулой
I
<7V(/)>= a2(7V(O)= Jv(T)dT. (30.69)
о
В практических задачах в качестве функции интенсивности часто берут убывающую функцию вида
v (/) = а ехр (—₽/), (30.70)
где а и Р — положительные величины, определяемые экспериментально.
Обобщенный пуассоновский процесс. Допустим, что остаются справедливыми условия (1)—(4), т. е. случайные точки на оси времени распределены по закону Пуассона (12), но произвольная k-я точка может содержать tnh каких-то событий, где mh — взаимоне-зависимые и одинаково распределенные случайные величины с известными вероятностями
р {т = k} = qh, k= 1, 2. 3.............. (30.71)
Введем производящую функцию этих вероятностей
g^ = 'Zqhzk. (30.72)
k
Пусть в полуинтервале (0, /| имеется N (/) случайных точек и М (/) — общее число событий. Предположим, что N (/) = п. Тогда вероятность числа событий М (/) представляет собой п-кратную свертку вероятностей (71), а производящая функция для М (/) равна gn (г). Так как число точек в полуинтервале (0, И случайно и распределено по закону Пуассона (12), то производящая функция вероятностей для М (I) будет равна
XI (vt)n
G(z,t) = Z g"(z) —e~v( =expMg(z)—v/]. (30.73)
Зная производящую функцию вероятностей, можно вычислить различные характеристики случайной величины М (/).
Нетрудно убедиться [10], что характеристическая функция обобщенного пуассоновского процесса имеет вид
Фдщ) (й) = ехр {W [<р (Q) — 1]}, (30.74)
Обобщения процесса Пуассона
421
где <р (Q) в свою очередь характеристическая функция неотрицательных целочисленных случайных величин т, имеющих вероятности qk
cp(Q)= У, <7fte'*Q. (30.75)
/ = i
Сложный процесс Пуассона. Стохастический процесс {X (/), t 0} называется сложным процессом Пуассона, если для t 0 его можно представить в виде
N (i)
Х(0= 2 г,, <30.76)
п~ 1
где {X (/), t 0} есть простой процесс Пуассона и {гп, п — = 1, 2, 3, ...} —независимые и одинаково распределенные случайные величины. Процесс {N (I), t 0} и последовательность случайных величин {гп} предполагаются независимыми.
Заметим, что правая часть равенства (76) представляет собой сумму случайного числа слагаемых, каждое из которых есть случайная величина, не зависящая от других, и все слагаемые одинаково распределены.
Покажем, что сложный процесс Пуассона {X (/), t 0} имеет стационарные и независимые приращения. Его характеристическая функция равна
Фхщ (И) = ехр {vZ |<рг (Q) — 11), t 0, (30.77)
где <рг (Q)—общая характеристическая функция независимых идентично распределенных случайных величин {гп} и v — средняя частота наступления событий Если среднее значение квадрата случайных величин {гп} ограничено (<г2> < оо), то процесс X (t) имеет конечные первые моменты, даваемые формулами
<Х (П> = Vt (z>, (30.78)
о2 (X (/)) = vt <z2>, (30.79)
k(s, 0 = <[Х (s) - <Х (s)>][X (/) - <Х (0>1> =
= v <г2> min (s, I). (30.80)
Перейдем к доказательству перечисленных свойств. Так как пуассоновский процесс {N (Z), t 0} имеет независимые приращения и {гп} есть последовательность независимых и одинаково распределенных случайных величин, то физически ясно, что процесс {X (/), t 0} имеет независимые приращения. Чтобы доказать, что процесс {X (0, t 0} имеет стационарные приращения и что спра-14в Зак. 1216
422
30. Пуассоновские процессы
ведлива формула (77), достаточно показать, что для любых t ~> s О характеристическая функция приращения процесса имеет вид
Фх (0—хи (£2) = ехр {v(/—s) [<рг (Q)— 1|). (30.81)
Действительно, при п = 0, 1, 2, ... для условной характеристической функции справедливо соотношение
(ехр /Q [X (0 — X (s)] | N (0 — N (s) — п) — {<р2 (Q)}n, так как при фиксировайном числе событий в полуинтервале (s, /), равном п, величина X (/) — X (s) представляет собой сумму п независимых и одинаково распределенных случайных величин г. Поэтому для безусловной характеристической функции приращения процесса можем написать
Фх(0-х(5)(П) = 2 (exp/Q[X(/) —X(s)]|7V(0 —X(s) = n>x
n = 0
VI Iv u — s)]"
x P {N (t) — N (s) = n}=- 2 {<PzW nl n-e-vu-8) =
n = 0
__ e-v (!~s' exp [v (r—s) tp, (£2)J.
Таким образом, формулы (77) и (81) доказаны.
Для получения формул (78)—(80) можно воспользоваться известным правилом нахождения моментов при помощи дифференцирования характеристической функции (32.26) или же применить тождество Вальда (см. с. 100).
Из формулы (77) следует, что если г есть целочисленная случайная величина, то сложный процесс Пуассона {X (0, t 0} совпадает с обобщенным пуассоновским процессом. Наоборот, любой обобщенный пуассоновский процесс может быть представлен как сложный процесс Пуассона. Однако оба процесса не являются тождественными; обобщенный процесс может быть сформирован другими способами (например, как линейная комбинация бесконечного числа простых процессов Пуассона), чем сложный процесс.
Простейшие операции над пуассоновским процессом
Над случайными точечными процессами, как и над обычными процессами, могут выполняться различные преобразования или операции, например, наложение (суммирование) двух и большего числа процессов, «разрежение» по определенному закону, случайное смещение точек и др. В этом отношении точечный процесс Пуассона обладает замечательным свойством устойчивости (инвариантности) по отношению к ряду преобразований, т. е. после некоторых преобразований процесс по-прежнему остается пуассоновским. Более то-
Простейшие операции над пуассоновским процессом
423
го, при определенных условиях он правильно описывает асимптотическое поведение многих других точечных процессов.
Рассмотрим некотрые операции над точечным процессом Пуассона, приведя ряд результатов без математических доказательств [127].
Предположим, что имеется конечное число г точечных процессов и объединенный (результирующий) процесс формируется наложением (суммированием) этих процессов, как показано на рис. 30,8. Для процесса Пуассона справедливо следующее утверждение.
О I--4/
0\—
---- т0
-x--------x-
—х-
’Ft i i *—-><—i—slc-
-х-
-х Процесс НГ(С)
Процесс Nz(t)
Процесс N3(t)
-w-f
i i
-x—X—i—x-x Результирующий процесс Hit)
Рис. 30.8. Наложение трех точечных процессов.
Если имеется сумма конечного числа г взаимонезависимых пуассоновских потоков Nl (/), Nr (0 с интенсивностями vb ..., v, соответственно, то суммарный поток W (/) = /V, (/) + ... 4- Nr (/) является пуассоновским с параметром интенсивности v = Vi 4-4* ... 4- vr.
Доказательство этого утверждения простое и базируется на том, что для суммарного потока N (/) остаются в силе три определяющих условия пуассоновского процесса (1)—(3). Действительно, так как отдельные процессы взаимонезависимы, то
Р {N (t + (t)= 1} = £ (/) = !} =
/=1
= 2 lvi А< 4-о (Л?)] = vAf 4"О(A/), v= S vi- (30.82) i = 1 1 = i
Аналогично,
P{N (< + Д/)-Л^(/) = 0}= П Р{ДГ((Л-Д/)_^(0=0} = /== 1
= fl [1—V, Д/ + о(Д01 = 1-*Д/4-о(Д/)- (30.83)
/ = 1
Наконец, поскольку значения &Nt = Nt (t 4- AQ — Л1Д1) Для разных i взаимонезависимы, когда интервалы Д/А не пересекаются, тр значения &N при разных неперекрывающихся интервалах А/Л будут также независимыми.
14в*
424
30. Пуассоновские процессы
Из методики доказательства следует, что сформулированное утверждение останется справедливым и для неоднородных пуассоновских потоков (/), когда функции интенсивности зависят от времени (f). В этом случае v (t) = Vi (0 + ... + vr (t).
Допустим, что интервал времени т0 от начала отсчета до первого события в суммарном потоке имеет плотность вероятности v ехр (—vt). Обозначим аналогичные времена (рис. 30.8) для частных процессов (/), ..., Nr (0 соответственно через Дь ..., Дг, так что x0 = min (Дь Дг). Эти времена независимо распределены с плотностями вероятностей vt ехр (—V;T), i = 1, 2, .... г. Рассмотрим совместное распределение величины т0 и номера потока, которому она принадлежит. Пусть известно, что т0 = т. Вероятность того, что это значение происходит от первого потока (t), равна
Р {Дг = т. Д, > т (t = 2.г) | т„ = т) =
_ Р(А1 = т,А<>т(( = 2, г), г0 = т) х
Р{т„ = т} ~V‘e Х
х е-^х... e~vr T/(ve-VT) = vi/v. (30 84)
Видно, что полученное выражение не содержит т. Поэтому систему независимых пуассоновских потоков можно трактовать следующим образом. Интервалы между последовательными событиями суммарного потока независимы и одинаково распределены с плотностью вероятности vexp(—vr). Затем события привязываются к частным потокам Nl (t), .... Nr (0 случайным образом с постоянными вероятностями vjv, ..., vr/v соответственно.
Приведем конкретную интерпретацию этого результата. Допустим, что электронные лампы имеют два типа отказов. Пусть немедленно после отказа лампа заменяется новой. Тогда следующие две трактовки будут эквивалентными: 1) отказы двух типов осуществляются как независимые пуассоновские потоки с интенсивностями Vi и v2; 2) отказы происходят по пуассоновскому закону с интенсивностью v = + v2 и вероятность того, что какой-либо
частный отказ принадлежит к первому типу, равна v/v, независимо от других отказов.
Рассмотрим теперь другое преобразование — независимое смещение точек. Пусть {xt (t)} — случайная последовательность частиц на прямой, образующих при t = 0 стационарный пуассоновский поток. Координата каждой частицы xt (t) меняется случайным образом во времени t. Величины смещений за время от 0 до t, равные Xt (/) — Xt (0), предполагаются взаимонезависимыми и одинаково распределенными случайными величинами. Именно такой процесс изменения координат назван выше независимым смещением. В данном случае справедлива следующая теорема.
П ростейшие операции над пуассоновским процессом
425
Если в начальный момент времени t = 0 последовательность координат системы частиц {хг (0)} образует стационарный пуассоновский поток с интенсивностью v, то при независимом смещении последовательность координат частиц {х;(/)} в момент времени t также образует стационарный пуассоновский поток с интенсивностью V.
Опишем кратко две операции «разрежения» точек и приведем для них окончательные результаты.
Пусть последовательность координат точек {хг} образует пуассоновский поток. Будем говорить, что эта последовательность подвергается операции случайного «разрежения», если каждая точка может быть исключена из дальнейшего рассмотрения с вероятностью у, где у — вероятность исключения. Предполагается, что операция исключения производится для каждой точки независимо, причем дается только одна попытка исключить каждую точку. После применения этой операции поток оставшихся точек {х,} будет более редким. Справедлива следующая теорема.
Если к последовательности координат точек {х(}, образующих пуассоновский поток с интенсивностью v, применяется операция случайного разрежения с вероятностью исключения у, то поток оставшихся точек является пуассоновским с интенсивностью (1—у) v.
Доказательство этого утверждения легко получить путем проверки трех определяющих свойств процесса Пуассона. Действительно, операция разрежения проводится одинаково при любом значении Х|, что обеспечивает свойство стационарности результирующего потока. Ординарность сохраняется очевидным образом, так как при разрежении количество точек может только уменьшиться. Отсутствие последействия сохраняется вследствие того, что исключение точек происходит каждый раз независимо от предыдущих результатов.
Предположим теперь, что разрежение точек в пуассоновском процессе /V (/) с параметром интенсивности v осуществляется по-другому. Допустим, что начиная с некоторого начального момента времени, все точки потока перенумерованы в порядке их появления во времени. Исключим все точки, кроме тех номера которых кратны некоторому целому числу k. На рис 30 9 изображен частный пример для k — 3. В результате такого исключения получим новый точечный процесс N' (/)• Временные интервалы между последовательными событиями нового процесса N' (f) равны разности между моментами появления (i + k)-ro и i-го событий исходного пуассоновского потока. Поэтому плотность вероятности межинтервальных времен процесса N' (/) будет определяться формулой Эрланга (35):
U7(t) = ve~VT(vT)ft~1/(fe—1)1 й=1 2, 3, ... (30.85)
426
30. Пуассоновские процессы
Естественно, что при k — 1 (нет исключения точек) отсюда следует хорошо известный экспоненциальный закон.
Среднее значение и дисперсия временных интервалов между соседними событиями в потоке Эрланга равны
тх = k/v, о2 = у k/v. (30.86)
Укажем один важный результат, который имеет математическое доказательство. Оказывается, что при сложении большого числа взаимонезависимых случайных потоков (не обязательно пуассоновских) малой интенсивности суммарный поток близок к пуассонов-
1 2 3 4 5 6 7 8 9 10 11 12
0\---х-----х-х—х—х-^<—х—х——х—х---х---1 Процесс N(t)
iii i
ОI---------i------k-----it-------Л---1 Процесс Эрланга
Рис. 30.9. Иллюстрация формирования потока Эрланга из пуассоновского потока при
скому. Ситуации, в которых случайный поток можно рассматривать как сумму большого числа независимых слагаемых потоков, встречаются довольно часто. Например, поток вызовов, поступающих на телефонную станцию, можно представить как сумму потоков вызовов отдельных абонентов. Поток отказов в сложной системе можно представить в виде суммы потоков отказов отдельных узлов, составляющих данную систему.
В заключение приведем два факта, относящихся к закону Пуассона (12).
1. Д. А. Райковым была доказана следующая теорема 1134]. Если сумма k независимых случайных величин распределена по закону Пуассона, то каждая из величин должна быть пуассоновски распределенной.
2. Найдем закон распределения разности двух независимых пуассоновски распределенных случайных величин. Пусть случайные величины х и у независимы с законами распределения Пуассона
Р (п)=Ж1е-^, /> (т)= ^е-»“. (30.87)
п! т!
Найдем закон распределения разности г = х — у.
Запишем физически очевидное соотношение
P2(fe) = P{z = /e} = 2 Px(k + l)Pv(l) = i=o
~ е- <х+и) > (М* V . (30.88)
(k + 01 Л
Простейшие операции над пуассоновским процессом
15>7
Воспользуемся разложением функции Бесселя в ряд Ц91
_______________ /_1_ \‘Л
л! (Л 4 л)! \ 2 ) ’
т е.
I
п! (Л-f-nT
'.«(f)"
где 1К (г) — функция Бесселя <е-го порядка от мнимого аргумента. Полагая здесь г/2 =• /Kpj, убеждаемся, что ряд в (88) можно заменить на
Таким образом, получим
Рг(Ь) .e-Hrtf/AW’ k^O, ±1,±2,... (30.89)
\ и /
Эту формулу можно представить в другом виде!
P,(A!)=(X/)»e-<K+w ’ У -ML, k~0, 1, 2, ... /"о Z* + *)’
Р, ( —А) «(ii/)* е—' v .М' /е = 0. I 2....
I «в О
(30.90)
На этом мы закончим здесь рассмотрение простейших обобщении случайного точечного процесса Пуассона и простых операций с ним. Следующим важным обобщением являются процессы восстановления, в которых временные интервалы между последовательными событиями считаются независимыми н одинаково распределенными случайными величинами с произвольным (а не обязательно с экспоненциальным) распределением. В § 32 будет приведено дальнейшее обобщение — профильтрованный пуассоновский процесс,
31. Процессы восстановления
Определение и классификация процессов восстановления
В пуассоновском процессе интервалы между последовательными событиями были независимы и одинаково экспоненциально распределены. Очевидное и важное обобщение получается в предположении, что интервалы между последовательными событиями взаимо-
428
31 Процессы восстановления
независимы и одинаково распределены с некоторой общей плотностью вероятности w (т). Получающаяся серия точечных событий на оси времени называется процессом восстановления.
Прежде чем классифицировать процессы восстановления, приведем частный поясняющий пример. Рассмотрим элементы, подверженные отказам. Допустим, что имеется совокупность элементов и что длительность безотказной работы элемента является неотрицательной непрерывной случайной величиной с плотностью вероятности w (т). Предположим, что немедленно после отказа каждый элемент заменяется таким же, но новым. Тогда возможны следующие три случая. Если работа с новым элементом начинается при t = О, то все интервалы времени между последовательными отказами, включая и первый, будут иметь одно и то же распределение. Однако, если элемент уже использовался при / = 0 и поэтому не является новым, то время до первого отказа будет характеризовать остаточный срок его службы и будет отличаться от времени безотказной работы нового элемента. Возможен также случай, когда начало отсчета времени взято через большой промежуток времени после начала процесса, имеющего большую продолжительность.
Итак, допустим, что первое событие процесса происходит в момент времени = Tj, второе — в момент времени /2 = 1! + т, и т. д., <-е событие — в момент времени
6 = Tj + та + ... + ть (31.1)
где {tz, I = 1, 2, 3, ...} — независимые неотрицательные непрерывные случайные величины, причем т8, т,, ть ... имеют одинаковую общую плотность вероятности w (т), а -ц может иметь другую плотность вероятности (т).
Допуская возможность различного выбора начала отсчета времени, можем получить три частных вида процесса восстановления.
1. Простой процесс восстановления, когда (т) = w (т), т. е. когда все случайные величины т(, i = 1,2, 3, ... имеют одинаковую плотность вероятности w (т).
2. Общий (или модифицированный) процесс восстановления, когда плотности вероятности (т) и w (т) не обязательно одинаковы. В данном случае выполнены все условия простого процесса восстановления, за исключением того, что длительность от начала до первого отказа имеет распределение, отличное от распределения для всех других длительностей безотказной работы.
3. Стационарный процесс восстановления, когда (т) имеет специальный вид,
И’1(т) = ^-Ц-/?(т)], (31.2)
Определение и классификация процессов восстановления
429
где тх = <тг>, I = 2, 3, 4, ... — среднее время безотказной работы и F (т) — функция распределения, соответствующая плотности вероятности w (т)
t
F (т) = Р{тг <т}= w(x)dx. (31.3)
о
F (т) определяет вероятность того, что элемент отказал до момента т. Физически такое название объясняется следующим. Допустим, что простой процесс восстановления начался в отдаленном прошлом
О
Рнс. 31.1. Иллюстрация работы электронного счетчика (X — зарегистрированные частицы, —----------------------------------время блокировки).
(t -> —оо). Если наблюдение процесса начинается в момент t = О, то длительность до первого отказа будет иметь плотность вероятности (2). Поэтому стационарный процесс восстановления можно рассматривать как простой процесс восстановления, при котором система начала функционировать задолго до того, как она впервые наблюдалась (см. также (52)).
Необходимо специально оговорить, что терминам элемент и длительность безотказной работы можно придавать различный физический смысл и интерпретировать их по-разному в зависимости от конкретной задачи (см. приведенный ниже пример со счетчиками).
Можно привести много других, более сложных процессов восстановления, когда имеются интервалы двух, трех и т. д. типов [127]. Приведем один из таких примеров, относящийся к теории обслуживания. Рассмотрим эмиссию потока частиц, допустим, от радиоактивного источника, описываемую законом Пуассона с параметром интенсивности v. Предположим, что частицы регистрируются электронным счетчиком, который работает в соответствии со следующим правилом. Вначале счетчик свободен. После случайного времени г", экспоненциально распределенного с параметром v, происходит эмиссия и она регистрируется счетчиком. Затем счетчик блокируется на время т', в течение которого эмиссия не регистрируется. После этого счетчик становится свободным и очередная эмиссия, появившаяся после времени т", регистрируется. Далее цикл повторяется (рис. 31.1).
При разных предположениях о статистических характеристиках двух последовательностей случайных величин {т", т", и {т', т', мы получим разные процессы восстановления.
430
31. Процессы восстановления
При принятом предположении о пуассоновском характере эмиссии случайные величины {т', т’, ...} независимы и одинаково экспоненциально распределены с параметром v. Допустим, что времена блокировки {т', т', ...} также независимы и одинаково распределены с плотностью вероятности w' (т), причем обе последовательности случайных величин {т/} и {т*} взаимонезависимы. Пусть нас интересует точечный процесс — зарегистрированные частицы. При оговоренных выше допущениях этот точечный процесс образует общий процесс восстановления, в котором время первого события = т"
0
Рис 31.2. Альтернирующий процесс восстановления ( — интервал 1-го типа, — — — интервал 2-го типа, X —событие 1-го типа, ©—событие 2-го типа).
экспоненциально распределено с параметром vt а времена после-дующих событий тг = т' + т", т3 = т' + т" и т. д. имеют одинаковые плотности вероятности в виде свертки w' (т) с упомянутым выше экспоненциальным распределением.
Если изменить начальное условие, а именно, считать, что период блокировки начинается при t = 0, то описанный выше точечный процесс будет простым процессом восстановления. Если в дополнение к этому отождествить время блокировки электронного счетчика с его мертвым временем и считать его постоянным (т' =• = т' = ... = т0 = const), то интервалы между зарегистрированными частицами будут иметь смещенное показательное распределение v ехр [—v (г — t0)J, т т0.
Отметим, кстати, что основной задачей в теории счетчиков является установление количественной зависимости среднего значения и дисперсии числа зарегистрированных частиц от параметра интенсивности v и параметров распределения времени блокировки 1135, 136].
Приведенный пример допускает следующее естественное обобщение. Пусть имеется две взаимонезависимых последовательности неотрицательных непрерывных случайных величин {т,, т*, т,, ...} и {т", т", г", ...}. Допустим, что случайные величины каждой из этих последовательностей также независимы между собой и все имеют одинаковые плотности вероятности ш' (т) и w" (т) соответственно. Образуем точечный процесс, беря поочередно случайные величины из двух последовательностей (рис. 31.2). Процесс начинается с интервала т' 1-го типа, в конце которого имеет место событие 1-го типа? За ним следует интервал т’ 2-го типа, заканчивающийся
Определение и классификация процессов восстановления
431
событием 2-го типа в момент времени т' + т" и т. д.; (2£ — 1) событие 1-го типа происходит в момент времени
Tj + ... + rk + Tj + ...
a 2£-e событие есть событие 2-го типа, осуществляющееся в момент времени
<+ ... +т£ + т-+ ... +4.
Получающийся случайный точечный процесс с поочередными интервалами двух типов называется альтернирующим процессом восстановления. Если обе плотности вероятности являются экспоненциальными, допустим, с параметрами vt и v2, то такой процесс называется альтернирующим процессом Пуассона.
При теоретическом рассмотрении альтернирующих процессоз восстановления обычно полагают, что смена состояний (типов интервалов) описывается цепью Маркова с двумя состояниями с известной матрицей вероятностей перехода. По существу такие процессы были изучены в § 8. В дальнейшем мы рассмотрим основные статистические характеристики простейших процессов восстановления.
Основные соотношения
Предварительно напомним основное соотношение, аналогичное (30.30), между целочисленным процессом {N (t), I 0}, определяющим число случайных точек процесса восстановления в полуинтервале (0, /], и соответствующей последовательностью случайных величин {4, k = 1, 2, 3, ...}, характеризующих времена их появления. Для любых t > 0 и k = 1, 2, 3, ...
N (/) k, если и только если 4+1 > t. (31.4)
Следовательно, число событий в полуинтервале (0, /1 меньше или равно k тогда и только тогда, когда время появления (k + 1)-го события больше I. Из (4) следует, что
N (t)=k, если и только если tk t и th+l > t. (31.5)
Это соотношение гласит, что в полуинтервале (0, /1 будет ровно k событий тогда и только тогда, когда время появления £-го события меньше или равно /, а время появления (k + 1)-го события больше t.
Из соотношений (4) и (5) следуют важные формулы для вероятностей
Р {N = Р {4+1> 0. & = 0,1,2,..., (31.6)
Р {N (/) k} = P{fh С t, 4+i > О =
= р {4 < t}p {4+1 > О = Р {4 С OU - Р {4+1С 01 =
= * = 1,2,3,^ (31.7)
р {N (0 = 0} - 1 - Р {4< 0.
432
31. Процессы восстановления
Формулы (6) и (7) можно записать через функции распределения FN(k)— 1— Fth+1(t), 6 = 0, 1,2............ (31.8)
= — 6 = 1.2. 3.. (31.9
/>„(/) =1-F(, (fl.
Время th до появления 6-гособытия равно сумметг + т2 + ...+тЛ и для процесса восстановления это есть сумма 6 независимых случайных величин. Применяя общеизвестные методы теории вероятностей, можно в принципе получить любые требуемые статистические характеристики случайной величина 4. В частности, из центральной предельной теоремы следует, что величина th при больших 6 асимптотически нормально распределена со средним значением 6гпт и дисперсией бст*, где mt и о| — среднее значение и дисперсия каждой из случайных величин тг, которые предполагаются конечными. Для этого асимптотического результата распределение случайной величины Tj не имеет значения (если дисперсия тг ограничена).
Если удается вычислить функции распределения случайных величин tk, то по формулам (8) и (9) можно найти соответственно функцию распределения и закон распределения числа событий в интервале (0, /]. Естественно, что для процесса Пуассона формулы (8) и (9) должны приводить к результатам (30.34) и (30.12). Компактные результаты также получаются в случае, когда интервалы между событиями тг имеют гамма-распределение [10].
Воспользуемся формулой (6) для исследования асимптотического распределения N (t) при больших t, базируясь на том факте, что случайная величина 4 при больших 6 асимптотически нормальна.
Поскольку значение величины 6, вообще говоря, зависит от /, обозначим ее через kt и перепишем соотношение (6):
P{N{t)^ki} = P{tkl + i>t}. (31.10)
Выше указывалось, что при больших 6( случайная величина th является асимптотически нормальной со средним значением ktmt и дисперсией 6(о?. Имея в виду последующий предельный переход, перейдем в правой части равенства (10) сначала к нормированной случайной величине, а затем заменим kt на xt согласно равенству ktmx — t t , , /~Т
х, =-----r---:-, т. е. kt =---Н xt ot 1 / — •
Тогда последовательно можем написать
P{iht>t} = p[
tht—kt mx
oxV kt
t — kt mx ) ^Vkt J
Основные соотношения
433
I °т V*t
(31.11)
Объединяя равенства (10) и (11) и переходя к пределу при t -> оо, получим
lim Р {N (0 i—>ос
kt} = lim Р ,—►00
— ktmx
I
t~^dz =
oo
—— Г e—du — '
/2л Д y /to
(31.12)
где Ф (x) — известный интеграл вероятности (4.7).
Напомним, что если нормальная случайная величина X имеет
плотность вероятности
w (х) = (2л)-1ехр [— (х — a)2/2a2J, то
P{X^h} = Ф
h—a о
(31.13)
На основании сравнения формул (12) и (13) приходим к заключению, что случайная величина N (/) при больших / асимптотически распределена нормально, причем среднее значение и дисперсия равны
Ши = Цтх,
0N = toxIm$, t-> оо.
(31.14)
Поскольку при доказательстве этого результата использовался только факт асимптотической нормальности распределения случайной величины при больших k, то полученный вывод справедлив для всех трех видов процессов восстановления: простого, общего и стационарного. Метод доказательства результата (12) требует только асимптотической нормальности th со средним значением и дисперсией, пропорциональными k. Поэтому он может быть применен для рассмотрения более общих процессов. Однако заметим, что если требуются поправки к асимптотическому распределению, то для общего и стационарного процессов восстановления может оказаться необходимым учитывать тот факт, что случайная величина может иметь распределение, отличное от других величин т1( i я 2, 3, 4,...
434
31. Процессы восстановления
Простейшим частным случаем результата (12) является пуассоновский процесс, для которого согласно (30.41)
= ат = 1/v.
При этом по формуле (14) получаем
ты = oft = vt. (31.15)
В данном частном примере формула (12) подтверждает хорошо известный в теории вероятностей факт, что при достаточно больших mN = o2n пуассоновское распределение переходит в нормальное.
Из формулы (14) для асимптотического среднего значения и дисперсии следует, что для предельного распределения (12) справедливо соотношение
ofa/mN & Ox/tnS- (31.16)
Это является обобщением на произвольный процесс восстановления хорошо известного свойства пуассоновского распределения, для которого согласно (15) отношение
o^lm.N =1. (31.17)
Конечно, (16) является только предельным результатом, в то время как (17) — точное равенство.
Применим формулу (16) к электронному счетчику, описанному на с. 429. Пусть эмиссия частиц описывается законом Пуассона с параметром v. Обозначим среднее значение времени блокировки счетчика через и дисперсию через ст(. Нетрудно убедиться (рис. 31.1), что среднее значение и дисперсия временного интервала между последовательными восстановлениями (зарегистрированными частицами) равны соответственно
/nT = /rii + (l/v), a’ = af+ (i/v)2.
Число частиц N (/), зарегистрированных счетчиком за достаточно большое время /, является асимптотически нормально распределенным со средним значением и дисперсией, определяемыми согласно (14):
„ _ V/ (l + v»oj)v,
—— ——— СГД( — —————— ,
14-Vffl! (l-f-Wli)8
Поэтому отношение дисперсии к среднему значению равно
CS^lniN « (1 + v’O|)/(l 4- V/7li)2. (31.18)
Если сгх < mlt что обычно выполняется на практике, то отношение (18) меньше единицы. Следовательно, относительный разброс будет меньше, чем для пуассоновского распределения.
Функция восстановления
435
Функция восстановления
Получим теперь выражение для функции Н (/) = (N (/)), которую часто называют функцией восстановления. Из формулы (9) имеем
оо ОС
//(/)= 2 = 2 *1^Ю-ЛЛ+1(01 =
6=0 /г = о
= 2 FtkW’ (^„(0=1)- (31.19)
k= i
В дальнейшем будет широко использоваться преобразование Лапласа. Приведем необходимые справочные сведения. Преобразование Лапласа от произвольной функции f (х), определенной на интервале (0, оо), при условии, что интеграл существует, дается выражением
f*(s) = $e-« f(x)dx. (31.20)
о
Если f (х) есть плотность вероятности неотрицательной случайной величины X, a F (х) —функция распределения, то
— <e~sX> = ^ e“sx f (x)dx, F* (s)=f* (s)/s. (31.21)
о
Пусть X1( X2, Xn — неотрицательные независимые случайные величины с плотностями вероятностей (х), /2 (х), .... fn (х). Преобразованием Лапласа суммы X, + Х2 + ... -j- Хп является по определению
<ехр [—s (Хх + Х2 + ... + Xn)]> = fi (s)f2 (s)...fn ($). (31.22)
Если fi (х) = f2 (х) = ... = fn (х) = f (х), то плотность вероятности суммы Xj + Х2 + ... 4- Хп имеет преобразование Лапласа
fn (S) = {/* (s)K (31.23)
Беря преобразование Лапласа от равенства (19) и учитывая (21), имеем
Н* (s) = — 2 («), оу* (s) = <ехр[ — s(r1 + ... + Th)]>. (31.24)
s Л=1
Здесь wh (f) — плотность вероятности появления k-a точки (восстановления), введенная после формулы (30.34):
= (31-25)
436
31. Процессы восстановления
Далее необходимо рассматривать раздельно простой, общий и стационарный процессы восстановления, поскольку Tj влияет на w'k (s) по-разному.
Для простого процесса восстановления все случайные величины т,, ..., xh распределены одинаково и поэтому wl (s) = {ш* (s)}*1. Подставив это выражение в (24) и выполнив суммирование, получим функцию восстановления HL (t) для простого процесса восстановления
НГ(5)= • <31-26)
S [1 —W* (S)]
В общем процессе восстановления случайная величина Tj имеет плотность вероятности wt (т) и поэтому wl (s) = ay; (s)to* (s)p-1, а функция восстановления Нг (1) будет определяться выражением
74(*) = (31.27)
S [1 —w* (s)]
Для стационарного процесса восстановления wt (т) дается формулой (2), соответствующее ей преобразование Лапласа имеет вид [1 —w* (s)]/smT. Поэтому функция восстановления Н3 (/) определяется формулой
(s) = l/s2mT, (31.28)
т. е.
Н3 (/) = t/mx. (31.29)
Таким образом, для стационарного процесса восстановления математическое ожидание числа событий в полуинтервале времени (4, 41 определяется простой формулой
Н3 (4) - Н3 (4) = (4 - 4)/тт. (31.30)
Анализ выражения (27) зависит от вида конкретных плотностей вероятностей wt (т) и w (т). Рассмотрим более подробно выражение (26) для простого процесса восстановления, обратив особое внимание на предельный случай при оо.
Если w* (s) есть рациональная функция s, то Н* (s) будет тоже рациональной функцией и ее обратное преобразование Лапласа получается в виде комбинации экспоненциальных функций. Например, пусть w (т) = v’t ехр (—vt). Тогда w* (s) = v2/ (v + s)2 и
Hi (s) = —— = —-------------— +--------!-----
s2(2v-f-s) 2s2 4s 4(2v+s)
Отсюда получаем
-Lvt—L + JLexp(-2w). (31.31)
2 4 4
Функция восстановления
437
Исследование общей предельной формы функции восстановления Нх (/) при t -> оо требует анализа функции //’ ($) при $ -> 0. Разлагая экспоненту в степенной ряд, формально можем написать
w*(s) = <e~ST> = 1— 5/Пт + у-82(тг4-СТт)+ ...
Подстановка этого выражения в (26) дает
^(8)
1 , ar~mT , „ ( 1 \
=-------1--------h о — .
s2 тх 2sm2 \ s /
Полагая оо, из формального обращения этого результата получаем
t al — ini ^1(0 = - + —- т +0(1). (31.32)
» т
Хотя строгое доказательство этой формулы возможно при весьма слабых ограничениях на вид плотности вероятности w (т), однако оно требует специальных и сложных математических аргументов и поэтому здесь не рассматривается 1127].
Приведем без доказательства асимптотические формулы для дисперсии on случайной величины N (/). Для простого процесса восстановления
= ----гй+я(1), (31.33)
т* I 12 Зт’ )
а для стационарного процесса восстановления
/гт2 / « гг4 X
^=Ч-+ 4-+-ТТ-ТТ +о(1)> (31-34)
ml \ 6 2т% 3ml /
где ц3 — <(т — /пт)3> — третий центральный момент случайной величины т.
Плотность восстановления
Рассмотрим плотность восстановления v (/), определенную формулой (29.16). Вероятность того, что k-e восстановление произойдет в малом интервале времени (/, t + Л/), равна пу* (/)Д/ + о(А7). Величина v (7)Д/ при Д/ —> О совпадает с вероятностью восстановления в интервале (/, t + Д/) безотносительно номера восстановления (первого, второго и т. д.). Поэтому
v(z)= 2 ^(0 = ^'(0-
*=i
(31.35)
438
31. Процессы восстановления
Здесь последнее равенство справа записано на основании выражений (19) и (25).
Воспользовавшись этой формулой и учитывая соотношение (29), находим, что для стационарного процесса восстановления плотность восстановления v3 (/) равна
v3 (/) = l/mT = const. (31.36)
Согласно (26) и (35) для простого процесса восстановления можем написать
vns) = -^7T (31-37)
1— w* (s)
или
v* (s) = u»* (s) + v* (s)ay* (s).
Отсюда путем обращения получаем
t
Vi (t) = w (t) + (t— u)w(u) du. (31.38)
о
Для общего процесса восстановления вместо формул (37) и (38) получим
V*(S)= (31.39)
1 — w (s)
v2 (0 = ay, (/) + хг (t — и) w (и) du. (31.40)
b
Интегральные уравнения (38) и (40) относительно функций v (/) часто называют интегральными уравнениями теории восстановления. Укажем, что уравнение (38) можно получить на основании вероятностных рассуждений. Вероятность восстановления в интервале (/, t + А/) равна сумме: 1) вероятности w (f)&t того, что первое восстановление произойдет в интервале (/, t + А/) и 2) сумме по всем и вероятностей того, что восстановление произойдет вблизи точки t — и, причем предшествующая длительность безотказной работы была равна и. Аналогичное обоснование применимо и к уравнению (40).
Общее предельное значение v, (/) для простого процесса восстановления формально находится с использованием формулы (32):
lim V1(0=l/mt. (31.41)
Путем предельного перехода в формуле (39) при s -> 0 можно показать, что этот асимптотический результат остается справедливым и для общего процесса восстановления.
Плотность восстановления
439
Таким образом, для всех трех видов процессов восстановления справедлива асимптотическая формула
lim v (() = 1/иц. (31.42)
( —> ОО
Выражения для плотностей восстановления Vj (/) и v2 (/) легко получаются в частном случае, когда интервалы времени между соседними восстановлениями имеют экспоненциальное распределение w (т) = v ехр (—vt). (31.43)
В этом случае уравнение восстановления (40) принимает вид
va (/) = а>! (() + v va (t — u) e-v“ du. (31.44)
о
Решение этого уравнения дается выражением
v, it) == va (0) 4- f e~v" |ev“ (и)] du. (31.45) J du
Действительно, пусть М2 (/) = ev< v2 (/), И?! (/) e (/)• Из уравнения (44) следует, что функция Мг (/) должна удовлетворять интегральному уравнению t
M2 (0=K7i(04-vjM2(u) du. о
Путем дифференцирования отсюда получаем соответствующее диф фереициальное уравнение
JLm2(/)-vM2(0 = ^- 1^(0.
решение которого имеет вид t
М2 (!) = М2 (0) evl - f ev<' — 1171 (M) du.
J du
о
Из этого решения непосредственно следует результат (45).
Применительно к простому процессу восстановления по формуле (45) получим
V! (/) = w (0) = v = const. (31.46;
При вычислении плотности восстановления для малых значений t обычно получаются хорошие результаты, если пользоваться формулой (35) и учитывать лишь несколько первых членов ряда.
440
31. Процессы восстановления
Времена возвращения
Получим асимптотические формулы для распределений обратного т" и прямого т+ времен возвращения. Чтобы найти распределение обратного времени возвращения т~, заметим, во-первых, что т~ = = t' в том и только в том случае, если в интервале (0, /') не произошло ни одного восстановления, т. е.
р {т- = /'} = р (Т1 = tl > t'} = 1 - P{tt < f} =
= 1-Л, (/'), (31.47)
где (/') — функция распределения первого элемента (вероятность того, что первый элемент откажет до момента времени t').
-t-ч— х х+Лх
t'-x t' t
Рис. 31.3. К вычислению плотности вероятности обратного времени возвращения.
Во-вторых, для некоторого х <Z t' вероятность того, что т~ заключено в интервале (х, х + Дх) для достаточно малых Дх, равна вероятности того, что в интервале (/' — х — Дх, f — х) произошло восстановление (рис. 31.3) и что длительность безотказной работы введенного тогда элемента больше, чем х:
Р {х < т~ х + Дх} « v (/' — х)П — F (х)1Дх, (31.48)
где функция распределения F (х) определена формулой (3). Плотность вероятности величины т_ для пуассоновского процесса дается второй формулой (30.48).
Рассмотрим предельное распределение величины т~ при оо. Так как Л, (/') -* 1 при t' -> оо, то для достаточно больших времен первый член (47) обращается в нуль. Далее, для любого фиксированного х согласно формуле (42) имеем
lim v(/'—-х)= l/mT.
Тогда из (48) следует, что предельная плотность вероятности обратного времени возвращения т~ имеет вид
[1 — F (х)]//лт.
(31.49)
Для того чтобы распределение величины г- удовлетворительно аппроксимировалось предельным распределением (49), момент времени t' должен быть выбран настолько большим, чтобы, во-первых, Ftt (f) была близка к единице и, во-вторых, плотность восстанов
Времена возвращения
441
ления v (/' — х) была близка к своему предельному значению для всех х, при которых существенны приращения Ftl (/').
Для стационарного процесса восстановления плотность восстановления согласно формуле (36) постоянна и равна 1/тт. Поэтому точное распределение обратного времени возвращения х~ равно предельному распределению (49), урезанному моментом t'.
Рассмотрим теперь прямое время возвращения т+, определяемое как интервал времени, измеряемый от произвольно выбранного момента /' до следующего восстановления. Другими словами, т+ есть остаточное время жизни элемента, используемого в момент времени f.
Чтобы величина т+ была заключена в интервале (х, х + Дх), нужно, чтобы: либо длительность безотказной работы первого элемента была заключена в интервале (/' + х, t' + х + Дх), либо для некоторого и в интервале (/ — и, t — и + 6п) произошло восстановление и длительность безотказной работы вновь введенного элемента была заключена в интервале (и + х, и + х Дх).
Следовательно, плотность вероятности прямого времени возвращения т+ равна
t'
tOj(/' + х) + v(f — u)w(u + x)du. (31.50) b
Предположим, что wr (/') -* 0 при t' -> oo. Тогда для предельной плотности вероятности с использованием формулы (42) получим выражение
ОО 00
—— С w(w + x)du — —1- (* w(s)ds — —F — • (31.51) J mx J mx
0 x
Это выражение совпадает с (49). Поэтому плотность вероятности (51) можно назвать предельным распределением времени возвращения, не уточняя, какое именно время возвращения (обратное или прямое) имеется в виду.
Применительно к стационарному процессу восстановления из выражения (50) можно получить точный результат. Так как для стационарного процесса
Wj (/' + х) = —F^-+x)-, v(/'~u) = -L
mz
то плотность вероятности будет равна
1-77 (z' + x) + — f w(и + х) du = . (31.52)
mT тх J тх
442
31. Процессы восстановления
Следовательно, предельная плотность вероятности времени возвращения является точной плотностью вероятности для стационарных процессов восстановления. Именно этим обстоятельством объясняется вид плотности вероятности wj. (т), принимаемый в формуле (2).
Плотность вероятности (52) является убывающей функцией х и имеет преобразование Лапласа
[1 — w*(s)Vsmx.
(31.53)
Пользуясь этим выражением, нетрудно показать, что среднее значение и дисперсия времен возвращения равны соответственно
В заключение укажем, что математический аппарат теории восстановления, первоначально разработанный в интересах теории надежности и массового обслуживания, в последнее время находит прогрессивно возрастающее применение для решения разнообразных радиотехнических задач [81, 137J.
Наложение процессов восстановления
Как и в случае пуассоновских потоков, предположим, что имеется г независимых, статистически идентичных (имеющих одинаковую плотность вероятности межточечных интервалов) процессов восстановления i — 1, 2, ..., г, которые налагаются (суммируются) так же, как это было изображено на рис. 30.8. Объединенный процесс IV (/), вообще говоря, не является процессом восстановления. Однако некоторые общие свойства результирующего процесса N (I) можно получить из соответствующих свойств суммируемых процессов. Так, если N (/) есть число восстановлений в полуинтервале (0, /], то
= Д\ (/) + ... + ЛЦ/),
(31.55)
где Ni(f) — число восстановлений t-ro процесса в том же интервале. Так как отдельные процессы считаются независимыми, то среднее значение, дисперсия и кумулянты для результирующего процесса находятся суммированием соответствующих величин для частных процессов, а характеристическая (или производящая) функция равна г-й степени характеристической (производящей) функции частного процесса.
При вычислении характеристик случайной длительности до А-го восстановления в данном случае следует воспользоваться формулами (6) или (8) в обратном порядке:
ЛА+1(0=1-^ (*)•
(31.56)
Наложение процессов восстановления
443
Это соотношение позволяет получить общий асимптотический ре-вультат для больших k. Ранее было доказано, что при больших t случайные величины NL(f) в формуле (55) являются асимптотически нормальными со средним значением tlmx и дисперсией /о’/т? (см. (14)). Следовательно, случайная величина N(t) является также асимптотически нормальной со средним значением rtlmx и дисперсией г/Ос/т?. Если теперь провести рассуждения после формулы (10) в обратном порядке, то придем к заключению, что время th асимптотически нормально распределено со средним значением kmx!r и дисперсией ko^lr*.
При дополнительном предположении, что суммируемые процессы восстановления Ni(t) являются стационарными, вычислим плотность вероятности ay0(s) интервалов между соседними восстановлениями результирующего процесса N(t). Чтобы вычислить tt>0(s), рассмотрим предварительно распределение обратного времени возвращения т,; результирующего процесса. Очевидно, что
то = min(тг,..., тг ),
где через tz“(Z = 1, г) обозначено обратное время возвращения процесса /7г(/).
Так как составляющие процессы независимы, то
Р {то- > s) = fl Р N > s} = z=i
— [1 — ^(х)] dx mz
Здесь последнее равенство написано согласно формуле (49), которая для стационарных процессов является точной. Дифференцируя по s, получаем плотность вероятности величины т.7:
к? (s)--------fl — F (s)J
f OO
f — fl — F (x)J dx
J
s
(31.57)
Покажем, что формула (49) применима к любому ординарному стационарному процессу. Действительно, для стационарного процесса обратное время возвращения т~ не зависит от произвольно взятого момента t'. Пусть щ0(т) есть плотность вероятности интервалов между последовательными событиями процесса. Если временная точка t' выброшена случайным образом, то вероятность того, что в какой-либо конкретной реализации процесса большой длительности опа упадет между двумя событиями, разделенными интервалом между т и т -f- dx, пропорциональна полной длине этих интервалов, т. е.
Стщ0 (т) dx.
444
Процессы восстановления
Так как точка обязательно упадет на какой-либо из интервалов, то
С xw0 (т) dx = Cm= 1, С = 1/m, о
т. е. интересующая нас вероятность равна tw0 (т) dxltn,
где m — среднее значение интервалов между соседними событиями.
Пусть известно, что случайная точка t' упала на интервал длины т. Естественно считать, что с одинаковой вероятностью она может оказаться в любом месте этого интервала, т. е. условная плотность вероятности случайной величины х~ является равномерной в интервале (0, т). Поэтому безусловная плотность вероятности для т~ равна
/ \ fl т / \ j 1 — /% (s) w (s) = 1-------------------w.. (т) dx =-------------------—
.) т m m
(31.58)
где F0(s) — функция распределения интервалов между событиями.
Применим формулу (58) к сумме г идентичных стационарных процессов восстановления. Опираясь на формулу (30), нетрудно заключить, что для результирующего процесса
tn — mx!r.
(31.59)
Подставив это значение m в формулу (58) и приравняв затем правые части формул (58) и (57), получим
F0(s)=l-[l-F(s)] — f (l-F(x)Jdx
(31.60)
Отсюда путем дифференцирования по s находим плотность вероятности интервалов между событиями в объединенном процессе
X(s)=-----[1—F(s)] — f [1 -F(x)]dx . (31.61)
Применительно к пуассоновскому процессу с экспоненциальным распределением межточечных времен вида vexp (—vt) функция распределения F(s) = 1 —ехр (—vs) и формула (61) дает известный результат ю0($) rvexp (—rvs). Если интервалы между события
Наложение процессов восстановления
445
ми распределены равномерно па отрезке (0, 2ц), то формула (61) приводит к выражению
0<s<21A. (31.62)
При г -> оо это распределение достаточно быстро сходится к экспоненциальному распределению со средним значением г/ц.
При большом числе г суммируемых стационарных процессов восстановления результирующий процесс асимптотически стремится к пуассоновскому потоку.
32. Профильтрованный пуассоновский процесс
На частном примере дробового шума сначала поясним название параграфа и опишем физический характер рассматриваемых процессов, а затем получим основные соотношения, определяющие статистические характеристики таких процессов.
Дробовым шумом обычно называют флуктуации тока в вакуумных и полупроводниковых приборах, обусловленные случайным характером эмиссии и движения электронов в них. Рассмотрим в ка честве конкретного и простейшего примера плоскопараллельный электровакуумный диод, работающий в режиме насыщения. Анод ный ток диода представляет собой суперпозицию элементарных индуцированных импульсов, возникающих из-за пролета между ка •годом и анодом отдельных электронов. Поскольку в режиме насы щення нет взаимного влияния элементарных импульсов друг иа друга, то анодный ток есть просто линейная сумма элементарны', импульсов. Форма отдельного элементарного импульса определяется динамическими уравнениями движения электрона. Если не учиты вать различие и случайное значение начальных скоростей эмитн руемых катодом электронов (см. ниже), то форма всех элементарных импульсов будет одинаковой и они будут отличаться только време нами появления Ц. Если // — момент времени вылета электрона из катода, то в рассматриваемом частном примере элементарный импульс тока, индуцированный на аноде пролетом электрона, имеет вид прямоугольного треугольника, изображенного на рнс. 32.1, где е — заряд электрона, та — время пролета электрона между катодом и анодом.
Предположим, что наблюдение за анодным током какого-либо одного диода начинается в момент времени t =» 0 и этот ток i(t) измеряется в момент времени t. Допустим, что t много больше длительности элементарного импульса та (чтобы можно было не учи-
446
32. FIрофильтрованный пуассоновский процесс
тывать влияние на ток i(f} элементарных импульсов, появившихся до начального момента времени t = 0). Если в полуинтервале (0, t\ было эмиттировано ровно k электронов, то ток рассматриваемого диода равен
1(0= 2 hV-^-
(32 1)
Рис. 32.1. Элементарный импульс индуцированного тока.
Здесь h(t — /') — детерминированная форма элементарного импульса, обусловленного электроном, эмиттируемым в момент времени t’i, причем времена t't не ранжированы.
Предположим, что описанная операция наблюдения осуществляется над большим числом идентичных диодов, работающих в одинаковых условиях. Тогда естест-
венно допустить, что число эмиттируемых электронов в разных диодах за время (0, будет различным. ‘ С учетом этого обстоятельства ансамбль диодов можно характеризовать случайным процессом {/а (/), 0</<оо), где
/.(0=2
(32.2)
/= I
Здесь W (/) — целочисленная случайная величина, определяющая число электронов, эмиттируемых в полуинтервале (0, /1, tt — случайные неранжированные времена эмиссии электронов.
Если принять, что случайный процесс эмиссии электронов из катода удовлетворяет трем условиям, сформулированным а начале § 30, то случайная величина N(t) будет иметь пуассоновское распределение.
Случайному процессу (2) можно дать другую трактовку. Предположим, что на вход линейной системы с импульсной характеристикой h (/) воздействует последовательность (сумма) пуассоновских дельта-импульсов
W(«)
s(0= 2 6(/--G), (32.3)
/=t
где tt — случайные времена появления дельта-импульсов, описываемые пуассоновским потоком. Тогда случайный процесс на вы-&оде системы будет иметь вид (2):
I W)
Х(/)= f/i(^ —T)s(x)dT = 2 h{t — tt).
0 i=l
Определение профильтрованного пуассоновского процесса
447
Если линейная система имеет переменные параметры и, следовательно, импульсную характеристику вида Л (t, г), то на выходе такой системы получим случайный процесс
ЛГ(П
(32.4) < = 1
Этот пример в некоторой мере поясняет название и содержание настоящего параграфа. По существу будут рассматриваться случайные процессы, получающиеся в результате своеобразных линейных преобразований пуассоновского потока.
Во многих практических ситуациях приходится иметь дело со случайными процессами более сложного вида, чем (2) и (4). Так, если учитывать случайный (максвелловский) характер начальных скоростей эмиттируемых электронов, то форма элементарных импульсов будет зависеть не только от времени вылета электрона /(, нои от его начальной скорости vt. При этом вместо процесса (2) получим более сложный процесс
W(t)
(32.5) ?=)
Если в приведенном выше примере считать различными и случайными высоты входных дельта-импульсов, т. е. полагать
Win
s(0=2 4(fi(/-6), (32.6)
< = ।
то на выходе линейной системы о переменными параметрами получим сложный процесс
Win
Х(0= 2 А Л (/,/,). (32.7)
/ (В I
Разумеется, что со случайными моментами времени tt можно связывать различные величины. Например, в теории надежности — стоимость или трудозатраты восстановлений и т. д.
Следуя [10], мы примем за исходное следующее определение профильтрованного пуассоновского процесса.
Случайный процесс {X (t), t 0} называется профильтрованным пуассоновским процессом, если для t 0 его можно представить в виде
Win
Х(/)= 2 Л(/,т<>2<). (32.8)
1=1
Здесь {N (/), t 0} — пуассоновский поток с интенсивностью V, {гп} — последовательность взаимонезависимых и одинаково
448
32. Профильтрованный пуассоновский процесс
распределенных случайных величин, не зависящая от {N (/), t 0}, h (I, т, г) — детерминированная функция трех действительных переменных.
Во многих практических задачах отдельные величины в записи (8) допускают следующую интерпретацию: Tt — время появления случайного события, г( — амплитуда элементарного сигнала, связанного с этим событием, А(/, т(, г) — обусловленное этим событием значение элементарного сигнала в момент времени t и X (/) — значение при t суммы элементарных сигналов, обусловленных событиями, осуществившимися во временном полуинтервале (0, Н.
Из выражения (8) следует, что для задания профильтрованного пуассоновского процесса необходимо указать: 1) интенсивность v порождающего пуассоновского потока, 2) общее для всех случайных величин ‘{zt} вероятностное распределение и 3) конкретный вид функции h (t, т, г).
Основные статистические характеристики профильтрованного пуассоновского процесса определяются следующей теоремой.
Пусть X (/) — профильтрованный пуассоновский процесс (8). Тогда для любых положительных t и действительных значений Q одномерная характеристическая функция определяется формулой
Фх((> (й) = ехр
v^[<exp/QA(/, т, z)>— 1 ] dr . о
(32.9)
а двумерная характеристическая функция для любых г2 > Л > 0 и действительных значений Qi и П2 дается выражением
фх(Ц).х(г,)(Й1,Й2) = ехр
v [<ехр/ (Qx А (/х, т,г)+
Q
4- А (Л, т, г))> — 1] dx + v [<ехр /Й2 А (/2, т, г)>— 1 ] dx t,
(32.10)
Если <А2 (/, х, г)> < оо для всех т, то процесс X(f) имеет конечные первый и вторые моменты, равные
Л1А (0 = <X(0> = vJ<A(/,T,z)>dT, (32.11)
о
ол (0 = <Х2 (/)> = v <А2 (/, х, г)> dx, о
(32 12)
(^i, G) = (/j) X (^2)> =. v <h(/1( x,z)h(titx, z)> dx.
о
(32.13)
Моменты профильтрованного пуассоновского процесса
449
Здесь X (0 = X (t) — Mx (t\ а через г формально обозначена случайная величина, имеющая тот общий вероятностный закон распределения, который описывает каждую из взаимно независимых случайных величин {г,}.
Из методических соображений начнем доказательство этой теоремы с вычисления математического ожидания процесса Mx(J). Случайный процесс X(f) согласно (8) есть сумма случайного числа детерминированных функций от случайных аргументов. Имея это в виду, вычислим математическое ожидание X(t), предполагая сначала, что целочисленная случайная величина имеет какое-либо фиксированное значение (допустим, k). Это условное математическое ожидание находится осреднением по k неранжированным временам тг и случайной величине г. Затем полученный результат осредним по всем возможным значениям случайной величины N(t).
Итак, можем написать
Мх (г) = <Х (0> «X(О I М (И = >г Р {/V (0 = k}, (32.14) 4 = 0
где N (t) имеет пуассоновский закон распределения
^ (/)=-.-1^-е-^ , £ — 0,1,2........ (32.15)
а условное среднее значение можно записать в виде
й
«X(/)|/V(/) = A>x,.\= 2 ((ЖчФгА. (32.16) = 1
Отметим, что в (16) должно выполняться двойное осреднение: по неранжированным временам появления событий тъ т2, ..., тЛ и по случайной величине г; порядок выполнения операций осреднения в принципе не имеет значения.
Рассмотрим, как это записано выше, сначала осреднение по случайным величинам тг. Из § 30 следует, что поскольку процесс /У(/) является пуассоновским, то все времена появления событий тг — взаимонезависимые случайные величины, каждая из которых равномерно распределена в полуинтервале (0, /]:
(т| УУ (/) = &)= | N (/) = k) =-j- при 0 < т t, i' = 1,2, ..., k.
(32.17) Следовательно,
t
<h (t, Tj, z)>t/ = ± J A (/, t, z) dx.
о
450
82. Профильтрованный пуассоновский процесс
Учитывая, что операции интегрирования и взятия математического ожидания можно менять местами, можем написать
«Л (/, т/( г)>х.>г = y J <Л (/, т, г)>dx. о
(32.18)
Здесь
оо
<Л(/, т, г)> = h(t, т, г) W (г) dz,
— оо
(32.19)
где W(z) — общая плотность вероятности каждой из случайных величин {zj. Подставив выражение (18) в (16) и полученный результат в (14), придем к формуле (11):
I мх (0= J-J</i(/,T, о
оо
z)>dT 2 fr = o
</i (t, т, z)> dx.
Получим теперь формулу (9) для одномерной характеристической функции
Ф^)Р)=<ехр[/ЙХ (/)]>==<(ехр 2 /1(<>тп2) >•
(32.20)
Поступим так же, как и при вычислении математического ожидания. Можем написать
00
Фх(0 (Й) = 2 «ехР 1/ЙА (OJI Ъ>г Р (/) = /г},
*=о
(32.21)
где
«ехр[/ЙХ(/)]|М(0 = ^>г =
. k k
П ехр [jGih (t, xt, г)]\ > = П «ехр [jQh (/, т(,г)]>т >г.
7=1 /Ч/г 1=1
(32.22)
Здесь последнее равенство написано на том оснований, что случайные величины Tlt т2, ..., тЛ взаимонезависимы. Так как все они имеют одинаковую равномерную плотность вероятности (17), то
(exp[/Q/i (t, xh г)]> J ехр[/йй (t, х, z)]dx, i= 1,2,.... k. о
Характеристические функции профильтрованного процесса
451
Поэтому выражение (22) принимает вид k I
П у J <ехР (*> М)1>г^ = 1= 1 О
J <ехр[/ЙЛ (t, т, г)]> di
Для упрощения записей в последнем выражении опущен индекс г. Подставим это выражение в (21) и учтем формулу (15). Тогда получим
Фхщ (&) = 2
*=о
i >4
J < ехр [/ПЛ (t, т, г)> di о
М* с~у/ kt
<ехр [jQh. (t, т, г)]> di
, t
= е_ vt ехр |v <ехр [/ПЛ (t, i, г)]> di
I о
Отсюда видно совпадение полученного результата с формулой (9).
Перейдем к доказательству формулы (10) для двумерной характеристической функции
Фхщьад (^i, ^2) = <ехр [/ПхХ (/i) + /На X (f2)j> =
Л/(Щ N(tt)
2 h (zi>г<) + 2h т‘> г‘)
z=l Z=1
/ W.) ч
= <ехр/ 2 [^1Л(^i, i;f, г*)+ ^2Л(^2>
х z=i 7
(32.23)
Здесь при записи последнего равенства две суммы заменены одной с одним общим верхним пределом суммирования (V(f2) на том основании, что при любых гит функция h (t, т, г) = 0, если t < т, так как элементарный входной сигнал, появившийся в момент времени т, не может оказывать влияние на результат в более ранний момент времени t.
Ради сокращения последующих математических записей введем обозначение
g (т, г) = £21Л(/1, т, г) + Q2h(t2, т, г). (32.24)
Тогда
(йь Й2) = <ехр (/[?)>, U=^g (ih Zi). (32.25) z= i
452
32. Профильтрованный пуассоновский процесс
Порядок последующих вычислений такой же, как и при вычислении одномерной характеристической функции. Можем написать
оо
<ехр(jU)>= 2 <<ехр(/У)| М(/3) = ^>т.>гР{М(/2) = й}.
4=0
Повторив приведенные выше рассуждения, относящиеся к одномерной характеристической функции, теперь получим
«exp(/[/)|W (/,) = й>х >X=J-L С <exp/g(i,z)>dT
*2 J
0
Подставив этот результат в предыдущее выражение и учтя формулу (15), получим
оо
e-V'2
4 = 0
7~ С <ехР Ш С1, г)> =
*2 J
0 )
= ехр J v [<ехр ig(i, г)> — 1 ] di I о
Если подставить сюда выражение g(x, г) из (24) и учесть, что h (t, i, z) = 0 при t < i, то придем к формуле (10).
Формулу (12) можно получить из (9), а (13) из (10), воспользовавшись известным правилом вычисления моментов по характеристическим функциям:
jMx (!) = AJn ФЛ(;. (0), а Л
I = |пфх(1> (0),
(32.26)
/2 Кх (G. Q = 1П ФХ((1),ад (0. 0).
C/Ldj (/Ъй2
Применительно к простейшему стационарному дробовому шуму вида (2), а именно, оо
Х(/) = У, h{t—ti)> -------- 0О</<0О,
/ =s — ОО
где времена появления элементарных импульсов одинаковой формы описываются пуассоновским потоком с интенсивностью v, формулы (9), (11)—(13) принимают следующий вид:
Фхя, (Й) = ФЛ (^)= expfv |exp(/Q/z(s))—l]d4 , (32.27)
Теорема Кемпбелла
453
Mx(t) = Mx—v $ h(s)ds, (32.28)
— оо
Ox(t) = osx = v h2(s)ds, (32.29)
— оо
Kx(t,t + ^)~kx(T:) — v Л(s)Л(s + т)ds. (32.30)
— оо
Формулы (28)—(30) обычно называют теоремой Кемпбелла о суперпозиции независимых случайных возмущений (импульсов).
В качестве иллюстрации этой теоремы рассмотрим ранее описанный пример дробового шума в плоскопараллельном диоде, работающем в режиме насыщения, когда элементарные импульсы имеют вид прямоугольных треугольников (рис. 32.1), т. е.
2<>
^(s)=—Fs, 0sCssCTa.
Применительно к этому частному случаю теорема Кемпбелла дает
Mx = ve, ox ~ 4ve2/3ra,
4ve / < 3 | т I , 1 | т |з \ i •
-— |1---------L-I-------L-5L-| при|т;<та,
при других т.
Пусть стационарный дробовой шум имеет вид
&х(т)~ 3Та ' ‘Та "
X(t) = 2 At — oo<f<oo. (32.31)
l « — OO
Здесь Ai — взаимонезависимые случайные амплитуды элементарных импульсов, имеющие общую (для всех Лг) плотность вероятности П7(Д), h — случайные времена появления элементарных импульсов, не зависящие отЛг- и описываемые пуассоновским потоком с интенсивностью v. В данном случае формулы (9)—(13) переходят соответственно в следующие:
ФДЙ) =ехр k ^[<ехр (/Q4/i(s))> —- l]ds|, (32.32)
I о '
Ф2(йъ Q2) = ехр ^[<ехр /А (йг h (s) + &2h(s + т))> —1 ] ds +
I о
+ v[<ехр/Qa ЛЛ (s)> — l]cfs|, т = (> —/1( (32.33)
о
454
32. Профильтрованный пуассоновский процесс
М л = v ( Д> h (s) ds, (32 34)
о
rt = v<A^h*(s) ds, (32.35)
О
kx (t) = V ( Д2> ^7i (s) h. (| т | 4- s) ds. (32.36)
о
Здесь
(Дп) = AnW(A)dA,
— 00
<ехр(/ЙД/ф))> = J exp (jttAh (s)) W (Д) dA. (32.37) — oo
В том частном случае, когда амплитуды всех элементарных импульсов одинаковы и равны До, т. е. W (Д) = S (А — До), эти формулы упрощаются, так как
(Д'1) = Апв, (ехр (/£M/i(s))> = ехр (/QД0A(s)).
Понятие профильтрованного пуассоновского процесса и соответствующие результаты могут быть обобщены на неоднородный, обобщенный и сложный процессы Пуассона. В частности, пусть {Л/ (/), / > 0} есть неоднородный процесс Пуассона с функцией интенсивности v(t). Напомним, что величина v(t)dt приближенно равна вероятности того, что в интервале (/, t + dt} произойдет одно событие процесса Л^/). Пусть профильтрованный неоднородный пуассоновский процесс по-прежнему определяется выражением (8). Можно показать, что для такого процесса формулы (9), (И)—(13) принимают вид
In ФЛ(П (й) = v (т) (ехр /Йй {t, т, г)— 1) di, (32.38) о
Мх (0 = v (т) (h(t, т, г)) di, (32.39)
о
ох (0 = v (т) (/г4 (t, 1, г)> di, (32.40)
о
mln (Ц, /г)
Кх(гь 5 v(I)</l(*i.I>z)M/a, T,z)>dt. (32.41)
О
Асимптотические свойства профильтрованного процесса
455
Отметим, что эти формулы дают статистическое описание нестационарного дробового шума. Если «насыщенный» диод работает при периодически изменяющихся напряжениях, то интенсивность эмиссии будет также периодически меняться. В результате получим неоднородный процесс Пуассона с периодически изменяющейся функцией интенсивности v(/).
Выше были получены формулы для характеристических функций профильтрованного пуассоновского процесса. Однако из обратного преобразования Фурье, как правило, не удается найти по характеристическим функциям соответствующие вероятностные распределения. Возникающие вычислительные трудности не позволяют выполнить расчеты точно и до конца. Этот вопрос подробно обсуждался в физической и математической литературе ПО, 94, 131, 138—142]. Здесь мы рассмотрим предельный случай, а именно, докажем асимптотическую нормальность профильтрованного процесса Пуассона при увеличении параметра интенсивности v (v -> оо). Этот результат, по существу вытекающий из центральной предельной теоремы (поскольку речь идет о сумме функций от независимых случайных величин), можно сравнительно легко доказать.
Из формул (11) и (12) видно, что математическое ожидание и дисперсия профильтрованного пуассоновского процесса линейно возрастают при увеличении интенсивности v. Поэтому целесообразно иметь дело с нормированным процессом
Y (/) - (X (?) - Мх (t)\lcsx (0, (32.42)
математическое ожидание которого равно нулю, а дисперсия — единице. Для сокращения записей введем формальные обозначения t i
а =Д (/, т, z))ch:, ]32= § <1г1 (Z, т, г)> dx (32.43)
л О
Из сопоставления этих обозначений с формулами (11) и (12) следуют равенства
Л4 А (0 = va, (Z) = v02. (32.44)
С учетом введенных обозначений имеем
У(0 = =—7Z7-—EV. (32.45)
P/v p/v p
Выразим характеристическую функцию нормированного процесса Y (?) через характеристическую функцию (9) процесса X (Z). По определению характеристической функции имеем
Ф= <ехр ПЙУ (/)]> = ехр ( — /у VG)/ехр Х(0]/=>
456
32. П рофильтрованный пуассоновский процесс
Подставив сюда выражение (Q/0 у%) из (9), можем написать
h(t, т, г, v v )
X ехр о На основании известного разложения экспоненциальной функции в ряд
е'* = 1 + /х--------— х2— / — х3 4- — х4 + ...
1 2 ' 3! 4!
представим экспоненту под знаком интеграла рядом и несколько преобразуем получающееся выражение с учетом введенных обозначений (43). Тогда получим
1 / й \4
+ — ----------— h*(t, т, г) + ... — ]\dx
\ Р ")/ V / /
= ехр
—Т, 2))dT + ' о
(32.46)
о
Отсюда видно, что если для любых t математическое ожидание Mx (t), дисперсия О/ (0 и входящие в (46) отношения
(/ifc (/, т, z)> dr I <Лг (/, т, г)> dx о Цо
k
, /г = 3, 4, ...
(32.47)
конечны, то при v оо нормализованный процесс Y (/), а следовательно, и исходный процесс X (/) становятся асимптотически нормальными. В этом предельном случае
lim ФУ(0(Й) = ехр { — — Й2). (32.48)
V-»oo \ 2 /
Воздействие пуассоновских импульсов на колебательный контур
457
AMt-ti)
Рис. 32.2. Колебательный контур.
Этой предельной характеристической функции соответствует нормальная плотность вероятности
РУ (у) = (2л)~1/2 ехр (-у2). (32.49)
Если теперь согласно (45) возвратиться к первоначальному процессу X (/), то при оговоренных выше условиях асимптотическая нормальйая плотность вероятности равна
Рх (х) = {2лстх (0}-1/2 ехр [—(х — Мх (/))2/2стх ДОГ (32.50)
Можно показать, что полученный асимптотический результат распространяется на многомерные характеристические функции. Следовательно, профильтрованный процесс Пуассона асимптотически стремится к нормальному процессу, когда параметр интенсивности v (среднее число событий в единицу времени) неограниченно возрастает.
Один пример нормализации про фильтрованного пуассоновского про
цесса, когда на интегрирующую цепочку RC воздействуют пуассоновские дельта-импульсы со случайной амплитудой, был рассмотрен в § 23. Рассмотрим здесь другой пример.
Пример 1. Воздействие пуассоновских дельта-импульсов со случайной амплитудой на колебательный контур. Пусть на колебательный контур LCR (рис. 32.2) воздействует последовательность импульсов тока вида А,6 (/ — /Д где Л,- — случайные взаимоне-зависимые «амплитуды» дельта-импульсов с одинаковой (общей) плотностью вероятности W (Л), h — случайные моменты появления дельта-импульсов, не зависящие от {Л;} и описываемые пуассоновским потоком с интенсивностью v. Конкретизируем условия, при которых плотность вероятности тока в индуктивной ветви колебательного контура будет близка к нормальной. При этом ограничимся рассмотрением колебательного случая (соо==(ЛС,)~1 /2 3> а = R/^L), когда импульсная характеристика имеет вид
G (/) = соое-“' sin сооЛ (32.51)
Каждый из указанных входных дельта-импульсов вызывает на выходе контура элементарный импульс тока, определяемый интегралом Дюамеля:
t
h(t — tb Ai) = A^G R—t)6(t — tt)dt = о
=<о()Лг exp[ — a(l— —tt). (32.52)
15 Зак. 1216
458
32. П рофильтрованный пуассоновский процесс
Поэтому интересующий нас профильтрованный процесс Пуассона в стационарном состоянии имеет вид
Х(/)=;со„ У A, expt—a (f — ZJ] sin co, (t— tt). (32.53) i = — OO
По формулам (34)—(36) находим математическое ^ожидание, дисперсию и корреляционную функцию процесса X (/):
0О .2
Мл ,1, -= vmL (Д) со,, f e-u' sin соо sds= vm,M) —« т/п1(Д),
J a24-(0o
о
X
ax = vtn2 (Д) co2 J e~2as sin2 co,, sds = о
= И) « vm2 (Д) co2/4a,
4a (a + io;)
OO
kx (t) = vm2 (Д) co"2 j e-<n2s+i т D sjn Sin coo(| t|4- s) ds = 0
= vm2(A) e-alT| [co2 (co2— a2) cos co,, t— aco3 sin co,, |x|]/4a (a2 + co2) « « vm2 (Д) co2 exp ( — a | т |) cos co, x/4a
Здесь и в дальнейшем начальные моменты случайной амплитуды обозначены через
тп(Д) = (Д'1>= J AnW(A)dA. (32.54)
— оо
Вычислим теперь отношения (47), входящие в выражение (46) для характеристической функции при k — 3 и 4. Применительно к нашему примеру они принимают вид
L С e-ufe sinft(ci>,,s) ds I C e-2a> sin2 (co s)dsl « Kin.iA) J J
° 2 a lo J
143 ;a/co„f при /г = 3,
<o0 mt (A) ( 24 (a/co,,)3 при k = 4.
Следовательно, если плотность вероятности случайных «амплитуд» воздействующих дельта-импульсов такова, что отношения тк(Д)/т*(Д) конечны, то плотность вероятности тока в индуктивной ветви колебательного контура при v -> оо будет весьма быстро (из-за выполнения неравенства а<^со0) стремиться к нормальной.
Воздействие пуассоновских импульсов на колебательный контур
459
Укажем, что выражение для одномерной характеристической функции (32) применительно к линейным узкополосным колебательным системам можно существенно упростить [141]. Обычно импульсная характеристика таких систем имеет вид
G (0 = g (/) cos (со,-,/ — ср), (32.55)
где g (0 — огибающая импульсной характеристики, <р — некоторый постоянный фазовый сдвиг.
Если рассматривать воздействие на такую систему пуассоновских дельта-импульсов со случайной амплитудой вида Д;б (t —tt), то элементарные импульсы на выходе системы будут иметь вид
fi (t — it, Д,) = A,g (t — G) cos I co,, (t — ti) — q>J. (32.56)
При этом для одномерной характеристической функции по формуле (32) можем написать
{ОО
v j [(ехр (/П Ag (s) cos(io0s—<р))>— И ds. (32.57)
о
Представим экспоненциальную функцию под знаком интеграла рядом
ехр [/ПДп'(х) cos (®,s—<p)| — 1= У Апgn (s)cos" (co,,s—ф).
ЛшЛ H1
! = 1
После статистического осреднения и разбиения слагаемых суммы на две группы: с четным и нечетным степенями получим
< ехр [ j&Ag (s) cos(cd.)S — <р)]>— 1 =
Г>2п
= У (— 1)п —— m2n(A)g2'' (s) cos2” (со0 s — ф) +
+ / У (— 1)" + ! (Д)§2,1+1(5)СО52'1+1(®п5— ф).
(2п 1)!
В результате подстановки этого выражения в (57) имеем
Ф^П^ехр^ У (— 1)"Нгт тгп(А) f g2n(s) cos2” (®os —ф) ds +
I jmh (2ft) J
h — i о
+/2("1)п
1 = 0
Q2” + 1
(2n + l)l
OO I
m2ri+1 (Д) J g2” + ‘ (s) cos2n + 1 (®os—ф) dsl. о J
(32.58)
15»
460
32. П рофильтрованный пуассоновский процесс
Разложим периодические функции cos2'1 (wos — ф) и cos2/1+1 (®os — ф) в ряды Фурье:
cos2" ((Оу s— ф) = а0 + 2 ak cos $ + 2 sin ko\ s,
k k
cos2" + 1 (<ou s — ф) = 2 Ch cos ka>0 s + 2 <4 sin s. k k
Перенесем эти разложения в выражение (58):
[ оо оо
(fi) = ехр v У (— 1)" —т2п (Д) [ g2l‘ (s) X лй (2п)! J
In— 1 О
X [а0 + S aii c0S + 2Ж sin ds + [ k k )
~ Q2"+i ‘p
+ / 2 < - 1)n £2n + ‘ x
n = G 0
X [2 С/t cos &и0$ -j- 2 c(h Sin fe(0„s Ids. (32.59) I k k |
Применим теперь лемму Лебега—Римана: если функция [ (х) абсолютно интегрируема в интервале (0, сю), то
оо ОС
lim J / (х) cos tiixdx — lim j / (х) sin <oxdx=^0.
(1) -> OO Q Cl) —> oo Q
Пусть ®0 значительно больше величины, обратной постоянной времени, характеризующей огибающую g (/) импульсной характе-ристики системы. Тогда в выражении (59) формально можно устремить <о0 к оо и применить лемму Лебега—Римана. Выполнив это, получим
{жг-ч О2п . i
V У ( — 1)"—- m2n(A)al: i g2«(s)ds . (32.60)
" 2п)! J
п= I 0 J
При оценочных расчетах этой формулой можно пользоваться в допредельном варианте, если, конечно, соо много больше величины, обратной постоянной времени огибающей g (/).
П риложение 1. Сведения из теории матриц
461
Приложение I.
Сведения из теории матриц
Прямоугольная таблица тп чисел, составленная из т строк и п столбцов, называется прямоугольной матрицей размером тХп 1143]. Она обозначается следующим образом:
(I —I)
_^ml •• ^mn_
Если m — n, то матрица называется квадратной, а число n — ее порядком. Числа, составляющие матрицу, называются ее элементами. При двухиндексном обозначении элементов первый индекс указывает номер строки, а второй индекс — номер столбца, на пересечении которых стоит данный элемент.
Две матрицы А и В называются равными А = В тогда и только тогда, когда они имеют одинаковый порядок и все соответствующие элементы их равны между собой, т. е. а;> = bi} (J = 1, n; i= = 1, т).
Матрица размером 1 X п называется вектором-строкой
X7 — [х, х2 ... xnL (I—2)
Прямоугольная матрица размером n X 1 называется вектором-столбцом
Матрицы и векторы, имеющие только один элемент, называются скалярами. Матрица, все элементы которой равны нулю, называется нулевой и обозначается через 0.
Квадратная матрица, у которой все элементы, расположенные вне главной диагонали, равны нулю
называется диагональной.
(1-4)
462
Приложение I. Сведения из теории матриц
Диагональная матрица, у которой все элементы, стоящие на главной диагонали, равны единице, называется единичной матрицей и обозначается 1. Следом квадратной матрицы tr А называется сумма элементов, стоящих на главной диагонали.
Суммой двух прямоугольных матриц А = 1аг>1 и В = одинаковых размеров tn X п называется матрица С = [с,,] того же размера, элементы которой равны суммам соответствующих элементов данных матриц:
С = А + В, если
си = аа + ^ц (1 — 5)
Операция сложения матриц обладает переместительными и сочетательными свойствами
А + В = В + А, (А + В) + С = А + (В + С).
Произведением прямоугольной матрицы А на число а называется матрица С, элементы которой получаются из соответствующих элементов матрицы А умножением на число а, т. е.
С = аА, если
Cij — aa,, (j = 1, m, /=1 л). (1—6)
Из определения (6) следует, что
а (А + В) = аА + аВ, (а0)А = а (РА), (а + 0) А =
= аА + 0А.
Разность двух прямоугольных матриц одинаксшиги размера определяется равенством
А — В = А + (—1) В.
Произведением двух прямоугольных матриц
А = а21 ^12 • а22 • • ат • а2и , В = &21 ь12. ^22 • b2q
ат2 • • ^тп- •• • b,lq_
си
^21
С12 ••• С1д
С22 ••• С2g
называется матрица
—С ml Cm2 Cmq—
Приложение /. Сведения из теории матриц
463
у которой элемент сц, стоящий на пересечении i-й строки и /-го столбца, равен скалярному произведению вектора, составленного из элементов i-й строки матрицы А, на вектор, составленный из элементов /-го столбца матрицы В:
п ____
С;;.= 'Ziaihbhj (1 — 7)
4= ।
Операция умножения матриц обладает следующими свойствами:
(АВ) С = А (ВС), (А + В) С = АС + ВС, А (В + С) = = АВ 4- АС.
Операция умножения двух прямоугольных матриц выполнима лишь в том случае, когда число столбцов в первом сомножителе равно числу строк во втором. В частности, умножение матриц всегда выполнимо, если оба сомножителя — квадратные матрицы одного и того же порядка. Однако даже в этом частном случае умножение матриц не обладает переместительным свойством, т. е. вообще говоря АВ В А. Если АВ = В А, то матрицы А и В называются перестановочными или коммутирующими между собой.
Аналогично определяются произведения матрицы на вектор-строку и вектор-столбец, произведение векторов на матрицу и произведение вектора на вектор. Например, произведение вектора-столбца на вектор-строку имеет вид
Х\т =
х}у, ХЛу.2...ХАут х2у, х2у2...х2ут
хпУ1 хпУ2 — х»Ут_
Детерминантом (определителем) квадратной матрицы А порядка n > 1 называется число
detA = |A| = 2 (-1)*+1«1йМ1А, (1-8)
4=1
где Mtk — детерминант квадратной матрицы порядка п — 1, полученной из А вычеркиванием первой строки и k-ro столбца. Матрица порядка 1 состоит из одного числа, и ее детерминант по определению считают равным этому числу.
Квадратная матрица А называется особенной (вырожденной, сингулярной), если det А = 0. В противном случае квадратная матрица А называется неособенной.
Для любых квадратных матриц А и В одного порядка имеет место равенство
det АВ = det А • det В.
(1-9)
464
Приложение 1. Сведения из теории матриц
По определению, алгебраическое дополнение (адъюнкта) элемента ац матрицы А имеет вид
= 1)' + 'Мо (i=177, /=Г7), (1—Ю)
где Mtj — детерминант матрицы, полученной из А вычеркиванием i-Й строки и /-го столбца.
Для каждой неособенной матрицы А существует обратная матрица А-1 — [ао1], элементы которой определяются соотношением «/71=дтт (1-11)
det А
Для произведения двух неособенных матриц имеет место равенство
(АВ)"1 = В^А'1. (1-12)
Кроме этого, для каждой неособенной матрицы
АА’1 = А-ХА = I. (1-13)
Здесь I — единичная матрица.
Для каждой квадратной матрицы А = 1аг-,1 порядка п транспонированной матрицей А7 = la/j называется матрица, элементы которой определяются соотношением
z а’ц = а/г (t,/ = l,n). (1—14)
Строки матрицы А являются столбцами матрицы А7 и наоборот. Для операции транспонирования выполняются следующие равенства:
(А + В)7 = А7 + В7, (аА)7 = аА', (АВ)7 = В7А7,
(А-1)7 = (А7)-1, (А7)7 = А. (1-15)
Если А = А7, то матрица А называется симметрической. Если А7 = —А, матрица А называется кососимметрической.
Линейное преобразование n-мерного вектора-столбца X может быть записано в виде
Y = АХ, (1-16)
где А — квадратная матрица порядка п.
В теории матриц большую роль играют векторы X, для которых АХ = ZX (X #= 0). (1—17)
Такие векторы называются собственными векторами, а соответствующие им числа % — характеристическими или собственными числами матрицы А. Для нахождения собственных чисел из (17) следует уравнение
det (А — А!) = 0.
(1-18)
Приложение 7. Сведения из теории матриц
465
Уравнение (18) называется характеристическим или вековым уравнением матрицы А.
Предполагая, что известны все корни характеристического уравнения (18) ..., Лп, из (17) можно определить собственные векто-
ры X/, которые удовлетворяют равенству
Х;Хг = АХг (i = 1Ги). (1—19)
Если все собственные числа (i = 1, /г) матрицы А различны, то собственные векторы Хг (i = 1, п) линейно независимы и ортогональны. В ряде случаев п линейно независимых собственных векторов могут быть найдены и при наличии кратных собственных чисел Л/.
Для матрицы Т = [Хт ... Хп], столбцами которой являются линейно независимые собственные векторы матрицы А, можно написать
ТА = АТ,
где Л — диагональная матрица вида
(1-20)
Таким образом, получим
А = Т АТ-1. (1—21)
Описанный процесс называтся приведением матрицы А к диагональной форме. Можно показать, что матрица А приводится к диагональной форме тогда и только тогда, когда ее собственные векторы линейно независимы.
Заменой переменных Х = Т1), Y = TV преобразование (16) приводится к виду
V = AU.
(1-22)
Если матрица А приводится к диагональной форме, то для всякой аналитической функции f (f) можно определить матричную функцию / (А) следующим образом [56]:
f(A) = T
7(М
О
(1 — 23)
если только скалярная функция определена в точках (i = 1, п). В общем случае / (А) определяется более сложно.
466
П риложение 1. Сведения из теории матриц
Можно доказать [143], что если функция f (г) разлагается в степенной ряд в круге |г — г0| < г,
00
/(?)= 2 aft(z—г0)\
k = 0
то это разложение сохраняет силу, если скалярный аргумент г заменить любой матрицей А, собственные числа которой лежат внутри круга сходимости.
Отсюда следуют, в частности, следующие разложения:
оо
cos А = V Хй
* = 0
(2й)!
ОО sin А = V
*=о
1 Д2Н-1
(2^ + 1)!
ch А =
А 2*
sh А =•-
Д^+1
(1-А)-1 = V А* при (|Х,. |<1 г=1 . п), (1-24)
/г = 0
оо I / 1
1пА= V (~?/~- (А-1)" при (|Х—1|<1, ,- = 177,). м
1
Для функций от матриц сохраняются некоторые свойства соответствующих скалярных функций, например, имеют место равенства
cos2 А + sin2 А = I, еАе~А = 1, eiA = cos А + г sin А.
(1-25)
В тоже время еА+в = еАев только в случае, когда АВ = ВА, т. е. когда матрицы А и В перестановочны.
Вектор, составляющие которого являются функциями некоторого аргумента /, называется векторной функцией, или, коротко, функцией от t. На векторные функции распространяются многие понятия скалярных функций. Например, векторная функция непрерывна, если все ее составляющие в рассматриваемом интервале являются непрерывными функциями аргумента t. Аналогичная терминология используется при описании матричных функций скалярного аргумента.
Операция дифференцирования вектора X (/) или матрицы A (t) по скалярному аргументу t определяется выражением [41]
dt [ dt ” dt j ’
Приложение I. Сведения из теории матриц
467
— А(1) = dt
dan (t) dt
da2i(0 dt
(0 dt
da«^ (t) dt
dam (0 ~ dt
dU2n (0 dt
(1-26)
dani(Q dan2 (Q dt
at
dann (0 di
Для производных от матричной функции скалярного аргумента, в частности, имеют место равенства
А(дв)= (А в + А f—BV — (А-1)=—А-1
dt \ dt I \dt / dt
А"1,
А А"-1
Ап~2
.. + А"-1
(1-27)
Аналогичным образом определяется операция интегрирования матричной функции скалярного аргумента
(1-28)
Lo
Производная скалярной функции есть вектор-строка
rfZ(X) _ df_ "
d'K [dxj дх-2
f (X)
по вектор у-столбцу X
дхп .1
(1-29)
по вектору-столбцу X
Y(X)
Производная векторной функции вид ду> " <?хп 0У2 дхп
называется матрицей Якоби и
rfY _ fdijj dX Idx,
<>У1 дч
С>У2 dxt
имеет
ОУ1 дх2 дУг дХ2
dK dy2 ах
(1-30)
О
дут tym dym
dxi dx2 dxn _
Производная скалярной функции f (A) ляезся формулой
д/Утп . дх _
по матрице
А опреде-
s-ha)-PF1-
dA I dtijj J
(1-31)
468
Приложение I. Сведения из теории матриц
Аналогично определяются частные производные скалярных и векторных функций по векторам. Например, для скалярной функции / (Y, X, /) от векторов Y = Y (X, /), X = X (/) имеем
гЁ!_\ + Ё1_ dX I, дУ ! дХ ф дХ ’
= — 'll — 4-[—1 — + — (1-32)
dt [ дХ \ дУ ) \ дХ I ] dt ‘ [ <3Y J д' д' '
Для векторной функции Z (Y, X, /) при тех же X и Y получим
_ = Г—1Г—1 -к — dX ~~ [ <?Yj [ дх] + дХ’
dZ Г dZl [/ dY\ dx , dY] , Г dfl dX , dZ oo.
— — --- I --- I------~r ---- -- “T--. (1-Ou)
d/ [dYjlAdX/ dt dt ] [ dxj dt df
Определения векторного дифференцирования позволяют записать разложения в ряд Тейлора в окрестности точки Хо скалярной f (X) и векторной Z (X) функции вектора X
/(Х) = /(Х0)+ |4^1(Х-Х0) +
L дл0 J
+ 2_(х- х,уН (№>П(х-х0) + ..., (1-34)
2 |_C/Aq у (7 A q / J
Z(X) = Z4X0) + Р^Ч (Х-Хо)+ ...
L dX0 J
Можно показать, что для производных от детерминанта матрицы X имеют место равенства
det Х = (det Х)[Х"1], dX
— In det Х = [Х-1]7', dX 11»
— det AXB = (det АХВ)[Х"1Г, (1-35)
dX
detX"=n(det X«)[X-XF.
Здесь матрицы А и В не зависят от X.
Использование матричных обозначений позволяет записать в компактной форме решение системы линейных дифференциальных
Приложение 1. Сведения из теории матриц
469
уравнений [56]
AX(o = ax(o + y(o, Х(0)=хо. (1-36)
f
Здесь X (/) — искомая векторная функция скалярного аргумента, А — постоянная матрица, Y (/) — известная векторная функция t.
Решение (36) имеет вид
t
Х(0 = еА'Хо+$ eA<'-s>Y(s)ds, (1 — 37)
о
оо t.
VI tk
Гдр оА' — — матричная экспоненциальная функция (24).
*=o
Можно показать, что eA(Z+s) = еА( eAs для любых t и $.
Решение линейного дифференциального уравнения
— Х(Л=АХ(/) + Х(/)В, Х(0) = Хо (1 — 38)
dt
при постоянных А и В дается равенством
Х(/) = еА'ХиеВ(. (1 — 39)
В тех случаях, когда матрицы А и В приводятся к диагональной форме, выражения (37) и (39) при помощи (23) записываются в виде обычных матриц.
При численном решении ряда задач статистической радиотехники на ЦВМ требуется моделировать случайные процессы, заданные линейными стохастическими дифференциальными уравнениями [55]
— X(/) = A(/)X(0 + B(/)N(/), Х(/0)=Х0, (1-40)
dt
где А (/) и В (0 — заданные функции времени t, N (/) — вектор-столбец нормального белого шума с известными статистическими характеристиками
(N (/)> = 0, <N (/) N'r (t + т)> = Q6 (т). (1—41)
Численное решение (40) методом Эйлера 142] требует очень мелкого шага по времени и для больших интервалов времени не обеспечивает необходимой точности вычислений. Применять более точные разностные методы, например метод Рунге—Кутта или метод Адамса, в данном случае нужно осторожно, так как правая часть уравнения (40) недифференцируема (см. § 19).
470
Приложение /. Сведения из теории матриц
Алгоритм численного решения (40), имеющий заданную точность при произвольном шаге по времени, можно получить на основании общего решения, которое имеет вид
Х(/)=Ф(<, ^0)Х0+ J Ф (/, s) B(s)N(s)ds. (1 — 42) to
Здесь Ф (/, /0) — фундаментальная матрица решений уравнения (40), для которой выполняются равенства
= А (/)Ф (/,/„), Ф (/„,/„) = !. (1-43)
Фундаментальная матрица решений обладает следующими свойствами:
ф-1 (/, /о) = ф (t0, t),
Ф (/3, /2) Ф (/2, А) = Ф. (73, А). (1—44)
t
Рассмотрим векторный случайный процесс Y (/) = [ Ф (/, s)x
х В (s) N (s) ds. Из (40) и (42) следует, что Y (/) удовлетворяет линейному дифференциальному уравнению
4 Y(0 = A(/)Y(0 + B(/)N(0 а'
с начальным условием
Y (/0) = 0.
Так как случайный процесс Y (/) получается в результате линейного преобразования нормального процесса N (/;, го Y (/) является нормальным случайным процессом, у которого среднее значение и дисперсия задаются соотношениями
<Y(0> = 0,
D(/) = (Y(/)Yr(O>= J Ф(С s) В (s) QB4 * * 7 (s) Фг (A s) ds. (1-45)
Кроме этого, можно показать [55], что симметрическая матрица D (/) удовлетворяет дифференциальному уравнению
4 D (/) = А (/) D (/) + D (/) А7 (/) + В (/) QB7 (/) (I - 46)
at
с начальным условием
D (/0) = 0. (1-47)
Приложение /. Сведения из теории матриц
471
Всякая симметрическая матрица D (/) может быть представлена в виде произведения
D (/) = G (/) GT (0, (1—48)
где G (f) — нижняя треугольная матрица, т. е. матрица, у которой равны нулю все элементы, расположенные над главной диагональю. Для вычисления элементов gtj по заданным dtj можно воспользоваться известным рекуррентным соотношением [143]:
Sih
к— 1
dik— 2 SifShj 1=1
ghk
i^k, k=\,n. (1—49)
Определив матрицу G (/), значение векторного случайного процесса Y (/) в момент времени t можно получить по формуле
Y (/) = G (/) S,, (1—50)
_ Г?11 « °
где В( — • — вектор, составленный из независимых случаи-
I Вп 1
ных величин, распределенных по нормальному закону с = 0 и = 6г> (i, / — 1, п). Для генерирования таких случайных величин на ЦВМ имеется стандартная программа.
Таким образом, из (42) и (50) для последовательного вычисления значений Xh = X (th) в моменты времени t = th (k = 1, 2, ...) по известным значениям ХА_, = X (4_г) в моменты времени tk-L<Z th получим рекуррентное соотношение
xh = ф (4> Д-J Xh_, + Gh Bfc. (I—51)
Алгоритм (51) является абсолютно точным в том смысле, что по известным Ф (th, th-J И Gh он позволяет для любых Д — tk-i > 0 получить случайный процесс с теми же статистическими характеристиками, что и решение (40), без погрешностей аппроксимации. Для численного вычисления Ф (th, Д-J и Gh можно воспользоваться любым известным методом решения дифференциальных уравнений (43) и (46), так как они не содержат в правой части вектора белого шума.
Особенно просто решение (43) и (46) получается в случае постоянных матриц А и В. Если к тому же матрица А приводится к диагональной форме, то для Ф (th, tk_L) и Gh можно получить аналитические выражения.
472
Приложение II. Основные теоремы о производящей функции
Приложение II.
Основные теоремы о производящей функции
Пусть имеется последовательность действительных чисел {фп}, п — О, 1,2, ... Степенной ряд
оо
^(«) = 5П
п = 0
(П-1)
можно рассматривать как преобразование, ставящее в соответствие последовательности {<рп} функцию F (s). Если ряд (1) сходится в каком-либо интервале |s|<s*, то функция F (s) называется производящей функцией последовательности {<рп}.
Рассмотрим случайный процесс {9 (/), t 0}, который принимает целочисленные неотрицательные значения, и последовательность вероятностей {pk (/)}, где pk (/) — Р {9 (/) = k} (k = 0, 1, 2, ...). Параметр t может быть дискретным или непрерывным. Пусть
ОО
^(s, 0=2 /МО5*
* = 0
(П-2)
является производящей функцией вероятностей pk (t). Так как оо
р1{ (/) ограничена для всех k и t и 2 Pk (0 = 1 Для всех Z^O, то k=0
сравнение с геометрической прогрессией показывает, что ряд (2) сходится равномерно по t по крайней мере при Js | < 1.
Приведем без доказательства основные теоремы, позволяющие продуктивно использовать производящие функции для исследования вероятностных свойств дискретных случайных процессов [5].
Теорема 1. Математическое ожидание случайного процесса определяется формулой
<9(/)> = -^-F(s,Z)|s=1. (11-3)
as
Теорема 2. Если <92 (/)> = у, Рц (/) < оо, то
А = 0
<92(/)> = [-^- F(s,t)---— F (s,Z) и дисперсия
(0 = <[9 (0- <9 (/)>]2> = F (s, Z) + 4- F(8. 0-L as21 as
^(s, o')2] . (П-4)
\ as I Js=l.
П риложение HI Дельта-функция
473
Теорема 3. Производящая функция суммы N независимых случайных величин равна произведению N производящих функций, связанных с каждой случайной величиной.
Теорема 4. Предположим, что F (s, t) является рациональной функцией от s:
f(s,/)= , (II —5)
H(s, /) v
где G и H являются многочленами от s, причем степень многочлена G меньше, чем степень многочлена Н.
Пусть Si (/) — различные корни многочлена Н (действительные или комплексные). Тогда F (s, t) может быть разложена на простые дроби
(Ч—6;
где аг (/) — функции времени, am — степень многочлена Н.
Отметим, что производящая функция является дискретным аналогом характеристической функции для непрерывных процессов.
Приложение III.
Дельта-функция
Формально дельта-функцией б (х — х0) называется такая функция, которая равна бесконечности, когда ее аргумент равен нулю, и равна нулю при остальных значениях аргумента (рис. III—1), причем интеграл от дельта-функции, распространенный на сколь угодно малый отрезок, заключающий особую точку х0, равен единице:
к/ \ (°° при х = х0, "р ,
о(х—х0) = { I о(х—x0)dx = l
(0 при х =f= х0, J
Хц — 8
при любом е>0. (III — 1)
Часто желательно определять дельта-функцию так, чтобы она была четной функцией своего аргумента
б (х — х0) = 6 (х0 — х). (III—2)
В этом случае
б(х—x0)dx= б(х— x0)dx = 1/2, е>0. (III — 3)
Хо—8 Хо
474
Приложение III. Дельта-функция
Дельта-функцию можно понимать как предел бесконечной последовательности обычных функций. Пусть имеется функция f (х), непрерывная в точке х0, и дано семейство обычных функций <ра (х) таких, что ь
lim (x)<pa(x—x0)dx==f(x0), a<xa<b. (Ill—4) a-*a„ J
1' n №-x^ .
Z7 Xj X
Рис. 1П-1. Дельтафункция.
Тогда функция б (х — х0) может быть записана в виде предела
б (х — х0) = lim фа (х — х0),
а —>-а(), ‘ (III—5)
понимаемого в том смысле, что величина f (х0), определенная соотношением (4), может быть получена путем формальной записи
Сг/хс/ ftW при а<х0<Ь, ..
J ( О при хп < а или х9 > Ь.
а
Рассмотрим функцию в виде прямоугольного импульса
11/а при х()—(а/2)<х<х0 + (а/2),
Ча (X Ло) — Z
( 0 при других X.
Для такой функции при всех а > 0 справедливо равенство
оо
$ Фа(х —x0)dx= 1.
— оо
Если теперь положить а —>- 0, то ширина импульса будет стремиться к нулю, высота к бесконечности, а площадь под кривой будет постоянной и равной единице. Поэтому можно принять
б (х—х0) = lim фа (х —х0).
а-* О
Хотя функция в виде прямоугольного импульса является простым прототипом дельта-функции, однако она разрывна. Во многих задачах бывает удобно использовать исходное семейство функций, обладающих производными. Укажем несколько таких семейств:
к/ \ 1 1- Г sin а (х—х0) 1 ( 1 Г (х— Хо)'2])
б (х — х0) - — lim ---------5----— = lim I-----ехр —5----------— } =
я а-оо[ х—Хо J а-0 ( а "|/2я [ 2а2 11
_ 1 |jrn f 1—cosa(x—х0) I _ 1 цт Г sina<z(x—x0) 1 _
я a-»L a(x—-«o)2 J я a->oo L a(x—x0)2 J
Приложение HI. Дельта-функция
475
(X—X„> + <1
= ±lim -------2---------=---!---iim f *L =
л a-*oo a3 (x— x0)3 + I n3(x—x0) a-*0 J у
(x—x,)—a
= lim ФпМ<Рп(4 (П1 —7)
лг-*“л = о
где <pn (x) — любая полная ортонормированная система функций. Справедливо также следующее формальное соотношение
1 Л2
б(х—х0) = —— |х—х0|. (III —8)
Использование дельта-функции позволяет во многих случаях значительно упростить и в известном смысле автоматизировать вычисления. Это объясняется тем, что дельта-функция обладает рядом замечательных свойств. Важнейшее из них выражается формулой (6), и его часто называют фильтрующим свойством дельта-функции.
Не прибегая к строгому предельному переходу (4), формально формулу (6) можно получить так. Поскольку б (х — х0) всюду равна нулю, кроме точки х0, а в бесконечно малой окрестности точки х0 непрерывная функция f (х) приблизительно постоянна и равна f (х0), то, вынося ее за знак интеграла и используя формулу (1), получим (6).
Если рассматривать f (х) как входной сигнал, воздействующий на линейный фильтр с импульсной характеристикой б (х), то на выходе такого фильтра согласно формуле (6) будет выделено (отфильтровано) лишь одно значение входного сигнала, соответствующее нулевому значению аргумента дельта-функции. Отсюда следует, что дельта-функция б (х — х0) имеет размерность, обратную величине х.
Отметим, что при х0 = а или хп — b интеграл (6) оказывается неопределенным. Иногда (если, конечно, это не приводит к физическим недоразумениям) принимают
ь <
p(x)6(x-x0)dx = Pj^/ при Ха==а’ (Ш-9) J (о)/2 при х0 = Ь.
Если точка х0 является точкой разрыва первого рода функции f (х), то
ь
р(х)б(х—x())dx = -1-tf (х+) + f (X-)], a<x0< b, (111—10)
где f (x*) и /(x;) — значения функции f (x) справа и слева от точки разрыва.
476
П риложение 111. Дельта-функция
уЙФЫ б(х—х0)dx,
f (х) б (сх — х0) dx = —
Если функция <р (х) непрерывна в точке х0, то Ф (х) 6 (х — х0) = ф (х0) б (х — х0), (III—11)
так как
ь ь
У (X) ф (х) б (х — х0) dx = t (х0) ф (х„) =
а а
а С х0 <; Ь.
В частности,
ь
^б(х—и) б (х — v) dx = б (и — v) — б (у — и), а<_и, v<b.
(Ill —12)
Применяя замену переменной интегрирования у = сх и воспользовавшись формулой (6), получаем соотношение
Ь Ос
а < х0/1 с | <b. (III —13)
Поэтому можем написать
б(сх—х0) = -р-|-б(х-----—'j . (111-14)
Применяя формулу (6) раздельно к функциям аб (х — х0) и б нетрудно убедиться в справедливости равенства
| а | б (х — х0) — б (———'l . (Ill — 15)
\ а /
Рассмотрим более общий случай. Пусть функция а (х) является монотонно возрастающей в интервале (а, Ь) и пересекающей ось х в точке х0 этого интервала (рис. Ill—2, а): а (а) < а (х0) = О <С < а (Ь). Для монотонно возрастающей функции уравнение а (х) = t имеет однозначную обратную функцию х (/), причем х (0) = х0. Производя формальную замену переменных, на основании (6) получим
Ь а (Ь)
f f (х)б [a (x)J dx = f /[х(01 8(t)dt = Z[x(0)l = {x°} .
J ' V k ' J «' [x (QJ V a' [x (0)] a' (x0)
a a (a)
(111 — 16)
Если a (x) является монотонно убывающей функцией, то знак получаемой зависимости будет обратным из-за перестановки пре
П риложение 111. Дельта-функция
477
делов интегрирования. Таким образом, для обоих случаев вышеприведенный интеграл будет равен f (х0)|а' (х0)|-1. Поэтому в формуле (6) можно полагать
6[а(х)) = -(*~*о) .
k |а' (х0)|
не пересекает ось х в интервале (а, Ь), то ин-
Если функция а (х) теграл равен нулю.
Предположим, что равенство а (х) = 0 выполняется для конечного или бесконечного счетного числа точек хп на всей оси х (рис. 111—2, б), т. е. а (хп) = 0, и что в этих точках функция а (х) имеет непрерывную производную а' (хп) =?*= 0. Нетрудно убедиться, что
6|а(х)] = 2-ГТ7-ТГ-п 1а (*п)|
(III —17)
Иначе говоря, б [а (%)] равна последовательности дельта-импульсов (рис. Ill—2, в) при х = хп с площадью |а' (хп)|-1.
Для доказательства формулы (17) разделим ось х на интервалы (с;, ci+1) таким образом, чтобы функция а (х) изменялась монотонно в этих интервалах, т. е. при cz < х < с(+1. Если интеграл с бесконечными пределами от выражения f (х) б [а (х)1 представить в виде суммы интегралов в примыкающих интервалах (с,, сг+1), то из выражений типа (16) придем к формуле (17).
Возвратимся теперь к первому равенству (7):
б(х—х0) = lim _lin «<*-*>) . (Ill —18) а-*оо л(х — хп)
В результате использования этого соотношения получаем
оо
lim С / (х) dx = f(x0).
СС зо J Л X Хр)
— оо
478
Приложение III. Дельта-функция
Следствием из выражения (18) является важное тождество
JL J е± i(z-z„)udu = J e±2nl<‘x~x<‘>vdv = 8(x—x0). (111 — 19) — оо — оо
Действительно, оо ОС
—— С е* i’(х—11 du — lim —J— С е*' ^х~х°>и du =
2л J а -»оо 2л J
— оо —а
= pm sin °Цх—*о) а-*оо л (х— Хр)
Понимая в тождестве (19) под х время t, а под переменной интег-рировгния и круговую частоту со, получаем представление дельтафункции б (/ — 4) интегралом Фурье
ОО 00
6(I — /0) = -L- е'шV — dm =— j* cos о>(t— t0)dm. (Ill—20)
Из обратного преобразования Фурье с использованием формулы (6) находим спектральную функцию для 8 (t — t0):
8(1— t0)e~,a dt-e-'®'”. (Ill — 21)
--ОС
При 4 = 0 отсюда следует, что спектр функции б (/) равномерный на всех частотах с интенсивностью, равной единице;
оо
$ 8 (t) е~iU>l dt = 1. (Ill —22)
— ОС
Если спектральной функцией для дельта-функции, расположенной в нуле, является постоянная величина, то спектральной функцией для полусуммы двух дельта-функций б (/ 4- 4) и б (/ — 4), симметрично расположенных относительно начала координат, является косинусоида. Действительно, оо
J (1 + 4) + 6 (/ — 4)1 е_/“' dt = -^-[e'“z»4-e-z“'» ] = cos mt0. — oo
(III-23)
Из обратного преобразования Фурье получаем
[б (/4-4)4-6(1 — 4)] = — f cos atlle‘al dm =
2 2л J
— oo
Приложение III. Дельта-функция
479
ОО
— — > cos at0 cos at da. (Ill—24)
Л. J
0
Тождество (19) позволяет установить связь между дельта-функциями для обычной частоты f и круговой частоты ш. Так, понимая во второй части равенства (19) под х обычную частоту f, а затем, делая замену переменной s = ?/2л, получаем
6(/— /0) = е± 2ai t dt ~ е± / (<0—Юо) t & _
— оо — оо
— 2л е± 2я/ (<0—“»>s ds = 2лб (а—со0).
— оо
Следовательно, б (f — f0) = 2лб (и — <оо). (Ш-25)
Приведем еще одно полезное равенство, следующее из (15) и (19), оо
J cos ± m° j xdx = алб (со ± со0) = лб 1,1 ± 01(1 . (I | ] — 26)
о
Разлагая в ряд Фурье периодическую последовательность дельта-функций б [х— х0—ш = 0, ±1, ±2................... получим формулу
е2л/м (х — х„) Т„ _ £ n COS 2лл (X—Хо) TQ =
п= — оо п == О
1 ОО / \
= V 2 б х-х0-^- , (Ш-27)
где £0 = 1, £п = 2 при п =/= 0. Справедливы также следующие соотношения:
У (-1)"6 ncos2nn(x —х0)Т0 = у- 2 — ’
п= —<х> 0 т=— оо
(III—28)
V £ncos2n(x — х0) TQ cos 2ппу = п=—оо
= S И*-*o + (/ + v-) + S(*— х0—У+-^~1 >
2/о “ I \ \ 1 о /J
т = — оо
(111—29)
480
Приложение 111. Дельта-функция
У 6ncos4nn(x —х0)Т0=-^ У б (х — Хо— -Д-4 .
£1 Q \ 1 о /
п—— оо т —— оо
(III—30)
Путем формального применения интегрирования по частям можно убедиться, что свертка производной n-го порядка дельтафункции с любой функцией, имеющей непрерывную производную n-го порядка в точке х0, равна
*о 4- е
J f(x)6<n)(x— x0)dx = (—1)" flrl1 (х0), е>0. (Ill—31)
*0-8
Если производная (х) имеет в точке х0 разрыв первого рода, то
хо 4- 8
J f(x) №>(х— х0) dx = ( — 1)" -^[fw(x$) + f<n>(xo)], е >0.
*0 — 8
(Ill—32)
Применяя формулу (31) к двукратному интегралу вида h b
J = ^f (х, у) б" (х— у) dxdy,
'I а
получаем, что при выполнении равенства
/*((/, у) = ^~~~\ = ГЛх,х)=^х;у) 1 (III —33)
дх2 |х=„ ду2 |у=д.
порядок интегрирования с дельта-функцией не имеет значения, т. е.
ь ь
J = ^fx (у, у) dy = (х, x)dx. (111—34)
а о
Аналогично дельта-функции одного аргумента можно ввести двумерную дельта-функцию б2 (х —х0, у—уа) = б (х— х0) б (у—у0), определив ее как единичную массу, сосредоточенную в точке (х0, У о)- Для двумерной дельта-функции справедливы соотношения
62 (х — х0,у—y0)dxdy= 1, (111—35)
— 00
JJ f(x,y)82(x~х0, у—уи) dxdy = f (х0, у0), (111—36)
— 00
jj f(x,y)82(x — x0,y—y0)dy = f(x,y0)8(x—x0). (111—37) — 00
Список литературы
1. Колмогоров А. Н. Об аналитических методах в теории вероятностей.— «Успехи матем. наук», 1938, вып. 5.
2 Стратонович Р. Л. Избранные вопросы теории флюктуаций в радиотехнике. М., «Сов. радио», 1961.
3. Дуб Дж. Л. Вероятностные процессы. М., ИЛ, 1956.
4. Феллер В. Введение в теорию вероятностей и ее приложения. М., «Мир», 1964.
5. Баруча-Рид А. Т. Элементы теории марковских процессов и их приложения. М., «Наука», 1969.
6. Сох D. R., Miller Н. D. The theory of stochastic processes Methuen, 1965.
7. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей. М., «Наука», 1967.
8. Гнеденко Б. В., Беляев Ю. К., Соловьев А. Д. Математические методы в теории надежности. М., «Наука», 1965.
9. Казаков В. А. Введение в теорию марковских процессов и некоторые радиотехнические задачи. М„ «Сов. радио», 1973,
10 Parzen Е. Stochastic processes. Holden-day, 1962.
II. Кемени Дж., Снелл Дж. Конечные цепи Маркова. М., «Наука», 1970.
12. Карлин С. Основы теории случайных процессов. М., «Мир», 1971.
13. Лоэв М. Теория вероятностей. М._ ИЛ, 1962,
14. Романовский В. И. Дискретные цепи Маркова. М., Гостехиздат, 1949.
15. Сарымсаков Т. А. Основы теории процессов Маркова. М., Гостехиздат, 1954
16. Чандрасекар С. Стохастические проблемы в физике и астрономии. М., ИЛ, 1947.
17. Дынкин Е. Б. Марковские процессы М., Физматгиз, 1963.
18. Басакер Р., Саати Т. Конечные графы и сети. М., «Наука», 1974.
19. Градштейн И. С., Рыжик И. М, Таблицы интегралов, сумм, рядов и произведений. М„ «Наука», 1971.
20. Lindsey W. С., Simon М. К. Telecommunication systems Engineering. Prentice-Hall, 1973.
21 Миронов M. А. Случайные блуждания между отражающим и поглощающим экранами. — «Изв. вузов СССР. Радиоэлектроника», 1974, т. 17, №4.
22 Holmes J. К. Perfoimance of a first-order transition sampling digital phase-locked loop using random walk models. «Trans. IEEE», 1972, COM-20, № 2.
23. Безяев Г. В. По погоду представления трехпозиционнон кодовой последовательности простой цепью Маркова. — «Радиотехника и электроника», 1969, т. 14. № I 1.
24. Козлов Б. А., Ушаков И. А. Справочник по расчету надежности аппаратуры радиоэлектроники и автоматики. М., «Сов. радио», 1975.
25. Саати Т. Элементы теории массового обслуживания и ее приложения. М., «Сов. радио», 1965.
26. Кофман А., Крюан Р. Массовое обслуживание. Теория и приложения. М., «Мир», 1965.
27. Броди С. М., Власенко О. Н., Марченко Б. Г. Расчет и планирование испытаний систем на надежность. Киев, «Наукова думка», 1970.
28. Броди С. М., Погосян И. А. Вложенные стохастические процессы в теории масювого обслуживания. Киев, «Наукова думка», 1973.
29 Howard R. A. System analysis of semi-markov processes. — ‘‘Trans. IEEE", 1964, ML1-8. № 2.
30. Тихонов В. И. Статистическая радиотехника. М., «Сов. радио», 1966.
31. Забрейко П. П. и др. Интегральные уравнения. М., «Наука». 1968.
32. Lendley D. V. Geometric distributions in the theory of quenes. — «J. Roy. Statist. Soc.», 1959, v. B21.
33. Вальд А. Последовательный анализ. M., ГИФМЛ, 1960.
482
Список литературы
34. Frieland А. В. Noise injected into coherent carrier signals by Random phase changes. — «Trans. IEEE», 1970, AES-6. № 5.
35. Крамер Г., Лидбеттер M. Стационарные случайные процессы. М., «Мир», 1969.
36. Pawula R. F. Generalization and extensions of the Fokker—Planck—• Kolmogorov equations. — «Trans. IEEE», 1967, IT-3, № 1.
37. Тихонов A. H., Самарский А. А. Уравнения математической физики. M., «Наука», 1972.
38. Курант Р., Гильберт Д. Методы математической физики, т. I, М., ГТТИ, 1933.
39. Степанов В. В. Курс дифференциальных уравнений. М., Физматгиз, 1959.
40. Черкасов И. Д. О преобразовании диффузионного процесса в винеровский. — «Теория вероятностей и ее применения», 1957, т. 2, вып. 3.
41. Melsa J. L., Sage А. Р. An introduction to probability and stochastic processes Prentice !'all, 1973
42. Березин И. С., Жидков Н. П. Методы вычислений, М., ГИФМЛ, 1960.
43 Вазов В., Форсайт Дж. Разностные методы решения дифференциальных уравнений в частных производных. М„ ИЛ, 1963.
44. Рихтмайер Р., Мортон К. Разностные методы решения краевых задач. М., «Мио», 1972
45. Ming Chen Wang, Uhlenbeck G. E. On the theory of the Brownian motion If. — «Reviews of Modern Physics», 1945, v. 17, № 2—3
46. Уиттекер Э. T., Ватсон Дж. H. Курс современного анализа, т. 2. М., ГИФМЛ, 1963.
47. Бейтмен Г., Эрдейи А. Высшие трансцендентные функции, т. 2. М„ «Наука», 1966.
48. Крамер Г. Математические методы статистики. М., ИЛ, 1948.
49. Wong Е. The construction of a class oi station-ary Markoff processes. — «Proc. Symp. Appl. Math.», 1964, v. 16.
50. Wong E., Thomas J. B. On polynomial expansions of second-order distributions. — «Jonrn Soc. Industr. Math.», 1962. v. 10, № 3.
51. Баррет Дж. Ф. Применение уравнения Колмогорова для исследования систем автоматического управления со случайными возмущениями. — «Труды 1-го Международного конгресса ИФАК». т. 3. М., АН СССР, 1961.
52. Хазен Э. М. Определение плотности распределения вероятностей для случайных процессов в системах с нелинейностями кусочно-линейного типа.— «Известии АН СССР. Энергетика и автоматика». 1961, № 3.
53. Atkinson J. D., Caughey Т. К. Spectral density of piecewise linear first order systems excited bv white noise — «Internal Journ. Nonlinear Meeh.». 1968, v. 3, № 2
54 Caughey T. K., Dienes J K. Analysis of a nonlinear first-order system with a white noise input. — «Journ. Appl Phys.», 196), v 32, № 11.
55 Ван Трис Г. Теория обнаружения, оценок и модуляции, т. 1. М., «Сов. радио», 1972
56. Веллман Р Введение в теорию матриц М., «Наука», 1969.
57. Стратоновкч Р. Л. Условные марковские процессы. Изд. МГУ, 1966.
58. Sage А. Р., Melsa J. L. Estimation theory with applications to communication and control. McGraw-Hill, 1971.
59. Ito K. Stochastic integral. — «Proc. Imp. Acad.», Tokyo, 1944, v. 20
60. Стратонович P. Л. Новая форма записи стохастических интегралов и уравнений. — «Вестник МГУ. Сер. мат., мех.», 1964, № 1.
61 Gray А. Н„ Caughey Т. К. A controversy in problem involving random parametric excitation. — «Journ. Math, and Phys.», 1965, v. 44, № 3.
62 Mortenson R. E. Mathematical problems of modeling stochastic nonlinear dynamic systems. — «Journal statistical Physics», 1969, v. 1, № 2.
Список литературы
483
63. Wright D. J. The digital simulation of stochastic differential equations.— «Trans. IEEE», 1974, AC-19, № 1.
64. Тихонов В. И. Марковский характер огибающей квазигармонических флюктуаций. — «Радиотехника и электроника», 1961, т. 6, № 7.
65. Liu S. С. The spectrum of a simple nonlinear system. — «BSTJ», 1968, v. 47, № 10
66. Свешников А. А. Прикладные методы теории случайных функций. М , «Наука». 1968.
67. Тихонов В. И. О вычислении коэффициентов сноса и диффузии для марковских процессов. — «Радиотехника и электроника», 1970, т. 6, № 7.
68. Chuang К., Kazda L. F. A study of nonlinear systems with random inputs. — «Trans, AIEE, Applications and industry», 1959, v. 78, pt. II.
69. Liu S. C. Solutions of Fokker—Planck equation with applications in nonlinear random vibration. — «BSTJ», 1969, v. 48, № 6.
70. Вакман Д. E. Об определении понятии амплитуды, фазы и мгновенной частоты сигнала. — «Радиотехника и электроника», 1972. т. 17, № 5.
71. Агеев Д. В. К вопросу определения понятий амплитуды, фазы и мгновенной частоты сигнала. — «Радиотехника и электроника». 1973, т. 18, № 8.
72. Стратонович Р. Л. Синхронизация автогенератора при наличии помех. — «Радиотехника и электроника». 1958, т. 3, № 4.
73 Тихонов В. И. О статистических характеристиках случайной фаты квазигармонического процесса «Радиотехника и электроника», 1968, т. 13, №5.
74. Рытов С. М. Введение в статистическую радиофизику. М., «Наука», 1966.
75 Cutler L. S., Searle С. L. Some aspects of the theory and measurement of frequency fluctuations in frequency standards. «Proc. IEEE», 1966, v. 54, №2.
76. Тихонов В. И. Влияние флюктуаций на точность работы устройств синхронизации. — «Успехи физич. наук», 1964. т. 83. № 4.
77. Тихонов В. И., Кульман Н. К. Нелинейная фильтрация и квазнкоге-рентный прием сигналов. М.. «Сов. радио», 1975.
78. Акопян И. Г. Исследование влияния флюктуационных помех па процесс синхронизации лампового генератора. Канд, диссертация, МГУ, 1959.
79. Тихонов В И. Влияние шумов на работу схемы фазовой автоподстройки частоты — «Автоматика и телемеханика» 1959. т. 20. № 9.
80. Lindsey W. С. Synchronization systems in communication and control. Prentice-Hall, 1972.
81. Тихонов В. И. Выбросы случайных процессов. М.. «Наука», 1970.
82. Витерби Э. Д. Принципы когерентной связи. М., «Сов. радио», 1970.
83. Morgan S. Р. Tables of Bessel functions of imaginary order and imaginary argument. Pasadena, Institute of Technology, California, 1947.
84. Тихонов В И., Шахтарии Б. И. Статистические характеристики фазовой автоподстройки частоты «Автоматика и телемеханика», 1965, т. 26, № 9.
85 Акопян И. Г. Об установлении синхронного режима в ламповом генераторе при наличии помех. — «Радиотехника и электроника». 1966, т. II. № 1.
86 Dominiak К. Е.. Pickholtz R L. Transient behave,г of phase-locked loop in the presence of noise. — «Trans IEEE». 1970. COM 18, № 4.
87 La Frieda J. R. LIndscv W. C Tr=in»:ent analyse d nhase-lncked tracking systems in the presence of noise. -- «Trans. IEEE», 1973, v. IT-19. № 2.
88. Ma’’field W. W. A sequence solution to the Fokker-Planck equation. — «Trans. IEEE», 1973, IT-19, № 2.
89 L’n С K. Transient mean and variance of phase error of the first-order phase-locked loop. — «Trans. IEEE», 1974, COM-22, № 1.
99. Ohlson .’. E., Rutherford A. Transient statistics of the first-order phase-locked loop. — «Trans. IEEE», 1974, COM-22, № 5.
91. Тихонов В. И. Работа фазовой автоподстройки частоты при наличии шумов. — «Автоматика и телемеханика», 1960, т. 21, № 3.
484
Список литературы
92, Feller W. On the integrodifferential equations of completely discontinues Markov processes. — «Trans. Am, Math. Soc.», 1940, v. 48, № 3.
93. Keilson J., Mermin N. D. The second-order distribution of integrated shot noise. — «IRE Trans, Inform, theory», 1959, v. 5, № 2.
94. Rice S. O. Mathematical analysis of random noise. — «BSTJ», 1944, v. 23, № 3; 1945, v. 24, Ns 1.
95. Волков В. M. Об оценке близости функции распределения дробового шума к нормальной функции распределения. — «Радиотехника и электроника», 1970, т. 15, № 12.
96. Ohlson J, Е. Phase-locked loop operation in the presence of impulsive and gaussian noise. — «Trans. IEEE», 1973, COM-22, Ns 9.
97. Самарский А. А. Введение в теорию разностных схем. М., «Наука», 1971.
98. Mengali U. Statistical behavior of second-order phase-locked loops in the presence of a mixture of impulsive and gaussian noise. — «Trans. IEEE», 1974, COM -22, Ns 11.
99. Камке Э. Справочник по обыкновенным дифференциальным уравнениям. М., ИЛ, 1950.
100 Wonham W. М., Fuller А. Т. Probability densities of the smoothed random telegraph signal. — «Journ. Electronics and Control», 1958, v. 4, Ns 6.
101, Pawula R. F. The transition probability density function of the low-pass filtered random telegraph signal. — «Internal. Journ. of Control», 1970, v. 12, № 1.
102. Обрезков Г. В., Разевиг В. Д. Методы анализа срыва слежения. М„ «Сов. радио», 1972.
ЮЗ. Фрейдлин М. И. О постановке граничных задач для вырождающихся эллиптических уравнений. — «Доклады АН СССР», 1966, т. 170, Ns 2.
104. Crandall S. Н. First-crossing probabilities of the linear oscillator. — «Journ. Sound Vib.», 1970, v. 12, № 3.
105. Понтрягин Л. С., Андронов А. А., Витт А.-А. О статистическом рассмотрении динамических систем. — «ЖЭТФ», 1933, т. 3, Ns 3.
106. Леоитович М. А. Статистическая физика, М., «Гостехиздат», 1944.
107. Морс Ф. М., Фешбах Г. Методы теоретической физики, М., ИЛ, 1958.
108. Миронов М. А., Яковлев А. И. Анализ срыва слежения н системах ФАПЧ первого порядка. «Изв. вузов СССР. Радиоэлектроника», 1974, т. 17, №4.
109. Зарицкий В. С. Определение вероятности надежной работы системы в течение заданного промежутка времени. — «Известия АН СССР. Техническая кибернетика», 1966, Ns 1.
110. Тихонов В. И. Достижения границ марковским процессом. — «Известия вузов СССР. Радиоэлектроника», 1972, т. 15, Ns 4.
111. Бейтмен Г., Эрдейи А. Таблицы интегральных преобразований. Пер, с англ. М., «Наука», 1969.
112. Корн Г. н Корн Т. Справочник по математике для научных работников и инженеров. М., «Наука», 1968.
113. Sigert A. J. F. On the first-passage time probability problem. — «Phys. Rev.», 1951, v. 81, № 4.
114, Darling D. A., Sigert A. J. F. The first-passage time problem for continuous Markov process. — «Ann. Math. Statist.», 1953, v. 24, Ns 4.
115. Selin I. The sequential estimation and detection of signals in normal noise. — «Information and Control», 1964, v. 7, № 4.
116. Selin I. The sequential estimation and detection of signals in normal noise. — «Information and Control», 1965, v. 8, № 1.
117. Пискунов H. С. Краевые задачи для уравнений эллиптико-параболи-ческого типа. — «Математический сборник», 1940, т. 7(49), № 3.
118. Фикера Г. К единой теории краевых задач для эллиптико-параболн-ческнх уравнений второго порядка. — «Математика», 1963, т. 7, № 3.
Список литературы
485
119. Никитин Н. П. Срыв слежения в схеме фазовой автоподстройки частоты. — «Автоматика и телемеханика», 1965, т. 26, № 4.
120. Ярлыков М. С. Оптимальный прием радиосигналов, искаженных фазовыми помехами. — «Изв. вузов СССР. Радиоэлектроника», 1971, т. 14, № 10
121. Кульман Н. К., Стратонович Р. Л. Фазовая автоподстройка частоты и оптимальное измерение параметров узкополосного сигнала с непостоянной частотой в шуме. — «Радиотехника и электроника», 1964, т. 9, № I.
122, Шахгильдян В. В., Ляховкин А. А. Системы фазовой автоподстрой-кн частоты. М„ «Связь», 1972.
123. Ярлыков М. С., Миронов М. А. О применимости гауссовой аппроксимации в марковской теории оптимальной нелинейной фильтрации. — «Радиотехника и электроника». 1972, т. 17, № 11.
124. Шахгильдян В. В., Игнатов Ю. Ф. Срыв синхронизации в системе ФАПЧ. — «Электросвязь», 1967, № 6.
125. Шахтарин Б. И. Диализ асимптотических значений статистических характеристик системы ФАПЧ «Радиотехника и электроника», 1968, т. 13, № 2.
126. Хиичин А. Я. Работы по математической теории массового обслуживания М Фи!матгпз 1963
127. Кокс Д. Р„ Смит В. Д. Теория восстановления. М., «Сов радио», 1967.
128. Lewis Р. A. W. (editor). Stochastic point processes: statistical analysis, theory and applications. Wiley-Interscience. 1972.
129. Кокс Д., Льюис П. Статистический анализ последовательностей событии. М , «Мир», 1969.
130. Morse Р. М. Comments of the random distribution of events or levels.— «Topics Mod. Phys.», 1971.
131. Haight F. A. Handbook of the Poisson distribution. John Wiley, 1967.
132. Papoulis A. Probability, random variables and stochastic processes McGraw-Hill. 1965.
133. Davenport W. B. Probability and random processes. McGraw-Hill, 1970.
134. Гнеденко Б. В., Колмогоров A. H. Предельные распределения для сумм независимых случайных величии. М., ГИТТЛ. 1949.
135. Гольданский В. И., Куценко А. В.. Подгорецкий М. И. Статистика отсчетов при регистрации ядерных частиц. М , ГИФМЛ, 1959.
136. Яноши Л. Теория и практика обработки результатов измерений. М., «Л^ир», 1968.
137. Меуг Н. Nonlinear analysis of correlative tracking systems using renewal process theory. — «Trans. IEEE», 1975, v. COM-23, № 2.
138. Tacacs L. On secondary processes generated by a Poisson process and their applications in physics. — «Acta Math. Acad. — Sci. Hung.», 1954, v. 5.
139. Bello P. On the approach of a filtered pulse train to a stationary gaus-sian process. — «Trans. IRE», 1961, v. IT-7, № 3.
140. Wolff S. S., Gastwirth J. J. On probability distribution for filtered white noise — «Trans. IEEE», 1967, v. IT-13, № 3.
141. Racin Ph., Haber F. Bruit a la sorti d'un filtre passe-bande resultant d'impulsions breves avec une distribution de Poisson a 1’entree. — «Ann. Tele-communs.», 1969, v. 24. № 9—10.
112 Sherman K.. Gagliardi R. On the representation of a continuous stochastic intensity by Poisson shot noise. — «Trans. IEEE», 1970, v. IT-16, № 2.
143 Гантмахер Ф. P. Теория матриц. M., «Наука», 1967.
144. Никитин Н. Н., Первачев С. В., Разевиг В. Д. О решении на ЦВМ стохастических дифференциальных уравнений следящих систем. — «Автоматика и телемеханика», 1975, № 4.
145. Коллатц Л. Функциональный анализ и вычислительная математика. М.. «Мир». 1969.
146. Королюк В. С., Турбин А. Ф. Полумарковские процессы и их приложения. Киев, «Наукова думка», 1976.
Предметный указатель
Амплитуда колебаний 225, 232
Анализ последовательный 355
Величина осцилляций 357
Вероятность вырождения 79
— интервально-переходная 83
— исключения 425
— ложно!' тревоги 355
— перехода 11, 13, 69
— поглощения 47
— пропуска целч 355
— финальная 1"
Время возвращения прямое 401. 441
---обратное 402, 440
— достижения границ 327, 363
— ожидания 81
- рекуррентное 87
Гроini'-ные условия 122, 126
— -- нулевые 123
---отражения 124, 322
-- — поглощения 124, 310. 322. 369
Дискретные устройства фазирования 59
Закон сохранения вероятности 123
Интенсивность процесса 408
— флуктуаций фазы и частоты 375
— шума 158, 235
Корреляционная функция 24, 74, 112
Коэффициенты сноса и диффузии 119
Мартингал 93, 160
Метод гауссова приближения 135
— замены переменных 131, 217
— линеаризации 242
— математической индукции 67
— последовательных приближений 200
— преобразования Лапласа 130, 328
— прогонки 143, 386
— разделения переменных 128, 240, 312
— Рунге — Кутта 203
— характеристической функции 13' 161
— численного решения 140, 383
Нестабильность естественная 246
Операция наложения 423, 412
— разрежения 425
— смещения 424
Отношение правдоподобия 355
Ошибка синхронизации 60, 253, 372
Плотность вероятности логнормальная 199
— — Накагами 191
— — нормальная 165, 178
---। прохода 111
---Пирсона 128, 168
---Ре.:-,я 194
--- — двумерная 199
--- экспоненциальная 169
— событий 403
Перескок фазы 239, 256
Полоса синхронизации 254, 373, 379
Поток вероятности 123, 150 362
— случайный 397
Порядковая статистика 414
Процесс Башелье 135
— винеровский 156
— вложенный 82
— возвратный 126
— восстановления 91), 427
---альтернирующий 431
— днекретно-непрерывиый 282
— дискретный 7, 69, 89
— диффузионный. 118, 147
— непрерывный 8, НО
— нестационарный 77
— однородный 72, 93, 112
— рождения и гибели 78
— полумарковский 81
— пуассоновский 76, 401
— — альтернирующий 431
— — в нескольких измерениях 418
--- неоднородный 418
---обобщенный 420
— — простой 404
---профильтрованный 447
— — сложный 421
— скачкообразный 281
— смешанный 301
— с уходом с границы скачком 122, 333
— точечный 397
— — ординарный 399
— — с независимыми приращениями 401
---стационарный 400
— — целочисленный 399
— установления разности фаз 275
— эргодический 74, 112
Распределение биноминальное 417
— показательное смещенное 430
— равновесное 107
— Эрланга (гамма-распределенне) 410
Сигнал телеграфный квазислучайный 24
--- случайный двоичный 72
События эквивалентные 409
Состояние возвратное и невозвратное 18
— поглощающее 18, 78
— равновесия 255
— равновесное 72, 107
Средняя частота колебаний 268
Срыв синхронизации 64, 267, 316, 367
Уравнение восстановления 353
— генератора 231
--- укороченное 233
— дифференциальное стохастическое 181
— интегральное 438
— Колмогорова — Феллера 282
— Колмогорова — Чепмена 69, 92
— Маркова 14
— непрерывности 123
— обобщенное 121
— обратное 71, 116
— параболического типа 115. 374
— Понтрягина 310, 337, 360
— прямое 71, 116
— разностное 48, 14-1
— Смолуховского 111
— Фоккера — Планка — Колмогорова 116
— характеристическое 313
—• эллиптического типа 374
Условие диффузионной изотропности 148
— Липшица 181
Фаза колебаний 225, 232
— приведенная к интервалу 238
Формула Ито 183
Функция восстановления 435
— потенциальная 148
— производящая 47, 53, 97. 406, 420
— распределения 81
— характеристическая 117, 420
Цепь вложенная 82
— однородная 15, 113
— поглощающая 18
— полумарковская 82
— простая 7, 10, 88
— симметричная 23
— сложная 12
— стационарная 17
— эргодическая |7
Экран отражающий 45, 105, 124
— поглощающий 45, 51, 65, 96. 124
— упругий жесткий 45. 62, 125
Энергетический спектр 26. 31, 76, 94, 177
Содержание
Стр.
Предисловие.........................................................3
Введение........................................................... 4
1. Классификация и определение марковских процессов.................7
2. Цепи Маркова....................................................10
Определение цепи Маркова (10). Уравнение Маркова (13). Цепь Маркова с двумя состояниями (19).
3. Энергетические спектры марковских сообщений.....................32
4. Одномерные дискретные блуждания.................................44
Неограниченные блуждания (4b) Один поглощающий и одни упругий жесткий экраны (47). Два поглощающих экрана (51). Одни поглощающий экран (54). Два отражающих экрана (54). Одни отражающий экран (56).
б. Анализ цифровых систем ФАП первого порядка......................56
Основные прнндопы работы цифровых систем ФАП первого порядка (56).
Модель случайных блужданий (59). Средний квадрат ошибки синхронизации (62). Среднее время до срыва синхронизации (64). Обобщение на случай сигналов более сложной формы (67).
6. Дискретный марковский процесс...................................69
7. Типовые разрывные марковские процессы...........................76
Пуассоновский процесс (76). Процесс рождения и гибели (78).
8. Полумарковские процессы.........................................81
9. Марковские последовательности...................................91
Основные определения и свойства (91). Общая модель одномерных случайных блужданий (96). Случайные блуждания между поглощающими экранами (96). Тождество Вальда (100). Случайные блуждания между отражающими экранами (105).
10. Непрерывный марковский процесс.................................ПО
Определение непрерывного марковского процесса (ПО). Дискретная модель непрерывного процесса (113).
11. Уравнение Фоккера — Планка — Колмогорова......................116
Вывод уравнения Фоккера — Планка —Колмогорова (116). Граничные условия (122).
12. Методы решения уравнений Фоккера— Планка — Колмогорова . . 127
13. Многомерные марковские процессы...............................146
Уравнение Фоккера — Планка — Колмогорова (146). Граничные условия (150).
14. Чисто диффузионный процесс....................................156
15. Нормальный марковский процесс.................................163
16. Процессы с распределениями Пирсона............................168
17. Процессы с кусочно-линейными коэффициентами сноса . . . .172
18. Многомерные нормальные марковские процессы....................177
19. Стохастические дифференциальные уравнения.....................181
Стохастические интегралы и дифференциалы (182). Теорема Дуба и вычисление локальных характеристик марковского процесса (188). Численные методы решения стохастических дифференциальных уравнений (199).
20. Область применения аппарата марковских процессов..............205
О коррелированное™ случайного воздействия (205). Другие отклонения от теоремы Дуба (212). Понижение порядка стохастических дифференциальных уравнений с малым параметром (220)
21. Воздействие шума на простейшие колебательные системы . . 224
Воздействие шума на колебательный контур (224). Анализ работы автогенератора при наличии шума (230). Корреляционная функция радиосигнала со случайной фазой манипуляцией (246).
22. Статистическая динамика синхронизируемого генератора и фазовой автоподстройки частоты...............'........................248
23. Интегродифференциальные уравнения Колмогорова — Феллера . .281
24. Статистические характеристики ФАП при воздействии нормального
шума и пуассоновских импульсов............................292
25. Обобщенные уравнения Фоккера — Плаика — Колмогорова для смешанных процессов..............................................301
26. Достижение границ одномерным марковским процессом .... 306
Вероятность достижения границы одномерным марковским процессом (307). Связь уравнения Понтрягина с уравнением Фоккера — Планка — Колмогорова (321). Плотность вероятности времени первого достижения границ (327). Моменты времени первого достижения границ (335). Уравнение восстановления. Определение длительности процедуры последовательного анализа (351). Некоторые смежные вопросы (357).
27. Достижение границ многомерным марковским процессом .... 359
Уравнения Понтрягина (359). Связь с уравнением Фоккера — Планка — Колмогорова (368).
28. Срыв синхронизации в системах ФАП второго порядка .... 370
Уравнение для моментов распределения времени до срыва синхронизации в оптимальных системах ФАП второго порядка (370). Уравнение для моментов распределения времени до срыва сннхроннзацнн в обычных системах ФАП второго порядка (377). Численный метод решения дифференциального уравнения в частных производных эллиптического типа (383). Среднее время н дисперсия времени до срыва синхронизации в системах ФАП второго порядка (387). -
29. Общие сведения о случайных точечных процессах.............397
30. Пуассоновские процессы....................................404
Характеристики простого пуассоновского процесса (404). Обобщения процесса Пуассона (418). Простейшие операции над пуассоновским процессом (422).
31. Процессы восстановления...................................427
Определение и классификация процессов восстановления (427). Основные соотношения (431). Функция восстановления (435). Плотность восстановления (437). Времена возвращения (440). Наложение процессов восстановления (442).
32. Профильтрованный пуассоновский процесс................. . 445
Приложение 1. Сведения из теории матриц.......................461
Приложение II. Основные теоремы о производящей функции .... 472
Приложение III. Дельта-функция.............................. 473
Список литературы.............................................481
Предметный указатель .............. 486