/
Автор: Левин Б.Р.
Теги: электротехника теория вероятностей и математическая статистика радиотехника радиосвязь
ISBN: 5-256-00264-3
Год: 1989
Текст
Б.Р.ЛЕВИН
Теоретичесиие
ОСНОВЫ
статистичесной
paguomexHUHu
3-е издание,
переработанное и дополненное
Москва
«Радио и связь»
1989
УДК 621.391:519.27@24)
Левин Б. Р. Теоретические основы статистической радиотехники. — 3-е
язд.., перераб. и доп. — М.: Радио и связь, 1989. — 656 с: ил. —
ISBN 5-256-00264-3.
Переработанное издание трехтомника A974—1976 гг.) состоит из двух ча-
частей, соответствующих двум основным задачам статистической радиотехники:
вероятностному анализу прохождения стохастических сигналов через типовое
системы и статистическому синтезу систем обнаружения, различения сигналов
и оценивания их параметров на фоне помех при полной априорной информации
и в условиях априорной неопределенности. Структура и логическая последовя-
тельность расположения материала остались прежними. Не включены некоторые
разделы трехтомника, представляющие интерес для более узкого круга специа-
специалистов, но добавлен ряд новых глав и новых результатов наряду с современной
трактовкой известных положений.
Для научных работников, специализирующихся в области радиотехники и
связи, а также для аспирантов и преподавателей вузов.
Ил. 104. Библиогр. 81 назв.
Рецензент д-р техн. наук Я. А. ФОМИН
Редакция литературы по радиотехнике и электросвязи
п 2303020000-148
046@1)-89
ISBN 5-256-00264-3 © Левин Б- Р-> 1989
ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ
Предыдущее трехтомное издание книги «Теоретические
основы статистической радиотехники» вышло в свет более
десяти лет тому назад. Эти годы статистическая радиотех-
радиотехника продолжала интенсивно развиваться как в теоретиче-
теоретическом, так и в прикладном аспекте. Статистические методы
все шире используются в научных исследованиях и прак-
практических разработках радиотехнических и других информа-
информационных систем. Это вызвало необходимость в новом изда-
издании книги.
Структура и логическая последовательность расположе-
расположения материала остались прежними. В новом издании первая
часть (анализ) соответствует первой книге трехтомника, а
вторая часть (синтез) — второй и третьей книге. Вместо
глав 10, 11, 12 (первой книги трехтомника включены не-
небольшие § 4.6; 5.5; 7.4. Большинство глав второй части на-
написано, по существу, заново. В процессе переработки и до-
дополнения учтены тенденции использования вычислительной
техники для решения практических задач.
Как и предыдущие издания, настоящая монография адре-
адресуется, прежде всего, научным работникам, инженерам-ис-
инженерам-исследователям в области радиотехники и связи. Опыт много-
многолетнего преподавания автором в Московском институте свя-
связи, а также чтение лекций в ВНР и ГДР позволяет рекомен-'
довать ее в качестве пособия для преподавателей вузов и
аспирантов.
Автор надеется, что это новое издание, как и те его ра-
работы по теории случайных процессов и статистической ра-
радиотехники, которые опубликованы за последние 30 лет,
также привлечет внимание широкого круга читателей, ин-
интересующихся техническими «приложениями вероятностных и
статистических концепций.
Введение
Детерминизм и случайность. Долгое время в исследовании
физических процессов преобладали детерминистические принци-
принципы. Но как бы .искусно и последовательно не использовались эти
принципы, они не охватывают сложности реальных явлений. Мно-
Многие процессы, для изучения которых казалось вполне достаточ-
достаточным применения классических методов математической физики,
при более глубоком изучении потребовали вероятностного под-
подхода, т. е. отказа от однозначного описания изменений физиче-
физической 'системы. Так, наряду с классической физикой возникла
статистическая физика, наряду с классической механикой —
квантовая статистика. Радиотехника, изучающая макроскопиче-
макроскопические процессы, не заняла в указанном смысле особого положе-
положения. Непредсказуемый, случайный характер шумов и помех, со-
сопутствующих работе радиотехнических устройств, статистическая
структура источников сообщений потребовали внедрения в тео-
теоретическую радиотехнику вероятностных методов. Случайный
процесс стал основной математической моделью сигналов-пере-
сигналов-переносчиков информации и сопутствующих им помех.
Не удивительно, что отказ от детерминистических принципов
повлек за собой необходимость использования нового математи-
математического аппарата. Однако, как это часто бывало в истории науки,
новые направления уже при своем рождении находили готовый
адекватный аналитический аппарат, ранее казавшийся лишь абст-
абстрактным математическим построением, пригодным для описания
очень узкого класса явлений. Такова была в начале текущего
столетия роль теории вероятностей и математической стати-
статистики в формировании нового подхода к исследованиям физи-
физических процессов как альтернативы детерминизму.
Статистическая радиотехника. Анализ априорных вероятност-
вероятностных моделей и статистические выводы в специфических радио-
радиотехнических аспектах составляют предмет статистической радио-
радиотехники. Поскольку нет термина, объединяющего вероятность и
статистику, предпочтение отдано наименованию «статистическая
радиотехника», подчеркивающему аналогию и связь с понятием
«статистическая физика».
Продуктивность и реализуемость априорного анализа зависят
прежде всего от того, насколько близки к действительности и
просты для использования выбранные вероятностные модели.
Статистические выводы всегда делаются в условиях априорной
неопределенности на основании ограниченного объема накоплен-
4
ных экспериментальных данных. Необходимо заранее указать ал-
алгоритм обработки (Выборочной информации, который позволил бы
наилучшим (в некотором смысле) образом использовать ее для
получения требуемых сведений о свойствах изучаемого яв-
явления.
Математический базис статистической радиотехники включает
теорию вероятностей и теорию случайных процессов, математиче-
математическую статистику <и теорию решений. Трудно (и, по-видимому, да-
даже нецелесообразно) провести границу между статистической ра-
радиотехникой «и родственными областями науки. Отдельные ре-
результаты, а иногда и целые разделы могут быть отнесены не
только к статистической радиотехнике, но и к теории информации
(в широком смысле), статистической теории связи, теории управ-
управления.
Наиболее эффективное и широкое применение методы стати-
статистической радиотехники получили в радиолокации (в задачах об-
обнаружения, сопровождения и дискриминации объектов в услови-
условиях помех) и © радиосвязи (коротковолновой, радиорелейной,тро-
радиорелейной,тропосферной, космической). При помощи этих методов решались
актуальные задачи в радиофизике, гидролокации, радиоастроно-
радиоастрономии, сейсмологии, в технике радиоуправления, телеметрии, нави-
навигации, радиоизмерений, в теории надежности систем.
Анализ и синтез. При разработке информационной системы и
отдельных ее элементов возникают задачи, «которые могут быть
разделены на два основных класса: анализа и синтеза. В наи-
наиболее общем виде они формулируются следующим образо/м. За-
Задача анализа: заданы характеристики системы и процесса, дей-
действующего на ее вход;' необходимо найти характеристики про-
процесса на выходе системы. Задача синтеза: заданы характери-
характеристика процесса на входе и требуемая характеристика процесса
на выходе; необходимо найти такую систему, которая преобразо-
преобразовывала бы процесс с заданной характеристикой в процесс с тре-
требуемой характеристикой.
В статистической радиотехнике исследуемые процессы — сиг-
сигналы и помехи — представляют реализации случайных процес-
процессов. Задача анализа при этом состоит в определении требуемых
вероятностных характеристик процесса «а выходе системы при
условии, что структура и характеристика системы заданы и дано
вероятностное описание процесса на входе (с той или иной под-
подробностью, необходимой для решения конкретной задачи). При-
Примером анализа является определение отношения мощности сиг-
сигнала к мощности шума на выходе приемного устройства, часто
используемое в качестве показателя помехозащищенности. Зада-
Задачам анализа посвящена 'первая часть настоящей -книги. Для их
решения используются методы теории вероятностей и теории слу-
случайных процессов.
Задача оптимального статистического синтеза состоит в опре-
определении наилучшего (в некотором смысле) образа действий, поз-
позволяющего по наблюдаемой реализации входного воздействия
принять решение о представляющих интерес характеристиках
входного воздействия как случайного процесса. Иными словами,
необходимо синтезировать оптимальную но некоторому критерию
систему (оптимальный алгоритм обработки наблюдаемого вход-
входного процесса), процесс на выходе которой представлял бы ре-
решение или (и) числовую оценку, характеризующие неизвестные
свойства наблюдаемого процесса. Независимо от формы пред-
представления процесс на выходе системы является функционалом
наблюдаемой реализации случайного процесса. Задачам синтеза
посвящена вторая .часть книги. Основным математическим сред-
средством их решения являются математическая статистика и теория
решений.
Следует подчеркнуть, что статистический синтез представляет
лишь определенную ступень познания, на которой, конечно, не
удается полностью освободиться от приближенного рассмотре-
рассмотрения объективно существующих явлений и уйти от неизбежных
компромиссов, продиктованных выбором критерия качества и не-
необходимостью каким-то образом преодолеть трудности, связанные
с отсутствием априорных данных, с математическими тупиками,
а также со сложностью реализации оптимальных алгоритмов.
Разделение книга на две части — анализ и синтез — отража-
отражающее различие в постановках задач статистической радиотехни-
радиотехники, не должно нарушать представления об их диалектической
связи. Такая связь прослеживается между теорией вероятностей
и математической статистикой.
Часть первая
АНАЛИЗ
Глава 1
СЛУЧАЙНЫЕ СОБЫТИЯ
1.1: ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ
1.1.1. Математическая модель эксперимента. В научных
исследованиях, в технике и производстве часто не удается пред-
предсказать результаты экспериментов, испытаний, измерений или не-
некоторых операций, многократно повторяемых при одинаковых ус-
условиях. Отказ от однозначного представления указанных резуль-
результатов объясняется обычно не столько сложностью изучаемого яв-
явления, сколько незнанием всех причин, связанных с его возникно-
возникновением или невозможностью задать необходимое число начальных
данных.
Математическая модель эксперимента (испытания, наблюде-
наблюдения, измерения), которая является основой излагаемой далее тео-
теории, определяется фиксированным комплексом условий и воз-
возможностью многократного повторения эксперимента при этих ус-
условиях.
Результаты эксперимента могут быть детерминированы в том
смысле, что условия эксперимента однозначно определяют его
результат. Они могут быть неоднозначными в том смысле, что
при неизменном комплексе условий эксперимента невозможно за-
заранее предсказать его результат. Непредсказуемый результат
эксперимента называют случайным событием. Теория вероятнос-
вероятностей изучает закономерности случайных событий и способы их ко-
количественного описания.
Если наблюдать длинные серии результатов эксперимента, то
обнаруживается следующая закономерность: отдельные резуль-
результаты могут отличаться друг от друга, но средние значения, отно-
относящиеся к сериям результатов, остаются постоянными, проявляют
статистическую устойчивость. Такая статистическая устойчивость
является еще одной особенностью рассматриваемой математичес-
математической модели эксперимента. Наконец, предполагается, что априори
(до осуществления эксперимента) известно множество возможных
результатов эксперимента.
Рассмотрим некоторое случайное событие А — один из воз-
возможных результатов эксперимента. Пусть при п повторениях экс-
эксперимента событие А появляется тА раз. Величина
7
vn{A}=mAfn AЛ>
называется частотой появления события Л при п экспериментах.
Очевидно, что vn зависит от п. При наблюдении за ней в любой
длинной серии рассматриваемого эксперимента обнаруживается
статистическая закономерность — устойчивость частоты, т. е. при-
приблизительно одни и те же значения величины vn. При достаточно
большом п эта частота, .мало изменяющаяся при увеличении пу
может служить количественной мерой статистической закономер-
закономерности появления события А.
Ясно, что частота появления события не может быть отрица-
отрицательной или превосходить единицу, т. е.
0<vn<l. A-2)
Если под событием А понимать появление любого результата из
множества априори (возможных результатов, то тА = п и vn=l.
Бели А и В — несовместимые события, а тА и тв — числа по-
появлений этих событий в серии п экспериментов, то число появле-
появления события А или В равно тА+тв и, следовательно,
VA или B = VA+Vb. A.3)
1.1.2. Алгебра событий. Как уже отмечалось, рассматриваемая
модель эксперимента априори характеризуется множеством воз-
возможных результатов. Каждый элемент этого множества называ-
называется элементарным событием, а все множество, обозначаемое сим-
символом й, — пространством элементарных событий. Подмножества
множества Q называют событиями.
Вводятся две логические операции над событиями: объедине-
объединение событий (логическая операция ИЛИ) и пересечение (совме-
(совмещение) их (логическая операция И). Объединением (суммой)
событий А и 5, обозначаемым символом А[)В, называется собы-
событие, состоящее в появлении А или В или того и другого события.
Объединением совокупности событий Ль ..., Лп, обозначаемым
п
U Aky называется событие, состоящее в появлении, по крайней
/г=1
мере, одного из событий Аи, A=lf п.
Пересечением (произведением) событий Л и В, обозначаемым
символом А[\В, называется событие, состоящее в совместном по-
появлении событий А и В (имеется в виду совместимость, в общем
случае логическая, а не обязательно во времени и (Пространстве).
Пересечением совокупности событий Ль ..., Лп, обозначаемым
п
П Ak9 называется событие, состоящее в совместном появлении
&1
всех событий Aki k=l, n.
8
Событие, включающее все элементы пространства Q, называ-
называется достоверным. Событие, не содержащее ни одного элемента
пространства Й, называется невозможным (пустое множество,
обозначаемое символом 0).
События Л и В называются несовместимыми, если их пересе-
пересечение невозможно: А[\В = 0. Совокупность несовместимых собы-
событий образует полную группу, если объединение этих событий до-
достоверно: U Ai = Q9 А$\А^0,1ф\,1, /=1, п.
t=i
Противоположным (дополнительным) событием А событию А
называется событие, состоящее из «всех_ элементов пространства
й, не принадлежащих А. События А я А образуют полную груп-
группу событий, так как A[)A=Qy А(]А = 0.
Событие А влечет за собой В (Лс:Б), если при 'появлении со-
события А обязательно происходит событие В. Если А влечет за
собой В и В влечет за собой Л, то события А я В называются
эквивалентными (А = В).
Система подмножеств множества й называется алгеброй s4-9
если из того, что Лг&5#, i"=l, n, следует [}А^<&, ГИг&^, и если
i i
, то Ле^. Таким образом, алгебра есть класс множеств, зам-
замкнутых относительно конечного (для булевой алгебры) или счетно-
счетного (для сигма-алгебры) количества операций объединения, пересе-
пересечения и дополнения. В качестве системы событий в теории вероят-
вероятностей рассматриваются системы множеств, которые представля-
представляют указанные алгебры.
1.1.3. Аксиомы теории вероятностей. Основанием теории веро-
вероятностей служат аксиомы, сформулированные А. Н. Колмогоро-
Колмогоровым. Пусть Q — пространство элементарных событий и^ — ал-
алгебра событий. Вероятность и ее свойства определяются следую-
следующими аксиомами:
1. Каждому событию А^зФ соответствует действительное чис-
число Р{Л}, называемое вероятностью события Л, такое, что
Р{Л}
2. P{Q} = 1.
3. Если ЛПВ = 0, то Р{Ли?}=Р{Л}+Р{?}.
Нетрудно убедиться, что аксиомы теории вероятностей пред-
представляют абстрактные эквиваленты приведенных свойств частоты
появления события при многократном повторении эксперимента
в неизменных условиях. Аксиома 1 'постулирует статистическую
устойчивость частоты в длинной серии испытаний и отображает
основное свойство частоты, выраженное неравенствами A.2). Ак-
Аксиома 2 постулирует достоверность появления какого-либо резуль-
результата из множества возможных результатов эксперимента. Аксиоме
3 соответствует соотношение A.3), относящееся к частоте появ-
появления события, которое представляет объединение двух несовмес-
несовместимых событий.
1.2. ОСНОВНЫЕ ПРАВИЛА ТЕОРИИ ВЕРОЯТНОСТЕЙ
1.2.1. Правило сложения вероятностей для несовместимых со-
событий. Если Аи ..-, Лп — несовместимые события, то вероятность
появления одного из событий Аи или Л2, или ..., или Ап равна
сумме вероятностей этих событий:
2Р{Л*Ь At[)Ak=0, i, k=hT. A.4)
Формула A.4) 'непосредственно следует из аксиомы 3 (см.
п. 1.1.3).
Если несовместимые события Ль ..., Ап составляют полную
группу, то одно из них появляется обязательно и, следовательно,
п
Р{ U Ak} = l. Учитывая A.4), получаем для полной группы со-
бытии
2Р{Л}=1. A.5)
Полная группа может представлять счетное множество собы-
сю
тий, причем Р{ЛП}-Н) -при я->оо, так что 2 P{Ah} = l.
Если (полная группа состоит из двух событий Л и Л, то -из
A.5) следует
A.6)
Пусть п случайных событий, составляющих .полную группу,
равновероятны, т. е. P{Ak}=p, k=ly п. По формуле A.5) нахо-
находим вероятность р появления одного из п равновероятных собы-
событий, составляющих полную группу:
P=Un. A.7)
В соответствии с A.4) и A.7) вероятность одного из ^
событий, входящих в полную группу п равновероятных событий,
J
1
U Л)=—• A-8)
1 J «
1.2.2. Правило умножения. Два события А и В называют
зависимыми, если вероятность события А зависит от того, произо-
произошло или нет другое событие В. Вероятность совместного наступ-
наступления двух зависимых случайных событий А и В равна произве-
произведению вероятности одного из этих событий на условную вероят-
вероятность /появления другого, вычисленную в предположении, что
первое событие совершилось:
Р{А(]В}=Р{А}Р{В\А}=Р{В}Р{А\В}. A.9)
В A.9) входят вероятности двух родов: безусловная вероят-
вероятность события А (события В) и условная вероятность события В
10
(события Л), в предположении, что произошло событие А (собы-
(событие В). Поэтому безусловные вероятности Р{Л} и Р{В} иногда
называют априорными, а условные вероятности Р{В|Л} и
|} — апостериорными.
огда события А я В независимы, априорные и апостериорные
вероятности становятся равными друг другу:
Р{В\А}=Р{В}, Р{А\В} = Р{А} A.10)
и из A.9) следует
Р{А()В}=Р{А}Р{В}. A.11)
Равенство A.11) может служить определением независимости
двух случайных событий А и В \я распространяется на произволь-
произвольное число независимых (в совокупности) событий Аи ..., Ап:
п л1 = прш. (i-i2)
Если события А\, ..., Ап зависимы, то
{РЧ}. A.13)
1.2.3. Правило сложения для совместимых событий. Рассмотрим сначала
совокупность Ви ..., Вп независимых событий. Пусть Вь. — событие, противо-
противоположное событию Bh. Тогда появление хотя бы одного (безразлично како-
какого) из событий Bh исключает возможность совместного наступления всех
_ _ п п _
событий Бь ..., В п. Поэтому в соответствии с A.6) Р{ U Bk}=\—Р{ П Въ).
/г=1 k=\
Так как Ви ..., Вп взаимно независимы, то по правилу умножения A.12)
п _ п _ _
Р{ U Bk}= П P{Bk}. Кроме того, P{Bk}=\—P{Bk}. Следовательно,
A.14)
Формула A.14) позволяет вычислить вероятность наступления по меньшей
мере одного из совместимых независимых событий Ви ..., Вп по заданным
вероятностям этих событий.
Выполним умножение в правой части A.14) и обозначим
Si= 2Р{*|}. s,= s 2
i=\ i=\ /=1
5r=2 ...2
^Каждая комбинация индексов в суммах появляется один и только один раз,
/ п \ п\
поэтому Sr содержит 1 = членов.) Последний член
V г j г\(п-г)\
11
Тогда формулу A.14) можно переписать в виде
Р ll^Bft} = S, - S?+ ... + (-I)" Sn. (I.15)
В частном случае при я = 2 из A.15) следует
P{51U52} = S1-S2 = P{51}+P{52b-P{51}P{52}. A.16)
Так как в сумму Si = P{5i}-f-P{52} дважды включаются те случаи, когда со-
события BY « Вч появляются совместно, то из нее вычитается вероятность S2 =
= P{Bi}P{B2] совместного появления независимых событий В\ и В2.
Для произвольного п формула A.16) трактуется аналогично на основании
так называемого принципа включения и 'исключения: включается все и исклю-
исключается лишнее, включается ошибочно исключенное и т. д., т. е. попеременное
включение и исключение. Используя этот принцип, нетрудно доказать, что
формула A.15) остается справедливой и для совокупности зависимых событий,
если только в формулах для Sr заменить произведения вероятностей вероят-
вероятностями совмещения событий:
Первый член Si в A.15) всегда равен сумме вероятностей, т. е. соответствует
несовместимости событий, а остальные члены дают поправку за счет того, что
события в действительности совместимы. Тогда, когда вероятностями совмеще-
совмещения событий можно пренебречь по сравнению с априорными вероятностями
самих событий, вместо обобщенного правила сложения A.15) можно с извест-
известным приближением пользоваться обычным правилом A.4) для совместимых
событий.
1.2.4. Формула полной вероятности. Иногда необходимо опре-
определить вероятность события Л, появляющегося с одним из п вза-
взаимно /несовместимых событий В\, ..., Вп, составляющих полную
группу, т. е.
А= U (А(]Вк).
События Bhy k=l, n, часто называют гипотезами, связанными с
наступлением события А. Так как при 1ф] (А[}В{)[](А[]В^Ф0>
то, используя правило сложения, представим вероятность события
А в виде суммы
= 2Р{ЛГ№. A.17)
Согласно правилу умножения каждое слагаемое этой суммы
P{Af\Bk}=P{Bk}P{A\Bk} и, следовательно,
Р{Л}= 2 P{Bk}P{A\Bk}. A.18)
12
Соотношение A.18) называют формулой полной вероятности.
Эт& формула позволяет определить вероятность события А, если
известны априорные вероятности гипотез Ви ..., Вп и апостериор-
апостериорный вероятности события А при условии, что одна из гипотез
подтвердилась.
1.2.5. Формула Байеса. Пусть, как в п. 1.2.4, совокупность со-
событий (гипотез) Ви ..., Вп составляет полную группу. Используя
правило умножения, находим
и, подставив вместо вероятности Р{А} ее значение по формуле
полной вероятности A.18), получим формулу Байеса
P{Bh\A} = Pt*»>pMlfl»> . A.19)
%P{Bk)P{A\Bh)
Если известны априорные вероятности гипотез Bk, ife=l, я, и
апостериорные вероятности события А при условии Ви, то по фор-
формуле Байеса можно найти апостериорную вероятность гипотезы
Ви при условии, что событие А осуществилось. Формулу Байеса
поэтому называют иногда формулой обратной вероятности.
1.3. ПОСЛЕДОВАТЕЛЬНОСТЬ НЕЗАВИСИМЫХ ИСПЫТАНИИ
1.3.1. Биномиальная формула. Многочисленные практические
задачи укладываются в следующую схему последовательности не-
независимых испытаний, называемую иногда схемой Бернулли.
Пусть производится п независимых испытаний (повторений экс-
эксперимента при неизменных условиях). В результате каждого ис-
испытания с вероятностью р появляется событие А. Вероятность
противоположного события Л, т. е. непоявления события Л, равна
<7=1—р. Необходимо определить вероятность Pn(k) того, что в
данной последовательности п 'независимых испытаний событие А
появилось точно k раз, 0^.k^n. Решение этой задачи, которое
получается простым применением правил сложения и умножения,
описывается следующей формулой:
К A.20)
\ к /
где
k\ (n — k)\
— число сочетаний из п элементов по k. Нетрудно заметить, что
Pn(k) равно коэффициенту при xk в разложении бинома (q +
+рх)п по степеням х. Поэтому формулу A.20) часто называют
биномиальной.
13
Функция Pn{k) целочисленного аргумента достигает максиму-
максимума при
где символ [х] означает целую часть числа х.
Вероятность того, что событие А появится не более т раз:
m m
2P (k\ = Y
и п ь n\ K
Сумма в правой части A.22) равна отношению неполной бета-
функции к полной *
где неполная Bq(x, у) и полная В(х, у) бета-функции представля-
представляются интегралами
Bq (х, у) = jV-> A - z)»-' dz, A.236)
О
В (jc, у) = /г*-> A - z)^-1 dz. A.23в)
о
Для того чтобы убедиться в справедливости равенства A.23а),
достаточно подставить в его правую часть интеграл A.236),
продифференцировать обе части по q и воспользоваться таблич-
табличным выражением
где
T(x)=]z*-lz-zdz A.23г)
о
— гамма-функция, которая >при целочисленном аргументе х = т
Г{т) = (т— 1)!, т>1. A.23д)
1.3.2. Асимптотика Муавра — Лапласа. В тех случаях, когда
число независимых испытаний велико, 'непосредственное вычис-
вычисление вероятностей по формуле A.20) представляет большие
трудности, так как при этом определение биномиальных коэф-
коэффициентов связано с вычислением факториалов при больших ар-
аргументах. Факториал можно с достаточной точностью получить,
применив так называемую асимптотическую формулу Стирлинга 1
1 Символ ^ (асимптотическое равенство) означает, что отношение двух
выражений, соединенных этим символом, стремится к единице при неограниченном
возрастании т. Формула Стирлинга справедлива и для гамма-функции Г(т + 1),
где т не обязательно целое число.
14
Используя формулу Стерлинга, при я-^оо из A.20) с точно-
точностью до малых порядка 1/У"/Г можно получить следующее асимп-
асимптотическое равенство:
где
Формула A.24), которую иногда называют локальной форму-
лой Муавра — Лапласа, является искомым асимптотическим при-
приближением вероятности Pn{k)t точное значение которой дается
биномиальной формулой A.20).
Вероятность того, что число появлений события при п неза-
независимых испытаниях находится в пределах от k\ до &2, можно
подсчитать с помощью асимптотической формулы
z, A.25)
^ ' У 2л i
где а= (кг—пр)/о9 b= (k2—np)/o.
Формула A.25) является аналитическим выражением так на-
называемой интегральной теоремы Лапласа.
1.3.3. Асимптотика Пуассона. Во многих практических зада-
задачах, относящихся к схеме последовательности большого числа
независимых испытаний (/г^>1), вероятность появления события
при одиночном испытании относительно мала, так что
р = К/п, A.26)
где X — положительная величина.
Рассмотрим вероятность того, что событие А при п испыта-
испытаниях не появляется вовсе. На основании A.20) и A.26) эту ве-
вероятность можно представить в виде
откуда
lnPn@)=/zln(l—X/n)=— X—
Если я^>Я2, то в разложении логарифма в ряд .можно ограни-
ограничиться первым членом, тогда
Рп@)~е-\ A.27)
Далее при фиксированном k
Pn{k) _x-(k-\)P _%_
Р﹫1) ' kq k ' l • }
Пр,и k=l из A.27) и A.28) следует РпA)~Хе~К Аналогично
15
при k = 2 имеем PnB) ~ (к2/2)е~к. При любом целом k получаем
асимптотическую формулу Пуассона
Используя A.29), ^находим вероятность того, что событие по-
появляется не более m раз:
? ^-e^=--P(m, Я). A.30)
Функцию P(m, Я) можно представить интегралом
Р(т, Л) = —Тг^е-^г. A.30а)
ml I
При ^ = 0 интеграл A.30а) — гамма-функция Г(т+1), кото-
которая при целочисленном аргументе равна ml [см. A.23г и д)].
Интеграл
Г(т+1, Х)= (zme-zdz = T(m+l)-]zme-zdz A.31)
о ь
называется неполной гамма-функцией. Формула A.30) может
быть записана следующим образом:
р(т, Я)=1-Х^+1^. A.32)
V ' Г(т+1)
1.4. ПРОСТАЯ ЦЕПЬ МАРКОВА
Предположим, что исходом каждого испытания может быть
не одно из двух событий А -или А, а одно событие из.полной
группы несовместимых событий Аи ..., Ат. Простейший вид веро-
вероятностной связи состоит в том, что условная вероятность pishj
появления какого-то события Aj лри E +1)-м испытании зависит
только от того, какое событие Лг- появилось при 5-м испытании,
и не зависит от того, какие события появились при более ран-
ранних испытаниях. Такая последовательность событий называется
простой цепью Маркова. Если условная вероятность рц перехода
от события А\ к событию Aj обусловлена только этими события-
событиями, но не зависит от номера испытания, то соответствующая про-
простая цепь Маркова называется однородной.
Следующее повышение сложности состоит в учете появления
двух или более событий, предшествовавших данному испытанию.
Подобным образом можно .получить все более сложные цепи Мар-
Маркова.
Как следует из приведенного определения, для описания
простой однородной цепи Маркова необходимо указать условные
вероятности появления события Aj после события Aiy i, /=1, m.
16
Эти\вероятности называются переходными; они могут быть рас-
расположены в -виде таблицы:
A.33)
Такая таблица называется матрицей переходных вероятностей
(или стохастической матрицей). Необходимо задать также апри-
априорные 'вероятности р*A) осуществления каждого из событий Ak
в дервом испытании. Матрица М переходных вероятностей вмес-
вместе с вектором априорных вероятностей рA) = [piA), ..., Pm(l)]
полностью определяют простую однородную цепь Маркова.
Поскольку при каждом данном испытании появление одного
из событий, составляющих полную группу, достоверно, то сумма
переходных вероятностей ib каждой строке матрицы М равна еди-
единице, т. е.
2/^=1, i=l, m. A.34)
/=i
В соответствии с формулой полной вероятности вероятность по-
появления события Aj во втором испытании
/>Н2)=2лA)Ри. /=U
или в векторной записи
рB)=МрA). A,35)
Общее соотношение между векторами p(t) и p(s) имеет вид
p(s) = M*-*p(i), s^t. A.36)
Справедлива теорема, согласно которой для однородной прос-
простой цепи Маркова с положительно определенной матрицей М
limp(s) = p, A.37)
S->oo
где р — вектор предельных вероятностей появления событий,
который не зависит от рA) и является собственным вектором
матрицы М, принадлежащим характеристическому числу, равно-
равному единице.
17
Глава 2
СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
2.1. РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ
СЛУЧАЙНЫХ ВЕЛИЧИН
2.1.1. Определение случайной величины. Случайная ве-
величина — числовая форма представления заранее непредсказуе-
непредсказуемых результатов эксперимента, для которого выполняются ус-
условия, приведенные в п. 1.1.1. Она характеризуется множеством
возможных значений >и распределением вероятностей, заданным
на этом множестве.
Если множество возможных значений случайной величины ко-
конечное или счетное
5= {^1, ..., Хп, ...},
то случайная величина называется дискретной. При этом каж-
каждому возможному значению дискретной случайной величины
можно поставить в соответствие событие Аи'. ? = #ь, k=l, 2, ..., а
всему множеству возможных значений ? — полную группу со-
событий. Тогда распределение вероятностей дискретной случайной
величины представляет .совокупность вероятностей, характеризую-
характеризующих эту полную группу событий:
= P{l = xh}, ft=lf 2, ..., B.1а)
B.16)
k
В дальнейшем, когда пределы суммирования могут быть конеч-
конечными или бесконечными, указывается только индекс суммиро-
суммирования [см. B.16)].
Однако не всегда можно установить взаимно однозначное со-
соответствие между множеством возможных значений случайной
величины и полной группой событий. Так, результаты измерений
физической величины могут принадлежать континууму значений,
т. е. заполнять интервал действительной оси. Если возможные
значения случайной величины заполняют интервал, то введение
понятия вероятности сложнее. Случайная величина принимает не-
несчетное множество значений, и априорная вероятность фиксиро-
фиксированного значения не имеет смысла, так как эта вероятность рав-
равна нулю. Можно, однако, разбить интервал возможных значений
случайной величины на конечное число непересекающихся отрез-
отрезков. Тогда совокупность событий, состоящих в том, что случай-
случайная величина попадет в каждый из этих отрезков, образует пол-
полную группу. При этом введение понятия вероятности того, что зна-
значения случайной величины находятся в пределах некоторого от-
отрезка, становится аналогичным дискретному случаю.
18
Чакой способ определения распределения вероятностей одно-
однозначен для дискретных случайных величин и неоднозначен для
случайной величины, значения которой заполняют интервал. В
последнем случае остается совершенно произвольным правило
разбиения интервала на конечное число непересекающихся отрез-
отрезков. Поэтому рассмотрим общепринятый подход к определению
распределения, справедливый для случайных величин обоих ука-
указанных видов.
2.1.2. Функция распределения. Предположим, что случайная
величина g может принимать любые действительные значения.
Данное предположение не уменьшает общности, так как ограни-
ограниченность интервала возможных значений будет означать, что ве-
вероятность попадания значения случайной величины в область чи-
числовой оси вне указанного интервала равна нулю.
Используем простейшее правило разбиения: зафиксируем на
действительной оси порог х. Область возможных значений случай-
случайной величины делится на две части: к одной из них относятся зна-
значения g, не превосходящие порог х, а к другой — превосходящие
порог. Функция
*б(*) = Р {?<*}. B.2)
показывающая, как Зависит от выбранного порога х вероятность
того, что значения случайной величины не превосходят его, назы-
называется функцией распределения вероятностей случайной величи-
величины g.
Укажем основные свойства функций распределения. Значения
этих функций, представляющие вероятности, должны находить-
находиться в пределах от 0 до 1, причем
lim /76(jc) = F6(-uo) = P{g<-oo} = 0 B.3a)
как вероятность невозможного события, а
1 im Fg (л:) = F6 (оо) - Р {? < оо} = 1 B.36)
как вероятность достоверного события. Свойство, выраженное ра-
равенством B.36), аналогично свойству полной группы событий.
Если Х2>хи то
и, следовательно,
P{S<*2}=P{
откуда, используя B.2), находим
)t x2>xv B.4)
Таким образом, вероятность того, что случайная величина за-
заключена в определенных пределах, равна разности значений функ-
функции распределения в верхнем и нижнем пределах.
Соотношение B.4) подчеркивает универсальность приведенно-
приведенного подхода к определению распределения вероятностей, так как
19
он позволяет перейти к любому другому определению. Так как ле-
левая часть равенства B.4) не может быть отрицательной, то при
). B.5)
Следовательно, функция распределения неубывающая.
Условия B.3) и B.5) необходимы и достаточны для того, что-
чтобы функция одной переменной была функцией распределения слу-
случайной величины.
2.1.3. Функция,распределения дискретной случайной величины.
Для дискретной случайной величины g функция распределения
= 2 Р$ = **}= 2 р*. B.6)
B.7)
Вводя функцию единичного скачка
ы(г) =
z<0,
можно переписать B.6) в виде
F%{x)= ЪРки{х-хк).
к
Обратно, зная функцию распределения, можно найти вероятность
рп = Р {% = хп} = Ft (хп) - F% (х„_,), п = 1, 2,... B.9)
B.8)
Графически функция распределения дискретной случайной ве-
величины представляется ступенчатой кривой (рис. 2.1) со скачками,
равными ри в точках xk, и постоянным значением на полузамкну-
полузамкнутом интервале {xk-u xk], !fe= 1, 2,...
Примерами распределения вероятностей дискретной случайной
величины являются биномиальное распределение, когда
п,
B.10)
х1 xz х5 О х^ х5 х6 х7 х
Рис. 2.1. Функция распределения дискретной случайной величины
20
Где ^=1—ру O^p^l [ср. с A.20)], и распределение Пуассона,
когда
4 B.11)
2.1.4. Плотность вероятности непрерывной случайной величи-
величины. Если функция распределения случайной величины дифферен-
дифференцируема при всех значениях аргумента (за исключением, может
быть, граничных точек), то такая случайная величина называется
непрерывной. Производная
называется плотностью вероятности непрерывной случайной ве-
величины (рис. 2.2) *.
Плотность вероятности как производная неубывающей функ-
функции (функции распределения) не .может быть отрицательной, т. е.
гМ*)>°- B.13)
Интегрируя обе части B.12) в пределах от —оо до х и учиты-
учитывая B.3а), выразим функцию распределения через плотность
(рис. 2.2,6):
du. B.14)
При х=оо из B.14) находим
'$щ(х)Aх=1. B.15)
— оо
Из B.15) следует, что w% (jk)-^O при |jt|-^oo, причем w\(x)~
~х-<1+8>, е>0 при |*| »1.
Условия B.13) и B.15) необходимы и достаточны, чтобы
функция одной переменной была плотностью вероятности непре-
непрерывной случайной величины.
Используя B.4) и B.14), находим (см. заштрихованную часть
рис. 2.2,а)
Р {*i < I < *2} = Х\Щ {и) du. B.16)
Значение х=хМ} при котором плотность вероятности имеет
максимум, называется модой. Кривая плотности может быть уни-
1 Так как F%(x) — величина безразмерная, то размерность плотности такая
же, как величины \/х.
21
a)
модальной, т. е. иметь один мак-
максимум как на рис. 2.2,а, или по-
лимодальной, т. е. иметь несколь-
несколько максимумов.
2.1.5. Обобщенная плотность
вероятности для дискретной слу-
случайной величины. Для дискрет-
дискретной случайной величины функция
распределения не дифференци-
дифференцируема в обычном смысле. Мож-
Можно, однако, распространить по-
понятие плотности вероятности на
дискретную случайную величи-
величину, используя обобщенную функ-
функцию — дельта-функцию !. По-
Поскольку дельта-функцию можно
представить в виде производной
функции единичного скачка [см.
B.7)]
B.17)
получим из B.8) выражение обобщенной йлотности вероятности
дискретной случайной величины
Sn Я (v v \ /О 1Q\
х
Рис. 2.2. Плотность вероятности
(а) и функция распределения (б)
непрерывной случайной величины
Плотность вероятности постоянного числа а
wa(x)=6(x—a).
B.18а)
Отметим, что дельта-функция удовлетворяет требованиям, предъ-
предъявляемым к плотности вероятности:
6 (
Плотность вероятности случайной величины может быть сум-
суммой функций вида B.12) и B.18):
B.19)
щ(х) = a
k
fli>0, а2>0, ^ + 02=1, 2/?ft=l.
Тогда случайную величину называют смешанной.
1 Ввиду того, что в дальнейшем дельта-функция широко используется, не-
некоторые главные свойства ее приведены в Приложении 1.
22
2.2. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ
СЛУЧАЙНОЙ ВЕЛИЧИНЫ
2.2.1. Моменты распределения. Рассмотренные в § 2.1 функ-
функция распределения и плотность вероятности дают полную харак-
характеристику случайной величины. Однако в ряде случаев о случай-
случайной величине достаточно иметь лишь некоторое общее представ-
представление. Аналогичное положение имеет место тогда, когда вместо
описания мельчайших подробностей геометрической формы твер-
твердого тела ограничиваются такими его числовыми характеристи-
характеристиками, как длина, ширина, высота, объем, момент инерции и т. д.
В теории вероятностей числовыми характеристиками случай-
случайной величины служат моменты распределения. Для непрерывных
случайных величин моменты распределения &-го порядка (k=
= 1, 2,...) определяют по формуле1
mk{l}= ]xkwi{x)dx B.20)
— со
в предположении, что несобственный интеграл абсолютно сходит-
со
ся, т. е. что J \x\hwi(x)dx имеет конечное значение. Геометри-
— оо
чески числа т& можно трактовать как моменты инерции соответ-
соответствующих порядков плоской фигуры, ограниченной осью абсцисс
и кривой плотности вероятности.
Если случайная величина дискретна и принимает значения
Xi,..., хп, ••• с вероятностями рь..., рп,..., то ее k-й момент рас-
распределения 2
тн№=МРг B.21)
Г
в предположении, что ряд в правой части B.21) сходится абсо-
абсолютно. Формулу B.21) можно переписать в векторной форме
mft{6}=(x*)'p, B.21а)
где xk, р — вектор k-x степеней значений случайной величины и
вектор вероятностей соответственно.
Следует подчеркнуть, что далеко не всегда удается характе-
характеризовать случайную величину при помощи моментов, так как не
для любого распределения эти моменты существуют.
Заметим, что если существует момент п-го порядка, то, ко-
конечно, существуют все моменты порядка k<Cn. Если же момент
я-го порядка неограничен, то и любые моменты порядка k>n
неограничены.
1 Символ mk{%} обозначает не функцию случайной переменной |, а операцию
усреднения величины ?ft по множеству ее возможных значений [ср. формулу
C.14а)].
2 Если допускать представление плотности вероятности дискретной случай-
случайной величины дельта-функциями [см. B.17)], то B.21) является частным слу-
случаем B.20).
23
2.2.2. Среднее значение. Простейшая числовая характеристи-
характеристика случайной величины — момент распределения первого поряд-
порядка— определяет абсциссу центра тяжести плоской фигуры, огра-
ограниченной кривой распределения и осью абсцисс и называется
математическим ожиданием, или средним значением случайной
величины.
Из B.20) и B.21) при k=l находим среднее значение непре-
непрерывной случайной величины
Щ{1)= ]хщ(х)<1х B.22)
»00
и среднее значение дискретной случайной величины
w1{E)=2^rPr = x'p. B.23)
Г
Среднее значение случайной величины характеризует только
расположение кривой распределения относительно начала коор-
координат. Для центрированной случайной величины g—я^Щ сред-
среднее значение равно нулю, а геометрическая форма кривой плот-
плотности та же, что и для случайной величины g. Размерность сред-
среднего значения совпадает с размерностью значений случайной ве-
величины.
2.2.3. Центральные моменты. В отличие от моментов /Яь{?},
которые называют начальными, моменты распределения центри-
центрированной случайной величины называют центральными и обоз-
обозначают \ik{l}- Для непрерывной случайной величины
]dxt k>2, B.24)
— оо
а для дискретной
Н®= 2(*г-«1©)*Рг, k>2. B.25)
Г
Если среднее значение случайной величины равно нулю, то
центральные моменты распределения совпадают с начальными.
Очевидно, центральный момент первого порядка всегда равен
нулю.
2.2.4. Дисперсия. Центральный момент второго порядка на-
называется дисперсией случайной величины1 и определяется в со-
соответствии с B.24) и B.25) по формулам:
для непрерывной случайной величины
\hil}= ^x-mtfwiMdx, B.26)
— с»
для дискретной
Vz{l}=2(xr-m1Jpr. B.27)
1 Отметим, что часто используют обозначение Л1? для среднего значения и
, для дисперсии случайной величины.
24
Величину У \х2 называют среднеквадратическим значением
случайной величины ?. Размерность дисперсии совпадает с раз-
размерностью квадрата значений случайной величины, а размерность
среднеквадратического значения — с размерностью случайной ве-
величины.
Центральный и начальный моменты второго порядка связаны
соотношением, которое непосредственно следует из B.26) или
B.27):
|х2=т2—m2i. B.28)
Обозначим т\{1}—а и рассмотрим вероятность
J щ(х)сЬс, е>0.
Так как (х—аJ/е2>1, то
Р{|?-а|>е}< — J (*-а)ааъ(*)Л*< — Ьх—aJwz(x)dx,
82 U—a|^s 82_^
т. е.
P{\t-a\>e)^Ml}/*2- B.29)
Соотношение B.29) называется неравенством Чебышева. При
z=kV\i2 из него следует
Р{|?-а|>?/|Г2}<1/?2, B.29а)
т. е. отклонения g от его среднего, значительно превышающие
среднеквадратическое, маловероятны. Таким образом, дисперсия
случайной величины характеризует разброс ее значений относи-
относительно среднего.
2.2.5. Коэффициенты асимметрии и эксцесса. Среднее и дис-
дисперсия не отражают всех особенностей кривой распределения. Од-
Одной из них являются симметрия или асимметрия кривой плотно-
плотности относительно оси, проходящей через центр тяжести. При лю-
любом симметричном распределении центральный момент произволь-
произвольного нечетного порядка равен нулю, что непосредственно видно
из B.24). Поэтому простейший из нечетных моментов — централь-
центральный момент третьего порядка:
И8®= ](x-m1)9wl(x)dx B.30)
в первом приближении служит характеристикой асимметрии рас-
распределения. Его можно выразить через начальные моменты пер-
первых трех порядков:
\1г=т3—3mlm2+2mzi. B.31)
Асимметрию распределения принято характеризовать безраз-
безразмерным отношением
B.32)
25
Рис. 2.3. Процентная точка
х
которое называется коэффициен-
коэффициентом асимметрии.
В качестве характеристики
сглаженности кривой распреде-
распределения около ее моды использу-
используют безразмерный коэффициент
эксцесса
у=\ц/\122—3. B.32а)
2.2.6. Квантили и процентные
точки распределения. Распределе-
Распределение вероятностей случайной ве-
величины часто характеризуют
квантилями порядка р, т. е. таким значением х=х*Р, которое удов-
удовлетворяет уравнению
Квантиль #*o,5, которая делит площадь под кривой плотности
вероятности на две равные части, называют медианой распреде-
распределения.
Процентные точки распределения определяются из уравнения
(рис. 2.3)
P{t>xq}=l-Fs(xq) = q B.34а)
или
xq = Ftl(l-q), B.346)
где /^iO—q) —функция, обратная функции распределения. Яс-
Ясно, что q — процентная точка распределения — совпадает с кван-
тилью порядка 1—q.
2.3. СОВОКУПНОСТЬ СЛУЧАЙНЫХ ВЕЛИЧИН
2.3.1. Многомерное распределение вероятностей совокупности
случайных величин. Некоторые положения теории случайной ве-
величины, изложенные ранее, можно обобщить на произвольную
конечную совокупность случайных величин ?i,..., gn. Эту сово-
совокупность можно рассматривать как случайную точку в я-мерном
эвклидовом пространстве со случайными декартовыми координа-
координатами ?г-, г=1, п, или как случайный вектор
S=Sni=Fi,..., In)'. B.35)
В дальнейшем для векторных величин \, х используем обозначе-
обозначения ^пь xni тогда, когда следует указать размерность вектора.
Таким образом, множеством возможных значений совокупно-
совокупности случайных величин является многомерное эвклидово прост-
пространство (или область, принадлежащая этому пространству). Не-
Необходимо также определить на указанном множестве распределе-
распределение вероятностей совокупности случайных величин.
26
По аналогии с функций распределения скалярной случайной
величины введем многомерную функцию совместного распреде-
распределения совокупности случайных величин (векторной случайной ве-
величины) [см. B.35)]
{n &<**)} B-36а>
или к векторной форме
^Ч(х7) = Р{6»<х»}. B.366)
Многомерная функция совместного распределения векторной
случайной величины обладает свойствами, аналогичными свойст-
свойствам функции распределения скалярной случайной величины. Зна-
Значения многомерной функции распределения неотрицательны и не
превосходят единицы. Если хотя бы один из аргументов xi=—оо,
то значение функции распределения равно нулю, а если все аргу-
аргументы Xi = oo, г=1, я, то значение этой функции равно единице.
Кроме того, многомерная функция распределения неубывающая
в любом направлении, изменяющемся от —оо к оо.
Однако появляется и новое свойство, присущее многомерной
функции совместного распределения. Если я—m аргументов функ-
функции B.36а) обращаются в бесконечность, то эта функция стано-
становится функцией совместного распределения остальных m случай-
случайных величин. Например,
*6i.-.6n(*i.-. *m> «>,..., *>) = Ftlt...9im(xl9..., xm) B.37a)
или в векторной форме
F|?(x- oo)=F|«(x7), B.376)
Обратное, вообще говоря, неверно, т. е. по распределениям ча-
частей совокупности случайных величин нельзя найти совместное
распределение всей совокупности. Исключение из этого общего
правила составляет совокупность совместно независимых случай-
случайных величин, для которой по определению
n ,
Пусть % и т| — два случайных вектора. Для их независимости
необходимо и достаточно, чтобы функция их совместного распре-
распределения была равна произведению функций распределений каж-
каждого из них:
/Ъ(х, у)«/\(х)Л!(у). B.38а)
2.3.2. Многомерная плотность вероятности. Смешанная произ-
производная я-го порядка от я-мерной функции совместного распреде-
распределе
ления
д"/\ ... . (*!,..., хп)
Щ б (* х) =;
B.39а)
27
называется п-мерной плотностью вероятности совокупности слу-
случайных величин li,..., gn. В векторной форме B.39а) можно пе-
переписать в виде
а"'*. К)
• B-39б>
дх*1
Многомерная плотность вероятности векторной случайной вели-
величины обладает свойствами, аналогичными свойствам плотности
скалярной случайной величины:
w |? (х?) > О, J w |? (xf) dx? = 1, B.40)
где Хп —n-мерное эвклидово пространство.
Многомерная функция совместного распределения выражается
через многомерную плотность при помощи интеграла
1 on 1
где Gn — область я-мерного эвклидова пространства, определяе-
определяемая системой неравенств —оо^иг-^д;г-, г=1, п.
Дифференцируя обе части B.37а) по переменным хи..., хт,
получаем
ОО оо
хт)= J... j^i..-.б„(%•••» xn)rfxm+i ...dxn. B.42)
оо —ОО
Таким образом, по известной я-мерной плотности вероятности
всегда можно определить плотность вероятности любой группы
т случайных величин (l^m^n) путем интегрирования в беско-
бесконечных пределах по остальным п—т переменным.
Обратное, вообще говоря, неверно, т. е. по многомерным плот-
плотностям частей совокупности случайных величин нельзя найти
плотность вероятностей всей совокупности. Исключение из этого
общего правила составляет совокупность совместно независимых
случайных величин, для которой (см. B.38))
Щг.-Лп(х1>-> **)= Ila^te). B.43)
t=i
2.3.3. Числовые характеристики совокупности случайных вели-
величин. Наиболее общей числовой характеристикой совокупности п
случайных величин является следующий смешанный момент сов-
совместного распределения:
ОО ОО
Лш!,,...,!^ xn)dx1...dxn,
B.44)
где kj — любые положительные числа (включая и нуль), j=l,n.
28
При ki—1, kj=O, /=1,..., i—1, t+1,..., n из B.44) получаем
среднее значение случайной величины Ъ,с
dxi=ai.. B.45)
— oo
Смешанный центральный момент второго порядка случайных ве-
величин ?г и lj
(Х) - %•) Щ,.-. 1„ (*1> - • хп) dxl- dxn =
= ] ](xi-ah)(xj-al.)wiilj(xi, x^dxtdXj B.46)
— oo —oo
называется ковариацией случайных величин ^ и gj. При i=j ко-
вариация представляет дисперсию случайной величины ?*•
Безразмерное отношение
, lj)/%otJ9 B.47)
где о$ = \/Г\*>2Ь называется коэффициентом корреляции случайных
величин ?i и gj.
Можно доказать (используя неравенство Буняковского —
Шварца), что
l^e,!^1- B-48)
Если случайные величины ^ и gj независимы, то /?g.|j*=O.
Обратное утверждение о независимости ^ и gj при ^^.|7- =0 в
общем случае несправедливо. Две случайные величины, для ко-
которых коэффициент корреляции равен нулю, называются некор-
некоррелированными. Таким образом, независимые случайные величи-
величины всегда некоррелированы, но не наоборот.
Если ограничиться моментами порядка не выше второго, то
совокупность случайных величин ?ь ..., ?п можно характеризовать
вектором средних
«4= К--. ЧпУ B.49)
и ковариационной (корреляционной) матрицей [см. B.46)]
К* = (*,,) = a'R* а, B.50)
где R|—матрица коэффициентов корреляции, а — диагональная
матрица с элементами at. , i'=l, n, на главной диагонали.
Ковариационная матрица К| представляет симметричную, по-
положительно определенную матрицу размером пХп. Положитель-
29
ная определенность матрицы Ki означает, что для любых дейст-
действительных чисел Ль ..., Лп
п п
2 2Mj*ij>0 B.51а)
или в векторной форме
Л'К|^>0, B.516)
где вектор-строка V= (Ль..., Лп)'. Необходимое и достаточное ус-
условие положительной определенности матрицы К| записывается
в виде
detK|>0. B.51в)
2.3.4. Условные функции распределения. Рассмотрим совокуп-
совокупность ?ь ... , ?п зависимых случайных величин и используем пра-
правило умножения для определения вероятности пересечения собы-
событий |mi^xmi и %nm+i^gxti у где g n —малая окрестность
Xm+1 Xm+1
точки xnm+i:
P
откуда [см. B.41)]
P f &m
1 v
rm sl
G
m+1
Когда область gxn стягивается в точку xnw+b получаем функцию
m+l
F(xm\xn \— lim
(Xl I Xm+lj "~ шп
g
I
^т tel
5 , B.52)
J ()d?
которая называется условной функцией распределения случайно-
случайного вектора |ть при условии, что зависимый от него случайный
вектор ?nw+i=
30
Для совокупности двух случайных величин (п=2, т=\) по-
получаем из B.52)
F(х, |*,) = =
7
B.53)
Вычисляя смешанную производную от F(xmi|xnm+i) по хи...
Хт, получаем условную плотность вероятности
Для совокупности двух случайных величин из B.54) следует
""¦Ъ{ХУ*2) . B.55)
Формулу B.54) можно переписать в форме, аналогичной фор-
форме правила умножения для случайных событий:
х»), B.56)
а также
«—1
а;,„ (ху) = щх {хх) П w (xk+i|xf). B.57)
1 fe=i
Заметим, что этот аналог правила умножения для случайных
величин выражается через плотности вероятности, а не через функ-
функции распределения.
Из B.56) следуют аналоги формулы полной вероятности
и формулы Байеса
*т+\
-,m (
WVL
J >
n—m Sm-J-1
B.59)
31
Для совокупности двух случайных величин из B.58) из B.59)
получаем
, B.60)
w (x2\Xl) = , l>Ki> . B.61)
2.3.5. Условные; среднее значение и дисперсия. При помощи
условных плотностей вероятности можно определить и условные
числовые характеристики случайных величин.
Если имеется совокупность зависимых случайных величин
|ь..., |п, то условное среднее значение случайной величины ii
При ?П2 =
со
аЫх« = т1{№ = х2}= lx1w(x1\x)dxv B.62)
2 —-00
а условная дисперсия
]-\\*п )* w (*i|*S) ^i- B-63)
2.4. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ
2.4.1. Многомерная нормальная плотность вероятности. Важ-
Важнейшим для практических приложений является нормальное рас-
распределение совокупности случайных величин, которое определя-
определяется следующим выражением многомерной плотности вероятно-
вероятности этой совокупности:
щ (х) = * ехр { —L (х - ае)' Kf1 (х - Ч)}, B.64)
где K-1g — матрица, обратная матрице Kg.
Из B.64) следует, что нормальное распределение совокупно-
совокупности случайных величин полностью определяется вектором средних
значений а$ и ковариационной матрицей Kg.
Совокупность случайных величин, подчиняющуюся нормально-
нормальному закону распределения, называют гауссовской.
Матричному представлению B.64) многомерной нормальной
плотности вероятности соответствует следующее ее выражение
через скалярные величины:
ъ- ¦ *п) =
Bя)я D
g' Y^b B'65)
32
где ai=ml{li}, o2i=ii2{li}, D=detR, 4={Ritik) —матрица ко-
коэффициентов корреляции размером пХпу a Dih— алгебраическое
дополнение элемента R$tik в определителе D. Таким образом,
л-мерная нормальная плотность вероятности зависит от 2л пара-
параметров (аи Oi) и от п(п—1)/2 параметров R%. %k.
Можно доказать, что любая часть гауссовской совокупности
случайных величин также является гауссовской. Обратное ут-
утверждение, вообще говоря, неверно (см. пример в [1, с. 51]).
2.4.2. Гауссовская случайная величина. Из B.65) при га=1
находим нормальную плотность вероятности одной гауссовской
случайной величины
^ B.66)
которая определяется двумя параметрами: средним значением и
дисперсией а2.
Как видно из рис. 2.4, кривые плотности нормального распре-
распределения при различных значениях дисперсии унимодальны, т. е.
имеют один максимум в точке х—а. Кривая плотности в полосе
а±3а ограничивает 99,7% общей площади, т. е. с вероятностью
0,997 значения гауссовской случайной величины попадают в ин-
интервал (а—Зет, а+Зст).
Нетрудно показать, что точки перегиба, в которых кривая плот-
плотности имеет максимальную крутизну, определяются из равенства
х=а±о. При а-^оо кривая распределения сливается с осью абс-
абсцисс, а при сг-^О она переходит в дельта-функцию:
11ш
а_и) а у 2л
Функция распределения гауссовской случайной величины
x—a
о , г2 \
- \ exp \dz. B.67Y
i _i V 2 / v '
Интеграл
г. B.68)
называемый интегралом Лапласа, представляет функцию распре-
распределения нормированной стандартной гауссовской случайной вели-
величины при а=0, а=1. Имеются многочисленные таблицы интегра-
Ш Лапласа, т. е. функции стандартного нормального распределе-
распределения (см., например, [2]). Эти таблицы можно использовать для
2-87 33
определения значений F$(x) при произвольных значениях пара-
параметров а и а>0, если заметить, что из B.67) и B.68) следует
B.69)
Таблицы интеграла Лапласа составлены для положительных
аргументов, а значения !jF(—х) определяются из очевидного соот-
соотношения 1
F(x)+F(-x) = l. B.70)
Вблизи начала координат функция F(x) имеет участок, близ-
близкий к линейному, который хорошо описывается несколькими пер-
зыми члена/ми степенного ряда
У 2л \ б 40 336
* . B.70а)
k^Bk\){k\)\
При достаточно большом аргументе имеет место асимптотическое
разложение
Заметим, что если в знакопеременном ряде ограничиться нес-
несколькими членами, то ошибка будет меньше значения первого
отброшенного члена. Поэтому из B.706) следует
2
На рис. 2.5 для сравнения приведены функции нормального
распределения при тех же значениях ст, что и на рис. 2.4. Пре-
Предельная кривая при а->0 имеет вид единичного скачка в точке
х=а.
Часто вместо функции F(x) рассматривается и табулируется
так называемый интеграл вероятности (функция ошибок, функция
Крампа)
ф (*) = 2 ?ехр (- z2) dz = 2F (х ]/2) - 1 B.71а)
V ^ 0
и функция
?exp( f) dz = F(x)L = ±O(xlV2) B-716)
1 Заметим, что формула B.70) верна для любой случайной величины, если
ее плотность вероятности симметрична относительно нуля.
34
о
х-а
Рис. 2.4. Плотности нормального рас-
распределения при различных дисперсиях
Рис. 2.5. Функции нормального рас-
распределения при различных диспер-
дисперсиях
для которой B.70) переходит в более простое соотношение
F0(—x)=—F0(x). B.71b)
2.4.3. Совокупность независимых гауссовских случайных вели-
величин. Если gi, ..., ?п — совокупность независимых гауссовских слу-
случайных величин с параметрами
то из B.43) и B.66) следует, что совместная плотность вероятно-
вероятности этой совокупности случайных величин
ГД|«. и (Y Y \
Si»*"» in \ 1* "* ' п) —
BJ2)
Формула B.72) является частным случаем общей формулы
B.65) (при #^бл=6#), для которого Dik=&ik, бг^= 1 при i=k
tih=O при ьфк. Ковариационная матрица Kg и обратная ей мат-
матрица К1 в этом случае диагональные.
Сравнение формул B.65) и B.72) показывает, что из попар-
попарной некоррелированности гауссовских случайных величин следу-
следует их независимость. Это положение является важным исключе-
исключением общего утверждения о том, что из некорреллированности слу-
случайных величин не следует их независимость, и является харак-
характерной особенностью нормального распределения вероятностей.
2.4.4. Совокупность двух зависимых гауссовских случайных ве-
величин. Двумерная плотность двух зависимых гауссовских вели-
величин \х и 12 зависит от пяти параметров: аи a2i аь а2, Ri&t =гл
Детерминант
1 г
г 1
D:
= 1-г2,
а алгебраические дополнения Dn=D22=l, Z)i2=D2i=—г. Из
2* 35
B.65) при /г=2 находим двумерную плотность вероятности двух
гауссовских случайных величин (рис. 2.6)
-2r-
exp
1
4 — azJ 1 ]
2A-,
B.73)
Функция распределения двух гауссовских случайных величин
f
В частном случае при
Г
exp ^
2A-г»)
B.73a)
= h функция ijFg^, (^1,^2)
связана простым соотношением с табулированным интегралом
(см. Приложение 1 в [1])
Условная плотность гауссовской случайной величины ?2 при ус-
условии, что зависимая от нее гауссовская случайная величина gi =
= хи в соответствии с B.55), B.66) и B.73) равна
X
B.74)
Из B.74) следует, что условная плотность описывается функцией
Xz
п я
Г=0,93
0,87^
«Ал
-4
-2
О
Рис. 2.6. Двумерная плотность Рис. 2.7. Условные плотности нормального
нормального распределения распределения
36
нормальной плотности вероятности с параметрами: условное сред-
среднее значение
mi fe| x) =a2+r (Xi—a^ a2foi B.75a)
и условная дисперсия
\X2{h\xi}=o*2(l-r>). B.756)
При г=0, что соответствует независимости случайных величин
Si и |2, условная плотность B.74) переходит в плотность вероят-
вероятности случайной величины ?2- При г-»-1
^^ *'~fll V B-76)
л «л I
На рис. 2.7 согласно B.74) построены кривые условных плот-
плотностей нормального распределения при Х1=аг+3а\ и нескольких
значениях параметра г.
2.5. ОРТОГОНАЛЬНОЕ РАЗЛОЖЕНИЕ
ПЛОТНОСТЕЙ ВЕРОЯТНОСТИ
2.5.1. Разложение в ряд по ортогональным полиномам. В не-
некоторых случаях полезно аппроксимировать плотность вероятно-
вероятности случайной величины частичной суммой ряда, представляю-
представляющего разложение функции плотности по ортогональным функци-
функциям. В качестве весовой функции q>(#), которая определяет сово-
совокупность ортогональных функций {Qn(x)}t выбирают какую-ни-
какую-нибудь простую, известную плотность вероятности, которая прибли-
приближенно отражает основные свойства аппроксимируемой плотности.
Формально упомянутый ряд, представляющий произвольную плот-
плотность вероятности wi(x), можно записать следующим образом:
оо
Щ (х) = Ф (*) 2 ck Qk (*)• B.77)
Коэффициенты ch можно определить, умножив обе части B.77)
на функцию Qn(x) и проинтегрировав с использованием условия
ортогональности
1 Ш 1А^ v^k \"/ *КП х™) МЛг — ^kn* \ )
— 00
где
\> k=n> B79)
), кфп
— символ Кронекера.
При этом в сумме все члены, за исключением одного при k=
— п> равны нулю и, следовательно,
сп= ]wi(x)Qn(x)dx. B.80)
37
Если {Qn(x)} — совокупность ортогональных полиномов, та
Qn (x) = ? агх?. Тогда
сп=?агтг, B.81)
где тг—момент г-го порядка случайной величины g и, следова-
следовательно,
°° 2 &(*)<№, B.82)
конечно, при условии, что моменты тг случайной величины суще-
существуют.
Сходимость ряда B.82) необходимо установить в каждом кон-
конкретном случае. Однако существуют задачи, в которых сходи-
сходимость указанного ряда не имеет значения. Речь идет о построении
аппроксимации неизвестной функции распределения, если заданы
лишь несколько моментов этого распределения. Поэтому важно
быть уверенным, что первые слагаемые ряда B.82) дают доста-
достаточно хорошее приближение к te>g (х). Тогда вопросами сходимо-
сходимости можно и не интересоваться. Ряд B.82) может быть даже рас-
расходящимся, моменты более высокого порядка могут вовсе не су-
существовать, а аппроксимация несколькими первыми слагаемыми
может оказаться лучшей, чем в том случае, когда указанный ряд
сходится.
2.5.2. Разложение по полиномам Эрмита. Чтобы не усложнять
выражений, предположим, что w%(x) представляет плотность нор-
нормированной случайной величины с нулевым средним и единичной
дисперсией. Переход к распределению с произвольными средним
а и дисперсией а2 дает w\ (д^—^ ) / а.
Начнем с разложения в ряд по полиномам Эрмита:
-^у п = 0,1,2,... B.83)
В рассматриваемом случае ф(д:) = A/]/2я)ехр(—х2/2) — нор-
нормальная плотность вероятности. Учитывая условие нормировки
B.78), получаем в соответствии с B.77) (ряд Грама — Шарлье}
-7b#*(*)> B.84)
где
= -j=]wt (х) Hk (x) dx—^щ {Hh (I)} B.85)
причем Со=1, а вследствие принятой нормировки случайной ве-
38
личины I имеем Ci = c2=0. Используя определение полиномов
Эрмита, можно B.84) переписать в виде
где <p{h)(x)—k-я производная нормальной плотности распреде-
распределения. Первые несколько коэффициентов Ck в ряду B.86):
Уб! _
B.87)
Тогда первые три члена разложения B.86) представляются
следующим образом:
^М = Ф«-~-фC)И+^ФD)М+..., B.88)
где к и 7 — коэффициенты асимметрии и эксцесса распределения
случайной величины |.
Из B.88) нетрудно также описать аппроксимацию интеграль-
интегральной функции распределения:
Ft(x)=F{x)-±<pW{x) + ^tf*)W-,.,f B.89)
где F(x) — интеграл Лапласа.
2.5.3. Разложение по полиномам Лаггера. Разложим плот-
плотность вероятности случайной величины, принимающей положи-
положительные значения, в ряд по полиномам Лаггера
L{na) (х)={-\)п± х-ае* —
л1 dx!1
1, л:>0. B.90)
В этом случае <р(х) =хае~х/Г(а+1)у х^О, а>0 (гамма-распреде-
(гамма-распределение); учитывая условие нормировки B.78), получаем в соот-
соответствии с B.77)
где
x)L{ka){x)dx. 2 .91а)
39
Так как для неотрицательной случайной величины среднее
mi>0, то все ее значения можно нормировать путем деления на
Ши Тогда в B.91) при а = 0
с0 = Iwi (x)dx=l9 сх = J(l — х) wi (x)dx = О,
о о
2m?
-12m^
Следовательно, первые члены разложения B.91) представля-
представляются следующим образом:
6m\
2.5.4. Разложение по полиномам Чебышева. Разложим в ряд
плотность вероятности случайной величины, возможные значения
которой принадлежат интервалу (—1, 1), по полиномам Чебы-
Чебышева: ,
Тп (х) = cos (л arccos» =
л=0, 1, 2, ..., |*|<1. B.93)
В этом случае ф(лг) = [A—^2I/2я]э |^|<1. Учитывая условие
нормировки B.78), в соответствии с B.77) получаем
\ \ B.94)
где
с* «1/2 /wiWnWd*. B.94a)
Из B.94а) находим, например:
jD;t3 _ 3x) wi (x) dx = Dm3 - Зт^ ]/2.
Тогда первые члены разложения B.94) представляются следую-
следующим образом:
щ () -,/Лт
я |/1 — х*
+ 2 Dт8 - Зт,) D*3 - За:) +...]. B.95)
2.5.5. Разложение двумерной плотности вероятности. Рассмо-
Рассмотрим двумерную плотность вероятности совокупности двух слу-
случайных величин. Аналогично B.77) можно формально предста-
представить ojg^, (x\f х2) в виде ряда
1ш {*%> Х*) = Ф1 (*) Ф2 (*) 2 2 Cftr Qx* (*Х) Q2r (*2), B.96)
где Qik(xi) и Q2r(^2)—ортогональные нормированные полиномы,
соответствующие весовым функциям ф1 (a:i) и ф2(#г). Коэффици-
Коэффициенты ckr находим, умножая обе части B.96) на Qim(xi)Q2n(x2)
и дважды интегрируя по Х\ и х2 в области, определяемой весовы-
весовыми функциями, с использованием условий ортогональности. Тог-
Тогда в кратной сумме все члены, за исключением одного (k = m,
/•=я), обращаются в нуль и в результате
] ] xdx2 =
im
B.97)
Часто за весовую функцию целесообразно принять одномер-
одномерные плотности вероятности случайных величин, т. е. qpi (л:) =
vs:Wli (x)y 4>2(x) = wh (х)- Кроме того, во многих практических
случаях оказывается, что стп = 0 при тфп, и приведенные фор-
формулы значительно упрощаются. Вместо разложения в кратный
ряд получаем сумму вида
Щ* Ъ (*i> **) = Щг (*i) Щ* W S cn Qm (xi) Q2n М* B.98)
где
lt (xly x2) Qln (хг) Q2n (x2) dxx dx2. B.99)
Так как Qto(#i) = Q2o(*2) =^o= 1, то из B.98) видно, что пер-
первый член разложения соответствует предположению о независи-
независимости случайных величин, а последующие члены определяют по-
поправку, учитывающую вероятностную связь.
Если одномерные распределения случайных величин одинако-
одинаковы: wix (x) =w%t (x) =w(x)y то разложение B.98) можно пред-
представить в виде
Щг Ъ (*i. *а) = » Mw (x2) ? сп Qn (хг) Qn (x2), B.100)
л=0
41
где
<?»- J ]whi,(Xu x2)Qn(x1)Qn(x2)dx1dxi. B.101)
— OO —00
Здесь Qn(x)—ортогональные нормированные полиномы относи-
относительно весовой функции w(x).
Примером ортогонального разложения является следующее
представление двумерной плотности вероятности двух нормиро-
нормированных гауссовских» случайных величин с коэффициентом корре-
корреляции R:
n=s0 n\
B.102)
где Qn(x)=Hn(x)/Vnl — нормированные полиномом Эрмита и
cn = Rn.
2.6. ЗАДАЧИ
2.1. Доказать, что начальные моменты распределения Вейбулла
Fl(x) = l-exp{-Xxa), (la)
ш6 (*) = X ах0-1 ехр ( - X ха),
х>0, Я>0, а>0
вычисляются по формуле
Раюсмотреть частные случаи при а—\ (зкшойенедиалыюе распределение) и при
а=2, А,=|(,2а2)-1 (.рэлеееское раашределен'ие).
2.2. Доказать, что начальные моменты гамма-распределения
вычисляются iro формуле
тк = Х-ьТ(к+п)/Г(п), A36)
а бет а -р aian p едел ения
Xй- (\ — дЛ6
I, a>0, b>0 Da>
по формуле
__ T(a + k)T(a±b) _ B(a+k, b)
mh T(a)T(a + b+k) В (a, b) '
42
2.3. Показать, что для m-распределения (распределения Накагами)
т г2т~Х I тг* \ 1
wtv=2m <T{m) ехЧ--^-> г>°> т>т Eа)
начальные моменты
Г(т + */2)
Убедиться, что при т=1 'ра-спределение Eа) переходит в рэлеевское, а три
т=1/2 — в одностороннее нормальное.
2.4. Показать, что для одностороннего нормального распределения
ш6 (х) = 1/2/(яа») ехр [ - *»/Bа*)], а:>0 Fа)
среднее значение и дисперсия соответственно
т^аТ/г/л, ^2=A_^2/я)о2. F6)
Вывести общую формулу для начальных моментов
Г (^)/ Г A /2). Fв)
2.5. Показать, что для распределения Лапласа
^ T Gа)
имеют место формулы
G6)
Глава 3
ФУНКЦИИ СЛУЧАЙНЫХ ВЕЛИЧИН
3.1. РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ
ФУНКЦИЙ СЛУЧАЙНЫХ АРГУМЕНТОВ
3.1.1. Постановка задачи. Решение очень многих прак-
практических задач радиотехники, связи и управления сводится к оп-
определению по заданной плотности распределения случайных ве-
величин плотности распределения другой совокупности случайных
величин, получаемой из первой детерминированным функцио-
функциональным преобразованием.
Рассмотрим исходную совокупность случайных величин
%ni=(lu |2) •••> In)у для которой известна совместная плотность
вероятности w n (xni). Зададим закон преобразования этой сово-
совокупности системой детерминированных функций
УкЧк(хп1), k^TTfn. C.1)
43
При помощи этих функций из исходной совокупности случайных
величин %ni получают т случайных величин
4k=fk(lni), k = T~m. C.2)
Необходимо определить плотность вероятности W m (ymi) слу-
случайных величин t)wi= (tji, ..., r)w).
Заметим, прежде всего, что решение сформулированной зада-
задачи при тфп всегда получается из решения симметричной зада-
задачи при т = п. Если pi<Znt то совокупность C.2) дополняется слу-
случайными величинами tjj = 5j, / = m+l, .,., п\ решается задача при
равном числе исходных и преобразованных случайных величин, а
искомая плотность W m (y'*i) находится интегрированием
W п (yni) по переменным ут+\, •••> Уп- Если т>п, то случайные
величины Tjn+i, Цп+2, ..., Цт связаны функциональными зависи-
зависимостями с T)ni, т, е. r\j=Q>j)(i\ni), j=n+t, ..., /п. Тогда искомая
плотность
1
т—п
у-) = W- (у«);. П б [у** - Фй (у«) ]. C.3>
l k\
;
3.1.2. Монотонное преобразование одной случайной величины.
Рассмотрим сначала простейшую задачу, сформулированную в
п. 3.1.1. Задана плотность вероятности ojg (x) случайной величи-
величины | и необходимо определить плотность вероятности Wx\(y) слу-
случайной величины г] =/(?). Предположим, что функция f(x) диф-
дифференцируема и преобразование y = f(x) монотонное, т. е. сущест-
существует единственная обратная функция х^у(у).
Если dy/dxX), и следовательно, dy(y)\fdy>0, то события
Z 5() эквивалентны. Поэтому
откуда следует
у <р (у)
$W*(y)dy= J Wl(x)dx.
Дифференцируя обе части последнего равенства по у, полу-
получаем
^ C.4а)
Аналогично при dy/dx<.0, т. е. при d<p(y)/dy<0, из эквивалент-
эквивалентности событий г]^г/ и |>* = ф(#) следует Ft, (г/) = 1—Fg [cp(y)] и
[C-4б)
Объединяя равенства C.4а и б), получаем
dMy)_\ C.5)
44
Рис. 3.1. Преобра-
Преобразование плотности
вероятности при
монотонном преоб-
преобразовании случай-
йой величины
I
а: х+Дх
Полезно привести наглядную геометрическую интерпретацию
вывода формулы C.5) (рис. 3.1). Так как преобразование y = f(x)
монотонное, то события A :x<.i^x+Ax и В : у<.ч\^у+Ау эк-
эквивалентны. Вероятность события А равна площади SXy а вероят-
вероятность события В — площади Sy. При достаточно малых Ах и Ау
Sxttwi (х)Ах, SV«UP4 (у)Ауу Sx=Sy. Переходя к пределу при
, Ду->0, получаем
ay
Но при ' <0 правая часть последнего равенства становится
dy
отрицательной, что невозможно, поскольку функция плотности по-
положительна. Поэтому для общего случая ^ 0 следует брать
dy
модуль производной, как в формуле C.5). Появление модуля про-
производной при указанном выводе формулы C.5) не будет казать-
казаться «подгонкой», если придать интервалам Ах и Ау знак (напра-
(направление). В дальнейшем при обобщении формулы C.5) будет ис-
использован геометрический подход.
Заметим также, что совместная плотность вероятности слу-
случайных величин I и r]=/(g) [см. C.3)]
(*. У) = Щ М 'w (У\х) - Щ (*)s [У ~ f (x)h
откуда следует
Используя фильтрующее свойство дельта-функции, приходим к
формуле C.5).
3.1.3. Линейное преобразование случайной величины. При ли-
линейном преобразовании у = ах-\-Ь обратное преобразование
* = Ч>(У) = (У—ь)/а> dq>(y)/dy= 1/а,
и в соответствии с C.5)
Из C.6) следует, что при линейном преобразовании плотность
вероятности исходной случайной величины смещается на значе-
45
ние b (вправо или влево в зависимости от знака Ь) сжимается
или растягивается вдоль оси х в а раз (возможно, с зеркальным
отображением относительно оси ординат, если а<0) и сжимает-
сжимается или растягивается вдоль оси у в \а\ раз.
Например, при линейном преобразовании стандартной гаус^
совской случайной величины (а% =0, a2g=l) получаем гауссой-
скую случайную величину, плотность вероятности которой Со-
Согласно C.6) (рис. 3.2)
1 I 1 /.. il\9. I /q \
причем ац =Ь, а2л =а2.
3.1.4. Немонотонное преобразование одной случайной величи-
величины. Предположим теперь, что преобразование y = f(x) немоно-
немонотонное. В этом случае данному значению у соответствует не-
несколько (возможно, счетное число, если f(x)—периодическая)
значений аргумента х, т. е. обратная функция имеет несколько
ветвей. Обозначим их через Хк = щ(у), &=1, 2, .... Тогда событие
В : у<Сц^у-\-\у эквивалентно объединению несовместимых со-
событий Ak : xk<.l^:xk-\-AXk, fe=l, 2, ... и, следовательно,
Р{?} = %P{Ah}. C.8а)
к
При достаточно малых Ах^ Ау
Р {Аъ} & Щ (xk) Axk, Р {В} « Wq (у) А У- C.86)
Подставляя C.86) в C.8а) и переходя к пределу при
Ду->-0, получаем с учетом замечания о модуле производной
dq>k (У)
C.9)
3.1.5. Квадратичное преобразование случайной величины.
При квадратичном преобразовании У = *2 каждому^ значению
у>0 соответствуют два значения X\=Yy и х2 = — YУ- Тогда в
C.9) сумма содержит два слагаемых. Так как dxi/dy =
\dx2/dy\ = lfBYУ), то получаем следующее выражение плотно-
плотности вероятности квадрата случайной величины г] = ^2:
У>0.
C.10)
¦^(у)
x
OJb
Рис. 3.2. Линейное преобразование гауссовской случайной величины
46
Во всем дальнейшем изложении для краткости не записывает-
записывается область нулевых значений плотности вероятности (как это
.сделано в (ЗЛО) при у<.0). Поэтому если приводится функция
клотности распределения с указанием ограничений ее аргумен-
аргумента, то это означает, что в области, где ограничения не выполня-
выполняются, эта функция тождественно равна нулю.
Из (ЗЛО) следует, например, что плотность вероятности ква-
квадрата гауссовской случайной величины с параметрами (а, о2)
При а = 0, сг2=1, т. е. для плотности вероятности квадрата
стандартной гауссовской величины из C.11) находим (рис. 3.3)
= —Д=-ехр( у—
у>о.
C.12)
Рис. 3.3. иллюстрирует тот факт, что при нелинейном преоб-
преобразовании случайной величины кривая плотности вероятности
подвергается существенной деформации, которую заранее, вооб-
вообще говоря, даже трудно предвидеть.
ЗЛ.6. Специальный случай. В приложениях встречается функ-
функциональное преобразование следующего вида:
= y=\ О,
При этом обратная функция x = q(y) вообще не существует, так
как континууму значений х на интервале (хи х2) соответствует
одно значение у = 0. Однако, вводя дельта-функцию, можно рас-
распространить формулы преобразования плотности вероятности и
на указанное преобразование. Пусть функция f\(x)—монотонно
убывающая, а Ь(#)—монотонно возрастающая. Тогда (рис. 3.4)
У} =
(x)dx +
где хAЦу) и xW(y) —функции, обратные f\(x) и /г(^), а и (у) —
Ох 0x0 у
Рис. 3.3, Квадратичное преобразование гауссовской случайной величины
47
функция единичного скачка [см. B.7)]. Плотность вероятности
случайной величины г] = /(?)
M</) = -
Р {0
<&<2) (У)
dy
dx{1> (у)
dy
, у>о.
C43)
Для линейных функций fi(x)=xi—х, f2(x)=x—х2 формула
C.13) преобразуется к виду
C.13а)
Рассмотрим также преобразование следующего вида:
-хйУ\ *>*о. v>0,
10, х<х0.
-й
Для определения плотности вероятности случайной величины
<n = f(t\ r.n^TTvPT воспользоваться формулой C.13) при /i(x)=0.
V—1 _ v/7(v~0/V I! "> О
рд
) = f(g) следует
Так как ^
то
.C.136)
В частном случае линейно-ломаного преобразования (v=l)
центрированной гауссовской случайной величины
] у>0,{ЗЛЗв)
где ^(л:) —функция Лапласа [см. B.68)].
3.1.7. Среднее значение функции случайной величины. Пусть
известна плотность распределения w (x) случайной величины |
и требуется найти среднее значение r) = f(?>). Конечно, для реше-
решения такой задачи можно по формуле C.9) предварительно най-
найти плотность вероятности №\(у), а затем определить т\{ц}. Но
среднее значение гп\{ц} можно определить, минуя промежуточ-
X) О
(у)
Рис. ЗА. Специальный случай преоб-
разования случайной величины
48
ный этап вычисления W^ (у), используя только исходные данные:
плотность w ъ(х) и закон преобразования y = f(x).
Разобьем область возможных значений случайной величины
г] на непересекающиеся интервалы Ду*. t=l, 2, ... и запишем ис-
искомое среднее как предел интегральной суммы
3 оо
Событие г]еАг/г эквивалентно объединению несовместимых собы-
событий l^AXiky k=l, 2, ..., число которых равно количеству ветвей
обратной функции х-=ц)(у). Тогда, используя правило сложения,
из эквивалентности событий получаем
Ptf леду,} = 2 Р {Еед *,*} = Ja^ (x) dx,
где область интегрирования ^ представляет сумму малых ин-
интервалов, содержащих все значения обратной функции ф(*/*)• Так
как l<=gj, то f(x) =yt и tfiP{r\&Ayi}№ J f(x)wi(x)dx.
Si
После суммирования по i ,и перехода к пределу получим
] C.14)
при условии, что интеграл C.14) сходится (абсолютно). При
— оо
т. е. &-й момент распределения можно трактовать как среднее
значение случайной величины k-й степени. Аналогично
\ik{l} = mk{l—mi} = mi{(l—mi)k}. C.146)
Обобщая формулу C.14), запишем для среднего значения
функции векторной случайной величины
772 (f /?> __ г ? /х\ до» /х\ jx /g jg\
хп
п
Если f(x)= П xk и | представляет совокупность независи-
независимых случайных величин, то из C.15) следует
*Ч ( П 1н} = П i ^ о%Л Ufc) <*** = П^i Aл)- C.15а)
Среднее значение произведения независимых случайных величин
равно произведению средних значений сомножителей.
3.1.8. Среднее значение линейной комбинации случайных ве-
величин. Рассмотрим линейное преобразование совокупности слу-
49
чайных величин *'= (?ь ..., |n)' с известной я-мерной плотностью
вероятности
4=2 с* ?* = <='6. C.16)
где c'=(ci, ..., сп)' — вектор-строка произвольных констант.
Согласно общей формуле C.15)
т1 {г\} = т1 {с' \\ = J с' х щ (х) dx = с' а% = 2 cft %. C.17)
хЛ *=i
Из C.17) следует, что среднее значение линейной комбинации
произвольно зависимых случайных величин равно линейной ком-
комбинации средних значений этих случайных величин. В векторной
терминологии это свойство среднего при линейном преобразова-
преобразовании C.16) можно сформулировать так: при усреднении скаляр-
скалярного произведения постоянного и случайного векторов постоянный
вектор можно выносить за знак среднего. В частности, скаляр-
скалярный множитель можно выносить за знак среднего mi{cg} =
= сгп\{^}. Далее, при Ск~±\ из C.17) следует, что среднее от
алгебраической суммы случайных величин равно алгебраической
сумме средних от слагаемых.
3.1.9. Линейное преобразование совокупности случайных ве-
величин. Рассмотрим линейное преобразование случайных величин
1= Aь •••> In)
4i= ?*«&-**)¦ i=U~~n C.18)
или
4 = C(S-a), C.18a)
где ч=(тI, ..., Цп)\ а=(аь ... ап), aj = mi{lj}n С = (сц) — симмет-
симметричная квадратная матрица произвольных констант. Из C.18) с
учетом C.17) следует, что mi{r\i}=Ot i=l, п. Ковариационная
матрица случайных величин х\и •••> Цп Кл= (Kij)> где
Ktj = щ {т|| лЛ = Щ \ 2 2 сп (^ - аг) {lk - ah) с Л.
Вынося, в соответствии с C.17), знаки суммирования и констан-
константы за знак среднего, получаем
C.19)
где С7 — транспонированная матрица, которая совпадает с С,
поскольку матрица С симметричная.
3.1.10. Декорреляция совокупности случайных величин. Как
известно из теории матриц [3], для любой симметричной поло-
положительно определенной матрицы К % всегда можно найти такую
ортогональную матрицу С, что произведение СК| С7 — диагональ-
50
ная матрица. Вектор-строками такой ортогональной матрицы яв-
являются ортонормированные собственные векторы ср*, i=l, n мат-
матрицы К| , а элементами диагональной матрицы — обратные ве-
величины 1Дг положительных собственных значений Л,*, i=l, я
матрицы Ki . Собственные векторы и собственные значения мат-
матрицы К| удовлетворяют уравнению
ЯК6Ф = ф. C.20)
Линейное преобразование C.18а), где С — ортогональная матри-
матрица, называется ортогональным. Таким образом, ортогональным
преобразованием из произвольной совокупности \ коррелирован-
коррелированных случайных величин получаем совокупность х\ центрирован-
центрированных некоррелированных случайных величин, причем К-п — диаго-
диагональная ковариационная матрица. Обратное преобразование
^ = а+С~1т] представляет ортогональное разложение элементов со-
совокупности коррелированных случайных величин на некоррели-
некоррелированные составляющие.
Если \ — совокупность зависимых гауссовских случайных ве-
величин, то ортогональным преобразованием получаем совокуп-
совокупность ц независимых гауссовских случайных величин, а обрат-
обратное преобразование дает разложение гауссовских случайных ве-
величин на независимые составляющие.
3.1.11. Дисперсия линейной комбинации случайных величин.
Из C.18), опуская индекс ?, получаем
^2 (Л) = Щ {л2} = mi { Г 2 СЛЬ - a,)] J =
n n n n
С 2ciSi-<
т. e.
И'г(л) = 2 2 cickKik= 2 ^ichci°kaiRlh iz> C.21)
где а^= (fjt2{Sfe}I/2- Так как Rik%k =1, то C.21) можно перепи-
переписать в виде
S eg |x.{Efc> +22 cftc,afca,/?6ft 6|. C.21a)
ft=i fe>/
Если |fe и |/, &=t^=/. некоррелированы, то
14 B^4 = 2 Зи, {&»}. C-22)
В частности, скалярный множитель можно выносить за знак дис-
дисперсии, если его возвести в квадрат; [хг {^Sfe} = ^2[X2 {Efe}. Далее
при Cfc+l из C.22) следует, что дисперсия алгебраической сум-
суммы попарно некоррелированных случайных величин равна сумме
дисперсий слагаемых.
51
3.1.12. Преобразование многомерной плотности вероятности
при функциональных преобразованиях произвольной совокупнос-
совокупности случайных величин. Вернемся теперь к общей постановке за-
задачи, указанной в п. 3.1.1. Задана многомерная плотность
w n (xni) совокупности случайных величин |i, ..., gn и необходи-
необходимо определить многомерную плотность W m (ymi) случайных ве-
величин тI, ..., х\т- Как отмечалось, решение этой задачи получа-
получается из предварительного решения при т = я.
Рассмотрим общий случай, когда преобразование, обратное
преобразованию
yh = h(xni), k = TTKy C.23)
неоднозначное. Обозначим i-ю ветвь обратного преобразования
#fei = (pfei(yni), k=l, ny i=l, 2, ... Следуя использованному в п.3.1.4
геометрическому подходу, введем событие 5, состоящее в том, что
точка T]ni в я-мериом эвклидовом пространстве принадлежит неко-
некоторой области Sy , и событие Аи состоящее в том, что точка
§ni€=Sx. , /=1, 2, ... (рис. 3.5). Так как В = []Аг и Ai[]Aj = 0i [ф\
то
р {В} = Vy = 2 Ух. = 2 р iAi] C.24а)
i l i
и при достаточно малых «объемах»1 областей Sx., Sy
У v ^^ W п. I Vi i Ovi У v // UUc.n I A» I их . \*J.jujl\Ji
Ч V * / * i К" l l j i * '
1 1
Как известно, предел отношения 5Х/ и 5У при переходе от коор-
координат Х{=(хи, ..., Xni) к координатам у=(Уи -,Уп), когда
Sxt ->0, 5у~>0, равен якобиану преобразования
t...t Xni)
°х.^и ^у д(У\>...» ^п)
5у->0
=l, 2,...
^1 "" РУп
C.25)
Тогда из C.24а), C.246) и C.25) с учетом свойства неотри-
неотрицательности плотности вероятности получим
ф,г(уП1) = [ф1г(уП1), ..., <Pnt(ynl)].
Если преобразование взаимно однозначное, то сумма в C.26)
содержит только один член.
1 Область S и ее «объем» S обозначим одним и тем же символом.
52
хп
Рис. 3.5. Преобразование многомерной плотности распределения
3.1.13. Плотность вероятности скалярной функции векторной
случайной величины. Рассмотрим частный случай общего преоб-
преобразования C.1), когда т=1, т. е.
Уг^Нхи -, *п). C.27)
В соответствии с общим методом определения одномерной плот-
плотности вероятности t)i = /(|i, ..., gn) по заданной многомерной плот-
плотности w n (xni) необходимо сначала найти многомерную плот-
плотность совокупности случайных величин
i\i = f(lu • •> In), r\h = lh, k = 2, n.
Если функция, обратная /, однозначна, то
C.28)
•••> Уп)у Xk = yh, k = 2, п. C.28а)
Как нетрудно убедиться, якобиан преобразования C.28а) [см.
C.25)]
и из C.26) находим
У*]
C.286)
C.29)
Интегрируя по переменным у2, ..., ,(/п, получаем искомую одно-
одномерную плотность скалярной функции векторной случайной вели-
величины
dy".
C.30)-
3.1.14. Плотность вероятности линейной комбинации случай-
случайных величин. Рассмотрим линейное преобразование совокупнос-
совокупности случайных величин 1=(|ь ..., In) с известной я-мерной плот-
плотностью w% (x). В этом случае закон преобразования C.28) запи-
записывается в виде
Ук
= 2, П,
C.31)
а обратное преобразование C.28а)
%i = Ух - 2 cj yj, xk = yhf k = 2, п. C.31а)
Без ограничения общности полагаем Ci = l. Так как
то якобиан преобразования /=1[см. C.286)].
В соответствии с C.30) находим плотность вероятности ли-
п
еейной комбинации ri== 2>ck%k случайных величин gi, ..., ?п
k=\
^ ZcjyJt y29..., yn)dy2...dyn. C.32)
y /-2 /
Если случайные величины gi, ..., gn независимы, то из C.32) сле-
следует
^л (i/i) = J о%, (f/i -1 2 ^ f/i) о%, (t/2)... о% (yn) dy2... dyn.
Y(n-1) \ /=2 7
В простейшем случае алгебраической суммы двух случайных
величин T) = gi±(g2 из C.32) получим
^л {У) = ?а%4 s. (У =F ^ «) d«?. C.33)
— оо
Если gi и ig2 независимы, то
^Kl^W'i". C.33а)
Интеграл в правой части C.33а) называется сверткой функции
Щх (х) и ^б!^)- ^3 C.33а) нетрудно определить функцию рас-
распределения алгебраической суммы двух независимых случайных
величин
М</)= ]Fll{y±u)wlMdu. C.336)
— оо
3.1.15. Плотность вероятности произведения и частного слу-
случайных величин. Пусть fni=(gi, ..., gn) —совокупность случайных
величин и w n(xni)—плотность совместного распределения- этой
совокупности. Найдем плотность вероятности случайной вели-
величины
!=Ш*. C.34)
54
Совершим над исходной совокупностью функциональное преоб-
преобразование
Уг = / (*i *п) = П х» Ук=*л> k = 27^ C.35а>
/
%я»(»1г.м Уп) = Уг Ш/> xh = yh, k = 2, п.
I /=2
В соответствии с C.286) якобиан преобразования
¦ C.356)
W-2
Используя C.30), находим искомую плотность вероятности
-dyn. C.36)
Если случайные величины gi, ..., ^п независимы, то из C.36)
следует
^л (Уг) = I о%, (^) Щ> Ш - о%Л Ы И dy2... dyn. C.36a)
В простейшем случае произведения двух случайных величин
ЪЪ из C.36) получим
,и^ц/|||Ь C.37)
а если ?i и |г независимы, то
. C.37а)
Аналогично д^я частного r] = gi/?2 имеем
^Ч(У)= К,ь(«У. u)\u\du C.38)
— оо
и для независимых gi и |г
^ C.38а)
3.2. РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ
МОДУЛЯ И ФАЗЫ СЛУЧАЙНОГО ВЕКТОРА
3.2.1. Плотность вероятности модуля и фазы случайного век-
вектора на плоскости. Рассмотрим специальный вид преобразования
двух случайных величин, представляющих значительный интерес
для приложений,
C,39)
55
Это преобразование взаимно однозначное, причем р>0, а
возможные значения случайной величины ср заключены в преде-
пределах от 0 до 2я (имеется в виду главное значение арктангенса).
Геометрически преобразование C.39) означает переход от слу-
случайных декартовых координат (g, rj) точки к ее случайным по-
полярным координатам: модулю р и фазе ф случайного вектора, на-
начало которого находится в начале координат, а конец совпада-
совпадает с точкой (|, ц). Преобразование, обратное C.39), имеет вид
| —pcoscp, r] = psin(p. C.40)
Пусть задана двумерная функция распределения случайных
декартовых координат w^ (x, у) и надо найти совместную функ-
функцию распределения полярных координат Wp<p(r, ft). Так как яко-
якобиан преобразования x = rcosft, y = rsinft от переменных х, у к
переменным г, ft равен
д(х, у) __
д(г, О)
cos ft — г sin ft
sin ft г cos О
то, используя C.26) для взаимно однозначного преобразования
двух случайных величин, получаем
№рф(г, fy^rwfr(гcos*, rsinft), r>0, 0<*<2я. C.41)
Если I и г] независимы, то
^рф(г> Ф) = raj (г cos О) ш„ (г sin О), г>0, 0<*<2я. C.41а)
Из C.41) 'находим плотность вероятности модуля и фазы
-случайного вектора
2Я
Wpi(r) = г J шв,, (г cos ft, r sin #) d ft, г > 0, C.42)
Ц7Ф (ft) = Jго^л (г cos ft, r sin ft) dr, 0 < ft < 2я. C.43)
0
3.2.2. Плотность совместного распределения полярных коор-
координат случайных точек на плоскости. Формулу C.41) можно
обобщить на п случайных точек, декартовы координаты .которых
зависимы и характеризуются 2/1-мерной плотностью распреде-
распределения wi^ (xu уь х2, #2, ..., Хп, Уп). Переход к модулям и фазам
векторов совершается с помощью преобразования
t=l, n. C.44)
Якобиан преобразования C.44), как нетрудно показать, равен
•д(х19 ylt..., хп, уп) =
Тогда в соответствии с C.26) переход от 2/г-мерной плотности
распределения случайных декартовых координат п точек к 2/г-
56
мерной плотности распределения модулей и фаз векторов опи-
описывается формулой
гг cos Glf гг sin \..-., rn cos #п, гп sin Фп),
/=Т7~^ C.46)
Интегрируя C.46) по переменным г* или Ф*, получают я-мер-
ные плотности распределения модулей или фаз случайных векто-
векторов:
2Я 2Я
гх cos «lt..., rn sin *n) ddx.-.-. d ftn,
rf>0, /=1, я, C.47)
J.
<2я, i = T7rT. C.48)
3.2.3. Распределение модуля вектора с независимыми гаус-
совскими компонентами. С помощью полученных формул най-
найдем плотность вероятности модуля случайного вектора, компо-
компоненты которого независимы и распределены нормально с пара-
параметрами (а, а) и F, а) соответственно.
Из C.41а) следует, что плотность совместного распределения
модуля и фазы вектора в -рассматриваемом случае
^
Тогда в соответствии с C.42) после элементарных преобразова-
преобразований получаем
г>0,
где fto = arctg (b/a) — фаза вектора средних значений.
Заменяя ц=>&—ftp и обозначая модуль вектора средних зна-
значений а=уга2 + 62, приводим интеграл к функции Бесселя нуле-
нулевого порядка от мнимого аргумента
57"
Таким образом, плотность вероятности модуля ©ектора
), г>0 C.50)
Частным случаем C.50) при а=6 = 0 является плотность распре-
распределения Рэлея ;
г>0. C.51)
Поэтому функция C.50) (рис. 3.6) может называться .плотностью
обобщенного распределения Рэлея К
Если а|/а< 1, то, ограничиваясь первыми двумя членами раз-
разложения функции Беоселя в степенной ряд, получаем из C.50)
C'52)
Если а/а>1, то в C.50) функцию Бесселя можно заменить
ее асимптотическим разложением
и тогда
- C'52а)
В этом .случае кривая плотности вблизи моды хорошо аппрок-
аппроксимируется кривой плотности нормального распределения (см. 5
на рис. 3.6) с лараметрами (а, а).
01224*5676 г/
Рис. 3.6. Плотность обобщенного распределения Рэлея
1 Ее называют также плотностью распределения Рэлея —Раиса.
58
Функция распределения модуля вектора с независимыми га-
гауссовскими компонентами (с одинаковыми дисперсиями а2)
—W г>0 C.53)
в элементарных функциях не выражается. Имеются подробные
таблицы этой функции распределения [4].
3.2.4. Моменты случайной величины, распределенной по обоб-
обобщенному закону Рэлея. Из C.50) находим
C.54)
где iFi — гипергеометрическая функция (см. Приложение 5 в
Среднее значение, второй и третий начальные моменты равны
Г C/2) ^ (- 1/2, 1, - аз/Bо2)) =
C.54а)
C.546)
Если а^>а, то, используя приведенное выше аспимптотическое
разложение бесселевой функции, находим
C.55а)
C.556)
3.2.5. Плотность вероятности фазы вектора с независимыми
гауссовскими компонентами. Определим плотность вероятности
фазы вектора с независимыми гауссовскими компонентами. В
соответствии с общей формулой C.43) плотность вероятности
фазы в рассматриваемом случае [см. также C.49)]
C.56>
59»
wJ-fr)
Рис. 3.7. Плотность распределения фазы
Путем дополнения экспоненты в подынте-
подынтегральной функции до полного квадрата и
замены переменной интегрирования
z=([r—a cos (ft—fto)]/а,
где а и fto — величины, введенные в п. 3.2.3,
и использования обозначения интеграла Ла-
Лапласа [см. B.68)], находим плотность веро-
вероятности фазы
'^cosfft-ft^x
C.57)
На рис. 3.7 построено семейство кривых распределения фазы
ври нескольких значениях отношения а/а. Как видно из C.57) и
из рис. 3.7, функция W<p (ft—fto) четная. При а = 0, Ф0 = 0
C.57а)
что соответствует равномерному распределению фазы.
Если а/а<С1, то, разлагая правую часть в C.57) в степенной
ряд по ojJg и пренебрегая членами второго порядка малости, по-
получаем
(ft-ft0), |ft-fto|<jr. C.58)
2я
—_
2оТ/2я
Таким образом, с точностью до малых «порядка а2/а2 плотность
распределения фазы вектора представляет собой косинусоиду,
смещенную вдоль оои ординат на 1/Bл).
Если (a/a)oos(ft—fto)>3, то из C.57) находим
Вблизи моды кривой плотности
C.59)
C.60)
т. е. распределение фазы нормальное со средним fto и диспер-
дисперсией (а/аJ.
Функция распределения /> (*) фазы вектора, компоненты ко-
которого — независимые гауосовские случайные величины с одина-
одинаковыми дисперсиями, выражается через табулированную функ-
функцию Никольсона (см. Приложение 9 в [5]).
60
3.2.6. Центральные моменты распределения фазы. Определим
центральные .моменты фазы
I** (Ф) = *?*<* - #0)* ^ф (*)d®- C-61)
Яоно, что в силу симметрии распределения все моменты нечетно-
нечетного .порядка равны нулю.
Для вычисления интеграла в правой части C.61) разложим
функцию №ф (Ф) [см. C.66)] на интервале (Фо—я, Фо+я) в ряд
Фурье. Для этого достаточно воспользоваться известным из тео-
теории бесселевых функций равенством
ехр (A, cos х) = 10 (Я) + 2 2° Im M cos m*
для разложения на указанном интервале подынтегральной функ-
функции в C.56) и интегральным представлением гипергеометричес-
гипергеометрической функции. В результате
W* (*> = ~t I,а» cos ft (* - *o).
где
ir"+yrt(f^) C-63)
где iF\ (x, yf z) — гипергеометрическая функция.
Подставляя C.62) в C.61), получаем
li2r= -^- + 2 ап ] x2r cos nxdx. C.64)
Дисперсия фазы
щ = -^- + 4я2 (-1)"^. C,65)
Если а/а<СA, то jj,2^ft2/3—4яа1=я2|/3—"|/л2яа/а, а при а/а>1,
как уже указывалось, jj,2~o2A*2.
3.3. ХАРАКТЕРИСТИЧЕСКАЯ ФУНКЦИЯ
3.3.1. Определение характеристической функции. Характерис-
Характеристической функцией &i (v) случайной величины 5 называется
среднее значение случайной величины ехр(ш?), гДе у — действи-
действительная переменная. В соответствии с C.14) характеристическая
функция случайной величины ?
00
р) =ш1{ ехр (i v I)} § Wi {х) ехр (i и х) dx =
= J ^(д:) cos vxdx + i J ^(x) sin m;d#. C.66)
во оо
61
Воспользовавшись представлением B.17) плотности вероят-
вероятности wi (х) в виде суммы дельта-функций, можно распростра-
распространить формулу C.66) на дискретные случайные величины
вб(«0= 2 рк exp (ivxh). C.66a)
Интеграл C.66) и соответственно сумма C.66а) сходятся при
любых действительных значениях переменной vt так как
|®? (у)|^1- Поэтому характеристическая функция определена
для каждой случайной величины.
Заметим, что для симметричного распределения, когда wg (я) =
= a;g (—х)9 мнимая часть в C.66) равна нулю, и, следовательно,
характеристическая функция является действительной четной
функцией 6&(и)=вб(—с). Наоборот, если характеристическая
функция .принимает только действительные значения, то она чет-
четна и соответствующее ей распределение симметрично.
Из C.66) следует, что характеристическая функция ®i(v) и
плотность вероятности w% (x) являются парой преобразований
Фурье. Поэтому плотность вероятности случайной величины мож-
можно ?найти обратным преобразованием Фурье ее характеристичес-
характеристической функции
щ (х)= —166 (v) ехр (- ivx) do. C.67)
Если ©g (v) — характеристическая функция случайной вели-
величины g, то для случайной величины г], получаемой линейным пре-
преобразованием ц = а1 + Ь, характеристическая функция
0^ (V) = mL {exp [W (а\ + Ь)]} = Э^ (av) exp (ivb). C.68)
3.3.2. Вычисление моментов и кумулянтов распределения. Од-
Одним из полезных применений характеристической функции явля-
является упрощение вычислений моментов распределения. Если суще-
существуют k-и начальный момент распределения случайной величи-
величины g, то характеристическая функция этой величины имеет про-
производную &-го порядка, .причем
=i*f х*щ(х) exp (ivx)dx,
dvk
откуда следует
C.69)
dvk
v=Q.
Из C.69) при k=l находим среднее значение случайной ве-
величины |
т1{1}= -i6fe@). C.69а)
62
Если существуют моменты любого порядка, то, как следует
из C.69), характеристическую функцию можно представить ря-
рядом Маклорена
e6(i>) = 1 + ? -^Mfo)*. C-7°)
Центральные моменты распределения связаны простыми соот-
соотношениями с производными от логарифма характеристической
функции i|)g (v)=\n@i(v)y называемого кумулянтной функцией.
Разлагая кумулянтную функцию в ряд Маклорена (в предпо-
предположении, что этот ряд сходится), получаем
оо
где
dk ,_ ъ /-л C.71а)
dv и=о.
Коэффициенты nh ряда C.71), называемые кумулянтами или се-
семиинвариантами распределения, выражаются через центральные
МОМеНТЫ Xi = mi, X2=|X2, Хз = Aз, Х4='(Х4 3|Х32, ... (СМ. [6]).
Из C.71) следует
дкк k
Используя C.67), получим [31]
v) exp (-ivx)dv = ±^ д\{х) . C.72)
k\ dxk V '
(i^et(v) exp (vx)dv
Следствием формулы C.72) является соотношение
-?- "г {f (I)} = l-=? k ] f (x) *?&W dx, C.73)
^ ^ oo dx
из которого интегрированием по частям находим
и далее
—Чг- mi if ©} = ~Т j / (*)wt Wx> C-736)
где
3.3.3. Характеристическая функция гауссовской случайной ве-
величины. В соответствии с C.66) характеристическая функция
63
случайной величины, распределенной нормально с параметрами
(а, а)
F=- ? «р
2q3
Заменяя z=—iav+(x—a)/of показатель экспоненты в подын-
подынтегральной функции приводим к полному квадрату. После ин-
интегрирования приходим к следующему выражению характеристи-
характеристической функции гауссоовской случайной величины:
©g (у) = exp (i av — о2у2/2). C.74)
Кумулянтная функция гауссовской случайной величины
<ф6 (p) = [av - oV/2. C.74a)
Таким образом, для нормального распределения [см. C.71а)]
>ci = cz, X2==cr2, x/i = 0, й^З. C.75)
Найдем общее выражение для центральных моментов нормаль-
нормального распределения, используя C.69) и учитывая, что централь-
центральные моменты совпадают с начальными при нулевом среднем зна-
значении (а = 0):
C.76)
3.3.4. Многомерная характеристическая функция. Характерис-
Характеристической функцией G& (v) совокупности случайных величин | =
= (h> —» ?п) называется среднее значение случайной величины
п
exp{i S ^gfe}, причем компоненты вектора v=(t>i, ..., уп) — дей-
ствительные переменные. В соответствии с C.15)
'S}= I Ш|(х) exp(iv'x)dx, C.77)
где wi (x) — многомерная плотность вероятности совокупности
случайных величин. Интеграл C.77) сходится при любом дейст-
действительном векторе v, так как |6g (v)|sgl. Следовательно, 6& (v)
и a/g (x) являются парой преобразований Фурье и
щ (х) = —l— j в% (v) ехр (- iv'x) dv. C.78)
Bп)п v(n)
По заданной характеристической функции Q^n (vni) совокуп-
совокупности случайных величин ?ni=(?i, ..., In) нетрудно лайти харак-
характеристическую функцию совокупности 1*1= (?i, ..., ?fc)> k<Zn, слу-
случайных величин
вьМ)= Hm eE«(v?). C-79)
^1 n n fel
64
Если lni — совокупность п независимых случайных величин,
то плотность их совместного распределения факторизуется
п
w п (х?) = П Щ (**)» переменные интегрирования в C.77) разде-
ляются и тогда
n6eft(wft), C.80)
т. е. многомерная характеристическая функция является произ-
произведением характеристических функций каждой из случайных ве-
величин. Условие C.80), как и условие B.43), является необходи-
необходимым и достаточным для независимости случайных величин gi, ...
Пусть § и Tj — два случайных вектора. Для их независимос-
независимости необходимо и достаточно выполнить условие
6ln(v, и) = в!(уHч(и). C.80а)
Логарифм многомерной характеристической функции
C.81)
называется многомерной кумулянт ной функцией. Разлагая C.81)
в кратный ряд Тейлора, получаем
где Kkt kn— кумулянты высших порядков.
Для совокупности независимых случайных величин из C.80)
следует
i C.82)
3.3.5. Вычисление моментов и кумулянтов многомерного рас-
распределения. Многомерную характеристическую функцию можно
использовать для определения смешанных моментов распределе-
распределения совокупности случайных величин. Если существует производ-
производная
П
X wi{х1у ...,хп) exp (i 2 vrxr)dxx...dxnf
г=1
TO
3—87 65
— X k
»r=' ©(»i»•• •,»n)lv=o. C.83)
Кумулянты многомерного распределения
5 *. ^ 4.» C 84)
v»=0
Простейшим кумулянтом двумерного распределения является
ковариация случайных величин |i и Ъ [см. B.46)]
cov/t п_„ _
соv (glf g,) - xu
C.84а)
ОО ОО
где
Ьг е. (»ь у2)= S 2 ^—— xfcl fe21;^1 vl\ C.846)
Из C.846) следует
Используя C.78), получаем [31]
V 2Я/ -ooJco
ь (fi, f2) exp [ - i (t»j ^ + y2 ATj)] Л»! dy2 =
'*J , C.84b)
9Jn
Следствием C.84в) является .соотношение
—oo — oo
«)x
-oo Л
X fw (x2) wll%2 (xt, x2) dxx dx2. C.84т)
3.3.6. Распределение вероятностей линейной комбинации слу-
случайных величин. Как было показано в п. 3.1.14, чтобы опреде-
определять плотность совместного распределения линейной комбинации
случайных величин, даже при независимости слагаемых необхо-
необходимо вычислить кратный интеграл. Использование такого реше-
решения уже при умеренном числе слагаемых становится практически
невозможным даже три современной вычислительной технике. Од-
Однако известно, что для характеристики линейных преобразований
сигналов эффективно используется гармонический анализ (интег-
(интеграл Фурье). Поэтому исследовать распределение вероятностей
линейного преобразования значительно легче, если -вместо плот-
плотности вероятности рассматривать ее «спектр» (характеристичес-
66
кую функцию), поскольку при этом решение указанной задачи
упрощается.
Рассмотрим совокупность случайных величин gi, ..., ?п и пред-
предположим, что известна многомерная характеристическая функ-
функция в^ (i>i, ..., vn) этой совокупности. Рассмотрим далее случай-
случайную величину т|, которая представляет линейную комбинацию
случайных величин ?ь ..., gn
п
1 = 2 ск1ъ. C.85)
Характеристическая функция случайной величины г\
%(v)^mAexp(iv2 cktk)\ =тЛехр (i 2 ckvlk)\9
откуда следует
4(v)=®t(civ,...,cnv). C.86)
Таким образом, характеристическая функция линейной комби-
комбинации C.85) случайных величин получается простой подстановкой
Vi=CiV, i=lf n в аргументах многомерной характеристической
функции исходной совокупности случайных величин.
Плотность вероятности линейной комбинации C.85) находим
путем однократного обратного преобразования Фурье [см. C.67)].
Конечно, такое упрощение задачи связано с предположением о
том, что известна или может быть легко найдена многомерная
характеристическая функция ©| (v). Такое предположение в не-
некоторых случаях (практически интересных) имеет место.
Дальнейшее упрощение решения рассматриваемой задачи воз-
возможно, если случайные величины gi, ..., gn независимы. Тогда из
C.86) и C.80) следует
в?(*)« П %>{chv). C.87)
Кумулянтная функция линейной комбинации независимых
случайных величин gi, ..., gn
?
о)= ? "hk(chv)9 C.87a)
откуда следует
к, т=1,2... C.876)
В частном случае, когда сь=1, й=1, /г, и все слагаемые имеют
одинаковое распределение, т. е. 0^ (t>)=G(u), "Ф^ iv) =<Ф(и)» из
з* 67
C.87), C.87а) находим характеристическую и кумулянтную функ-
функция суммы независимых случайных величин:
•{„«-••«• C.88)
^ C.88а)
откуда следует
\ se*=nXm' C88б>
Л301!
Характеристическая функция суммы двух независимых одина-
одинаково распределенных случайных величин
а характеристическая функция разности таких случайных вели-
величин
C.88г)
Из C.88г) следует, что распределение разности независимых,
одинаково распределенных случайных величин симметричное.
Заметим, что формулы C.87) и C.88) легко обобщаются на
векторные случайные слагаемые. Для этого достаточно скалярный
аргумент v заменить векторным v соответствующей размерности.
3.3.7. Характеристическая функция совокупности гауссовских
случайных величин. Характеристическая функция совокупности п
зависимых гауссовских случайных величин |i, ..., ?п
... .оя)-«р \l S akvk-~ 2 2 °Wiflfls}9 C.89)
где ak, oh — среднее и дисперсия случайной величины gft, a r<,- —
коэффициент корреляции случайных величин 1г и gj.
Формулу C.89) легко получить, если использовать матричное
представление
в5 (v) = Bп)~п/2 (det К)~1/21 х(п) exp {iv'x -
- — (х - а)'К~х (х - a)} dx = exp (ia'v - — v'Kv}, C.90)
где v/= (v\9 ..., vn)', a — вектор средних значений, К — ковариа-
ковариационная матрица, штрих указывает на транспонированную мат-
матрицу [см. B.64)].
Кратный интеграл в C.90) вычисляется путем линейного пре-
преобразования переменных интегрирования, приводящего квадра-
квадратичную форму в показателе экспоненты к сумме квадратов (см.
гл. Ив [в]).
68
3.3.8. Распределение вероятностей линейной комбинации гаус-
совских случайных величин. Из C.86) и C.89) следует, что ха-
характеристическая функция линейной комбинации C.85), в кото-
которой ?i, ..., In — гауссовские случайные величины,
k=\
Обозначая
n n
fl= 2 Cftflft, a2= 2 2 ctcflfljrw C.91)
перепишем это выражение
Ол (и) = exp {iae - oV/2}. C.92)
Сравнивая C.92) с C.74), замечаем, что линейная комбинация
произвольно зависимых гауосовских случайных величин пред-
представляет гауосовскую случайную величину, подчиняющуюся нор-
нормальному распределению вероятностей, со средним значением и
дисперсией, определяемыми согласно C.91). При этом следует
заметить, что формулы C.91) относятся к линейным комбинаци-
комбинациям любых случайных величин [см. C.17) и C.21)], а новым ре-
результатом применения метода характеристических функций явля-
является установление нормального распределения произвольной ли-
линейной комбинации любого числа случайных величин, подчиняю-
подчиняющихся многомерному нормальному распределению. Свойство ин-
инвариантности нормального распределения по отношению к ли-
линейному преобразованию полностью характеризует этот класс
распределений (подробнее см. в [7]).
3.4. ПРЕДЕЛЬНЫЕ РАСПРЕДЕЛЕНИЯ СУММ
СЛУЧАЙНЫХ ВЕЛИЧИН
3.4.1. Сходимость последовательности случайных величин. Де-
Детерминированная числовая последовательность S\y ..., sn сходится
к величине s, т. е. имеет единственный предел lim sn = s, если
Л — оо
для любого е>0 существует такой номер \Ne , что при n>Ne
выполняется неравенство |sn—s|<e. В отличие от указанного
определения предела детерминированной последовательности оп-
определение предела последовательности случайных величин зави-
зависит от критерия сходимости. Это объясняется тем, что последо-
последовательность случайных величин представляет множество число-
числовых последовательностей, подчиняющихся вероятностному распре-
распределению.
Последовательность случайных величин gi, ..., gn сходится по
распределению к случайной величине ?, если последовательность
функций распределения Fi^x), ..., Fin (x) сходится к функции
распределения Fg (x) во всех точках непрерывности последней.
Кратко сходимость по указанному критерию записывают в виде:
69
gn nl^! g. Сходимость по распределению называют также слабой
сходимостью. Если функции Fik (x), &=1, n, и F^ {x) дифферен-
дифференцируемы, то при слабой сходимости плотности w\n (х) сходятся
к wi (х) и, соответственно, характеристические функции
®ln (v) — к ®б(у)# -шШ
Последовательность случайных величин gi, ..., gn сходится по
вероятности к случайной величине g, если для любого 1>0
ton P{\ln-t\>z} = 0 C.93)
с. П. В
или кратко ёп —> 6-
П->оо
Последовательность случайных величин gi, ..., ln сходится в
среднеквадратическом к случайной величине |, если
x{{ln-lf}=0 C.94)
при кратко 1п —> fe.
П->оо
Из сходимости в среднеквадратическом следует сходимость по
вероятности, а из сходимости по вероятности — сходимость по
распределению.
Приведенные критерии сходимости относятся к последователь-
последовательностям не только скалярных случайных величин, но и векторных.
Так, для определения слабой сходимости последовательностей
векторных случайных величин достаточно одномерные функции
распределения заменить многомерными, а для определения сходи-
сходимости по вероятности и в среднеквадратическом потребовать, что-
чтобы соотношения C.93) и C.94) выполнялись для каждой компо-
компоненты вектора §п.
3.4.2. Сходимость последовательности сумм случайных вели-
величин. При теоретических исследованиях и практических приложе-
приложениях теории часто необходимо решать задачу определения функ-
функции распределения сумм конечного числа случайных величин (ли-
(линейной комбинации случайных 1величин). В общем случае решение
этой задачи даже при использовании метода характеристических
функций сопряжено с известными трудностями (см. п. 3.1.14 и
3.3.6). Исключение составляет сумма конечного числа (даже за-
зависимых) гауссовских случайных величин, которая представляет
гауосовскую случайную величину, т. е. подчиняется нормальному
закону распределения вероятностей (см. п. 3.3.8). Можно указать
и еще несколько примеров, когда закон распределения суммы
произвольного конечного числа одинаково распределенных незави-
независимых случайных величин совладает с законами распределения
слагаемых (см. задачи 3.14 и 3.15). Однако, как правило, закон
распределения суммы случайных величин не повторяет закона
распределения слагаемых. Задача становится еще сложнее, если
функции распределения слагаемых суммы различны.
70
В тех случаях, когда решение задачи <при конечных парамет-
параметрах громоздко или практически непригодно, применяется асимп-
асимптотическое решение, которое затем используется в допредельном
случае, если сходимость достаточно быстрая. В рассматриваемой
задаче асимтотический подход имеет место, когда число слагае-
слагаемых в сумме неограниченно увеличивается. Для этого необходимо
исследовать сходимость последовательности сумм случайных ве-
п
личин rin= 2 Ik, когда п-^оо.
k=\
Прежде всего следует отметить, что содержательное исследо-
исследование сходимости сумм случайных величин возможно лишь после
соответствующего центрирования и .нормирования сумм. Пусть,
например, все слагаемые |&, &=1, я, независимы и распределены
по одному и тому же закону, причем mi{?&}=#, \Х2{1к}:=о2<.оо.
Тогда mi{r\n}=naf p,2 {r\n}= no2. Следовательно, при п-^оо среднее
и дисперсия искомого предельного распределения неограничены.
Однако, если вместо случайных величин суммировать центриро-
центрированные случайные величины ?&—а, то среднее суммы всегда будет
равно нулю. Нормирование центрированной суммы возможно дву-
двумя способами:
C.96)
1
n
1
n
2 (
n
_ 2.
n k=
yok
1
При первом способе [X2{riA)n}=a2/rt и, следовательно, \{\}
при я-^оо, т. е. последовательность сумм C.95) сходится (по
меньшей мере по вероятности) к константе (к нулю). При вто-
втором способе |Х2{т1B)п} = 1 для любого п и, следовательно, после-
последовательность C.96) сходится при п-^оо (по меньшей мере по
распределению) к случайной величине г) с параметрами ^i{r)}=0,
Если распределения слагаемых сумм независимых случайных
величин различны, то центрирование и нормирование приводят
к следующим выражениям:
r)^ = — S E*-0*). **="*!{?*}. C.97)
п k=i
C.98)
При определенных условиях последовательности нормирован-
нормированных сумм центрированных независимых случайных величин схо-
сходятся к ^предельной величине, вероятностные характеристики ко-
которой не зависят от индивидуальных характеристик слагаемых.
71
Формулировка условий возникновения подобных устойчивых за-
закономерностей и их вероятностных характеристик составляют со-
содержание предельных теорем теории вероятностей — закона боль-
больших чисел и центральной предельной теоремы.
3.4.3. Закон больших чисел. Пусть gi, ..., ?п — последователь-
последовательность независимых, одинаково распределенных случайных вели-
величин с конечными дисперсиями \Х2{1ъ}=о2<.оо, &=1, /г. Тогда по-
последовательность сумм C.95) сходится по вероятности к нулю,
что равносильно утверждению
I п п. в. »
т. е. среднее арифметическое независимых, одинаково распреде-
распределенных случайных величин сходится при п-^оо к среднему значе-
значению слагаемого суммы. Сходимость по вероятности среднего
арифметического к среднему а следует непосредственно из нера-
неравенства Чебышева. Так как [см. C.95)] т\{г\1%}=09 |Х2{т)A)п} =
о2/п, то из B.29) находим
lim P{|— 2 5*-0|>в}=О. C.100)
Обозначим через @(v) характеристическую функцию случай-
случайной величины (lh—а)\1п9 а через 6S (v) — характеристическую
функцию суммы C.95). Тогда >в соответствии с C.88)
\n&z(v) = n In в(и) = л In (I -oV/B/ia)+...) =
= (_ o2v2/Bn) + o(l/n2). C.101)
При п->оо из C.101) следует lim 6z(t/) = l, т. е. предельное
распределение последовательности сумм C.95) вырожденное —
плотность такого распределения представляет дельта-функцию в
начале координат.
Формула C.99) является аналитическим выражением закона
больших чисел.
Из C.101) следует, что с точностью до членов порядка 1/п2
распределение среднего арифметического независимых одинаково
распределенных случайных величин (при конечной дисперсии)
нормальное с плотностью
w(x)~ l expl~— (x~a)* \ C.102)
Если случайные величины ^ в C.97) не распределены одина-
одинаково, то для сходимости распределения суммы C.97) к вырож-
вырожденному (плотность представляет дельта-функцию в нуле) дос-
достаточно выполнить условие
lim /г-п+*> j т1 {\ %k - ak \ l+6} = 0, 0 < б < 1. C.103)
72
При 6=1 получаем более простой вариант C.103):
lim ol/ti2 = 0, C.103а)
П-* оо
где
°
= 2 МУ- C-1036)
3.4.4. Центральная предельная теорема теории вероятностей.
Пусть 1и .... ?п — последовательность независимых, одинаково
распределенных случайных величин, имеющих конечные средние
mi{lk}=a и дисперсии [А2{?л} = а2. Тогда последовательность сумм
C.96) сходится по распределению к стандартной гауссовской слу-
случайной величине, что равносильно утверждению
=-^г f exp ( -^\du =
C.104)
т. е. последовательность функций распределения центрированных
и нормированных сумм C.96) случайных величин при п-+оо схо-
сходится к нормальной функции распределения с параметрами @; 1).
Формула C.104) является аналитическим выражением цент-
центральной предельной теоремы теории вероятностей. Доказательст-
Доказательство этой теоремы основано на исследовании последовательности
характеристических функций сумм C.96) при п-^оо. Обозначая
&l (v) характеристическую функцию центрированной случайной
величины ^k—я, получаем согласно C.71)
- 1 _*.
В соответствии с C.88) логарифм характеристической функции
суммы C.96)
()?L^ C.105)
Из C.105) следует
lim Bsn (и) = exp (- иг/2), C.106)
т. е. последовательность характеристических функций сумм C.96)
при п-*~оо сходится к характеристической функции гауссовокой
случайной величины с нулевым средним и единичной дисперсией.
Если случайные величины |* в C.98) не распределены одина-
одинаково, то для слабой сходимости сумм C.98) к стандартной гаус-
гауссовской случайной величине достаточно выполнить условие: при
б>0
B+б s m1{IE*-fl*l2+e> = 0. C.107)
73
При 6=1 C.107) упрощается:
1 = 0
или
limcn/an = 0, C.107а)
где
с\= ? mi{\ln-*cih\*}. C.1076)
k=i
Необходимое и достаточное условие, при выполнении которого
распределение нормированной суммы C.98) независимых случай-
случайных «величин при я->оо сходится к нормальному, следующее: при
каждом е>0
j x2dFk(x)-+0f C.108)
где Fk(x) — функция распределения ?&.
Из C.108) следует очень простое достаточное условие асимп-
асимптотической нормальности (см. [8])
lim тах>2{У/а2 = 0. C.109)
Условие C.109) означает, что дисперсии ^fe} отдельных слагае-
слагаемых суммы C.98) (Малы по сравнению с суммой дисперсий всех
слагаемых.
Рассмотрим, например, нормированную линейную комбинацию
независимых, одинаково распределенных, центрированных случай-
случайных величин |ft
Ч,= у2 chlh, C.110)
где Ck — произвольные константы и
2 П «. П 2
°п = S 1^2 \Ск ikS = ° 2 °k> °2 = |Ы2 {Ik}'
k=\ k=l
Тогда из C.109) следует, что для сходимости при я-^оо функции
распределения суммы (ЗЛЮ) к нормальной функции распределе-
распределения достаточно, чтобы
lim max с?/2 с| = 0. C.1 И)
В гл. 5 (см. п. 5.2.7) будут сформулированы условия, при ко-
которых центральная предельная теорема имеет место и для сумм
3afBHCHMbix случайных величин.
3.4.5. Оценка сходимости к нормальному закону. На практике
приходится исследовать распределение конечного числа случай-
74
ных величин и поэтому необходимо оценить асимптотическое ра-
равенство C.104) в зависимости от числа п и параметров функции
распределения слагаемых. Поправка к нормальному закону полу-
получается из рассмотрения выражения C.105). Функция lneS/1 {v)
представляет степенной ряд по v9 'коэффициенты которого зави-
зависят от п и от центральных моментов распределения слагаемых.
В зависимости от требуемой точности оценки приближения к
нормальному закону можно ограничиться тем или иным числом
членов этого ряда. Если оставить, например, члены порядка не
выше 1/я, то, предполагая, что третий и четвертый центральные
моменты случайных величин ?& конечны, из C.105) находим
24я V, а*
^+0(П-3/2I.
1*П J
Вводя коэффициенты асимметрии к и эксцесса у слагаехмых,
получаем с точностью до порядка о (я~~3/2)
л / \ / ^2 \ / 1 ik 4,7/1 k2 ft\ /о 1 ю\
02 (у) = ехр I т=-v + — v v I • C-!l2)
n W *\ ¦ 2 A 6 У л 24ai 72ai ; V ;
Обратным преобразованием Фурье из C.112) находим приб-
приближенное выражение плотности распределения суммы C.96) с
точностью до малых порядка 1/я3/2
где Нк{х) — полиномы Эрмита [ом. B.83)].
Заметим, что правая часть C.113) представляет первые четы-
четыре члена разложения плотности вероятности суммы C.96) в ряд
Эджворта, который получается также из ряда Грама — Шарлье
(см. п. 2.5.2) перегруппировкой членов по порядку их малости.
Из C.113) следует, что распределения нормированных сумм
независимых случайных величин с симметричными плотностями
распределения (к = 0) сходятся к нормальному распределению
быстрее, чем нормированные суммы случайных величин, для ко-
которых плотности распределения асимметричны (к=И=О).
Отметим также, что приближенное выражение плотности ве-
вероятности Wzn (x) ненормированной суммы (независимых, одина-
одинаково распределенных случайных величин 2 lk = о Уп т]л2) +
[см. C.96)] следует из C.113) с учетом C.6)
(ЗЛ14)
75
3.4.6. Обобщения. Центральная предельная теорема распространяется также
на многомерные случаи. Пусть §ь ..., ?п — последовательность независимых
г-мерных векторных случайных величин с одинаковыми r-мерными функциями
распределения. Обозначим через а вектор средних, а через К — ковариацион-
ковариационную матрицу каждой из векторных случайных величин указанной последова-
последовательности. Тогда последовательность r-мерных функций распределения сумм
Ч» = -^г 2 (Б*-а)
У п л=1
при ai-^oo сходится к А-мерной нормальной функции распределения с нулевым
векторам средних и ковариационной матрицей К.
Доказательство приведенной обобщенной предельной теоремы аналогично
приведенному в п. 3.4.4 для скалярного случая. Если B(v) — характеристи-
характеристическая функция центрированной векторной случайной величины %h—а, то с уче-
учетом C.84а) и замечания в конце п. 3.3.6 имеем
(^) C.115,
откуда следует приведенное выше утверждение.
Можно также получить приближенное выражение многомерной плотности
суммы конечного числа независимых векторных случайных величин. Рассмот-
Рассмотрит, например, совместное распределение компонент двумерного результирую-
результирующего вектора Цп=(г\п\, Лпг), где
1 п 1 п
Лш = — 2 (Efti - fli). %2 = — 2 (Ы - *г), C.1
%к=\(?,к1, lh2Jt k=l, n — последовательность независимых, одинаково распреде-
распределенных двумерных случайных векторов, каждый из которых характеризуется
вектором средних а=(аь аг) и ковариационной матрицей
K/<*2i o1o2r\
В [5] были получены в первом приближении следующие выражения плотности
совместного распределения компонент C.1il6) результирующего вектора:
Л „Г «>-2г*у + у» л
2пУТ=75 СЛ1)\~ 2A-г»)
1
,-(, _ fay Шг-г kl3) [(гу - *)» - 3 A - г*) (гу - х)] +
+ (k, - rku) [(rx -у)*-3A-г*) (гх - у)] +
-f 3klt у A - /¦*) [(/-у - х)* - A - ^)] + Зкц х A - г^ ](« - у)* - A - л?)]}1.
C.117)
где г — коэффициент корреляции случайных величин 1м а |(,2, ki « kj —
коэфф|ицивнты аоиммет,рии величин |si .и ^2 соответственно,
76
, y)dxdy,
1 __» _?>
wl (*» У) — совместная плотность вероятности компонент вектора §ь, &=1, я.
Если каждая пара компонент |ai и ?й2 суммируемых векторов не корре-
лирована (г=0), имеет «улевые средние (ai = a2=0) и одинаковые дисперсии
(сг21 = (У22=о*2)> то распределение модуля результирующего вектора, как это сле-
следует из (ЗЛ17) и п. 3,2.3, асимптотически рэлеевкжое, а распределение фазы
результирующего вектора — равномерное на интервале (—я, я).
3.5. ЗАДАЧИ
3.1. а) Показать, что плотность вероятности произведения Sib зависимых
гауссовских случайных величин с нулевыми средними дисперсиями о2\, а2г и ко-
коэффициентом корреляции R равна
Г {У) = W Ko
ata,(?-«•)
(О
где Ко(^) — бесселева функция первого рода нулевого порядка от мнимого
аргумента.
б) Показать, что плотность вероятности частного ?1/^2 зависимых гауссовс-
гауссовских случайных величин со средними аи &ъ дисперсиями a2i, a22 и коэффици-
коэффициентом корреляции R
У1 - R* aj_O2
Хехр { —- [ef o|-
1 2A-Я2) a?of
X | 1 + У 2я г FQ (г) ехр ( — ] |, Aа)
где
a3 a j — Rax ox Oz + ctxoly — Ret* o± a2 у
Fo(z) — определена согласно B.716).
В частном случае при ai = a2=0
При /?=0 из A6) следует плотность распределения Коши.
77
3.2. Показать, что плотность вероятности модуля вектора, координаты ко-
которого .независимы и распределены нормально с параметрами (аь О\) и (а2, 0*2),
имеет вид
Убедиться, что при Oi = O2=ss(J формула B) переходит в C.50). Рассмотреть
также частный случай при ai = a2=0.
Показать, что при ai = a2=0 и коррелированных координатах плотность
распределения модуля вектора равна (распределение Хойта)
где
Р = a? + a* _ [( о?- (ф2 + 4Я»of
/? — коэффициент корреляции координат. Убедиться, что при а\ = а2—о и R
распределение Хойта переходит в рэлеевское
а при /?=1 — в одностороннее нормальное
3.3. Показать, что плотность вероятности и функция распределения про*»о-
ведения двух независимых рэлеевских случайных величин с параметрами О\ и
а2 соответственно равны
- "¦•¦ т
где Hi^^(z) — функция Ханкеля и Kd(^) — функция Бесселя второго рода ну-
нулевого .порядка от мнимого аргумента.
78
3.4. Показать, что плотность распределения суммы двух независимых слу-
случайных величин, одна из которых распределена нормально с нулевым средним
и дисперсией а2, а другая представляет синусоиду амплитуды а со случайной
фазой, распределенной равномерно на интервале (—я, я), равна
E)
3.5. Показать, что функция распределения и плотность вероятности суммы
двух независимых рэлеевских случайных величин с одинаковыми параметрами
а [см. C.51)] равны
V/ F)
G)
где Fo(z) определены согласно B.716) и у^О.
3.6. Показать, что характеристическая функция квадрата гауссовской слу-
случайной величины с параметрами @, а) равна
lB(y)=i(l-H2ia2t;)-1/2. (8)
Разлагая правую часть (8) в ряд по степеням v, показать, что начальные
моменты определяются ло формулам
ть = а2*B&—1)!1, ?=И, 2, ..., (9)
где B k—1)!! — произведение всех нечетных чисел натурального ряда до 2k—
—1 включительно.
3.7. Показать, что характеристическая функция рэлеевской случайной вели-
величины равна
®(v) = \+i<jv Уя72[1+Ф(шу/У2)]ех^р(--а2у2/2), A0)
где ф(г) — функция Крампа [см. B.71а)].
(Последовательным дифференцированием определить начальные моменты
рэлеевского распределения и сравнить с A2) в задаче 2.1.
3.8. Показать, что характеристическая функция квааидетерминированного"
гармонического колебания §(?)=acos(cD0^+(p) (постоянной амплитуды а, посто-
постоянной частоты оH 'И случайной фазы ф, равномерно распределенной на интер-
интервале (—я, я), равна
в8(о)=/о(ао), (И)
где J0(x) — бесселева функция нулевого порядка первого рода. Используя
A1), получить выражения плотности вероятности и функции распределения
указанного колебания
8gs „avi 1 ело» ' ]х[<а' A1а)
= 4-+ — arcsinf—), \х\^а. A16)
2 я \ а I
79
3.9. Доказать, что сумма л квадратов независимых стандартных гауссозс-
ких случайных величин подчиняется так называемому х2"РаспРеделению с п
степенями свободы, плотность и функция распределения которого равны
W2-1
% , х/2)/Т{п/2), *>0, A3)
где Г (л/2, */2) — неполная гамма-функция [см. (il.31)]. Показать, что началь-
начальные моменты %21ргспрелел&аия с п степенями свободы определяются по фор-
формуле
(H)
/
а кумулянты этого распределения
иЛ = 2*-1д(&—1I A5)
Сравнить A4) с B) ш задаче 2.1 для экспоненциального распределения,
которое является %2-\ратред1елъттм с двумя степенями свободы.
Указание: формулу A2) получить двумя способами: а) используя C.33)
и метод полной математической индукции, б) используя формулы (8) задачи
3.6 и C.88).
ЗЛО. Используя формулу A1) задачи 3.8, показать, что плотность вероят-
вероятности суммы независимых гармонических колебаний с постоянными амплиту-
п
даш и случайными равномерно распределенными фазами l(t)= 2 ahX
Xsin{toA/+q>ft) равна
: S^ft. A6)
ГяяХ \ A J k=l \ A
Рассмотреть частный случай одинаковых амплитуд аь = а и доказать, что
в этом случае
Aба)
Определить вероятность того, что сумма %(t) по абсолютному значению не
превзойдет Ка. Привести плотность раюцределения суммы двух независимых
гармонических колебаний одинаковой амплитуды и случайной фазы к «иду
A66)
где К(z) — полный эллиптический инггеграл первого рода.
З.П. Пусть случайные величины г\ и ? связаны функциональным преобра-
эоваеием т1—/\(|). Предположим, что F(x) предогавляет также функцию рас-
распределения случайной величины ^. Показать, что ири указанных условиях слу-
случайная вел)ичина г\ распределена равномерно на инте^рвале @, 1).
80
3.12. Показать, что плотность вероятности случайной величины T] = es, где
? — йауссовская случайная величина со средним а и дисперсией о2, имеет вид
(логарифмически нормальное распределение)
A7)
Вывести следующие выражения среднего, дисперсии и коэффициента асиммет-
асимметрии для логарифмически нормального ракш редел ения
т! = ех1р(а+а2/2), A7а)
ца = (е02 - 1) ехр Bа + о»), A76)
к = (еаЯ + 2) (еа* - 1I/2. A7в)
3.13. Пусть ?<, i=l, n — совокупность независимых случайных величин с
нулевыми средними, имеющие одинаковые функции распределения. Доказать
неравенство Чернова [9]
[ 1 п 1
I n м J
<exp( — nv), e>0, A8)
где v = ln ^i{exp[^(^i—в)]} )И Ко — корень
}. A8а)
3.14. Показать, что характеристическая функция дискретной случайной ве-
величины, распределенной по закону Пуассона [см. A.29)], равна
u-l)], A,>0. A9)
Используя A9), доказать, что сумма независимых (Пуассоновск-их случайных
величин также подчиняется распределению Пуассона.
3.15. Показать, что для случайной величины, распределенной по закону
Коши
+ !t B0)
характеристическая функция
"|). B0а)
Используя B0а), доказать, что среднее арифметическое произвольного конеч-
конечного числа независимых случайных велич-ин, распределенных по закону Коши,
также подчиняется распределению Коши.
3.16 [1]. Доказать, что характеристическая функция суммы случайного
числа v независимых случайных величин ?ь ..., ?v
%h B1
r=l k=\ h
где pr = P{v = r}, r=l, 2, ... и случайные величины v и ?ь неэаюиоимы. Исполь-
81
зуя B1) (и предполагая, что случайные величины ?ь ..., ?v распределены оди-
одинаково, вывести следующие формулы для среднего значения и дисперсии слу-
случайной величины ?v :
atav> B2)
где <3|, [x2g' aV' ^2V — средние >и дисперсии случайных величин ?ь и v, & =
= 1, 2 ...
3.17. Пусть % — случайный вектор, у которого а — вектор средних и К —
корреляционная матрица. Образуем квадратичную форму %'Q%, где Q — сим-
симметричная положительно определенная матрица. Вывести следующее выраже-
выражение характеристической функции величины rj=,^/Q§:
]/2
0Л W = [det (I — 2i tr KQ)]/2X
v KQ) ] a J
Xexp |-ya' K [I - (I - 2\v KQ) ] a J , B3)
где I — единичная матрица [З].
3.18. Рассмотрим задачу о «блужданиях» [5]. Пусть точка может переме-
перемещаться в плоскости по отрезкам прямых. Будем трактовать эти перемещения
как взаимно независимые векторы со случайными компонентами (?&,т]ь). Поло-
Положение точки после п перемещений определяется результирующим вектором с
п п
компонентами §=S?feHTl=2j Ль» Предположим, что модуль рь =
k=l /г=1
= (?>2k+r\2kI/2 и фаза (pk = arctg(r\k/lh) каждого вектора также независимы,
причем фаза распределена равномерно на интервале @, 2л), а плотность рас-
распределения мюдуля равна wp (г). Показать, что плотность вероятности моду-
модуля р результирующего вектора
оо П ОО
W {г) = r$sJ0(rs) И $w lv)J0(t>s)dvdst r>0, B4)
0 fe=l 0 к
а функция распре|деления
оо п
Fo W = г 1У1 ^ П ^Рь (у) h (vs) ds, r > 0. B5)
О k=\ к
Глава 4
СЛУЧАЙНЫЕ ПРОЦЕССЫ
4.1. ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ
СЛУЧАЙНЫХ ПРОЦЕССОВ
4.1.1. Определения. Функция l(t) действительного пере-
переменного / называется случайной, если при каждом значении ар-
аргумента / она представляет случайную величину. Иначе говоря,
82
6д,учайная функция — семейство случайных величий l(t), зави-
зависящих от действительного параметра t. Если параметром t яв-
является текущее время, то случайная функция l(t) называется
случайным процессом. В отличие от детерминированного процес-
процесса, развитие во времени которого априори определено однознач-
однозначно, случайный процесс представляет такие изменения во времени
физического явления или состояния технического объекта, кото-
которые заранее точно предсказать невозможно.
Если случайная величина определялась множеством ее воз-
возможных значений и распределением вероятностей на этом мно-
множестве, то случайный процесс характеризуется множеством функ-
функций времени
E@ = ft(fc)@. ts=T) D.1)
и вероятностной мерой, заданной на множестве функций D.1).
Каждая отдельная функция времени Qk)(t) называется реализа-
реализацией (траекторией, выборочной функцией) случайного процесса
%(t). Индикатор реализации (k) может принадлежать счетному
множеству действительных чисел или интервалу действительной
оси (континууму). Детерминированный процесс имеет единствен-
единственную реализацию, описываемую заданной функцией времени S(t).
Множество Т значений параметра / называют областью опре-
определения случайного процесса ?@> а множество X, которому при-
принадлежат возможные значения l(t) — пространством значений
процесса.
Более общим, чем понятие случайного процесса, является по-
понятие случайного поля — случайной функции нескольких пере-
переменных l(t, х, у, г, ...). Например, случайное поле может пред-
представлять изменения состояния технического объекта в зависимос-
зависимости не только от времени, ,но и от его положения в пространстве
(от координат х, у, г). В этой книге мы ограничиваемся изложе-
изложением только теории случайных процессов и ее практических при-
приложений.
4.1.2. Общая классификация случайных процессов. Различают
два класса случайных процессов: с дискретным временем (слу-
(случайные последовательности), когда область определения Т слу-
случайного процесса представляет конечное или счетное множество
моментов времени, и с непрерывным временем, когда область оп-
определения — континуум.
Случайная последовательность называется дискретной, если
множество X (пространство значений процесса) конечное или
счетное, и непрерывной, если множество X — континуум. Случай-
Случайный процесс с непрерывным временем называется дискретным,
если множество X (пространство процесса) конечное или счетное,
и непрерывным, если множество X — континуум (рис. 4.1 и 4.2).
Часто используется временная дискретизация случайного про-
процесса с непрерывным временем, и тогда такой ^процесс аппрокси-
аппроксимируется случайной последовательностью.
83
Рис. 4.1. Реализа-
Реализация непрерывного
случайного процес-
процесса
fit)
Рис. 4.2. Реализация дис-
дискретного случайного про-
процесса
Пусть задано произвольное число п моментов времени (t\t
t2y ..., ?n)=teT(n). Совокупность значений случайного процесса в
указанные моменты времени ?(^)> t=l, n образует систему слу-
случайных величин (векторную случайную величину)
со значениями в n-мерном эвклидовом пространстве ^еХп. Тогда
вероятностными характеристиками случайных последовательнос-
последовательностей и случайных процессов с непрерывным временем (при вре-
временной дискретизации) являются функции совместного распреде-
распределения указанных случайных величин.
Далее рассматриваются вероятностные характеристики слу-
случайных (Процессов с непрерывным временем. Определение соот-
соответствующих характеристик случайных последовательностей не
вызывает особых затруднений, как будет показано, например, в
гл. 7.
4.1.3. Функции распределения случайного процесса. Фиксируя
последовательно л=1, 2, ... моментов времени, находим последо-
последовательность функций распределения случайного процесса ?>{t):
одномерную функцию распределения
Fi(*i, *i)=P{S('iX*i}, D.2)
двумерную
/Ч*ь *2, Uy t2)=P{(Wi)^xl)(](Ut2)^x2)} D.3)
и так далее до произвольной конечномерной функции распределе-
распределения
n
n
D.4)
Fn(xu ..., xn, tu ..., tn) =
или сокращенно
Fn (x, t) = P {\ (t) <^x} D.4a)
(принято, что размерность вектора оорогов х определяет размер-
размерность функции, а вектор t является вектором параметров).
84
Последовательность функций распределения Fi(*i, t\)f
F2(Xi, X2i tU t2), ..., Fn(X\9 ..., Xn, tU ..., tn)
представляет своеобразную лестницу, поднимаясь по которой уда-
удается все подробнее характеризовать случайный процесс. Рассмат-
Рассматриваемая последовательность функций распределения как функ-
функций порогов хи ..., Хп должна обладать всеми свойствами функ-
функций распределения вероятностей, изложенными в гл. 2. В част-
частности, из функций распределения /г-го порядка можно получить
все функции распределения более низких порядков, вплоть до
первого. Однако в отличие от функций распределения случайных
величин, функции распределения случайных процессов зависят не
только от порогов х\, .,., хп, но и от моментов U, ..., tn.
Функции распределения случайного процесса должны удовлет-
удовлетворять условию симметрии
Fn (хъ ... , xni tl9..., tn) = Fn (xkl,..., xkn, tkl,..., tkn), D.5a)
где k\f ..., kn — целые числа от 1 до п, 'расположенные в произ-
произвольном порядке, и условию согласованности
lim Fn (xl9..., хП9 tl9 n«, tn) = Fk (xly..., xk, tl9..., th), k<n.
хл-ь1^° D.56)
Если семейство конечномерных распределений удовлетворяет
условиям симметрии D.5а) и согласованности D.56), то эти ус-
условия необходимы и достаточны для существования случайного
процесса, имеющего те же самые конечномерные распределения
(теорема Колмогорова [10]).
4.1.4. Плотности вероятности и характеристические функции
случайного процесса. Вероятностными характеристиками случай-
случайного процесса являются также плотности вероятности:
одномерная
двумерная
wi(xl9x29tltt2)= — у*-*)
OXi OX%
и так далее до произвольной конечномерной
w (х х t М — д"*7 (*Х /
дхг.„ дхп
или сокращенно
wn(*,t)=dnFn^ t} • D.8а)
Последовательность плотностей вероятности случайного процесса
как функции порогов х\9 ..., хп обладает всеми свойствами плот-
плотностей вероятности, изложенными в гл. 2. Особенностью является
85
зависимость плотности вероятности от времени. Плотности веро-
вероятности случайного процесса, как и функции распределения,
должны удовлетворять условию симметрии
U>n (*1> - ¦ *n. 'l. - . tn) = Wn (Xkl9 -. , Xhn, tkt, ... , tkn) D.86)
и условию согласованности
00 OO
wh(x1,...,xh,t1,...,tk)= J ... J ш„ fo,..., xn, tlt .-.-,,/„) d*ft+1 .^d*».
— 00 —oo
D.8b
Совершая преобразования Фурье по переменным х\9 ..., хп% по-
получаем из D.6) — D.8) последовательность характеристических
функций случайных процессов:
одномерную характеристическую функцию
@i(vu ^i)=m1{expf[toiE(/,)]}, D.9)
двумерную
02(^1, v2, tu /j)=
и так далее до произвольной конечномерной
]} D-11)
или сокращенно
On(v, t)=m,{exp[iv/?(t)]}. D.11a)
Характеристические функции случайного процесса, как и плот-
плотности вероятности, должны удовлетворять условию симметрии
в„ (vl9..., vn, tt,..., /n) == 6n (vkl9..., оЛя, ^,..., tkj) D.116)
и условию согласованности
Sk(vu ..., ufe, *lf ..., ^)=вп(»ь ..., t;fc>Of ..., 0, tu ..., tn). D.11b)
В некоторых случаях используется кумулянтная функция случай-
случайного процесса
tyn(Vu .-, Vn, tu ..., tn) =\nQn(Vu ..., Vn, U, ...» *n). D«12)
4.1.5. Моментные функции случайного процесса. В отличие от
конечномерных функций распределения (плотностей вероятности,
характеристических функций) случайного 'процесса, которые опре-
определяют «тонкую структуру» процесса, моментные функции
» m^.kn (*lf..., У - Щ {g*i (У ... Б*п (U) =
— оо
п
f f xk*
) ••• J xl •
oo
D.13)
86
дают более «грубое» вероятностное описание процесса и не ха-
характеризуют его однозначно в том смысле, что у двух различных
процессов могут быть одинаковые моментные функции (несколь-
(нескольких порядков).
Наряду с моментными функциями случайного процесса исполь-
используют кумулянтные
**,...*„(*!. -.*п)= ("О
X
... (dvn)kn
D.13a)
которые представляют коэффициенты разложения кумулянтной
функции D.12) в ряд Тейлора
X
X хЛж ^ (^ /п) о*.... о*» . D.136)
Для решения многих задач иногда достаточно знать следую-
следующие моменты функции:
среднее значение случайного процесса (моментную функцию пер-
первого лорядка) ,
i С / J.\ 1 /J\ / Л 1 Л \
— oo
дисперсию (центральную моментную функцию второго порядка)
Щ № @ - Ч (ОJ} = ] [х - щ (ОJ Щ (х, t) dx = of @, D.15)
корреляционную функцию (смешанную моментную функцию вто-
второго порядка)
mi {? (^i)? (Q} = f f ^1-^2^2 (^i -^2» ^i» ^2) dx1dx2 =B§(tu t2). D.16)
Нетрудно доказать, что корреляционная функция случайного
процесса (центрированного) совпадает с кумулянтной функцией
[см. D.13а) и C.84а)]
Кц(*1,'.) = Яб &.'.)• DЛ6а)
4.1.6. Совокупность случайных процессов. Иногда необходимо
исследовать совокупность случайных процессов |i@»—эБет(О- Каж-
Каждый из процессов li{t), i=l, N, можно рассматривать как компо-
компоненту векторного случайного .процесса %{t) со значением в Af-мер-
ном эвклидовом пространстве.
87
Функция совместного распределения совокупности случайных
процессов |i@, .... ?iv@
D.17)
N
где Л1 = 2 nt*
Рассмотрим более подробно распределение вероятностей двух
случайных процессов g(f) и т)(?). Из D.17) при я = 2 (и очевид-
очевидном изменении обозначений) получим
Ь ..., Xn, tU ..., fn, f/l, ..., f/m, ^1, ..., t'm). D.18)
Смешанная производная
дп+т Fn+m ^ ...9xn, tif ..., tn, ylt ..., ym, t[ Q ^
дхг... дхпдуг ...дут
(xl9 ...,Xn, tlf...,tn, yl9.-.,ym, t'v...,t'n) D.19)
называется (п+т) -мерной совместной плотностью вероятности
случайных процессов %(t) и r)(t).
Два случайных процесса |(/) и r\(t) независимы, если для лю-
любых пит
= Fe (Xi, ..., хп, tlt .... <в) F4 (У1 ут, t\ Q. D.20)
Совместные моментные функции двух случайных процессов
m*i fcn. г, rm (^i, •••, tn, t[, .... Q =
= mx g*. (у ... Eft" (tn) Tir> (^) ... лг- (U) =
= J ... ] 4l... ^ny? •••, y> x
— 00 OO
x wn+m(xlt.... аг„, ^i.... tn, ylt .... ym, f[, ..., Q x
x dxx... dxndy1... фт. D.21)
Простейшей совместной моментной функцией является взаим-
взаимная корреляционная функция двух случайных процессов
= ] ] xyw2(x, tlt y, tjdxdy. D-22)
—"OO —чОС
4.1.7. Комплексный случайный процесс. Как правило, в при-
приложениях рассматриваются действительные случайные .процессы.
88
Однако иногда бывает полезным рассматривать комплексный слу-
случайный процесс %(t)=%(t)+ir\(t) (см. гл. 15), который определя-
определяется двумя действительными случайными процессами l(t) и т]@>
представляющими его действительную и мнимую части. Распре-
Распределение л-го порядка ?(/) задается 2л-мерным совместным рас-
распределением l(t) и r\{t). Среднее значение, дисперсия и корреля-
корреляционная функция комплексного процесса определяются по фор-
формулам
D.23)
№ @ " 1*1 { I
9 t2)}. D.25)
4.2. КЛАССИФИКАЦИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ
ПО ИХ ВЕРОЯТНОСТНЫМ ХАРАКТЕРИСТИКАМ
4.2.1. Предварительное замечание. В п. 4.1.2 случайные про-
процессы классифицировались в зависимости от вида области опре-
определения процесса и пространства его значений. После введения
вероятностного описания случайных процессов можно дать их
классификацию с учетом тех или иных ограничений, которые
предъявляются к вероятностным характеристикам случайных
процессов.
4.2.2. Стационарные случайные процессы. Случайный процесс
l(t) называется стационарным (в узком смысле), если для произ-
произвольной последовательности fb..., tny для любого значения U и
для любого целого числа п^\ функция распределения л-го по-
порядка процесса удовлетворяет тождеству
^п(*Ь... , Хп, <ь ... , tn) ='f n (*U — , Хп, ?l + *0, ... , tn+to).
D.26)
Иными словами, случайный процесс стационарен в узком смысле
тогда и только тогда, когда функции распределения любого по-
порядка не зависят от начала отсчета времени, т. е. когда любые
вероятностные характеристики инвариантны относительно сдвига
переменной t.
Условие стационарности D.26) в узком смысле практически
трудно проверить для произвольного случайного процесса. Однако
можно сформулировать ряд необходимых (но не достаточных)
условий стационарности в узком смысле. Значение этих усло-
условий состоит в том, что если хотя бы одно из них не выполняется,
то можно утверждать, что исследуемый процесс — нестационарный.
Полагая в D.26) п=\, получаем одно из необходимых усло-
условий стационарности
Fi(x, t)=Fl(x, t+to)^Fi(x), D.27)
т. е. для стационарности процесса необходимо, чтобы его одномер-
89
ная функция распределения не зависела от времени. Из D.27)
следует, что необходимыми условиями стационарности являются
также независимость от времени одномерных плотности W\ (x)
и характеристической функции 6i (v) процесса, а следовательно,
и моментных функций mi{lk(t)}=mk. В частности, самыми про-
простыми необходимыми условиями стационарности являются посто-
постоянство среднего значения ai(t)=ai и дисперсии \i2i(t)=\X2i
процесса.
Полагая в D.26) п=2 и to =—tu получаем еще одно необхо-
необходимое условие стационарности
F2{xu х2, ti, t2)=F2(xu x2f U—U). D.28)
т. е. для стационарности процесса необходимо, чтобы его двумер-
двумерная функция распределения зависела не от двух моментов вре-
времени, а только от их разности. Из D.28) следует, что необходи-
необходимыми условиями стационарности являются также зависимости
только от разности двух моментов времени двумерных плотности
вероятности w2{xu х2, t2—t{) и характеристической функции
62(^1, t>2, t2—ti), а следовательно, и корреляционной функции
оо оо
&1 (т) == J j хгх2ы) (хъ х2У т) dx± dx2, т = t2 — t±. D.29)
—00 — 00
4.2.3. Пример стационарного в узком смысле случайного про-
процесса. Рассмотрим случайный процесс ?>(t), представляющий гар-
гармоническое колебание, у которого амплитуда и частота постоян-
постоянные, а фаза — случайная величина:
?@=4osin((DoH-<p). D.30)
Покажем, что необходимым и достаточным условием стационар-
стационарности в узком смысле является равномерное распределение фазы
щ (О) = 1/2я, 0 < * < 2я. D.30а)
Ясно, что любая конечномерная функция распределения процесса
D.30) полностью определяется распределением случайной фазы
я, следовательно, для доказательства инвариантности функции
распределения процесса относительно сдвига переменной t необ-
необходимо и достаточно доказать указанную инвариантность для
распределения случайной фазы.
Пусть U = t—U. Тогда из D.30) следует
l(ti) =,4osin(cDo*i+cpi), ф1 = Ф+'&о, '&о=соо^о. D.31)
Плотность вероятности случайной фазы ф процесса %(t) и слу-
случайной фазы ф1 процесса l(ti) после временного сдвига изобра-
изображены сплошными линиями на рис. 4.3,а,б. Так как фазы, отли-
отличающиеся на 2я [см. интервалы @, Оо) и Bя, 2я+'&о)], не изме-
изменяют значений процесса, то при условии D.30а) ^фДФ) =и>ф (О),
т. е. равномерная плотность вероятности фазы инвариантна сдви-
сдвигу процесса во времени (штриховая линия на рис. 4.3,6). Но при
неравномерном распределении фазы случайный процесс D.30)
90
2тс
1/*
Z7t
6)
Рис. 4.3. Плотность вероятности фазы, инвариантная (а, б) и неинвариантная
(в, г) сдвигу
перестает быть стационарным, как это иллюстрируют рис. 4.3,в,г
(плотность, изображенная штриховой линией на рис. 4.3,г не сов-
совпадает с исходной плотностью, изображенной на рис. 4.3,в).
Заметим, что при равномерном распределении случайной фазы
процесс D.30) сохраняет свойство стационарности в узком смыс-
смысле и тогда, когда амплитуда А становится случайной величиной,
не зависящей от времени, так как в этом случае инвариантность
функций распределения процесса относительно сдвига определя-
определяется инвариантностью к сдвигу только распределения фазы.
4.2.4. Стационарность в широком смысле. Случайный процесс
называется стационарным в широком смысле, если его среднее
значение не зависит от времени: tfii{?(/)}=ag, а его корреляци-
корреляционная функция зависит только от разности моментов времени:
ml{l{t)i{t+i:)} = Bi(x). Ясно, что D.27) и D.28) являются не
только необходимыми, но и достаточными условиями стационар-
стационарности случайного процесса в широком смысле. Случайные про-
процессы, стационарные в узком смысле, стационарны, конечно, и в
широком смысле, но обратное, вообще говоря, неверно.
4.2.5. Эргодические случайные процессы. Стационарный в уз-
узком смысле случайный процесс называется эргодическим, если
любая его вероятностная характеристика, полученная усреднени-
усреднением по множеству реализаций, с вероятностью, сколь угодно
близкой к единице, равна временному среднему, полученному ус-
усреднением за достаточно большой промежуток времени из един-
единственной реализации случайного процесса. Из эквивалентности
двух способов усреднения по множеству и по времени следует,
что для определения вероятностных характеристик эргодического
случайного процесса нет необходимости изучать совокупность ре-
91
ализаций, которыми исследователь, как правило, не располагает,
а достаточно одной реализации, наблюдаемой в течение длитель-
длительного промежутка времени.
Рассмотрим некоторую реализацию lw(t) случайного процес-
процесса на интервале времени (--Г, Т). За период 2Г суммарное вре-
время пребывания реализации ниже порога х (рис. 4.4)
где h(z) — функция единичного скачка [см. B.7)]. Предел
imт<*> (x)lBT) «lim~- f и[х-?<*> (/)] Л D.32)
называется относительным временем пребывания реализации
?<*> (?) ниже порога х.
Для эргодического процесса относительное время пребывания
реализации не зависит от того, какая выбрана реализация, и сов-
совпадает с одномерной функцией распределения стационарного слу-
случайного процесса
рх {х) внш JL $и[x-iw (*)] Л. D-33)
Дифференцируя обе части D.33) по х и учитывая B.17), на-
находим
1 т
wx (x) = lim
Из D.34) следует
D.34)
т"
92
Puc. 4.4. Реализация слу-
случайного процесса
Обозначая символом < > усреднение по времени, получаем соот-
соотношение
D.35)
которое устанавливает равенство между моментом /г-го порядка
эргодического процесса и усреднением по времени я-й степени
произвольно выбранной реализации этого процесса. В частности,
величину <?*|(/)> можно трактовать как постоянную составляю-
щую реализации, которая в соответствии с D.35) равна среднему
значению эргодического процесса:
flS-mxffWJ^^W). D.36)
Если lih)it) представляет изменение напряжения или тока на наг-
нагрузке 1 Ом, то <[?(fe)@]2> равен средней мощности (квадрату
эффективного значения) реализации. Тогда в соответствии с
D.35)
m2=ml {g2 @ } = < [?<*> (t) ] 2>, D.37)
т. е. средний квадрат эргодического случайного процесса равен
средней мощности любой его реализации.
Соотношения D.33) и D.34) обобщаются очевидным образом
на двумерную функцию распределения и двумерную плотность
{ufalWWulXlWit + ftdt, D.38)
2.1 j>
w2 (xv x» т) = lim -1- ] б [xt - IW (t)] б [x, -1(« (t +1)] At. D.39)
Из D.39) следует
(т) = <?(*) @ ?<*> (/ + t)> = lim JL [ gW (t) g(*> (/ + т) tf, D.40)
7 2У ^
т. е. корреляционная функция эргодического случайного процес-
процесса равна временной корреляционной функции любой его реали-
реализации.
В наиболее общем виде свойство эргодичности случайного про-
процесса выражается соотношениями
Mx^T?) = lim~^ { nu[xf-^r(t + Tt)]dt, т1==0, D.41)
wn (x?f т;) = lim -L f П 6 [xt - IW (t + t,)] Л, т2 = 0, D.42)
mn (x2, .„, tn) = <g(«[@ ?<ft» (< + x,)... S(« (< + тп)>. D.43)
Стационарный процесс называется эргодическим в широком
смысле, если среднее значение процесса совпадает с постоянной
составляющей его реализации, а корреляционная функция — с
временной корреляционной функцией реализации.
93
4.2.6. Условия эргодичности. Необходимым и достаточным ус-
условием эргодичности стационарного случайного процесса являет-
является так называемая метрическая транзитивность процесса. Стаци-
Стационарный случайный процесс метрически транзитивен, если любая
часть совокупности реализаций процесса, вероятностная мера ко-
которой меньше единицы, уже не является стационарной. Если же
указанная часть реализации процесса сохраняет свойство стаци-
стационарности, то процесс не является метрически транзитивным и,
следовательно, эргодическим. Образно выражаясь, можно охарак-
охарактеризовать метрическую транзитивность как «ортодоксальный
коллективизм» совокупности реализаций, которая теряет стаци-
стационарность вместе с потерей части «членов коллектива».
4.2.7. Пример эргодического случайного процесса. Рассмотрим
снова гармоническое колебание D.30), у которого амплитуда и
частота постоянные, а фаза — случайная величина, распределен-
распределенная равномерно на интервале @, 2я). Как было показано в п.
4.2.3, это колебание представляет стационарный в узком смысле
случайный процесс.
Рассмотрим часть совокупности реализаций процесса D.30),
определяемую неравенством 0<ф^4я/3 (рис. 4.4,а). Ясно, что
Р@<ф'<—)=— -— = — <1.
I 3 J 2я 3 3
Заменяя переменную U=t—/о и полагая Фо=соо^о = я, получаем
для указанной части совокупности реализаций смещенную плот-
плотность, изображенную на рис. 4.5,а штриховой линией. Вследствие
неразличимости двух значений фаз, отличающихся на 2я, ука-
указанная смещенная плотность приобретает вид, изображенный на
рис. 4.5,6, который существенно отличается от исходной плотно-
плотности (рис. 4.5,а, сплошная линия). Это означает, что для указан-
указанной части совокупности реализаций процесса D.30) хю^(Ь)Ф
Фг0я>1 (Ф), т. е. свойство стационарности нарушено и, следова-
следовательно, рассматриваемый стационар-
стационарный случайный процесс эргодический.
Однако не каждый стационарный
случайный процесс эргодический. В ка-
качестве примера рассмотрим гармониче-
гармоническое колебание D.30) с постоянной ча-
_^ стотой о)о, случайной фазой ф, равно-
равного мерно распределенной на интервале
@, 2я), и независимой от фазы случай-
случайной амплитудой Л, распределенной по
рэлеевскому закону. Как отмечалось
в п. 4.2.3, такое колебание сохраняет
свойство строгой стационарности.
Пусть часть совокупности реализаций
№*)
i 1
о
а)
1/B ft)
2Я
Рис. 4.5. Эргодическое гармоническое колеба-
колебание со случайной фазой
94
этого стационарного случайного процесса определяется неравенст-
неравенствами О^Л^го,5, 0^ф^2я, где го,5 — медиана рэлеевского распре-
распределения. Ясно, что Р{О^Л^го,5, 0^ф^2я}=0,5.
Но так как инвариантность функций распределения рассма-
рассматриваемого процесса относительно сдвига времени определяется
инвариантностью к сдвигу только распределения фазы, то стаци-
стационарность сохраняется и для указанной части совокупности ре-
реализаций (с вероятностной мерой, равной 0,5). Следовательно,
гармоническое колебание со случайной амплитудой и равномер-
равномерно распределенной фазой служит примером стационарного, но не
эргодического случайного процесса. Нетрудно убедиться, что для
этого процесса среднее по времени квадрата случайного процесса
зависит от выбора реализации и принимает различные значения
для» двух реализаций. Например, если усредняются по времени
следующие две реализации: l{i)(t) =sinoH^ и |B)@ =2 sincW,
^)@]21/2[^2)()]2 2
@][^()]>
4.2.8. Случайные процессы, удовлетворяющие условию сильно-
сильного перемешивания. Стационарный в узком смысле случайный про-
процесс ? (/) удовлетворяет условию сильного перемешивания, если
при т-^сх)
а(т)= sup |Р{ЛП?}-Р{Л}Р{В}|->0, D.44)
?де порожденные случайным процессом l(t) сигма-алгебры М'_оо
и M°°t+%9 т>0, интерпретируются как прошлое {?(s), s<Ct} и бу-
будущее {i(s), s^t-\-x} процесса l(t).
Функция а (г), называемая коэффициентом сильного переме-
перемешивания,— числовая мера зависимости будущего процесса от его
прошлого. Случайные процессы, удовлетворяющие условию силь-
сильного перемешивания, являются эргодическими.
Если при
Ф(т)= sup |РМПВ>-рм>Р{в>|^0> D-44а)
—оо' t-\-X
то стационарный в узком смысле случайный процесс удовлетво-
удовлетворяет условию равномерно сильного перемешивания. Процесс, удо-
удовлетворяющий условию D.44а) равномерно сильного перемеши-
перемешивания, удовлетворяет и условию D.44) сильного перемешивания.
Если а(т)^0 при т>Г, то случайный процесс с сильным пе-
перемешиванием называют Г-зависимым. В этом случае два значе-
значения процесса ?(^i), ?(^i+t) независимы, если |т|>7\
4.2.9. Стационарно связанные и совместно эргодические слу-
случайные процессы. Понятия стационарности и эргодичности мож-
можно распространить на совокупности случайных процессов (век-
(векторные случайные процессы).
Случайные процессы gi (/),..., gn@ образуют совокупность
стационарно связанных (в узком смысле) процессов, если их сов-
совместные функции распределения не зависят от выбора начала от-
95
счета времени. Два стационарных случайных процесса ?,(t) и
r\(t) стационарно связаны (в широком смысле), если взаимная
корреляционная функция зависит только от временного сдвига
[см. D.22)]
Bhi W = Дч8 (- т) = тг {I (t) t) (t + т)}. D,46)
Стационарно связанные случайные процессы совместно эрго-
дические, если любая их совместная вероятностная характерис-
характеристика совпадает с соответствующей характеристикой, полученной
усреднением по времени функции от любого набора реализаций
процессов (по однбй от каждого процесса).
Два эргодических случайных процесса l(t) и r\(t) совместно
эргодические в широком смысле, если
iW*)e <Е(» @ Т1(г) (' + *)> =
= lim -5- h{k) W Г\{г) (t + x) dt. D.46)
4.2.10. Случайные процессы со стационарными приращениями.
Случайный процесс \(t) называют процессом со стационарными
приращениями, когда при любом фиксированном т Д? (t) =
= l{t)—%{t—t) представляет стационарный случайный процесс.
Очевидно, что любой стационарный процесс является случайным
со стационарными приращениями, но не наоборот. Например,
сумма стационарного случайного процесса и нестационарного про-
процесса вида go+Ы» гДе ёо и gi — случайные величины, — нестаци-
нестационарный случайный процесс со стационарными приращениями.
Можно ввести более общее понятие случайного процесса ?(*)
со стационарными я-ми приращениями как процесса, для кото-
которого
представляет стационарный случайный процесс.
4.3. ЭНЕРГЕТИЧЕСКИЕ ХАРАКТЕРИСТИКИ
СЛУЧАЙНЫХ ПРОЦЕССОВ
4.3.1. Общие свойства корреляционной функции. Из определе-
определения D.16) следует, что корреляционная функция случайного про-
процесса ?(/) симметричная:
Рассмотрим среднее значение квадрата линейной комбина-
комбинации значений случайного процесса
^{ГД^ШТ}^, D.48)
96
где Яь..., Хп — произвольные действительные величины и п —
любое целое число. Заменяя квадрат суммы двойной суммой, ме-
меняя порядок суммирования и усреднения, получаем
2 2 ?s('i, *j)*i*i>0. D.49)
Условия D.47) и D.49) означают, что корреляционная функ-
функция представляет симметричное ядро положительно полуопреде-
полуопределенной квадратичной формы. Эти условия являются необходимы-
необходимыми и достаточными для того, чтобы функция двух переменных
была корреляционной функцией случайного процесса.
Если М — корреляционная матрица, элементы которой
М,,, = ад, t,)9 D.50)
то необходимым и достаточным условием положительной опреде-
определенности квадратичной формы является (см. [3])
det M>0. D.50а)
Из D.49), D.50) и D.50а) при л=2 следует
*,), D.51)
причем
@}>0 D.52J
— среднее значение квадрата случайного процесса l(t).
Если l(t) представляет изменение напряжения или тока на
нагрузке 1 Ом, то, как следует из D.52), размерностью корре-
корреляционной функции является мощность процесса. Поэтому кор-
корреляционную функцию называют энергетической характеристикой
случайного процесса.
Отметим, что эквивалентным приведенному ранее необходи-
необходимому и достаточному условию того, чтобы функция двух пере-
переменных была корреляционной функцией, является следующее ус-
условие: корреляционная функция должна быть симметричным яд-
ядром положительной полуопределенной интегральной формы
{ J B{(u, v) f (и) f (vYdu dv > 0 D.53)
для любого фиксированного значения Т и любой действительной
ею
функции f(t), интегрируемой с квадратом, т. е. J f2(t)dt<oo.
00
Корреляционная функция центрированного случайного про-
процесса l(t)—a\ (t)
Щ A5 (У - flfc (У1 \Ъ (У - Ч С,)]} = Ъ\ Pi, U) - ai (tx) ai (/2), D.54)
где а5 (/)—среднее значение g(/). Часто под корреляционной
функцией случайного процесса g(/) имеют в виду корреляционную
функцию D.54) центрированного процесса g(/)—a\(t).
4-87 97
Условия D.47), D.48) обобщаются на корреляционную функ-
функцию комплексного случайного процесса [см. D.25)]:
*Г), D.55а)
2 25е(<1. <i)Mi>0, D.556)
где черта сверху указывает на комплексно сопряженную величину.
Для того чтобы функция двух переменных Б|Л (tu t2) была
взаимной корреляционной функцией двух случайных процессов
Z(t) ит) (t), необходимо и достаточно, чтобы
2
*-! /«=1
+ Ялл(<*. 0)(*fM>0f D.56)
где 5ц (/г, ^), 5ЛТ1 (^, fj) — корреляционные функции процессов
g(f) и т](/) соответственно.
4.3.2. Ортогональное разложение корреляционной функции.
Представим корреляционную функцию случайного процесса l(t)
в виде ряда
5 @() D.57)
Функции фл@ образуют систему ортогональных нормированных
функций, т. е.
^ D.57а)
где dkj — символ Кронекера [см. B.79)].
Умножая обе части D.57) на ^тфт(у), интегрируя по у в пре-
пределах (—7, Т) и используя D.57а), найдем, что фЛ?(*) и Ль долж-
должны быть собственными функциями (решениями) и собственными
числами однородного линейного интегрального уравнения
{ D.58)
Умножая обе части D.58) на ф(/), интегрируя затем по t в пре-
пределах от —Т до Г и учитывая D.53), D.57а), убеждаемся, что
собственные числа Л*>0. Так как корреляционная функция
&Ъ (U у) положительно определенная, то совокупность собствен-
собственных функций полная. Это означает, что на интервале |^|^Т не
существует больше ни одной функции rp(f), которая была бы ор-
ортогональна всем фь(/).
Из D.57) при t=y находим выражение для среднего значения
квадрата случайного процесса ?,{t):
fl, 0. D.59)
•58
Интегрируя обе части D.59) по /, с учетом D.57а) получаем
2 J-- ГГВ,(<, t)dt. D.60)
Нетрудно показать, что в общем случае сумма обратных сте-
степеней собственных чисел
2-ТГ= [BW(u% u)du, D.61)
где В(пЦиу v) — л-кратная итерация корреляционной функции
(и, v) = Sg (u, v). D.62)
4.3.3. Корреляционная функция стационарного процесса. Для
стационарного в широком смысле случайного процесса |(?) сред-
среднее значение постоянно at(t)=at, а корреляционная функция
зависит только от сдвига т во времени:
В1A)штх$№(* + *)}- D.63)
Если функция Bi(x) непрерывна в начале координат, то
D.64)
Далее
lim Въ (т) - [тх {I (*)}]* - а\ D.65)
и, следовательно, дисперсия случайного процесса
Из симметрии корреляционной функции [см. D.47)] следует,
что корреляционная функция стационарного в широком смысле
случайного процесса является четной:
В|(т)-Я|(-т), D.67)
а нз D.51) следует
|56(т)|<В6@). D.68)
На рис. 4.6 построена типичная корреляционная функция ста-
стационарного (в широком смысле) случайного процесса. Следует
отметить, что приближение B\{i) к a2i при |т|-^оо не всегда
происходит монотонно, иногда значения корреляционной функции
колеблются около a2i, стремясь к этой величине при увеличе-
увеличении |т|.
Отношение
D.69)
99
для центрированного случайного процесса называют нормирован-
нормированной корреляционной функцией. Из приведенных формул следует
Яб(О) = 1, /?6(oo)=0f /?6(x)e/?8(-T), |/?в(т)|<1. D.70)
Нормированная корреляционная функция может принимать
нулевые значения и при конечном т. Однако равенство этой функ-
функции нулю еще не означает независимость двух значений случай-
случайного процесса в моменты времени t и t-\-%.
Для стационарного случайного процесса всегда можно ука-
указать такое то<т, при котором величины ?(/) и ?(/+г) для любо-
любого t можно считать практически некоррелированными в том смыс-
смысле, что при т>то абсолютное значение нормированной корреля-
корреляционной функции остается меньше заданного, например |-/?|(т) |<
<0,05. Величину то называют интервалом корреляции. Иногда
интервал корреляции то определяют следующим образом:
D.71)
4.3.4. Взаимная корреляционная функция стационарно связан-
связанных процессов. Взаимные корреляционные функции двух стаци-
стационарных и стационарно связанных в широком смысле случайных
процессов 5@ и л@> определенные согласно D.45), зависят толь-
только от сдвига т во времени. Вообще говоря, эти взаимные корре-
корреляционные функции Bin (т), Втгё (т) не являются четными (в от-
отличие от корреляционной функции стационарного случайного про-
процесса). Например, В^ {х)фВ%^ (—т). Но из D.22) следует
%,(t) = ^s(-t). D.72)
Нетрудно доказать, что
|55п(т)|2< 5| @M,@).
Отношение
D.73)
для центрированных случайных процессов l(t) и r\(t) называют
нормированной взаимной корреляционной функцией.
4.3.5. Спектральный анализ случайных процессов. При изуче-
изучении детерминированных процессов весьма успешно применяется
гармонической анализ: ряды Фу-
Фурье — для периодических процессов,
интеграл Фурье — для апериоди-
апериодических. Желательно было бы иметь
столь же простой и эффектив-
эффективный математический аппарат при
изучении случайных процессов. Не-
Непосредственное приложение клас-
классического гармонического анализа
к случайным процессам невоз-
" Это следует из того, что
Рис.
4.6. Корреляционная
,5Е?'РН0ГО СЛУ"
100
реализация случайного процесса не удовлетворяет условию абсо-
абсолютной интегрируемости, т. е.
]=оо, D.74)
и, следовательно, «амплитудный» спектр такой реализации не су-
существует (неограничен) при любых частотах. Чтобы преодолеть
возникающее затруднение, в качестве спектральной характерис-
характеристики случайного процесса была введена спектральная плотность
мощности.
Рассмотрим реализацию l{k){t) случайного процесса ?(/).
Пусть ?(fe)r@—усеченная реализация, равная нулю вне интер-
интервала |/|^Г/2 и совпадающая с l{h)(t) внутри этого интервала.
Спектр (преобразование Фурье) финитной функции ?(Л)т@
Т/2
Z{Tk)(a>)= ] HTk)(t)exp(-i(dt)dt. D.75)
-Т/2
Из D.75) следует, что при Т-+оо спектр Z<feV(co) неограничен на
любой частоте со.
Если ?(ft)r@ —напряжение или ток на нагрузке 1 Ом, то сред-
средняя мощность на частоте со, отнесенная к полосе Д/= 1/71, т. е.
спектральная плотность мощности усеченной реализации,
= 4 Г T^HtiWPi^expi^icoit^t^dt.dt,. D.76)
1 —Т/2—Т/2
При Г-^оо случайная величина Gt(g)) (на множестве реали-
реализаций) не стремится, вообще говоря, к определенному пределу (в
[60, п. 3.5.5] показано, что дисперсия этой величины при Г->оо
остается конечной на любой частоте со). Поэтому в качестве спек-
спектральной характеристики принимают предел при Г->оо среднего
значения спектральной плотности мощности усеченной реализа-
реализации
S6 (со) = lim тг {GL*> (со)} = \im—m1 {|Z<*>(co)|2}. D.77)
Г-*оо Г->оо Т
Функцию 5g(co) называют спектральной плотностью средней
мощности случайного процесса ?(<). Эту функцию для краткости
иногда будем называть спектром.
4.3.6. Теорема Хинчина — Винера. Из D.76) следует, что сред-
среднее по множеству реализаций случайной величины GT(to)
0 Т/2 Т/2
ST @) ~ mt {GT (со)} = -L J J mx {I (tj I (Q) X
1 -T/2-T/2
X exp [ — i со (tx —12)] dt± dt2.
101
Вводя корреляционную функцию В* (tu U) процесса \(t) мож-
можно ST (ко) представить в виде
ST (со) - —
T
F ]\ (tl9 t
r/2-772
t2) exp [ - i ш (tt- U)] dtx dt2.
Предположим, что случайный процесс %(t) стационарный (по
крайней мере, в широком смысле). Тогда Bi (h, *2)=5*t(*a—Ц
и, следовательно,
Т -г/2-Г/2
Разбивая в D.78) область интегрирования по tu U на две вдоль
диагонали квадрата и вводя переменные %=t\—t2, U для области
над диагональю (т>0) и %=U—U, —U для области под диаго-
диагональю (т<0), получаем (рис. 4.7)
у у/2
(Г/2)
т Lo х-
О +(Г
О Т+(Г/2)
f
или
Т/2
-г
Рис. 4.7. Область интегриро-
интегрирования
102
г. D.79)
Из D.79) при Г-^оо следует
Sg (со) = lim ST (со) = 2 jB6 (т) ехр (- i ют) d%
D.80)
при условии, что корреляционная функ-
функция абсолютно интегрируема, т. е. что
о. D.80а)
Для того чтобы выполнялось условие
D.80а) необходимо, чтобы процесс ?(/)'
был центрирован.
Формула D.80) означает, что спек-
спектральная плотность мощности стационар-
ного в широком смысле случайного процесса получается преобра-
преобразованием Фурье корреляционной функции этого процесса. Отсюда
следует также, что корреляционная функция получается обратным
преобразованием Фурье спектральной плотности стационарного в
широком смысле случайного процесса.
± JS6(co)exp(icoT)dco. D.81)
"— ОО
Формулы D.80) и D.81) являются аналитическим представ-
представлением теоремы Хинчина — Винера: корреляционная функция и
спектральная плотность мощности стационарного в широком смы-
смысле случайного процесса являются парой преобразований Фурье
[П. 12].
ОО
Замечая, что jS§ (x)sincoT/dT=0 ввиду четности корреляци-
ОО
онной функции, перепишем D.80) в тригонометрической форме
(со) = 4jBg (т) cos сот dx. D.82)
Из D.77) и D.82) следует, что спектральная плотность мощности
является неотрицательной, непрерывной, четной функцией часто-
частоты, причем имеется в виду четность (симметрия) относительно
нулевой частоты, т. е. 5g(co)=5g(—со). Используя свойства чет-
четности функции S* ), перепишем также и D.81) в тригономет-
тригонометрической форме
Bfi (т) = — lSi (со) cos сот d со. D.83)
2л 0
Из D.83) при т=0 находим, что средняя мощность стационар-
стационарного в широком смысле случайного процесса
D.84)
а спектральная плотность мощности при со = 0 [см. D.80)]
В,@) = 2 ]вг(х)Aт D.85)
равна удвоенной площади, ограниченной корреляционной функ-
функцией.
4.3.7. Соотношение неопределенности. Корреляционная функция Б| (т) и
энергетический спектр S|(<o) стационарного в широком смысле случайного
процесса как пара преобразований Фурье обладают всеми присущими этому
преобразованию свойствами. В частности, чем «шире» апектр Sg (о), тем «уже»
корреляционная функция В^ (т) и наоборот.
103
Площадь, ограниченную кривой спектра, отнесенную к спектральной плот-
плотности на некоторой характерной частоте, называют шириной полосы спектра
Эту вел1ич!ину можно трактовать как ширину равномерного в полосе спектра
процесса, эквивалентного данному по средней мощности.
Если S^(O)>5g (со), со>0, то величину Ас определяют из D.86) при
соо=0:
Согласно D.71) интервал корреляции стационарного в широком смысле
центрированного случайного процесса при Б^(т)>0 [см. также D.85)]
В. (т) dx i S? @)
Б§@) " 4 ?s@) '
Из D.87) и D.88) следует
т0Дс = 1/4г D.89)
т. е. произведение интервала корреляции на ширину полосы спектра — посто-
постоянная величина. Формулу D.89) можно назвать соотношением неопределеннос-
неопределенности (по аналогии с известным соотношением в квантовой механике). Она полу-
получена при условии, что корреляционная функция неотрицательна и S\ @)#0,
Можно снять эти ограничения, если определ.ить эффективный интервал корре-
корреляции и эффективную ширину полосы спектра как «радиусы инерции» квад-
квадратов соответствующих функций:
i\ = J х2 В\ (т) dx I \ В\ (т) dxt D.90)
Дс= ja>a5|(co)dco / jS|(co)d(u. D.91)
Для величин t0 и Ас, определенных из D.90) и D.91), соотношение не-
неопределенности записывается в виде
ТоДс>1/2. D.92,)
4.3.8. Взаимная спектральная плотность. Аналогично изложен-
изложенному в п. 4.3.5, рассматривая усеченные реализации |(Л)г@ и
r\(h)T{t) случайных процессов l(t) n r\{t) и вводя преобразования
Фурье Z^(o)) и Ztt\ (©) этих усеченных реализаций, можно оп-
определить взаимную спектральную плотность случайных процессов
t % ИЩЙ) D.93)
где черта сверху указывает на комплексно-сопряженную вели-
величину.
Применяя с небольшими изменениями метод, использованный
при выводе соотношения D.80), можно установить связь между
104
взаимной спектральной плотностью и взаимной корреляционной
функцией стационарных и стационарно связанных (в широком
смысле) случайных процессов:
S^ (со) = 2 ]В^ (т) ехр (- i со т) А т, D.94)
—оо
^ ^ D.95)
Таким образом, взаимная спектральная плотность и взаимная
корреляционная функция представляют пару преобразований
Фурье. Необходимо отметить, что в отличие от спектральной
плотности мощности стационарного случайного процесса, который
является действительной четной функцией частоты, взаимная
спектральная плотность двух процессов — комплексная, так как
функция В^ (т) не является, как отмечалось, четной.
Представляя взаимную спектральную плотность в виде
Sin(co) = [/^ (co)+iViTi(o)), получим Uir\ (со) = Uix\ (—со), l/in(co) =
=—Vir\ (—со), т. е. действительная часть функции S^ (со) —чет-
—четная, а мнимая — нечетная. Тогда из D.95)
В|Т1 (т) = — J ?/|т1 (со) cos сот d со — J Vtn (со) sin сот d со. D.96)
Из D.72) следует, что взаимные спектры S^ (со) и S^% (со) яв-
являются комплексно-сопряженными величинами.
4.3.9. Энергетические характеристики суммы случайных про-
процессов. Рассмотрим сумму стационарных и стационарно связан-
связанных случайных процессов
t{t)=hr(t). D.97)
Из D.97) непосредственно следует формула для корреляцион-
корреляционной функции процесса ?@
М W
г=\ 1=\ /=1
Преобразованием Фурье от обеих частей D.98) получаем спект-
спектральную плотность мощности суммы зависимых случайных про-
процессов
Si И = 2 \ (со) + 2 2 Sh i, (со). D.99)
Если суммируемые случайные процессы некоррелированы меж-
между собой, то корреляционная функция суммы равна сумме корре-
корреляционных функций слагаемых, а спектральная плотность мощ-
мощности— сумме спектральных мощностей слагаемых.
105
4.3.10. Спектральная плотность мощности нестационарного случайного про-
процесса. Рассмотрим текущий спектр усеченной реализации нестационарного слу-
случайного процесса %(t):
t
-Г/2
D.100)
Среднее mo множеству реализаций мощности процесса ?(/) на частоте со
на интервале времени (—Г/2, t)
I -Г/2 -Г/2
ХБ(Г*> С*) ехр { - i со <ft - t2)} dtt dtA =
t i
= f I BT(tit t2) exp { - i со (tt -1$ dtt di2
-f/2 -Г/2
BT(tit /a)=
Заменяя переменную интегрирования t=/i—U и (разбивая область интегри-
интегрирования на две, получаем
t ti+T/2
j I 5Г
-Г/2 О
/ 0
+ j f
-Г/2 -Л2-Г/2
t tt+T/2
Xexp( - iсот)didt%= [ J [BT (tl9 tx - т)Х
-r/i о
Xexp ( — i cot) + BT (/x — т, /x) exp (i сот)] dx dt19
« так как ?г(/ь W=Br{/2» ^i), то
it tt+T/2
Щ {| Z(j?> (со, 012} = 2 f f Br (tt, /j - т) cos сот dx dtt. D.101}
-Г/2 0
Определим мгновенную спектральную плотность мощности нестационарного
анучайного опсроцесса согласно равенству
Ф$ (со, 0 = Игл Фт (со, 0» D.102)
Г—>оо
где
фг (со, 0 = 2 -|- щ {| Z(/) (со, 0|2} • 4.103)
106
Дифференцируя обе части D.101) по t, находим
t+T/2
Фт (со, t) = 4 J BT{tt t — т) cos сот (to,
о
откуда, переходя к пределу при Г->оо, получаем
t+T/2
<Dg (со, /) = 4 lim f BT (t, t — т) cos сот di =
оо
g(^ ^ —T)coscoTdT, D.104)
1 °°
t t — т) = —— J Ф| (со, 0 cos сот Жо, D.105)
где В | (/i, ^2) — корреляционная функция нестациона|р1ного случайного процес-
процесса W).
Следовательно, мгновенная спектральная плотность мощности и корреля-
корреляционная функция нестационарного случайного процесса являются парой преоб-
преобразований Фурье по переменным со и т. Формулы DЛ04) и D.105) представ-
представляют обобщение теоремы Хинчина — Винера иа нестационарные случайные
процессы.
Из Dj105) следует
-^- j<I)s(G), 0<*<о = Я6(г, О-
zn 0
Введем среднее по времени
1 V2
= — f Фг(со, t)dt. D.106)
1 -Г/2
Г/2
Подставляя D.103) в D.106) находим
Так как согласно D.100) Z(*)t(cd, —Г/2)=0, a Z(fc)T(co, Г/2) =Z(ft)T(co) [см.
D.75)], то
где _ I ^Ш (со)!2, как было 'указаню в п. 4.3.5, — средняя (мощность про-
процесса на частоте со, отнесенная к полосе частот Aco = il/7.
В аоответств'ии с общим определением D.80) спектральной плотности мощ-
'Ноети случайного процесса для нестационарного случайного процесса получаем
2 1 т/2
= lim — m1 {|zy>>(©)|2}=llm — J Фг (со, t)dt. D.107)
Т>оо i T->oo 1 у/2
107
lim m1 {|zy>(©)|}=llm J
Т—>оо i T->oo 1 — у/2
Из D.104) и D.106) следует также, что спектральная плотность мощности
нестационарного 'случайного процесса связана с усредненной по времени кор-
корреляционной функцией этого процесса преобразованием Фурье:
! t+T/2
Вт (tt t — т) cos wcdxdt =
(со) = liml —' \ \
Г-»оо Т _f/2 ft
00
D.108)
Т/2
J
Вт (/, t-T)dt. D.109)
4.4. КЛАССИФИКАЦИЯ СТАЦИОНАРНЫХ
В ШИРОКОМ СМЫСЛЕ ПРОЦЕССОВ
ПО ИХ СПЕКТРАЛЬНОЙ ПЛОТНОСТИ МОЩНОСТИ
4.4.1. Узкополосные процессы. Стационарный в широком смы-
смысле случайный процесс называется узкополосным, если его спект-
спектральная плотность мощности сосредоточена в относительно узкой
полосе частот около некоторой фиксированной частоты юо {рис.
4.8). Если Дс — ширина полосы спектра, то условие узкополосно-
сти представляется неравенством
Ас<0О. D.110);
Для того чтобы исследовать характерные особенности корре-
корреляционной функции узкополосного процесса, рассмотрим выра-
выражение D.83) и введем вместо переменной со новую переменную
интегрирования Q = co-^coo, равную расстройке текущей частоты
относительно некоторой фиксированной частоты со0:
Si (Q + 0О) cos (Q + о)о) dQ.
1 —©о
Обозначим через 5*i(Q)=Sg (Q+coo) спектр, полученный из
исходного спектра смещением в область нижних частот на вели-
ao(t)
0 со0 со
Рис. 4.к>. Узкополосный спектр
Рис. 4.9. Корреляционная
функция узкополосного слу-
случайного процесса
108
чину «о. Тогда выражение для корреляционной функции можно
переписать в виде
?6 (Т) = (J-. 7 si (Q) cos Qxdo] cosco0x +
Если теперь использовать условие D.110), то, пренебрегая ве-
личинами I S* (Q)dQ=0(Ac/co0), можно получить следующее
—оо
выражение корреляционной функции, характеризующее узкопо-
полосный случайный процесс:
В1 (х) = ас (т) cos ^от + ав (т) sin соо т = а0 (х) cos [соо х - г|H (х)], D.111)
где
?, D.112а)
as (х) = — 1st (Q) sin Qx dQ, D.1126)
2Я j«.6
(x)/ac(T)]. D.112b)
Так как спектр S*g (Q) низкочастотный, то функции ас(х), as(x),
а следовательно, и ^о(х), г()о(т) будут медленно меняющимися
функциями переменной х по сравнению с «высокочастотным за-
заполнением» COS (DoT.
Следовательно, корреляционная функция узкополосного слу-
случайного процесса, спектр.которого сосредоточен в узкой полосе
около частоты «о, представляет осциллирующую (с частотой юо)
функцию с медленно меняющейся огибающей (рис. 4.9). Если та-
такой спектр считать симметричным относительно центральной час-
частоты соо: S*z (?2)=5g(o)o+tQ)=5g(oH—?2)=S*g (—Q), то из
D.1126) следует as(x)s==0 и тогда
^W = «oWcosco0x, D.113)
где
а0 (х) = -L j S* (Q) cos Qx du. D.11 За)
Здесь рассматривалась функция S\ (о) при со^О и предполо-
предположение о ее симметрии относительно некоторой частоты «о в прин-
принципе неправомерно, так как ее ветвь при со<Са>о ограничена (ш^,
^0), а при сй>о)о неограничена. Однако продолжение ветви в
область (—оо, 0) при условии D.110) узкополосности дает погреш-
109
ность того же порядка, какая была принята допустимой при вы-
выводе формулы D.111).
Интервал корреляции узкополосного процесса можно опреде-
определить по формуле [ср. D.71)]
00
1
.i На)
Ширина полосы узкополосного спектра [см. D.86)]
5* @)
4.4.2. Белый шум. Рассмотрим теперь предельно широкополос-
широкополосный случайный процесс, спектральная плотность мощности кото-
которого сохраняет постоянное значение 2N0 на всех частотах
Si((d) = 2N0, — оо<ю<оо. D.115)
Стационарный в широком смысле случайный процесс, имеющий
равномерный на всех частотах спектр, называют белым шумом1.
Корреляционная функция белого шума
Bg (т) = -^ Jexp (i сот) d со = 7V0 б (т), D.116)
т. е. представляет собой дельта-функцию в начале координат (см.
Приложение 1).
Таким образом, белый шум характеризуется тем, что «значе-
«значения» его в любые два, даже сколь угодно близкие, момента вре-
времени некоррелированы. Следует отметить, что понятие белого шу-
шума относится только к спектральной картине случайного процес-
процесса и оставляет совершенно открытым вопрос о законах распре-
распределения. Точнее говоря, распределения вероятностей белого шу-
шума в обычном смысле не существует (см. далее п. 5.3.9). Белый
шум является идеализацией (математической моделью), не реа-
реализуемой в действительных условиях, так как, во-первых, доста-
достаточно близкие значения случайного процесса практически всегда
зависимы и, во-вторых, реальные процессы имеют конечную мощ-
мощность, а полная мощность белого шума бесконечна.
Однако, как правило, рассматривают результат прохождения
белого шума через линейные системы (см. гл. 6) — так называ-
называемые линейные функционалы, распределения которых и опреде-
определяют в обобщенном смысле тонкую вероятностную структуру бе-
белого шума. Вследствие ограниченности полос пропускания радио-
радиотехнических устройств использование белого шума в качестве мо-
модели процессов на входе этих устройств, которая значительно
упрощает математический анализ, не вносит сколько-нибудь су-
существенных погрешностей.
1 По аналогии с белым светом, имеющим сплошной и приблизительно рав-
равномерный (однородный) спектр в пределах видимой его части.
ПО
4.4.3. Случайные процессы с дискретным спектром. Рассмот-
Рассмотрим случайный процесс
?(*)=? c°s aot+г) sin coo*, D.117J
где |, т] — случайные величины, не зависящие от /, а со0 — посто-
постоянная частота. В общем случае процесс D.117) нестационарный.
Для того чтобы он был стационарным, по крайней мере, в широ-
широком смысле, необходимо выполнение следующих условий. Сред-
Среднее значение процесса не должно зависеть от времени. Это усло-
условие выполняется, если случайные амплитуды g и ц центрирова-
центрированы, т. е. mi{l}=mi{r\}=0. Во вторых, корреляционная функция
процесса должна быть функцией одной переменной т. Поскольку
ТПх {? (t) t, {t+x) } = Mi {I2} COS CDo* COS GH (t+x
+m\ {r\2} sin ©of sin co0 {t+x) +m\ {lr\}sin со0 (
то корреляционная функция B^{x) не будет зависеть от перемен-
переменной t, если mi{g2} =mi{r]2}=a2/2 и если случайные величины ?
и г] некоррелированы, т. е. rai{gr]} = 0.
Пи выполнении указанных условий случайный процесс D.117),
представляющей гармоническое колебание со случайной амплиту-
амплитудой p=Yl2+t]2 и со случайной фазой cp=arctg(r]/?), будет ста-
стационарным в широком смысле, а его корреляционная функция
Bt (t)=:(a2/2)coscoorr. D.118)
Средний квадрат случайной амплитуды
Как видно из D.118), корреляционная функция колебания со
случайными амплитудой и фазой пропорциональна дисперсии ам-
амплитуды и не зависит от каких-либо вероятностных характеристик
фазы.
Заметим, что только при предположении о независимости ам-
амплитуды и фазы и равномерном распределении последней на ин-
интервале @, 2я) рассматриваемый процесс удовлетворяет условию
стационарности в узком смысле (см. п. 4.2.3).
Хотя интеграл от модуля корреляционной функции D.118) не-
неограничен, понятие спектральной плотности мощности можно рас-
распространить и на рассматриваемый случай, воспользовавшись
дальта-функцией (см. Приложение 1). Преобразование Фурье
корреляционной функции D.118)
Si (со) = яо2 [б (со + соо) + б (со — соо)]. D.119)
Этот спектр представляет собой две дискретные линии бесконеч-
бесконечной интенсивности на частотах —соо, <*>о
Рассмотрим теперь случайный процесс, который получается
сложением элементарных случайных процессов вида D.117) и по-
постоянной составляющей
С@ = а + 2 {lkcos(okt + r]ksincoft*). D.120)
111
Рис. 4.10. Дискретный
спектр
D ftcOj 0J Q)j со
Стационарность в широком смысле этого процесса имеет ме-
место при выполнении следующих условий:
mi{lkr\j} = 0 k, /=1, л,
При выполнении этих условий корреляционная функция про-
процесса D.120)
Bt(x)= S -^-cos<Dftx + a2. D.121)
k—l 2
Если cDfe=ft(Oo> то корреляционная функция периодическая с пе-
периодом 2я/@(ь но если частоты со& не кратны определенной часто-
частоте, то эта функция непериодическая (или почти периодическая,
как ее иногда называют).
Преобразование Фурье корреляционной функции D.121), т. е.
спектральная плотность мощности процесса D.120) (рис. 4.10)
S;(со) = а2б@) + я 2 of в;(а> + coft) + 6(co-coh)]. D.122)
Стационарные в широком смысле процессы, спектры которых
представляют последовательности спектральных линий (дельта-
функций), сосредоточенных на дискретных частотах, называют
процессами с дискретным спектром. Величины o2k дают распре-
распределение полной мощности по отдельным дискретным частотам ш,
а величина а2 — мощность постоянной составляющей.
4.5. ЛОКАЛЬНЫЕ СВОЙСТВА СЛУЧАЙНЫХ ПРОЦЕССОВ
4.5.1. Вероятностные характеристики разности двух значений
случайного процесса. Исследуем локальные свойства случайных
процессов — непрерывность и дифференцируемость. Так как по-
понятия непрерывности и дифференцируемости случайного процес-
процесса ^(t) связаны со сходимостью (по некоторому критерию, как от-
отмечалось в п. 3.4.1) последовательности случайных величин
Бт@=6СН-Г)— l(t) и lr(t)fT при 7-И), то необходимо предва-
предварительно найти некоторые вероятностные характеристики (сред-
(среднее, корреляционную функцию, спектральную плотность мощно-
мощности) разности 1т (t). Впрочем, эти характеристики могут иметь и
самостоятельные значения, так как процесс ?т@ соответствует
112
Рис. 4.11. Вычитающее устройство с
линией задержки
w
$r(t)
процессу на входе элементарного устройства, изображенного на
рис. 4.11, которое часто используется в технических системах.
Нетрудно доказать, что среднее и корреляционная функция
разности |т@
«1 Ит (t)} = щ {I (t + Т)} - щ {I (Q) = аъ (t + Т) - at (t), D.123)
BiT(h, к) = ЗД + 7\*2 + Т)-
- S6 (tlt tt + T)- % (h + T, t2) + Bt (tlt t2). D.124)
Из D.124) находим выражение для среднего квадрата процес-
процесса ?т @:
тЛЦ-({)}=В1ту, f) = Bt(t + T, t + T)-2Bt(t, t + T) + Bt(t, t).
D.125)
Взаимные корреляционные функции процессов |(^) и 1т(t):
fi«r('i. <i) = B8('i. t* + T)-Bl(tl, g, D.126a
Вътъ (<!, /,) = 5g (^ + Т, Q - Вг (tlt t2). D.1266)
Если l(t) стационарный в широком смысле случайный про-
процесс, то из D.123) —D.126) следует
щ{1тЦ)} = 0, D.127)
Вгт (т) = 2В5 (т) - Ве (т + Т) - Въ (т - Г), D.128)
55г @) = щ {5г @) = 2 [Ве @) - Ве (Г)], D.129)
56ЕГ (т) = Ве (т + Т) - Въ (т), D.130а
^rt(T) = ?|(T-r)-?s(T). D.1306)
Спектральная плотность мощности S%T (со) процесса ?т@ свя-
связана простым соотношением со спектральной плотностью мощно-
мощности Si {а) стационарного в широком смысле процесса l{t). Под-
Подставляя D.128) в D.80), получаем
S5r(o)) = 2 J?|(T){2exp(-i@T)-
—оо
-exp[-ico(x-T)]-exp[-i(l)(x + 71)]}dT =
= 4(l-coscoT) |55(T)exp(-icoT)dx
— оо
или
S57,(cd) = 4sin2 (©Г/2) S|((o). D.131)
113
В соответствии с D.94) и D.130а) взаимная спектральная
плотность %(t) и §г@
Sttr(©) = 2 JBttr(T)exp(-i©x)dx =
—00
= 2 J
= (exp (i со Т) — 1} 2 j 5S (т) ехр (- i сот) dr
— oo
или
SKr @) = (exp (i соТ) - 1) S6 (со). D.132)
Действительная и мнимая части этого спектра соответственно
U№t (со) = - 2S| (со) sin2 (©772), D.133а)
Уцт И =: si Иsin ® г- D-1336)
4.5.2. Непрерывный случайный процесс. Случайный процесс на-
называется непрерывным в момент времени t в среднеквадратичес-
ком\ если
Hmmx {К (/ + Г) - Е (О]2} = 0. D.134)
Т-+0
Случайный процесс, непрерывный при всех значениях t на не-
некотором интервале, называют непрерывным на этом интервале.
Из D.125) следует, что необходимым и достаточным условием
непрерывности случайного процесса в точке t в среднеквадрати-
ческом является непрерывность его корреляционной функции при
lim B60lf г2) = ад t)=m1{t2(t)}<°°. D.135)
Для стационарного в широком смысле случайного процесса
l() из D.129) следует, что необходимым и достаточным услови-
условием его непрерывности всюду (т. е. при любом t) в среднеквадра-
тическом является непрерывность корреляционной функции В|(т)
при т=0, иными словами, ограниченность средней мощности про-
процесса
В1 @) = — ]Si (со) dco <oo. D.136)
2я 0
Из условия D.136) следует, что спектральная плотность мощности
непрерывного случайного процесса должна убывать при
быстрее, чем ю~~A+е), 8>0.
1 Из непрерывности в среднеквадрэтическом следует непрерывность по ве-
вероятности (см. п. 3.4.1).
114
Докажем, что корреляционная функция В|(т) непрерывного
в среднеквадратическом случайного процесса непрерывна при лю-
любом значении аргумента т. Так как \Вь(т-\-Т)—Bi{i:)\ =
= \mi{l{t+r+T)l(t) - 6(М-тN(*)}| = \mi{[Ut)-ai][l(t+
T)(]}\ = |cov(Ef БгI<ЫБ@}МБг(*-И)}]|/8 и
lim|i2{Er(<+T)}=0, то Н|5(+Г) BOOl
r*o r>o
=0, что и доказывает приведенное выше утверждение. Отсюда
также следует, что для непрерывности корреляционной функции
стационарного в широком смысле случайного процесса при любом
т необходимо и достаточно, чтобы она была непрерывна в начале
координат т=01.
4.5.3. Производная случайного процесса. Случайный процесс
дифференцируем в точке t в среднеквадратическом2 если суще-
существует такая случайная функция |'(?), называемая производной в
среднеквадратическом процессе g (t) в точке t, что ^
- <4-137>
Из определения D.137) производной случайного процесса сле-
следует, что для формулировки условий дифференцируемости слу-
случайного процесса и расчета вероятностных характеристик его
производной необходимо исследовать предельные вероятностные
характеристики последовательности случайных величин {l/T)lT{t)
при Г-^О.
Дифференцируемость^в среднеквадратическом случайного про-
процесса l(t) обеспечивается непрерывностью в среднеквадратичес-
среднеквадратическом ее производной ?'(?)• Поэтому определим корреляционную
функцию производной
Bi>(tl9 «-Hm/ihttr (УБг (*,)/Г»} = Hm-L В1т{1ъ t2), D.138)
где 5|7(/i, f2) определяется согласно D.124). Разложим первые
три члена правой части D.124) в ряд Тейлора:
1 Для нестационарного процесса из непрерывности корреляционной функции
g(?i, t2) при ti = t2 = t следует ее непрерывность по любому из аргументов
t\ и t2.
2 Из дифференцируемости в среднеквадратическом следует дифференцируе-
мость по вероятности
при произвольном е>0.
115
, t2 + т) = вг(tlt tj+T^ + ^.^ + 0en),
Подставляя эти выражения в правую часть D.138) и учитывая,
что lim о(Г2)/Г2=0, получаем после перехода к пределу
Формула D.139) устанавливает связь между корреляционны-
корреляционными функциями случайного процесса и его производной. Из этой
формулы следует, что непрерывность второй смешанной произ-
производной корреляционной функции случайного процесса при fr=
= t2 = t является необходимым и достаточным условием его диф-
ференцируемости в среднеквадратическом. ,
Среднее значение производной случайного процесса
а*- @ = Щ. {?' @} = Нш тх {1Т (f)/T) = lim а6^ + Г)а?@ = ^
Т->0 Т^О Т s
т. е.
D.140)
Определим взаимную корреляционную функцию дифференци-
дифференцируемого в среднеквадратическом случайного процесса l(t) и его
производной |'@- Разлагая правую часть D.126а) в ряд Тейло-
Тейлора по переменной /2, получаем
r a i\ т дВ^1У ^д.п(Т\
BViT{ti> Ч)=1 щ Ьо(У),
откуда
(tl, t2)/T = д%{^ h) ,
1{UinB)}
D.141)
4.5.4. Корреляционные и спектральные характеристики произ-
производной стационарного в широком смысле процесса. Если случай-
случайный процесс стационарен (по крайней мере, в широком смысле),
то, разлагая правую часть D.128) в ряд Тейлора, получаем для
корреляционной функции Вь> (т) производной \'(t) следующее
выражение:
Вг (т) = lim В1т (т)/Г2 = lim [ - В\ (т) + о (Т)]
ИЛИ1
Вг(т)д-Д-(т). D.142)
1 D.142) следует также из D.139) при замене x=t2—ti и dtidtz = — (dtJ.
116
Из D.131) предельным переходом находим также спектраль-
спектральную плотность мощности производной
Sv (со) =* lim -i- sin2 — Si (со) = со2 Ss (со). D.143)
Формулу D.143) можно также получить из D.142), если ин-
интеграл D.83) продифференцировать дважды по параметру т.
Дисперсия (средняя мощность) производной
Bv @) = - В"ь @) = — J со2 Si (со) d©. D.144)
о
Так как при т = 0 корреляционная функция Bg (т) всегда до-
достигает максимума, то B'i @) =0 и В'\ @) <0.
Необходимым и достаточным условием дифференцируемости
в среднеквадратическом стационарного в широком смысле слу-
случайного процесса является конечная средняя мощность
Bi* @) производной. Это условие, как видно из D.144), означа-
оо
ет также, что интеграл j co2Sg (со)Ло<оо, т. е. спектральная
о
плотность мощности процесса, на высоких частотах должна убы-
бать быстрее, чем со.
Из D.140) следует, что среднее значение производной стацио-
стационарного в широком смысле случайного процесса равна нулю, т. е.
эта производная — всегда центрированный случайный процесс.
Отношение средних мощностей производной l'(t) и процесса
6@
0J = Bv@)/Bi (°) = - Щ @) = Jco2 Si (со) d со / jS6 (со) dco. D.145)
Для узкополосного процесса, спектр которого сосредоточен в
окрестности высокой частоты соо, из D.145) заменой Q = co—coo
получаем (см. п.4.4.1)
D.146а)
где S*g (Q) — исходный спектр, смещенный на соо в область ниж-
нижних частот. Если спектр симметричен относительно частоты соо, то
второе слагаемое в D.146а) обращается в нуль и тогда
Q. D.1466)
Второе слагаемое в D.1466) пропорционально квадрату ширины
полосы спектра процесса §(/).
117
Взаимная корреляционная функция стационарного в широком
смысле процесса и его производной (см. D.141) при т = ^2—U)
Вц* (т) = - Bvl (т) = В[ (т). D.147)
Из D.132) предельным переходом находим также взаимную
спектральную плотность процесса и его производной:
%' (©)= Hm % т (®IТ = Sg (со) lim [exp (i <о 71) - 1]/Т = i со Sg (со),
т. е.
Sgg' (о) = i со Sg (со). D.148)
Формулу D.148) можно получить иначе, дифференцируя ин-
интеграл D.83) по параметру %
, I °°
Bgg' (т) = 5. (^) = J со Sg (со) sin сот d ©. D.149)
2я 0
Тогда D.148) следует из D.95).
Заметим, что взаимный спектр процесса и его производной —
чисто мнимая величина. Соответственно этому их взаимная кор-
корреляционная функция — нечетная, т. е. Вц* (т)=—Вц» (—т).
При т=0 из D.149) следует
Вй'@)=5б(°) = 0- D.150)
Таким образом, взаимная корреляционная функция дифферен-
дифференцируемого стационарного в широком смысле случайного процесса
и его производной в совпадающие моменты времени всегда рав-
равна нулю, т. е. случайная функция и ее производная в совпадаю-
совпадающие моменты времени некоррелированы.
Заметим также, что производная ?'@ стационарного случай-
случайного процесса стационарна и стационарно связана с g(f).
4.5.5. Корреляционная функция и спектр высших производ-
производных. Если случайный процесс %'(t) дифференцируем в среднеква-
дратическом, то ?"(/) называется второй производной в средне-
квадратическом процессе g(f) в точке t. Аналогично можно оп-
определить производные более высокого порядка.
Для существования п-й производной ?(п)(/) необходимо и до-
достаточно, чтобы существовала непрерывная при ti = t2 = t смешан-
смешанная производная 2 п-то порядка от корреляционной функции про-
процесса l(t):
Корреляционная функция п-й производной стационарного в
широком смысле процесса
, D.152)
а ее спектральная плотность мощности
S6(n)(©) = (D2»S,(©). D.153)
118
В этом случае производная п-го порядка процесса существу-
существует, если 2 п-я производная его корреляционной функции непре-
непрерывна при т=0 или (что эквивалентно) спектр на высоких час-
частотах убывает быстрее, чем со~Bп+1>.
Нетрудно показать, что взаимная корреляционная функция
k-й и 1-й производных процесса в общем случае
к) , D.154)
^ 1 ^2
а для стационарных в широком смысле процессов
). D.155)
4.5.6. Ортогональное разложение центрированного случайного
процесса. Рассмотрим непрерывный в среднеквадратическом
смысле случайный процесс !¦(/) с нулевым средним и корреляци-
корреляционной функцией В$ (/, у). Введем в качестве координат случай-
случайного процесса случайные величины (интеграл в среднеквадрати-
среднеквадратическом *)
] D.156)
где <$k{t), Xk>0 — собственные функции и собственные числа ин-
интегрального уравнения [см. D.58)],
, y)ip(y)dy>' \*\<T. D.157)
Х Ij
Эти случайные величины имеют, очевидно, нулевые средние.
Кроме того, они попарно некоррелированы и имеют одинаковые,
равные единице, дисперсии (см. п. 4.3.2), что следует из орто-
нормированности собственных функций интегрального уравнения
D.157):
Покажем теперь, что при любом t9 принадлежащем интерва-
интервалу (—Г, Т), справедливо (в среднеквадратическом смысле) сле-
следующее равенство:
/5=1
DЛ58)
1 Это означает, что последовательность \kn=~]/~hi S \(ti)^h(U) (U—ti-%)
сходится в среднеквадратическом к |&, когда п-*-оо и max (it—/;-i)-*0 (подроб-
(подробнее см. гл. 5).
119
Рассмотрим последовательность случайных процессов
и определим величины
2ф*@ JH
NT N
= 2 чы (О
2-
«**» "tfcl к ЛЛ ЛГО «=1 Aft
Используя полученные выражения, находим
mi {? @"~ ?w @12} = В% (t, t) — 2 — . D.159)
Но из D.59) следует, что при iV->oo правая часть D.159) стре-
стремится к нулю, т. е. последовательность |iv@ сходится в средне-
квадратическом к случайному процессу ?(*)•
Разложение D.158) центрированного случайного процесса в
ортогональном детерминированном базисе со случайными центри-
центрированными, попарно некоррелированными коэффициентами (ко-
(координатами) называют ортогональным (или разложением Кару-
нена — Лоева).
Отметим, что можно получить разложение случайного процес-
процесса по произвольной совокупности ортогональных детерминирован-
детерминированных функций, но при этом координаты процесса будут, вообще
говоря коррелированы. Только при специальном выборе базиса,
согласованного с корреляционными свойствами процесса [см.
D.157)], координаты становятся некоррелированными. Напри-
мер, для тригонометрического базиса {1^2/7cosftcootf, 1^2/Гх
Xsinfecoo^, (оо = 2я/71} получаем представление случайного процес-
процесса рядом Фурье (в среднеквадратическом)
коэффициенты которого, вообще говоря, коррелированы.
4.5.7, Ортогональное разложение нецентрированного случай-
случайного процесса. Если среднее значение \{t) отлично от нуля и
равно at(t), то разложение D.158) следует использовать для
центрированного случайного процесса, т. е.
6Ю-вв@+2 Jy??L. DЛ6°)
причем ядром интегрального уравнения D.157) служит корреля-
корреляционная функция центрированного процесса.
120
Детерминированную функцию ag (t) на интервале И
можно представить в виде ортогонального разложения в любом
базисе и, в частности, в том же, что и во втором слагаемом в
D.160):
i= 2 *Ф1:;, \Ц<т, D.161)
где
'"" Т D.161а)
т
Предполагается, что f a$(t)dt= 2
Т
f a$(t)dt
-г
Объединяя D,160) и D.161), можно ортогональное разложе-
разложение нецентрированного случайного процесса ?(/) представить в
виде
5 9^ DЛ62)
4.5.8. Ортогональное разложение комплексного случайного про-
процесса. В некоторых задачах потребуется обобщение ортогональ-
ортогонального разложения на комплексный случайный процесс ?@==
= !(/)+ir)(i). Аналогично D.57) корреляционную функцию ком-
комплексного случайного процесса ?@ можно представить в виде
где черта сверху указывает на комплексно-сопряженную величи-
величину, а фл(/) и Ял — собственные функции и собственные числа ин-
интегрального уравнения D.58) с ядром Bj (t> у), причем
т
Вводя некоррелированные комплексные координаты центриро-
центрированного случайного процесса
DЛ63)
D.163a)
приходим к следующему ортогональному разложению
D.164)
121
Если среднее а^ (t) процесса ?(/) отлично от нуля, то аналогично
D.162) имеем
С @ =2 (Ьк + в*)^. DЛ65)
где
^Г (ЛЫ D.165а)
4.5.9. Распространение теоремы Котельникова на случайные
процессы. Рассмотрим следующую систему ортогональных функ-
функций, заданную на всей действительной оси t
ft-o. ±1. ±2.«, А>0. D.166)
— о
Вследствие фильтрующего свойства функций D.166) (см., на-
например, Приложение VI в [1])
(*\ D.167)
J6(<) Л
я _?, А? —-яя
т. е. координаты сигнала в базисе D.166) представляют после-
последовательность значений случайного процесса в моменты времени,
следующие через равные интервалы я/Л.
Если спектральная плотность мощности случайного процесса
l(t), стационарного в широком смысле и непрерывного в средне-
квадратическом, ограничена полосой частот |со|^А, т. е.
Sg(co) = 0, |ю|>Д, D.168)
то имеет место следующая интерполяционная формула (в сред-
некв адр атическом)
= 2 Е(^) «fa(^""«) t ~co</<oo. D.169)
Формула D.169), обобщающая известную теорему Котельникова
{теорему отсчетов) на случайные процессы, означает, что непре-
непрерывный в среднеквадратическом смысле процесс с ограничен-
ограниченным спектром полностью определяется счетным множеством слу-
случайных величин (координат случайного процесса) gn=?(*w/A),
я=0, ±1, ±2, ...
Для доказательства формулы D.169) следует убедиться, что
корреляционные функции правой и левой частей этой формулы
совпадают. Корреляционная функция правой части
5
S
= 2 gg(^\ sin(Ат-яд)
122
Но так как спектральная плотность Sg (со) ограничена полосой
|со|^А, то по теореме Котельникова для детерминированных
функций имеет место следующая интерполяционная формула для
ее преобразования Фурье, т. е. для корреляционной функции про-
процесса
- S В1(Щ)*п{*-лп). D.171)
Сопоставление формул D.170) и D.171) завершает доказательст-
доказательство справедливости разложения в среднеквадратическом смысле
случайного процесса l(t) в ряд D.169).
Заметим, что координаты D.167), вообще говоря, коррелиро-
ваны, так как
mi&E,}=B,[Ji;(ft-r)/A]. D.172)
Исключение составляет процесс, спектральная плотность мощно-
мощности которого постоянна в полосе частот |со|^А, так как в этом
случае В% (т) =Bi(O)sinxAf(i:A) и, следовательно, согласно
D.172) mi{lklr} =Bt (О)б^г, т. е. координаты процесса в этом
случае некоррелированы.
4.6. ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ
ВЫБРОСОВ СЛУЧАЙНОГО ПРОЦЕССА
4.6.1. Среднее число пересечений. Рассмотрим дифференциру-
дифференцируемый (по меньшей мере) по вероятности (см. п. 4.5.3) случайный
процесс ?(/). Вероятность пересечения случайным процессом g(f)
заданного уровня х=х0 снизу вверх (т. е. с положительной про-
производной) в достаточно малом интервале времени At совпадает
с вероятностью неравенств
Пусть дог (*, У, t)—двумерная плотность вероятности процес-
процесса l(t) и его производной ? (t) в совпадающий момент времени
t. Тогда указанная вероятность
о. П0>О} = У ]° wt(x, y,t)dxdy.
О аг0—Ах
При достаточно малом At внутренний интеграл можно заменить
выражением w2{x0, у, t)Ax=yw2(xo, у, t)At, и тогда
]щ(х0, у, t)dy = vx(x09 t)AU D.173)
где
<>1 (х, t) = J yw2 (x, у, t) dy. D.174)
о
123
Разобьем теперь интервал времени (t> t+T) на N неперекры-
неперекрывающихся малых интервалов (tu ti + AU) промежуточными точ-
точками t=t\<H2< ... <tN+\ = t+T, Ati = t,i+i—U. Для каждого из
указанных интервалов времени определим случайную величину
v,i, равную единице, если ^(t) на интервале (tu ti + Ati) пересе-
пересекает уровень х = х0 с положительной производной, и нулю, если
такого пересечения не происходит. Эти случайные величины яв-
являются своеобразными счетчиками пересечений. Ясно, что общее
число пересечений на интервале (t, t + T) равно v= 2 v*. Пред-
Предполагается, что Ati столь мало, что вероятностью более одного
пересечения можно пренебречь. Так как вероятность того, что
Vi=l, определяется по формуле D.173), то среднее значение
М\(хоу t, T) числа пересечений с положительной производной
уровня х=Хо на указанном интервале
Мг (xort,wT) = щ {v} = 2 m1 Ы -
Переходя к пределу при ЛЛ->~оо, находим среднее число пересече-
пересечений уровня х = х0 с положительной производной на интервале
(U t + T)
t+T t+T oo
Мг(х0$ U T)= J v±(x0J t)dt= f $yw2(x0f у, f)dt)dydt. D.175)
t t о
Среднее значение числа пересечений с положительной произ-
производной уровня хо в единицу времени
> U Т)^Мг(х0, U T)IT= ±- J $ywi(xo, У> Qdydt. D.176)
Для стационарного случайного процесса его совместное рас-
распределение с производной в совпадающие моменты времени не
зависит от f, и среднее число пересечений с положительной про-
производной уровня Хо в единицу времени постоянно и равно
*i W = »1 W = ]УЩ (х0, У) dy. D.177)
о
Аналогично находим среднее значение числа пересечений уро-
уровня х=х0 сверху вниз (т. е. с отрицательной производной) на ин-
интервале {tt t+T)
ТЛ\ (*0, U Т) - Yv\ (х0П) Я, D.178)
где
v\(x9 0= - $УЩ(х, y*t)dy= \\y\wiifr у, f)dy, D.179)
—00 —ОС
124
Однако в силу четности по переменной у совместного распре-
распределения процесса и его производной в совпадающие моменты вре-
времени
v*i{x, t)=vi{x, t) D.180)
и, следовательно,
Af*i(x0> U Т)=М{(хОу U Т). D.181)
Для стационарного случайного процесса
D.182)
Среднее значение в единицу времени общего числа пересе-
пересечений
% (х0) = 2Х± (х0) = Цут2 (x09 у) dy. D.183)
о
4.6.2. Средняя длительность выбросов случайного процесса.
Для решения многих практических задач необходимы вероятно-
вероятностные характеристики длительностей выбросов случайного про-
процесса l(t), где под длительностью ?в выброса понимается от-
отрезок времени, в течение которого %(t) превышает заданный уро-
уровень х = Хо. Наряду с этим представляет интерес длительность ин-
интервала ?и между выбросами (отрицательного выброса), т. е. от-
отрезок времени, в течение которого ?(/) не превышает заданный
уровень х=Хо (рис. 4.12).
Нетрудно определить среднее значение длительности выброса
над уровнем х = х0 эргодического случайного процесса. Рассмот-
Рассмотрим относительное время пребывания реализации этого случай-
случайного процесса над уровнем хо за время Т. Согласно эргодическо-
му свойству [см. D.33)] при больших значениях Т эта величина
приближается к P{?>{t) >Хо} = 1—Fi(xo)> и, следовательно сум-
суммарное время пребывания процесса %(t) над уровнем х0 асимпто-
асимптотически приближается к [1—Fi(xo)]T, где F\ (x)—одномерная
функция распределения случайного процесса %(t). За достаточно
длительное время Т общее число интервалов, на которых %(t)>
>х0, равно среднему числу выбросов за это время, т. е. равно
Х\(хо)Т. Среднее значение длительности выбросов
mi{Z,*} = [l—Fi(xo)]lh{xo). D.184)
Подобным же образом получаем выражение для средней
длительности интервалов между выбросами эргодического слу-
случайного процесса1
m1{^} = Fl(xo)/h(xo). D.185)
Отметим, что среднее число выбросов совпадает со средним
числом пересечений случайным процессом заданного уровня с
1 Формулы D.184) и D.185) являются частными случаями более общей фор-
формулы среднего времени пребывания эргодического процесса в заданной области,
определяемой двумя порогами Xi и Хг (см., например, [33]).
125
Рис. 4.12. Выбросы слу-
случайного процесса
положительной (или с отрицательной производной [см. D.176) и
рис. 4.12].
4.6.3. Экстремумы случайного процесса. Пусть ?(/) — непре-
непрерывный, дважды дифференцируемый по вероятности случайный
процесс. Вероятность того, что на достаточно малом интервале
r{t, t + At) случайная функция l(t) будет иметь максимум, вели-
величина которого попадает в интервал (а:—Да:, л:), совпадает с веро-
вероятностью неравенств
х—Дх<Б(*)<*, — А»<Б/(О<О, Г@<0.
Если Wz(x, у у z, t) —трехмерная плотность вероятности процесса
l(t) и его первых двух производных в совпадающие моменты
времени t, то эта вероятность при достаточно малом At
P{x-Ax<t(t)<x, -
= f J lw*(*> У> *,t)dxdydz =
х—Ах —й.у — о»
О
= —Дат |
> t)dz= -
, 0, z,
G(x, t)Axbt,
где
G(x, t)
, 0, z,
D.186)
D.187)
Формула D.186) определяет также среднее число максимумов на
интервале (t, t + At), значение которых заключено между х—Да: и
х. Среднее число максимумов указанной величины в единицу вре-
времени равно G(xt t)Ax, а для стационарного процесса G(x)Ax.
Для стационарного процесса среднее число максимумов в
единицу времени, значение которых превышает хОу
D.188)
а среднее число максимумов любой величины
° У [\z\wz(x9Q,z)dzdx =
= (|z|o;2@, z)dz,
D.188a)
126
где w2(y, z) —совместное распределение первой и второй произ-
производных процесса.
Отношение G(x)/gmax(—оо) представляет плотность вероятно-
вероятности максимумов.
Аналогично D.196) вероятность того, что на достаточно ма-
малом интервале А^ случайная функция ?•(/) будет иметь минимум,
значение которого попадает в интервал (х—Дл:, х)у
P{x-bx<t(t)<x,
°\, О, г, t)dz = H{x, t)AxAt, D.189)
о
где
Н(х, t)~]zws(x, О, г, t)dz. D.190)
о
Формула D.189) определяет также среднее число минимумов
%(t) на интервале {t, / + A/), значение которых заключено меж-
между х—Ах и х. Среднее число минимумов указанного значения в
единицу времени равно Н(х, t)Ax, а для стационарного процесса
Н(х)Ах.
Для стационарного процесса среднее число минимумов в
единицу времени, значение которых превышает Хо.
hm]n(x0)=]H(x)dx, D.191)
а среднее число минимумов любого значения
- °°) = ]н W dx = ? Jw» {*> 0. z)dz dx = ]ZW2 @, г) dz.
0 0
D.191a)
oo 0
Отношение H(x)lhmin(—oo) представляет плотность вероят-
вероятности минимумов.
Из D.188а) и D.191а) следует, что среднее число экстрему-
экстремумов стационарного случайного процесса
J ]\z\w3(x, 0, z)dzdx*= J|z|w2@, z)dz. D.192)
127
Глава 5
ОСНОВНЫЕ МОДЕЛИ СЛУЧАЙНЫХ ПРОЦЕССОВ
5.1. КЛАССИФИКАЦИЯ ОСНОВНЫХ МОДЕЛЕЙ
5.1.1. Предварительное замечание. Классификация слу-
случайных процессов по различным признакам рассматривалась в
гл. 4. Наиболее общим является разделение случайных процес-
процессов на два класса: с непрерывным временем и с дискретным. Из
этих классов случайных процессов, в общем нестационарных,
можно выделить подклассы процессов, стационарных в широком
смысле, стационарных в узком смысле, эргодических, с сильным
перемешиванием (см. § 4.2). Другими признаками классификации
были энергетические характеристики случайных процессов и свя-
связанного с ними свойства непрерывности и дифференцируемости
(в среднеквадратическом, см. § 4.4, 4.5).
Каждый из указанных классов и подклассов представляет
множество случайных процессов, управляемых различными рас-
распределениями вероятностей. Например, два стационарных в ши-
широком смысле случайных процесса, подчиняющихся двум совер-
совершенно различным двумерным функциям распределения и отобра-
отображающих различные по физической природе явления, могут иметь
совпадающие корреляционные функции или спектральные плот-
плотности мощности.
Полное вероятностное описание случайного процесса, кото-
которое назовем моделью случайного процесса, определяется после-
последовательностью конечномерных функций распределения.
В этой главе рассматриваем несколько основных моделей
случайных процессов, используемых при решении практических
задач. Как отмечалось (см. п. 4.1.3), последовательность
Fn(xu ..., Хп9 U, ..., tn), /г=1, 2, ..., функций распределения по ме-
мере возрастания числа п все более полно характеризует случай-
случайный процесс, причем функция Fn содержит информацию о всех
функциях распределения порядка k<n, но, вообще говоря, не на-
наоборот. Однако вопреки этому общему положению существуют
некоторые специальные виды случайных процессов, для которых
одномерная и/или двумерная функции распределения позволяют
определить последовательность функций Fn сколь угодно боль-
большого порядка.
Этим замечательным свойством обладают случайные процес-
процессы, модели которых более подробно исследуются далее.
5.1.2. Детерминированный процесс. Если множество реализа-
реализаций процесса состоит из одной реализации, появляющейся с ве-
вероятностью единица, то такой процесс называют детерминирован-
детерминированным. Полное и единственное описание детерминированного про-
процесса представляется заданной функцией s(t) времени t. Этот
процесс можно рассматривать как вырожденный случайный про-
128
цесс, функция распределения которого — единичный скачок при
x = s(t), т. е.
Л(х, t)=u[x—s(t)] E.1)
[см. B.7)]. Ясно, что среднее значение детерминированного про-
процесса равно s(t), а дисперсия равна нулю.
Заметим, что сумма г|(/) стационарного случайного процесса
?(/) и детерминированного процесса s(t) является процессом не-
нестационарным, так как mi{r[(t)}~mi{l(t)-\-s(t)}=az +s(t). Од-
Однако эта нестациоиарность проявляется только в изменяющемся
во времени среднем значении процесса r\ (t) и может быть при
необходимости исключена на некоторых этапах решения зада-
задачи путем центрирования.
5.1.3. Квазидетерминированные случайные процессы. Квазиде-
терминированный процесс представляется совокупностью функ-
функций времени заданного вида s(t, #), зависящих от случайного
параметра # (вообще говоря, векторного), принимающего зна-
значения из подмножества 0 евклидового пространства параметров.
Каждому возможному значению случайной величины #ев со-
соответствует одна реализация квазидстерминированного про-
процесса.
Простейшим примером квазидетерминированного процесса
является гармонический сигнал со случайными амплитудами, час-
частотой и фазой (см. п.4.2.3 и 4.2.7). При равномерно распределен-
распределенной фазе и постоянной частоте этот сигнал стационарен в узком
смысле, а при тех же условиях и при постоянной амплитуде —
эргодичеокий (см. также задачу 5.1). Другим примером квази-
квазидетерминированного процесса служит случайный процесс D.120),
который при определенных условиях, сформулированных в
п. 4.4.3, стационарен в широком смысле и характеризуется дис-
дискретным спектром средней мощности.
Нестационарным квазидетерминированным процессом являет-
является процесс, описываемый полиномом по переменной t со случай-
случайными коэффициентами
6@=25*'*.
ft=0
который используется в качестве математической модели траек-
траектории полетов летательных аппаратов.
Квазидетерминированными являются также импульсные слу-
случайные процессы — последовательность импульсов заданной фор-
формы, параметры которых амплитуда, длительность, момент воз-
возникновения являются случайными величинами (см. § 5.5).
Докажем, что конечномерное распределение любого порядка
квазидетерминированного процесса полностью определяется его
одномерным распределением. Пусть стало известно значение х{
процесса в момент времени tiy т. е. X\ = s(t{\ Ф), где Ф — скаляр-
скалярный случайный параметр. Обозначая через Q функцию, обратную
5-87 129
5 относительно параметра О, получаем ® = Q(tu х\). Тогда в лю-
любой момент гкФг\ значение процесса
zk = s[tk\ Q{ti, xi)], k>l.
По правилу умножения находим выражение многомерной плот-
плотности вероятности квазидетерминированного процесса
= М*ъ УПМ^1^). E.2)
/?=2 *
где ws(x\\ t\)—одномерная плотность вероятности квазидетер-
квазидетерминированного процесса, которая, как нетрудно убедиться, свя-
связана с плотностью вероятности w® {и) случайного параметра со-
соотношением
1 оо ОО
и>8 (*; t) = f f w® (a) exp {iv [s (t; u) — x]} dudv.
2я -i-L
Приведенное доказательство можно распространить и на ква-
зидетерминированный процесс, зависящий от векторного пара-
параметра.
5.1.4. Случайные процессы с независимыми значениями. Еще
одним классом случайных процессов, для которого вся вероятно-
вероятностная информация содержится в одномерном распределении, яв-
являются процессы с независимыми значениями в несовпадающие
моменты времени. Для любой последовательности t\y ..., tn(ti?=
tj, i, /=1, n) случайные величины ?(/i), ..., %>(tn) независимы в
совокупности. Поэтому многомерная функция распределения слу-
случайного процесса с независимыми значениями факторизуется,
т. е равна произведению одномерных функций распределения в
заданные моменты времени
М? ) **; '*)• E.3)
Из E.3) следуют также аналогичные соотношения для многомер-
многомерных плотностей вероятности и характеристических функций слу-
случайных процессов с независимыми значениями
f*; У- E.5)
k=\
Следует отличать процессы с независимыми значениями от
процессов с некоррелированными значениями, у которых для лю-
любой пары несовпадающих моментов времени U и tj
130
Если одномерная функция распределения не зависит от вре-
времени, то процесс с независимыми значениями представляет слу-
случайную последовательность независимых одинаково распределен-
распределенных случайных величин. Эта последовательность эргодична (и,
следовательно, стационарна в узком смысле).
5.1.5. Случайные процессы с независимыми приращениями.
Процесс l(t) называют случайными с независимыми прираще-
приращениями, если для любой последовательности моментов времени
t\<t2< ... <tn случайные величины l(ti), l(t2) — l(ti), ..., i(tn) —
—l(tn-\) независимы. Любое конечномерное распределение про-
процесса с независимыми приращениями определяется его одномер-
одномерным распределением и распределением приращения, т. е. дву-
двумерным распределением. Более подробная характеристика ука-
указанного класса случайных процессов дана в § 5.3.
Следует отличать процессы с независимыми приращениями от
процессов с некоррелированными приращениями, для которых
приращения процесса на непересекающихся интервалах некорре-
лированы.
5Л.6. Марковские случайные процессы. Еще одной моделью
случайного процесса, полное вероятностное описание которого
дается распределением второго порядка, является марковский
случайный процесс. Эта модель широко используется в приложе-
приложениях теории случайных процессов.
Марковский процесс — процесс без последействия, что анали-
аналитически выражается следующим соотношением между условными
функциями распределения случайного процесса:
tj>ti, j>i. /= 1, п. E.6)
Вводя обозначения условных функций распределения, перепишем
E.6) в виде
F(xn\ tn\*\n-l\ t\n-l)=F(xn\ tn\xn-\\ tn-i). E.6a)
Соотношение E.6) означает, что будущее состояние хп и прош-
прошлые состояния xin-2=(*i, ..., хп-ч) марковского процесса при фик-
фиксированном настоящем состоянии хп-\ независимы. Иными сло-
словами, будущие состояния связаны с прошлым только через фик-
фиксированное в данный момент времени состояние, в котором ока-
оказывается «закодировано» все прошлое марковского процесса. Бо-
Более подробная характеристика марковских процессов дана в
§ 5.4.
Следует отличать марковский процесс от мартингала, для ко-
которого при h<t2< ... <tn-i<tn
=xu ..., l(tn-i)=Xn-i}=xn-i. E.7)
131
5.2. ГАУССОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
5.2.1. Определение. Случайный процесс ?(/) называется гаус-
совским, если совместная плотность вероятности любой конечной
совокупности величин gft=?D), ?=1, п> нормальная, т. е. опре-
определяется по формуле [см. B.64)]
wn(x, t) =
где х= (xi, ...,xn), t=(tu -.., tn)\ ag —вектор средних значений
процесса с компонентами 0fe = flg(fti) =tf*i{?(/&)}, &=1, п\ К|—
корреляционная матрица процесса размером пХп с элементами,
равными корреляционной функции центрированного процесса в
моменты времени t\ и tj, i, /=1, п;
Ки = Bl (tif tj) = tn1 {[I (tt) - аБ (tt)\ [I (tj) - щ (tj)}}. E.9)
Конечно, гауссовский случайный процесс может быть опреде-
определен последовательностью характеристических функций
®n(t>i,-, vn, tl9..., tn)
= exp (/ |aft^-^2 2 Kuvivj)> E-10)
которая получается п-кратным преобразованием Фурье от плот-
плотности E.8).
Модель гауссовского случайного процесса широко использу-
используется в естествознании и технике. В радиотехнике и связи гаус*
совский случайный процесс является адекватной математической
моделью активных и пассивных помех, атмосферных и космичес-
космических шумов, каналов с замиранием, с многолучевым распростра-
распространением, групповых сигналов в многоканальных системах. Флук-
туационные шумы приемных устройств, обусловленные дробовым
эффектом и тепловым движением электронов, также подчиняются
нормальному закону распределения. Адекватность модели гаус-
гауссовского случайного процесса многим реальным помехам и сиг-
сигналам и ее универсальность объясняются во многих случаях дей-
действием центральной предельной теоремы теории вероятностей (см.
п. 5.2.7).
Из определения E.8) гауссовского случайного процесса сле-
следует, что эта модель полностью определяется заданием среднего
значения ag (t) и корреляционной функции В\ {и, v) случайно-
случайного процесса.
5.2.2. Стационарный гауссовский случайный процесс. Если га-
гауссовский случайный процесс стационарен в широком смысле,
то средние значения au = a постоянны, а корреляционная функ-
функция В\ (tu t2) зависит не от двух переменных U и /2, а только от
их разности x = t2—ti' При этом распределение вероятностей E.8)
гауссовского процесса не меняется для любого сдвига группы то-
132
чек t\, ..., tn вдоль оси времени на постоянное значение. Иначе
говоря, при выполнении указанных условий гауссовский случай-
случайный процесс является строго стационарным. Таким образом, из
стационарности в широком смысле гауссовского случайного про-
процесса следует его стационарность в узком смысле.
Плотность вероятности произвольного n-го порядка стацио-
стационарного гауссовского процесса представляется в следующей ска-
скалярной форме
wn(xi,-, хп9 xlf..., xn_i) =
= Bла2)-/2 D-i/2 ехр ( - -4- 2 2 D* (*i ~ а) (хк -а)\, E.11)
где о2 — дисперсия процесса, D — детерминант матрицы Rg , эле-
элементы которой Rih = Rki = R(tk—ti)=Bi(nk—ti)/fig @) представ-
представляют значения нормированной корреляционной функции, a D%h —
алгебраические дополнения элемента Riu в матрице Rg .
Многомерная характеристическая функция стационарного га-
гауссовского случайного процесса
vk-^-i 2 RtjViVj]. E.12)
Выпишем отдельно одномерную и двумерную плотности веро-
вероятности и характеристические функции стационарного гауссов-
гауссовского процесса
exp (i:(xa)8) EЛЗа)
lt X2t X) = „„.-,/; Я=— X
- 2R (т) (Xl - а) (х2 -а)+ (х2 - а?]}, E.136)
6i(i>)=exp(iai>—a2t-2/2), E.14а)
— (a2/2) {v2i+2R(%)vlv2 + v22)]. E.146)
Отметим, что достаточным условием эдгодичности и условием
сильного перемешивания стационарного гауссовского процесса яв-
является непрерывность его спектральной плотности мощности, т. е.
оо
ограниченность интеграла j |^?^(т)|^т (см. [13]).
о
5.2.3. Гауссовский процесс с независимыми значениями. Если
любые два значения гауссовского случайного процесса в несов-
несовпадающие моменты времени некоррелированы, то Rik = Rki=:0 при
133
и тогда матрица Rg—диагональная с элементами Ru=l по
диагонали. Поэтому в E.И) следует подставить значения
В этом случае плотность вероятности п-ro порядка гауссов-
ского процесса
wn (*i,..., хп) = BпоТп/2 exp J - -±- %{Хк _ af j =
= П Bяо2)'/2 exp { - -i- (xk -af), E.15)
k=l l 2G }
т. е. является произведением п одномерных нормальных плотно-
плотностей распределения, что соответствует независимости значений
процесса в любые два момента времени.
Таким образом, стационарный гауосовский случайный процесс
с некоррелированными значениями является также процессом с
независимыми значениями.
Координаты нормального случайного процесса в ортогональном
разложении D.158) представляют, следовательно, совокупность
независимых случайных величин.
5.2.4. Линейное преобразование гауссовского процесса. Линей-
Линейная комбинация гауссовских процессов, производная и интеграл
гауссовского процесса или любое другое линейное преобразова-
преобразование снова приводит к гауссовскому процессу (или к гауссовской
случайной величине), как это следует из п.3.3.8.
Рассмотрим линейную комбинацию гауссовских случайных
процессов lk{t):
k=i
(где ck(t), Sk(t)—заданные функции), которая представляет
также гауссовский случайный процесс. Если заданы средние, дис-
дисперсии, корреляционные и взаимные корреляционные функции
гауссовских процессов %k(t), k=l, n, то нетрудно определить рас-
распределение любого порядка случайного процесса i\(t).
Для примера рассмотрим сумму двух гауссовских случайных
процессов r\(t)=h(t)+b(i) и пусть agl @, ag, (t), 56l (tu t2),
ВЪ (tu t2), ВЫ2 (tu t2), ВЫх (ti, t2) — их средние, корреляци-
корреляционные и взаимные корреляционные функции соответственно. Ис-
Используя матричное представление характеристической функции
[см. E.10)], можно в компактном виде представить 2д-мернук>
совместную характеристическую функцию процессов gi(/) и |г@:
E.16)
где v= (vt, ..., vnt uu ..., tin), t= (tu ..., tn), а —вектор-столбец сред-
134
них значений [aSl (ti)t ... а^% (/п)], К(^г, /j)—матрица ковариа-
дий случайных величин ?i(/i), ^(tj), причем
E.17)
И Kgt (^?» 0) == H^i (^г> ^у)Н> K|j g2 (?j, ^;) = Ц-Sgi ^2 $U h)\\ И T> Д*
Тогда п-мерная характеристическая функция суммы r\(t) =
= |i (/) +^2@ имеет вид
a^v--yv/KT|V), где
v = К = «1,..., vn = ип), t = (*lf..., tn),
an = aEl + ag2, K4 = K6l + K6l g2 + Kg2 6l + Kg2.
Если два гауссовских процесса некоррелированы, т. е. их вза-
взаимные корреляционные функции равны нулю, то из приведенных
соотношений следует [см., например, E.10)], что эти процессы
независимы.
5.2.5. Производная в среднеквадратическом гауссовского про-
процесса. Определим одномерную и двумерную плотности вероятно-
вероятности производной гауссовского случайного процесса. Так как од-
одномерное распределение гауссовского процесса определяется
двумя функциями времени — средним и дисперсией, то одномер-
одномерная плотность вероятности производной гауссовского процесса
Щ> {У, 0 = [2яс|, (О]/2 ехр ( -! [у - av @]21, E.18)
I 2o|,@ J
где в соответствии с D.140) и D.139)
E.19а)
Для стационарного гауссовского процесса E.18) упрощается,
так как при этом а^ =0 и o2i> =—B'\ @). Если, кроме того,
а? = 0, т. е. a26 = Sg@), то
Щ- (У) = Ь=^ exp f - —FT-V EЛ9)
G| (ui У 2я у 2a| o)| у
где 02i определяется по формуле D.145).
Используя D.142) нетрудно найти двумерную плотность рас-
распределения производной стационарного гауссовского процесса
( E.20)
где
Rv (т) = - В' (хЩ @) = - ^ (T)/e»f. E.20a)
135
Подобным же образом, определяя корреляционную матрицу
для производной в п моментах времени, можно получить выраже-
выражение n-мерной плотности вероятности производной гауссовского
случайного процесса.
5.2.6. Совместное распределение гауссовского процесса и его
производной. Как было показано в 4.5.4, значения стационарного
в широком смысле случайного процесса и его производной в
среднеквадратическом некоррелированы в совпадающие моменты
времени. Поэтому для гауссовского случайного процесса указан-
указанные величины независимы в совпадающее моменты времени.
Тогда совместная плотность вероятности гауссовского центриро-
центрированного стационарного случайного процесса g(?) (при а^ = 0) и
его производной в совпадающие моменты времени
щ (^ у) = \ ехр Г - —— (л:2 + г/2/со2) 1. E.21)
Совместное распределение стационарного гауссовского про-
процесса и его производной в несовпадающие моменты времени пред-
представляет двумерное нормальное распределение гауссовских слу-
случайных величин l(t) и l'(t + %).
Учитывая D.147), находим
w» (х, и, т) = =
2V * ' Or™2_/p'^211/2
= ехр - -i * , ' " . E.22)
1 2o|[co?-(/?g(T))«] j
При т=0, R'\ @)=0 формула E.52) совпадает с E.21).
Совместное распределение гауссовского стационарного слу-
случайного процесса и его производной в два момента времени t и
t-\-% представляет четырехмерное нормальное распределение че-
четырех гауссовских случайных величин: g(/), l(t+t)9 l'@> V
+т). В этом случае нормированная корреляционная матрица
К6'б КГ )'
где
i I I-Ssw о ]
K"=Uw о ]• **-['-**> »: I
Таким образом,
1 #j(t) 0 #g(T)'
к»|Лв(х) 1 ~RiW 0 ^ E23)
1 — R't (т) со? -' п' '
0
136
Детерминант этой матрицы и алгебраические дополнения ее
элементов1
(t?)()(^22a)i), E.24)
Используя E.11), находим искомое четырехмерное распределе-
распределение
w*<*• х» *¦ ^ т) - -^^[^гехр {" й^[Du (*?
2D12 ^ х2 + 2D34 ух у2 + D33 ( у? + у*) +
(^ у1 -. л:2 у2) + 2D14 (^ у2 + л:2 у,)]). E.26)
5.2.7. Центральная предельная теорема для стационарных
случайных процессов. Пусть |(л) — стационарный центрирован-
центрированный случайный процесс с дискретным временем, удовлетворяю-
удовлетворяющий условию сильного перемешивания с коэффициентом а(п)
[см. D.44)]. Предполагается, что для некоторого 6>0
оо
Если 2 [а(п)]б/B+б)<оо, то ряд
о» = щ {? @)} + 2 5 тг {\ @)? (*)} E.27)
абсолютно сходится. Если, кроме того о7ф0, то
^i* E-28)
где г] — гауссовская случайная величина с параметрами @; 1).
Для стационарных процессов с независимыми значениями со-
соотношение E.28) соответствует C.104).
Если последовательность 1(п) удовлетворяет условию равно-
равномерно сильного перемешивания [см. D.44а)], то соотношение
оо
E.28) выполняется при условии 2 ф2(/г)<оо.
п—\
1 В E.24) и E.25) опущены аргументы функций R^ (т), R\(%)> #"|(т).
137
Приведенное утверждение распространяется и на стационар-
ные центрированные случайные процессы с непрерывным време-
временем g(/), которые удовлетворяют условию равномерно сильного
перемешивания с коэффициентом ф(т). Если ^i{?2@}<°° я
J ф1/2(т)Л<оо, ТО
о
о2 = 2]т1 {? @)? @)dt < оо. E.29>
о
Если, кроме того, о2ф0, то
где г] — гауссовская случайная величина с параметрами @; 1).
Подробные доказательства приведенных здесь результатов
см., например, в [13, 14]. Заметим также, что эти утверждения,
очевидно, имеют место для Г-зависимых случайных процессов
(см. п. 4.2.7).
5.3. СЛУЧАЙНЫЕ ПРОЦЕССЫ
С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ
5.3.1. Вероятностные характеристики. Из определения случай-
ного процесса ?(/) с независимыми приращениями, приведенно-
приведенного в п.5.1.5, получаем следующее представление процесса
i (**) = i (*,) + 2 К (tt) -1 fo-i)L h<t,<...< th. E.31)
i=2
Дисперсия процесса в момент времени th представляет монотонно
возрастающую функцию, так как при независимых приращениях
из E.31) следует
Н {I (th)} = ^2 {I W + 2 N {I (ti) -1 (^-i)}. E.32)
Используя известные свойства характеристической функции
суммы независимых случайных величин (см. п. 3.3.6), запишем
я-мерную характеристическую функцию процесса с независимы-
независимыми приращениями
Эп (v- t») = в± (vi; tj П вд (vh; tb-l9 tk), E.33)
k—Ч,
где
E.34)
вд (и; ti-x, U) = mx {exp [i и (I (*,) -1 (tt-i))]}, E.35)
4 = 2 «i- E-36)
138
Таким образом, характеристическая функция любого порядка
случайного процесса с независимыми приращениями определяет-
определяется его одномерной и двумерной характеристическими функциями.
5.3.2. Однородные процессы с независимыми приращениями.
Случайный процесс l(t) с независимыми приращениями назы-
называется однородным (иногда — процессом со стационарными не-
независимыми приращениями), если он определен при tZ^O, при-
причем ?@)=0, и распределение приращения 5(/ + т)—l(t) совпа-
совпадает с распределением ?(/) для всех />0, т>0. Однородный
процесс с независимыми приращениями непрерывен по вероят-
вероятности.
Из E.31), следует, что однородный процесс с независимыми
приращениями можно представить конечной суммой одинаково
распределенных случайных величин и, следовательно,
01 (и; kx)=<dki(u\ т).
E.37)
5.3.3. Случайные процессы со скачками в фиксированные мо-
моменты времени. Рассмотрим процесс ?(/), реализации которого —
ступенчатые функции со случайными скачками в фиксированные
моменты времени (рис. 5.1). Скачок процесса в один из фикси-
фиксированных моментов ti представляет случайную величину |г- =
= i (^г+0)—?(Л—0). Тогда рассматриваемый процесс можно за-
записать в виде суммы
6@= 2 h-
E.38)
Этот процесс непрерывен по вероятности при всех значениях t
за исключением тех фиксированных моментов времени, где появ-
появляются случайные скачки. Если скачки ?г-, /=1, 2, ..., представля-
представляют совокупность независимых случайных величин, то рассматри-
рассматриваемый процесс является случайным с независимыми прираще-
приращениями.
5.3.4. Гауссовский процесс с независимыми приращениями.
Если приращения на непересекающихся интервалах времени не-
независимы и распределены по нормальному закону, то процесс с
Рис. 5.1. Процесс со случайными скачками в фиксированные моменты времени
139
независимыми приращениями принадлежит классу гауссовоких
случайных процессов. Характеристическая функция такого про-
процесса
в%{и; t)=exp[iua{t)—G2(t)u2/2]t E.39)
@{Б@}@|{Б@>
Характеристическая функция приращения этого процесса
@д (и; tl9 t2) = exp (i и aA - o\ u2/2), E.40)
где aA(tu t2)=a(t2)—a(ti), o2A(tu U) = |12{?(*2)—SCO).
Так как aA (tu t2)JraA(jt2t t3)=aA (tu t3) и а2д (tu t2) +
+ o2A{t2, ^з)=а2д (/ь /3), tl<l2<t3t то из E.39), E.40) следует
общая формула E.33).
5.3.5. Винеровский случайный процесс. Частным случаем га-
уссовского случайного процесса с независимыми приращениями
является винеровский процесс, для которого
/п,{|@}=0, ]1*№)} = о2*- E.41)
Одномерная и двумерная характеристические функции вине-
ровского процесса
вг(щ ^) = exp(-a2fe2/2)? E.42)
©2 (Mi, «2; U s) = exp { —1- [о2 s (Ml + u2f - a2 (/—s) u\) j. E.43)
Из E.43) находим корреляционную функцию винеровского
процесса
B(t, s)= —^—S2(ul9 u2; tt s)U1=U2=0 = o2min(s, f). E.44)
o^ ou2
Винеровский процесс с параметром a2=l называют стан-
стандартным.
Реализации винеровского процесса непрерывны, но недиффе-
ренцируемы в любой момент времени с вероятностью единица
(см., например, [15]). Винеровский процесс часто называют про-
процессом броуновского движения, так как он служит математиче-
математической моделью хаотического перемещения частиц под ударами мо-
молекул жидкости.
5.3.6. Пуассоновский процесс. Рассматривается последова-
последовательность случайных событий, каждое из которых можно пред-
представить точкой на оси времени, а всю последовательность собы-
событий— потоком случайных точек. Обозначим через v(i) число со-
событий (случайных точек), появившихся на интервале @, t).
Предположим, что число событий v(^)—v(^i) на интервале
(^i, t2) не зависит от того, сколько событий и когда происходили
до указанного интервала, т. е. отсутствует последействие. Предпо-
Предположим, кроме того, что вероятность появления более одного со-
события на интервале (t, t+At) при At-+O убывает быстрее, чем
At (имеет место ординарность), и что вероятность появления од-
одного события на интервале (/, Н-Д/) равна X{t)At-\-o(At). Тогда
140
v(/)—случайный процесс с независимыми приращениями, под-
подчиняемый закону распределения Пуассона
Рн (h> к)
Л = 0, 1, 2
- v (У] = k) =
ехр [ - Л (tlf
где
= )k(t)dt, t2>tl9
E.45)
E.45a)
и называемый пуассоновским.
При фиксированном значении ^ реализации пуассоновского
процесса — неубывающие ступенчатые функции t>tx с единич-
единичными скачками в случайные моменты времени (рис. 5.2). Пуас-
соновский процесс — непрерывный по вероятности, что не проти-
противоречит возможности скачков в отдельных реализациях.
Характеристические функции пуассоновского процесса и его
приращения
вг(щ /)=ехр [Л@, *)(exp(ia)-l)], E.46)
вд {щ t± t2) = ехр [Л (tl9 Q (ехр (i и) - 1)], E.47)
из которых следует и общая формула E.33).
Модель пуассоновского процесса широко используется в есте-
естествознании и технике, в теории массового обслуживания, в тео-
ри надежности, в ядерной физике и многих других областях.
5.3.7. Однородный пуассоновский процесс. Пуассоновский про-
процесс однородный (стационарный), если интенсивность X(t) пото-
потока событий — постоянная величина. Тогда из E.45а) следует
A(t, t+x)=k%, т^О, Л>0 E.48)
и, следовательно, [см. E.45)]
pft(T)=P{[v(* + T)-v(O] = fc}=-^exp(->a). k = 0, 1,2,...
E.49)
Одномерная и двумерная характеристические функции однород-
однородного пуассоновского процесса
0i'(m; O=exp[M(exp(iM) — 1)], *>0, Х>0, E.50)
62(щ\ и2\ t, s)=ei(ui+u2\ s) Q\(u2\ t—s) =
= exp [Xs(exp[i(ui + u2)] — l)]X
Xexp[X(t—s)(exp(iu2) — 1)], t>s. E.51)
Рис. 5.2. Пуассоновский
процесс
14!
Из E.50) находим среднее значение однородного пуассоновского
процесса
m1{v(/)} =
а из E.51) —
J.X7 /I «* '\J r
i ди
смешанный момент второго порядка
E.52)
m1{v@v(s)}=--
«!ди2
s, t).
E.53)
Заметим, что моментная функция второго порядка E.53) однород-
однородного пуассоновского процесса отличается от корреляционной функ-
функции E.43) винеровского процесса только постоянным множите-
множителем, хотя указанные случайные процессы (пуассоновский и ви-
неровский) существенно отличаются как по виду отдельных реа-
реализаций, так и по распределениям вероятностей.
5.3.8. Обобщенный однородный пуассоновский процесс. Слу-
Случайный процесс
v(O
~ ", E.54)
где |t — одинаково распределенные независимые случайные вели-
величины, a u(t—ti)—единичный скачок в момент /^соответствующий
?-му скачку однородного пуаосоновского процесса v(t) с парамет-
параметром Л, назовем обобщенным однородным пуассоновским [16]. Ре-
Реализациями такого процесса являются ступенчатые функции со
случайными независимыми скачками в случайные моменты време-
времени (рис. 5.3).
Характеристическая функция обобщенного однородного пуас-
пуассоновского процесса [16]
0Х (и; /) = ехр {X t [в6 (и) - 1]}, X > 0, t > 0, E.55)
где 0g (и) — характеристическая функция случайных скачков ?г-.
Если скачки детерминированы и равны единице, то 0g (и) =
= exp(iw) и формула E.55) совпадает с E.50).
Среднее значение и смешанный момент второго порядка обоб-
обобщенного однородного пуассоновского процесса [16]
E.56а)
, t)mx{lh}. E.566)
Имея в виду, что ?* распределены одинаково, т. е. что
1
и
t
Рис. 5.3. Обобщенный пу-
пуассоновский процесс
142
с =
и ^1{?2г}=Ь2, нетрудно заметить, что указанные величины отли-
отличаются от соответствующих величин однородного пуассоновско-
пуассоновского процесса лишь множителями а и Ъ2 [см. E.22) и E.53)].
Как и однородный пуассоновский процесс, обобщенный пуас-
соновский является случайым процессом с независимыми прира-
приращениями.
5.3.9. Белый шум. Рассмотренные ранее случайные процессы
с независимыми приращениями — винеровский, однородный пуас-
пуассоновский, обобщенный однородный пуассоновский — непрерыв-
непрерывны по вероятности, но не дифференцируемы. Производные этих
процессов можно рассматривать как обобщенные случайные про-
процессы с независимыми значениями [17], корреляционные функ-
функции которых
В(s, t)=c -^— min (s, t)=c8(t-s), E.57)
dsdt
где
а2 для винеровского процесса [см. E.44)],
К для однородного пуассоновского процесса [см. E.53)],
ХЬ2 для обобщенного однородного пуассоновского про-
процесса [см. E.566)].
Корреляционная функция E.57) является по определению
корреляционной функцией белого шума — случайного процесса с
постоянной на всех частотах интенсивностью спектральной плот-
плотности мощности (см. п. 4.4.2).
Таким образом, имеется три класса белых шумов: гауссов-
ский (производная винеровского процесса), пуассоновский и
обобщенный пуассоновский (производные однородных пуассонов-
пуассоновского и обобщенного пуассоиовского процессов).
5.3.10. Разложение случайного процесса с независимыми
приращениями. Как доказал П. Леви (см., например [8]), про-
процесс с независимыми приращениями может быть представлен
суммой трех независимых слагаемых: а) детерминированного
(центрирующего) процесса, б) процесса с независимыми прираще-
приращениями со скачками в фиксированные моменты времени (см.
п. 5.3.3), в) непрерывного по вероятности процесса с независимы-
независимыми приращениями. Непрерывная часть любого процесса с незави-
независимыми приращениями есть либо гауссовский процесс с незави-
независимыми приращениями (см. п. 5.3.4), либо пуассоновский (см.
5.3.6), либо сумма этих процессов.
5.4. МАРКОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
5.4.1. Вероятностные характеристики. Из определения марков-
марковского процесса, приведенного в п.5.1.6, а также непосредственна
из формулы E.6) следует
W (хп\ tn\Xl9 •••) Хп—\\ t\y •••> tn-l) =
= w(xn; tn\xn-u tn-i), tj>tu j>L E.58)
143
Условную плотность
w(x; t\y; s) = -j-F(x; t\y; s), t>s E.59)
ox
называют плотностью вероятности перехода марковского процес-
процесса из состояния у в момент s в состояние х в момент t.
Используя формулу B.57), определяем многомерную плот-
плотность вероятности (любого конечного порядка) марковского про-
процесса
М )
E.60)
Формула E.60) означает факторизацию многомерной плотности
вероятности марковского процесса — представление ее в виде
произведения одномерной плотности и плотностей вероятности
перехода. Условие факторизации E.60) многомерной плотно-
плотности—характерная особенность марковских процессов (ср. с ана-
аналогичным более простым условием факторизации E.4) для про-
процессов с независимыми значениями).
Одномерная плотность и плотность вероятности перехода свя-
связаны соотношением
Wl(x; I)» Jo>(*; *\УШ> s)^i(y; s)dy> *>s. E.61)
Плотность вероятности перехода марковского процесса не
является произвольной условной функцией распределения, удо-
удовлетворяющей только обычным условиям неотрицательности и нор-
оо
мировки, т. е. w\x\ t\y\ s)^0, J w(x\ t\y\ s)dx—l. Она должна
— 00
еще удовлетворять некоторому интегральному уравнению. Дей-
Действительно, из E.60) при п = 3 имеем
W3(XU X2, Xi\ tu U, U) =Wi(Xi\ ti)w(X2\ t2\Xi)ti)w(X3)
ts\x2\ t2), U<h<U.
Интегрируя обе части этого равенства по х2, получаем
оо
w2(xl9 x3; tl9 t3) = w1(x1; ij \w(x2\ t^x^t^wfa, U\x^\ t2) dx2,
—oo
и так как
TO
oo
w(x3; tz\xx; tt)= \w{xa; t3\x2; t2)w(x2; t2\xx; tjdxt. E.62)
— oo
144
Интегральное уравнение E.62) называют уравнением Колмогоро-
Колмогорова — Чепмена.
5.4.2. Однородные марковские процессы. Если распределение
вероятностей марковского процесса инвариантно временному
сдвигу, то его называют однородным (стационарным). В этом
случае плотность вероятности перехода E.59) зависит лишь от
одного временного параметра w(x\y, т), x — t—s>0.
Условие факторизации многомерной плотности однородного
марковского процесса записывается в виде )[см. E.60)]
М? fl b U-U-x), и>П-и E.63)
i=>2
а уравнение Колмогорова — Чепмена
оо
-s-Qwix^x^ t2-t^dx2. E.64)
Отметим, что класс однородных марковских процессов совпа-
совпадает с рассмотренным классом однородных случайных процессов
с независимыми приращениями.
5.4.3. Многосвязный марковский процесс. Назовем марковский
процесс fe-связным, если плотность вероятности перехода зависит
от k предыдущих значений процесса [см. E.58)]:
W(xn\ tn\Xu ..., Хп-и tu ..., tn-l) =W{(xn; tn\Xn-k, ..., Xn-U tn-k, ...
tn-\), n>k^\, tj>tu j>i. E.65)
Условие факторизации многомерной плотности /^-связного
марковского процесса записывается в виде
E.66)
- ]w(x2; t2\xLk+2) w {xx; ^|х!Л+1; t-k+i) йхг. E.67)
— 00
5.4.4. Векторный марковский процесс. Совокупность случай-
случайных процессов g'i(Oi i=l,^ образует векторный марковский про-
процесс, если для полного вероятностного описания этой совокупно-
совокупности необходимо и достаточно знать совместное распределение
5«@<^} E.68)
и условное распределение
а уравнение Колмогорова — Чепмена
w{x2;
F (xa; fa|xi; У = Р ( П 61 (У < ^2г-
П Si ft) = ДГц) E.69)
i J
145
или соответствующую плотность вероятности перехода
70) /y • / iv • i \ — d/7 (x2; t2\x; tj ,- _n
w(X2, Г2|хь tx) . E.7U)
oxox
Заменяя ib E.60) — E.62) скалярные величины векторными, по-
получаем соответствующие соотношения для векторного марковско-
марковского процесса.
Каждый из случайных процессов gi(i), принадлежащий сово-
совокупности, образующей векторный марковский процесс, называют
компонентой векторного марковского процесса, которая, однако,
не является скалярным марковским процессом, вообще говоря.
Отметим связь (векторного и многосвязного марковских про-
процессов: й-связную марковскую последовательность можно интер-
интерпретировать и как векторную (размера k) марковскую последо-
последовательность ![18].
5.4.5. Гауссовский марковский процесс. Марковский процесс
называют гауссовским, если его распределение подчиняется нор-
нормальному закону распределения вероятностей (см. п. 5.2.1). Как
для любого гауссоеского процесса, корреляционная функция га-
уссовского марковского процесса обеспечивает его полное вероят-
вероятностное описание. Можно доказать, что случайный процесс | (\t)
является центрированным гауссовским марковским процессом
тогда и только тогда, когда при 5<^<т его корреляционная
функция удовлетворяет уравнению '[ 19]
т). E.71)
Для однородного гауссовского марковского процесса условие
E.71) записывается при помощи нормированной корреляционной
функции, зависящей, естественно, от одного аргумента
Rt (t + т) = Ri (t) /?6 (т), t > 0, т > 0. E.72)
За исключением тривиального решения 7?!(/)===0, уравнение
E.72) имеет единственное решение
-А,т), т>0, Х>0. E.73)
Таким образом, стационарный центрированный гауссовский
процесс с дисперсией а2 — марковский тогда и только тогда, ког-
когда его корреляционная функция (рис. 5.'4)
E.74)
или соответствующая спектральная плотность мощности процесса
(рис. 5.5)
S6H= Q2A ¦ E.75)
* w 1 + (со/ЯJ
Из E.74) и, соответственно, из E.75) следует, что однородный
гауссовский марковский процесс непрерывен в среднеквадратиче-
ском, но не дифференцируем в среднеквадратическом (ср. также
задачу 5.6).
146
Sf(o)J/Sf(ff)
о
Рис. 5.4. Нормированная корреляци-
корреляционная функция однородного гауссов-
ского марковского процесса
Рис. 5.5. Спектральная плотность мощ-
мощности однородного гауссовского марков-
марковского процесса
5.4.6. Гауссовская марковская последовательность. Пусть gi, ...
..., In — последовательность центрированных гауссовских случай-
случайных величин с дисперсиями т\{Ъ?к}=о2к и коэффициентами кор-
корреляции fni{li^j}/aiGj = rij. Для того чтобы эта последователь-
последовательность была марковской, необходимо и достаточно, чтобы
E.76)
последовательности
Для стационарной гауссовской марковской
из E.76) следует
Ол-р1*"'1» 1рКЬ
E.77)
где р — коэффициент корреляции между двумя соседними члена-
членами последовательности.
Каждая подпоследовательность гауссовской марковской по-
последовательности также гауссовская, марковская.
5.4.7. Дифференциальное уравнение для плотности вероятно-
вероятности перехода непрерывного марковского процесса. Решение ин-
интегрального уравнения E.62) Колмогорова — Чепмена представ-
представляет трудную задачу. Определение плотности вероятности перехо-
перехода марковского процесса можно свести к решению дифференци-
дифференциального уравнения, если ограничиться непрерывными процессами.
Марковский процесс называют непрерывным, если за малые про-
промежутки времени лишь с малой вероятностью возможны замет-
заметные перемещения. Точнее говоря, это означает, что каково бы ни
было 6>0
lim
At-+0
w(z\ t\x\ t-
6
Реализации непрерывного марковского процесса
ностью единица непрерывны.
Из уравнения E.62), полагая t\ = t—A/, t2 = t, t$ =
обозначения переменных, получаем
E.78)
с вероят-
верояти изменяя
w(y; T\x; t-M)^ ]w(y; Т\г; t)w(z; t\x; t-M)dz.
147
Кроме того, очевидно, что
w(y; Т\х; t)= ]w(y; Т\х; t)w(z; t\x; t-M)dz.
—oo
Из последних двух равенств следует
w(у; Т\х; t-At)-w(y; T\x; t) =
= ]lw(y; T\z- t)-w(y; T\x; t)]w(z; t\x; t~M)dz. E.79)-
Предположим, что плотность вероятности перехода можно
разложить в ряд Тейлора
w(y; Т\г; t)-w(y- Т\х- t)= ^-tzz^J^w{y. T\Xy t). E.80>
ft=l k] dxk
Подставив E.80) в E.79), поделив обе части на Д^ и перейдя к:
пределу при At-^O, получим
—j-w{y; T\x; t) = i±-Ah(x; f)*-w(у; Т\х; /), E.81)
где
Ak(x; 0 = Hm — °\{z-x)kw{z\ t\x; t-&t)dz. E.82>
5.4.8. Диффузионные процессы. Если функции А\(х\ t) и А2{х;
t) конечны (А2(х; i) отлично от нуля) и Аи(х\ t)=0 при ?^=3, то
непрерывный марковский процесс называется диффузионным. Из
E.81) следует, что плотность вероятности перехода диффузионно-
диффузионного процесса удовлетворяет дифференциальному уравнению в
частных производных
-^-w(y; T\x; f) + A1{x- f)-^-w(y- T\x- 0 +
ot ox
+\Ла {х; t]^w (у; Т{х; t]=0>
называемому обратным уравнением Колмогорова.
Аналогично можно доказать, что плотность вероятности пере-
перехода диффузионного процесса удовлетворяет и прямому урав-
уравнению Колмогорова:
д w(y; Т\х; 0 + -^-[Л1(*/; T)w{y; T\x; <)]-
дТ Wf ' ' ' ' ду
где
ЛАу; Л = Ит-^- Цг-у)т(г\ Т\у\ T-M)dz E.85)
148
коэффициент сноса, а
Л2 (у, Т) = lim -L- 7(z - уJ да (г; Г | у, T-At) dz E.86>
— коэффициент диффузии.
Прямое уравнение Колмогорова E.84) известно так же, как
уравнение Фоккера — Плавка. Уравнения E.83) и E.84) при-
принадлежат к классу параболических дифференциальных в частных
производных. В E.83) переменными являются х и ^Г, а пере-
переменные у и Т входят только в условие w(y\ Т\х\ Т)=Ь(у—х). В
E.84) переменными являются у и T^ty a x и t входят только че-
через начальное условие w(y\ t\x\ t)=6(y—х). Методы решения
уравнений Колмогорова рассмотрены, например, [20, 21].
5.4.9. Стационарные диффузионные процессы. Для стационар-
стационарных диффузионных процессов коэффициенты сноса E.85) и диф-
диффузии E.86) не зависят от временного параметра, а плотность
вероятности перехода зависит только от разности х=Т—t. Тогда
из E.84) получаем
JLw(y;
дх
E'87>
с начальным условием w(y; 0\х)—6(у—х).
Если при т~^оо существует предел плотности вероятности пе-
перехода, не зависящий от начального состояния х, то его называ-
называют предельной функцией распределения стационарного диффуз-
диффузного процесса
т|х). E.88>
Из E.88) следует, что —w(y\ t|jc)-^O (при т->оо. Поэтому пре-
дельную функцию распределения можно найти из обыкновенного
дифференциального уравнения первого порядка
-Г" И, (У) W (у)} = 2АХ (y)W (у) + с1г E.89)
ау
решение которого имеет вид
- / (у)) dy], E.90)
W {у)
Л2 (У)
где
(S'90a)
оо
-константы ciHc2 определяются из условия нормировки j W(y)dy
—оо
= 1 и граничного условия W(oo)=0.
ид
5.4.10. Гауссовский диффузионный процесс. Рассмотрим гаус-
<:овский стационарный случайный процесс с нулевым средним,
дисперсией а2 и нормированной корреляционной функцией /?(т).
Условная плотность распределения этого случайного процесса
[см. B.74)]
[^^] E.91)
где R = R(X).
Найдем для рассматриваемой условной плотности вероятности
функции Ап (у) 9 ойределенные согласно E.82):
Аг (у) = lim — Ъг - у) [2яа2 A - R2)]-^ ехр Г (^"J Лдг=
у = yR' @+), E.92)
Л2 (у) = lim — Г (г- уJ [2яа2 A - Я2)]-1/2 ехр Г - {Ry~zJ 1 & =
= lim —[o2(l - R2) + y2 A - /?J] = - 2o2R' @+), E.93)
T0 T
Ап (у) = 0, n > 3, E.94)
где /^(O-f.)—значение производной при приближении к нулю
справа. Если J?'(t) непрерывно в нуле, то ,7?/@)=0. Предполо-
Предположим, что /?'(т) терпит разрыв при т = 0. Тогда А{(у)фО> А2{у)ф-
=7^0.
Найдем частные производные:
— w(y9 n\x) = —w(y, \х) (т)-
= R'(T)w(y; R\x)-?-lnw(y; R\x) =
dy
; R\x)jw(y; t\x) =
,;^1^ E-96)
1пш(г/; |х) + (
ду* \ ду
— In и» (у; т|х)У]а»(у; х|дс) =
д J >
150
Подставляя E.95) — E.97) в E.87), получаем
(R /тч
_ R (т) R' (Q+) f , [/? (т) x - у] [* - R (т) у
f ,
Так как выражения в фигурных скобках совпадают и отличны от
нуля, то условная плотность E.91) гауссовского процесса удов-
удовлетворяет уравнению Колмогорова E.87) при условии
Я'(т)=Я'@+)Л(т). E.98)
Единственным решением уравнения E.98), удовлетворяю-
удовлетворяющим условию /?@) = 1, является
|/?(т)=ехр(-а,|т|), E.99)
где Х = — i?/@+)
Таким образом, гауссовский стационарный случайный про-
процесс с экспоненциальной корреляционной функцией является
диффузионным. При иной корреляционной функции гауссовский
случайный процесс не может быть диффузионным (см. п. 5.4.5).
Предельная функция распределения гауссовского диффузион-
диффузионного процесса
W{y)=\imw(y; х\х) = -^=ехр ( —?Л E.100)
что согласуется и с E.90).
5.4.11. Винеровский процесс как диффузионный процесс. Из
определения винеровского процесса, приведенного в п. 5.3.5, сле-
следует, что его условная плотность вероятности
w(y; t\x;s) = [2no*(t-s)rWexp{- 2%~5s) }» ^>s- EЛ01>
Нетрудно убедиться, что коэффициент сноса А\(у) винеровского
процесса равен нулю, а коэффициент диффузии Л2(у) = 1- Урав-
Уравнение Колмогорова E.87) в рассматриваемом случае имеет вид
-j^wfa %\x) = Ylt*w{y; T]x)' T = ^-s>° EЛ02>
и функция E.101) удовлетворяет этому уравнению.
5.4.12. Стохастический интеграл Ито. Пусть r\(t) — винеров-
винеровский процесс. Стохастический интеграл по винеровскому процес-
процессу, определяемый пределом в среднеквадратическом интеграль-
интегральной суммы
[о [I (s), s] d л (s) = lim So [I &), sj] [r, (s/+I) - л (sj)] E.103)
t max Л s->0 ;
называется стохастическим интегралом Ито.
Из E.103) и определения винеровского процесса r\(t) следу-
следует, что
E.104)
==/пЛ jf o*[t(s), s]dsj. E.105)
5.4.13. Прямое и косвенное описание диффузионного процесса.
Рассмотрим стохастическое интегральное уравнение
ЦТ) = 6 ф + /a [g(s), s] ds + fa [g (s), s] dц(s) E.106)
/ t
и соответствующее ему стохастическое дифференциальное урав-
уравнение
dl(t)=a[l(t), t]dt + a[l(t)9 t]dr\(t). E.107)
Можно доказать, что при определенных ограничениях (см. ^[22],
гл. 8, § 3) плотность вероятности перехода случайного процесса
?(/), определяемого уравнением E.107), удовлетворяет уравне-
уравнению Колмогорова с коэффициентом сноса Ах(у, t)=a(y, t) и ко-
коэффициентом диффузии Л2(#, t)=G2(y> t). Верно и обратное ут-
утверждение: каждому диффузионному процессу, задаваемому сво-
своими плотностями вероятности перехода, которые удовлетворяют
уравнению Колмогорова, соответствует стохастическое дифферен-
дифференциальное уравнение типа E.107).
Представление диффузионного процесса уравнением E.107)
можно назвать его прямым описанием, а уравнение Колмогорова
E.102), определяющее вероятностные характеристики диффузи-
диффузионного процесса, — его косвенным описанием [16]. Эти уравне-
уравнения устанавливают взаимно однозначное соответствие между
прямым и косвенным описанием диффузионного процесса.
5.5. ИМПУЛЬСНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
5.5.1. Определение. Многие известные задачи импульсной тех-
техники требуют исследования спектров последовательностей иден-
идентичных импульсов. Основные параметры, характеризующие гео-
геометрическую форму или положение этих импульсов (амплитуда,
длительность, момент возникновения фронта и др.), могут изме-
изменяться по заданному закону или быть случайными. Последнее
имеет место, когда импульсы искажаются случайными помеха-
помехами или когда модулированную импульсную последовательность
можно рассматривать как квазидетерминированный случайный
процесс.
Назовем последовательность импульсов, параметры которых
являются случайными величинами, импульсным случайным про-
процессом. Если форма импульсов задана и случайными являются
их параметры, то последовательности импульсов соответствует
152
последовательность многомерных случайных величин, а именно:
началу каждого импульса можно приписать случайные значения
его параметров. Импульсный случайный процесс определяется
бесконечным множеством реализаций, каждая из которых пред-
представляет собой последовательность импульсов.
5.5.2. Классификация импульсных случайных процессов. В за-
зависимости от вероятностных характеристик моментов появления
импульсов рассматривают три группы случайных процессов. К од-
одной из них относятся случайные процессы, у которых известное
число импульсов со случайными параметрами появляется на де-
детерминированных тактовых интервалах времени. Такие процессы
могут быть нестационарными. Действительно, два значения им-
импульсного случайного процесса в момент прохождения импульса
и в паузе между иАшульсами независимы. Значения импульсного
случайного процесса могут стать зависимыми, если рассматри-
рассматривать два момента времени, относящихся к прохождению произ-
произвольной пары импульсов. Наконец, значение импульсного процес-
процесса определяется однозначно для паузы между импульсами. Та-
Таким образом, нормированная корреляционная функция импульс-
импульсного случайного процесса при заданной разности двух моментов
времени может принимать любое значение от нуля до единицы.
Среднее значение импульсного случайного процесса также за-
зависит от времени. В лаузах между импульсами оно всегда равно
нулю, в то время как для моментов времени, соответствующих
прохождению импульсов, среднее значение может быть не равно
нулю и различно для разных импульсов. Рассматриваемую груп-
группу случайных процессов можно представить как «несущую» в
форме периодической последовательности импульсов, параметры
которой модулированы случайной стационарной модулирующей
функцией с дискретным временем. Иначе говоря, указанные им-
импульсные случайные процессы представляют собой результат на-
наложения стационарной случайной последовательности парамет-
параметров импульсов на детерминированную последовательность такто-
тактовых интервалов. Назовем эту группу импульсных случайных про-
процессов импульсными процессами с детерминированным тактовым
интервалом.
Другая группа объединяет такие импульсные случайные про-
процессы, для которых характерно отсутствие какого-либо периоди-
периодически повторяющегося тактового интервала. В отличие от процес-
процессов первой группы, для которых разность между моментами появ-
появления имлульсов не может превосходить удвоенную длительность
тактового интервала, для процессов второй группы эта разность
может быть произвольной. Можно сказать, что сдвиг каждого им-
импульса вызывает смещение всех последующих импульсов. Это оз-
означает отсутствие каких-либо признаков периодичности в импуль-
импульсном случайном процессе. При некоторых дополнительных огра-
ограничениях, наложенных на распределения вероятностей интерва-
интервалов между моментами появления импульсов, эти импульсные слу-
случайные процессы являются стационарными. К рассматриваемой
15$
группе импульсных случайных процессов относятся: случайный
телеграфный сигнал, клиппированный сигнал, получаемый из не-
непрерывного предельным ограничением, последовательность стан-
стандартных импульсов, формируемых из клиппированного сигнала,
и т. п. Назовем эту группу импульсных случайных процессов
апериодическими импульсными случайными процессами.
Наконец, в некоторых задачах импульсной техники появляют-
появляются процессы смешанного типа, для которых как параметры, так и
число импульсов на заданных тактовых интервалах, вообще гово-
говоря, случайны. Подобные импульсные случайные процессы имеют
место, например, в многоканальных системах с ИКМ, в системах,
использующих статистическое уплотнение каналов, и др.
5.5.3. Общая формула для спектральной плотности мощности
импульсного случайного процесса. Рассмотрим усеченную реали-
реализацию (например, k-ю) импульсного случайного процесса, состо-
состоящую из импульсов, расположенных по О'бе стороны от нулевого
импульса, связанного с началом отсчета времени.
Обозначим через Z^N((o) преобразование Фурье этой после-
последовательности импульсов, пусть расстояние между крайними
импульсами BN+l)T = TN. Вообще говоря, величина TN для им-
импульсного случайного процесса является случайной. Пусть g2t —
дисперсия интервалов между импульсами и за достаточно боль-
большой промежуток времени TN в какой-то реализации импульсного
случайного процесса проявилось BN+1) импульсов. Тогда
(k От \
1 + )
TT/2/V+1 /
я асимптотически TN<y>BN+\)T, где Т — среднее значение интер-
интервала между импульсами.
В соответствии с общим определением спектральной плотно-
плотности мощности случайного процесса [см. D.77)] запишем выраже-
выражение спектральной плотности мощности импульсного случайного
процесса l(t) в виде
m^Z^ (co)|2}
Sg(co) = lim -—- m^Z^ (co)|2}. E.108)
v ; n-+oo BiV+1O ll1 N v " ' v '
Обозначим через l^h)n случайные моменты возникновения и
окончания импульсов, причем четному значению индекса п соот-
соответствует начало импульса, а нечетному — конец. Присвоим каж-
каждому импульсу реализации импульсного случайного процесса но-
номер— число (положительное или отрицательное), равное поло-
половине числа в индексе ^г» соответствующего началу импульса. По-
Последовательность моментов времени, соответствующих началам
импульсов, упорядоченная, т. е. ?2(r+i)>^2r- В отношении моментов
времени с нечетными индексами такое требование, вообще гово-
говоря, необязательно, т. е. могут быть случаи, когда /2M-i<^2r+i при
/>г, и это будет означать, что r-й импульс перекрывается со все-
всеми последующими импульсами, номер которых, по крайней мере,
меньше, чем /.
154
Обозначим через ?(fe)n(/—t{hJn, ^(feJn+i) функцию, описываю-
описывающую во времени п-я импульс k-й реализации. Эта функция долж-
должна тождественно обращаться в нуль вне интервала (/(feJn, t{hJn+\)-
Пусть форма импульсов задается детерминированной функцией
времени v(t), которая тождественно равна нулю вне интервала
O^f^l. Импульсы любой реализации рассматриваемого случай-
случайного процесса получаются из v (t) умножением на случайное зна-
значение амплитуды gwn, сдвигом по оси (Времени на /(feJn и делени-
делением на значение случайной длительности T(fe)n = ^(feJn+i—^кJп. Та-
Таким образом,
Щ(, Ak) Ak) \_p(k) г(, *ik)\.(kU
Последовательность 2N-\-\ импульсов k-й реализации процес-
процесса можно записать в виде суммы
n=~N
Обозначим через g"(co) преобразование Фурье функции v(t):
g (со) = jo (t) exp (- i со t) dt. E.109)
Тогда
NT
-NT
N
= S In tnk) g (оугл ) exp ( — i со tfn). E.109a)
Для определения спектральной плотности мощности импуль-
импульсного случайного процесса подставим E.109а) в общую формулу
E.108):
S% (со) =
2 1
= — lim mx
T n-+oo 2N -f 1
N
n=—N
E.110)
Из E.110) видно, что для определения Si (со) необходимо най-
найти сначала среднее по множеству величины
mf) exp{-i<o[ № -tif)}, E.111)
где черта над g указывает на комплексно-сопряженную величину.
Выделяя в двойной сумме члены, соответствующие я = /, и учиты-
учитывая, что среднее суммы всегда равно сумме средних, находим
155
= 2
+ 2 2 «
Wk)) exp { - i со [ $> - Й/Ч}. E.112)
Ограничимся такими импульсными случайными процессами,
у которых вероятностные характеристики импульсов не зависят
от того, какой из' импульсов последовательности принят за нуле-
нулевой. При указанном ограничении величина
^H = m1{[^'x<ft']2|^(a>x<fe))|2} E.113)
не зависит от номера импульса я, а величина
X g (cox<fe)) exp (- i со [ /?> - 4/4) E.114)
зависит только от разности п—/ номеров двух импульсов. Тогда
2 «Л! ^ W16 КА))|2> = B* + 1) К И, E.115)
а двойную сумму в E.112) можно представить в виде
N N 2N
2 2 Л*-/ (о) = 2 BЛ^ + 1 -р) [Лр (со) + Лр (- со)]. E.116)
Подставляя E.115) и E.116) в E.112) и учитывая E.110), по-
получаем общую формулу для спектральной плотности мощности
импульсного случайного процесса
E.117)
оо
Если 2 ^р С00) сходится, то
JI } Eл18)
или
U l E.118а)
Предел в E.117) может существовать также и в некоторых
00
случаях, когда-сумма 2 ^р С0) расходится.
р=\
156
Формула E.117) дает наиболее общее выражение спектраль-
спектральной плотности мощности импульсного случайного процесса с уче-
учетом взаимной корреляции его случайных параметров: амплитуд,
.длительностей и моментов возникновения импульсов.
5.5.4. Импульсные случайные процессы с независимыми пара-
параметрами. Предположим, что случайные параметры импульсного
>случайного процесса независимы, но при этом будем учитывать
корреляцию между однородными параметрами различных им-
импульсов. Введем теперь вероятностные характеристики парамет-
параметров импульсного случайного процесса. Обозначим через а, а2
среднее значение и дисперсию случайных амплитуд, Rp — коэф-
коэффициент корреляции амплитуд я-го и /-го импульсов (р = п—/),
W\%(x)i ^2т (*> У\ р) —одномерную и двумерную функции распре-
распределения длительности импульсов, то, сг2т — среднюю длительность
и дисперсию длительности импульса и RPtX— коэффициент кор-
корреляции длительностей я-го и /-го импульсов. Из E.113) следует
К((д) = {а2 + о2)Ко((о), E.119)
где
K0((o) = ]x2\g((ox)\2wlx(x)dxi E.119а)
о
а из E.114) находим
hp (со) = (o2RP + а2) КР (со) Нр (со), E.120)
где
КР (со) = j J xyg (со х) g (со у) w2x (х, у; р) dx dy, E.120а)
о о
Яр(со) = т1{ехр[^1со(^)-4/))]}, р = л-/. E.1206)
Используя полученные соотношения, находим теперь из общей
формулы E.117) спектр импульсного случайного процесса с незави-
независимыми параметрами
+ lira 2 2 f1- „Л, Wa Кр+ аа) Re [ffp (ев) Яр ((¦))]}. E.121)
tf-»oo p==l \ IN + 1 ) )
Здесь функция #р(со) определяется только совместным распре-
распределением моментов появления импульсов, а функция /Ср (со) —
только двумерным распределением длительностей импульсов. Из
формулы E.121) видно также, что спектр импульсного слу-
случайного процесса зависит от среднего, дисперсии и коэффициен-
коэффициента коррреляции случайных амплитуд и не зависит от вида функ-
функции распределения этих амплитуд.
157
Формула E.121) несколько упрощается, если длительности
импульсов неограничены. В этом случае
2N
N-+OQ
где
-л
o) , E.122)
J
g-(co) = ji/ @ exp (- i со /) Л. E.122a)
о
В дальнейшем предполагается, что разнородные параметры
импульсных случайных процессов (амплитуда, длительность, мо-
момент появления) независимы.
5.5.5. Импульсные случайные процессы с детерминированным
тактовым интервалом. В импульсных случайных процессах с де-
детерминированным тактовым интервалом момент появления fth\n
любого п-то импульса реализации процесса можно представить
в виде
*<ft>2n = /i74v<*>n, E.123)
где Т — длина тактового интервала; vn — случайная величина с
нулевым средним.
Так как \в рассматриваемом случае за один такт возникает
только один импульс, то vn не превосходит по абсолютному зна-
значению 71/2. Пусть известны характеристические функции 6iv (ко) и
02 v (юь о>2; рТ) случайных величин vn.
Для рассматриваемой группы случайных процессов [см.
E.1206)]
Нр (о) - ехр (- i сорГ) пг1 {ехр [ — i <d ( v^> — v<;*>)]} =
p = n-j. E.124)
В том случае, когда однородные параметры различных им-
импульсов также независимы, Rp = 0 и
E.125а)
xg((Dx)wlx(x)dx == /Coo (со). E.1256)
2
О
Обозначим
^И = 2Шт1 2 A~ ^^ ){o2/?pRe[^p(a>)x
хв2л,К -со; /7Г)ехр(-1со/7Т)] +
- /(ос (o))|6lv (о))|2 ехр (- i сор Г)]}. E.126)
158
Нетрудно видеть, что г|)(со)=0, когда все параметры незави-
независимы.
Используя E.121) и E.126), запишем для спектра импульсно-
импульсного случайного процесса с детерминированным тактовым интерва-
интервалом
= jr [(а2 + а2) К0Н - a2 \Sl
E.127)
Нетрудно доказать (см. '[1], с. 461), что
lim [l +2 2 ( 1 — N)c°sPuO1l =
N^oo[ р=1\ 2Л^+ 1 / J
r = 0, ±1, ±2,... E.128)
Из E.127) и E.128) следует, что энергетический спектр им-
импульсного случайного процесса с детерминированным тактовым
интервалом слагается из непрерывной 5н(со) и дискретной 5д(со)
частей:
Sg(cD)=SH(co) + SA(a>), E.129)
где
^ }, E.130а)
E.1306)
5.5.6. Апериодические импульсные случайные процессы. Рас-
Рассмотрим теперь импульсные случайные процессы, у которых нет
детерминированного тактового интервала. Предположим, что ин-
интервалы между последовательными импульсами взаимно незави-
независимы. Обозначим интервал между моментами появления двух 'по-
'последовательных импульсов реализации через
и зададим характеристическую функцию в^со) случайной вели-
величины \хПу предполагая, что эта функция ше зависит от я, т. е. от
того, где расположен интервал \in на оси времени. Можно пока-
показать, что при указанном предположении импульсный процесс бу-
будет стационарным в широком смысле.
Для исследования спектра рассматриваемого импульсного слу-
случайного процесса обратимся вновь к формуле E.117). Если со-
сохранить предположение о том, что отсутствует статистическая
зависимость амплитуд импульсов от их длительности, то функция
/((со) определяется по E.119). Для определения /ip(co) нельзя
159
воспользоваться E.120), так как это соотношение получено в
предположении, что интервалы времени между моментами появ-
появления импульсое не зависят от их длительностей. Теперь необхо-
необходимо отказаться от этого предположения. Действительно, интер-
интервал времени \in между моментами возникновения двух последо-
последовательных импульсов является суммой двух случайных величин:
длительности импульса хп и длительности паузы между импуль-
импульсами т*п. Следовательно, в общем случае случайные величины
\хп и хп зависимы. Обозначим через 6iT (со) и 6iT* (со) характе-
характеристические функции случайных (величин %п и т*п- В дальнейшем
ограничимся случаем, когда длительности импульса и паузы не-
независимы. Тогда
в11х(со) = в1г((о)в1г.((о). E.132)
Так как при пф\
V
r=/+l
то из E.114) для некоррелированных амплитуд непосредственно
следует
hn-i (со) = а*тх\ T{nk) %{jk) g (ют<Л)) X
где а —среднее значение амплитуд импульсов.
В силу независимости случайных величин tj, t*j, тп, т*п, t2n—
п— 1
—/2/+2= S Ft и независимости в^ (со) от номера интервала
имеем
--/-1 (- со) 01х* (-0) щ {%Ы g (mW)} X
Учитывая, что
g (ют)*0) ехр [ - i ют}*)] = ji> (t) exp [i сот<*> (t - 1)] dt =
о
о
и обозначая:
g-x (со) = jy A — x) exp (- i со*) dx = g (- со) exp (— i со), E.133)
о
Q (со) = m, {xW gr"(cot<«)] = ]>g («we) »i, W dx, E.134)
0
Qx И = тх{ xf) ft (©!(*>)} = J^i M »it W d^» E.135)
160
получаем
АР И = a*Q (со) Q± (со) 61х*(-со) &>-* (- со). E.136)
Заметим, что Q@) = Qi @) = T0g@), так как
1 1
о о
Учитывая, что при со=^=0
а при со = 0 указанная сумма может быть представлена дельта-
функцией, из E.117) с учетом E.119) и E.136) получаем следую-
следующее выражение энергетического спектра апериодического им.-
пульсного случайного процесса:
+ 2Re {Q (- со) Qx (- со) 01т* (со) [ 1 -в1|? (со)]-*} + -?1^-в(©).
^E.137)
Формула E.137) указывает на существенное различие энерге-
энергетических спектров апериодического импульсного случайного про-
процесса и импульсного случайного процесса с детерминированным
тактовым интервалом. Спектр E.137) не содержит дискретной
части, характерной для спектра процесса с детерминированным
тактовым интервалом (кроме одной дискретной компоненты, со-
соответствующей постоянной составляющей процесса).
5.5.7. Импульсные случайные процессы смешанного типа. Рас-
Рассмотрим импульсный случайный процесс смешанного типа при
следующих ограничениях:
форма всех импульсов идентична и задается нормированной
функцией единичной амплитуды v(t), которая тождественно рав-
равна нулю вне интервала @, 1);
межтактовая корреляция импульсов отсутствует;
нет статистической связи между изменениями различных па-
параметров импульсов (амплитуды, длительности, момента возник-
возникновения) ;
на данном тактовом интервале длительности импульсов и па-
пауз статистически независимы;
вероятностные характеристики импульсов и пауз не зависят
от их положения в тактовом интервале и от номера тактового
интервала и задаются величинами среднего а и дисперсии а2 ам-
амплитуды импульса, функцией распределения wix(x) длительности
импульса, характеристическими функциями 6it* (со) паузы и
61ц(со) интервала между появлением двух последовательных им-
импульсов на данном тактовом интервале.
6—87 Ш
Обозначим, кроме того, через рг вероятность того, что на так-
тактовом интервале длительностью Т находится точно г импульсов,
Спектр рассматриваемого импульсного случайного процесса
состоит из непрерывной и дискретной части, причем
5Н И = -f ? Рт\г (а2 + о2)Ко И -
•2a2Re| i-VM [r-T^w)\\' E.138)
2 6 (со — ^f-\ E.139)
Здесь использованы обозначения E.119а), E.1256), E.134),
E.135).
Для импульсных случайных процессов с детерминированным
тактовым интервалом pi = l, pr = 0 при г=^=1, и из E.138) и
E.139) как частный случай получаются формулы E.130а) и
E.1306) (в этом случае момент появления импульса определяет
длительность паузы v от начала тактового интервала).
Для апериодических импульсных случайных процессов рг-+-0
для любого конечного г и Г = гГ0->оо при заданном конечном
среднем расстоянии Го между импульсами. При этих условиях
второе слагаемое в фигурных скобках E.138) обращается в
нуль, а E.139) после раскрытия неопределенности переходит в
Ba2/r2o)/Coo@N(i(o). Таким образом, для апериодических процес-
процессов из E.138) и E.139) следует E.137).
Большое число интересных для практических приложений
примеров, иллюстрирующих изложенную в этом разделе теорию
имлульсных случайных процессов приведено в '[1, гл. 11] (см.
также задачи 5.8—6.12).
5.6. ЗАДАЧИ
5.1. Доказать строгую стационарность квазидетерминированного процесса
b,(t) ==a cos(r)^+cp) A)
при условии, что случайные величины а, г\ и ф взаимно независимы, причем <р
распределена равномерно иа интервале @, 2я). Проверить, что
1
вде © (т) — характеристическая функция случайной величины ц.
162
Доказать, что при постоянных а=а0 и г|=Шо процесс ?@ эргодический,
причем
^1Й2(О}=«2о/2, В^ (T)=i(a2o/2)icoscu0T. D)
5.2. Доказать, что двумерная плотность вероятности и двумерная характе-
характеристическая функция гармонического колебания постоянной амплитуды а0 и
частоты со0 с равномерно распределенной фазой равны
о>з(*1> Х2\ т)= Л !/—5 о (б *, —
2як ag — х{ I |_
+ б ха — я0 cos ( со0 т — arccos "~"±"-) } >
а0
(Ui, v%\ т) = 2 ( - l)w em Im («о fi) Im («о »«) cos m щ т, F)
— функция Беоселя m-го порядка от мнимого аргумента, 8о=1, 8т = 2,
5.3. Показать, что одномерная характеристическая функция квазидетерми-
нированного стационарного процесса 6@=a'COs(a)o^+9)» где со0 — постоянная,
Ф (распределена равномерно на интервале @, 2зт), а (распределение а равна
Wa(r), имеет вад
где 1о(х) — функция Б^сселя нулевого порядка.
Указание. Представить одномерную плотность вероятности |(/) в виде
]wa(r)w^(x\r)dr G)
— оо
и использовать результат задачи 3.8.
5.4. Замечая, что в условиях задачи 5.3 одномерное распределение W^ (x)
всегда симметрично (поскольку 0g Jo)) —действительная и четная функция),
установить следующую связь между моментами четного порядка ?(/) и амп-
амплитуды а:
22rt МJ
т%п {а} = B/l)j m2n{l(t)}. (8)
Если We (х) = Bяа2)~1/2ехр ( __ — х2/а2\ » то показать, что
т2п{а}=2пп1о2п (9)
[ом. C.76)].
5.5. Доказать справедливость следующего соотношения для гауссовского
случайного процесса:
6* , 16S
Обобщить формулу A0) иа гауосовский случайный процесс с нулевым
средним
«1 | П Ш|=0, (Па)
где суммирование ведется по воем различным способам, по каким можно раз-
разделить 2/г моментов времени на п пар.
Указание. Использовать связь моменггаых функций гауссовскога процес-
процесса с его многомерной характеристической функцией.
5.6. Рассмотреть случайный телеграфный сигнал ?(/), реализациями которо-
которого являются «прямоугольные волны» (рис. 5.6), принимающие два значения h
и —h. Пусть число v(/) перемен знака полярности сигнала на интервале @, t)
представляет пуассоновский процесс, подчиняющийся распределению E.45). До-
Доказать, что корреляционная функция телеграфного сигнала при указанных
предположениях
Г U 1
t*>tlt A2
-2 jMOtf ,
где X(t) — интеноивность nyaccioiHOiBiCKoro процесса.
Показать, что для однородного пу&юсоновского потока случайных моментов
перемен знака телеграфного сигнала с интенсивностью Я>0 корреляционная
функция и спектральная плотность мощности сигнала
2Х|т|), A3)
Убадиться, что стационарный в широком смысле случайный телеграфный сиг-
сигнал непрерывен в средаеквадрэтическом (хотя каждая его реализация имеет
¦бесконечное число точек разрыш). Убедиться также, что этот сигнал, однако,
не дифференцируем в среднеювадратическом,.
5.7. Доказать, что среднее число и средняя длительность выбросов над
уровнем х0 эргодического центрированного гаусюовского процесса равны
j
где а2 — дисперсия процесса, F(z) — интеграл Лапласа и ©i апределяется по
формуле D.145).
5.8. Рассмотреть последовательность равноотстоящих на интервалах Т пря-
прямоугольных импульсов длительностью т0 со случайными независимыми одина-
одинаково распределенными амплитудами (рис. 5.7). Средние значения и дисперсии
амплитуд импульсов равны а и а2 соответетвешю. Доказать, что непрерывная
164
(Щ
/7
-h
t
Рис. 5.6. Случайный телеграфный сигнал
и доискрегаая части спектра рассматриваемого импульсного случайного процесса
с детерминированным тактовым интервалом ((рис. 5.8)
Г sina)T0/2 \2
\ сото/2 ] '
A8)
Доказать также, что корреляционная функция рассматриваемого импульсного
случайного процесса (рис. 5.9)
A9)
где
0,
B0)
B1)
/¦ = 0, ±1, ±2,...
5.9. Рассмотреть последовательность прямоугольных импульсов с одинако-
одинаковыми амплитудами а, длительностью т0, но со случайным моментом появления
внутри заданного тактового интероала длительностью Т (рис. 5.10). Моменты
появления различных импульсов независимы, распределены одинаково, причем
швестна характеристическая функция 6V (<o) случайного смещения v середи-
середины импульса относительно начала тактового интервала. Вывести следующее
1
Рис. 5.7. Импульсный случай-
случайный процесс (случайные ам-
амплитуды импульсов)
Рис. 5.8. Спектральная плотность мощно-
мощности процесса, представленного на рис. 5.7
165
B(v)k
л л
О
Рис. 5.9. Корреляционная функция процесса,
представленного на рис. 5.7
Рис. 5.10. Импульсный случай-
случайный процесс (случайное время
появления импульса)
выражение для спектра рассматриваемого «мпульшого случайного процесса с
детерминированным тактовым интервалом
5(cd) = -
sino)To/2
сото/2
б со —
B2
5.10. Рассмотреть последовательность прямоугольных импульсов постоянной
амплитуды а и случайной длительности, которые появляются в начале каждого
тактового интервала Т (рис. 5.11). Длительности импульсов независимы, распре-
распределены одинаково, причем известна характеристическая функция Ох (со) слу-
случайной длительности -импульса. Доказать, что непрерывная и дискретная части
спектра рассматриваемого импульсного случайного процесса с детерминирован-
детерминированными тактовыми интервалами!
9/72
аJ Г2
[1
0Т И12 ~ \ N ехр (i сото) -
—- 0^ ( — со) ехр ( — i сот0)]
61 со-
2кг
B3)
B4)
5.11. Рассмотреть клиппированный сигнал, представляющий апериодическую-
последовательность прямоугольных импульсов постоянной амплитуды а и слу-
случайной длительности, которые возникают в случайные моменты времени (рис.
5.12). Такой сигнал появляется на выходе идеального ограничителя, когда на
его входе действует случайный процесс. Пусть случайные длительности им-
импульсов и пауз между ммпульса'ш независимы и подчиняются одному и тому
же закону распределения, а ©т (со) ¦— характеристическая функция, соответ-
соответствующая этому закону.
Т Г
11"_DL
Рис. 5.11. Импульсный случайный про-
процесс (случайные длительности им-
импульсов)
166
Рис. 5.12. Клиппированный сигнал
Доказать, что спектр такого клиштировашюш сигнала имеет следующий вид:
Т0С02
Re
-Л(со)
B5)
где то — среднее значение длительностей импульсов и пауз. Вычислить значе-
значение спектральной плотности при со=0 непрерывной части спектра B5) и убе-
убедиться, что
5^@) =2a2iG2T/To, B5a)
где о2х — дисперсия длительностей импульсов и пауз.
Рассмотреть экспоненциальное распределение длительностей импульсов и
пауз, когда
w%(x) = —ехр ( ——), *>0, 9Х (со) = A — coTq)"*1 , то>0
то \ то /
я убедиться, что в этом случае непрерывная часть спектра B5) совпадает со
спектрам случайного телеграфного сигнала [см. A4) задачи 5.6 при Я=1/то я
5.12. Рассмотреть импульсный случайный процесс, реализациями которого
являются пачки амшштудно-модулированных импульсов на детерминированных
тактовых интервалах Т. Длительности импульсов т0 и пауз между ними т*0
постоянны, а число импульсов в пачке случайно (рис. 5.13). Доказать, что не-
непрерывная часть спектра рассматриваемого импульсного случайного процесса
5Н (со) =
sincoTo/2 \2
сото/2
B6)
где % — среднее число импульсов в пачке и а2 — дисперсия амплитуды им-
импульсов.
Выражение B6) отличается от непрерывной части энергетического спектра
процесса, в котором на каждом детерминированном интервале проявляется
только один амплитудно-модулированный импульс, лишь множителем Я, равным
среднему числу импульсов в пачке.
Доказать, что дискретная часть спектра рассматриваемого импульсного
случайного процесса
1
sincoTo/2
(О
X
=—оо \ I
/fe=-oo
Рис. 5.13. Импульсный
случайный процесс (слу-
(случайные амплитуды и слу-
случайное число импульсов
яа тактовом интервале)
р
—»
п
т
л
п
1 [
п
167
где а — среднее значение амплитуд импульсов и рт — вероятность того, что
в лачке окажется г импульсов, г>0.
Заметим, что в отличие от B6) дискретный спектр зависит от закона
распределения случайного числа импульсов в пачке, но не зависит от диспер-
дисперсии амплитуд (т, е, от амплитудной модуляции импульсной последовательности)*
Глава 6
ОСНОВНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ СИСТЕМ
6.1. КЛАССИФИКАЦИЯ И ХАРАКТЕРИСТИКИ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ СИСТЕМ
6.1.1. Определение модели системы. Для решения мно-
многих задач, возникающих при разработке и исследовании радио-
радиотехнических систем, систем связи и управления и других инфор-
информационных технических систем используют математические моде-
модели систем. Такие модели представляют формализованное количе-
количественное описание системы без детализации ее физических осо-
особенностей. В этом смысле математические модели обладают уни-
универсальностью, так как одну модель можно использовать для
многих технических систем различного назначения.
Математическая модель системы определяется оператором S
отображения множества X значений сигналов на входе системы
на множество Y значений сигналов на выходе системы
x{t)<=X, y(t)<=Y, t<=T. F.1)
Сигналы x(t) на входе системы и y(t) на ее выходе являются
функциями времени, т. е. отображениями множества моментов
времени Т на множества X и Y соответственно. В дальнейшем
функции x(t) и y(t) будем называть входным и выходным сигна-
сигналами или кратко: «вход» и «выход».
Отметим, что приведенное определение F.1) математической
модели системы можно отнести к любому техническому объекту.
6.1.2. Системы с дискретным и непрерывным временем. Раз-
Различают два класса систем: с дискретным временем, когда об-
область Т определения входных и выходных сигналов представля-
представляет конечное или счетное множество времени, и с непрерывным,
временем, когда указанная область — континуум.
Системы с непрерывным временем называют аналого-дискрет-
ными, если множества X и У значений сигналов — конечные или
счетные. Их называют аналоговыми, если указанные множест-
множества — континуумы.
Системы с дискретным временем называют цифровыми, еслш
множества X и Y — конечные или счетные. Их называют дискрет-
но-аналоговыми, если указанные множества — континуум.
168
6.1.3. Характеристики системы. Отображение F.1) можно за-
записать в виде функционала
-x), F.2)
представляющего зависимость выходного сигнала в произволь-
произвольный момент t от всех предыдущих значений входного сигнала на
интервале от —оо до t. В такой форме характеристика F.2) учи-
учитывает условие физической реализуемости системы, согласно ко-
которому реакция системы, обусловленная предыдущими значения-
значениями входного воздействия, не зависит от последующих (причина
не может опережать следствие). Обозначение F* указывает на за-
зависимость вида функционала или его параметров от времени. Ес-
Если такая зависимость отсутствует, т. е. если выходной сигнал за-
зависит от времени / только через входной сигнал, то систему на-
называют инвариантной во времени (или системой с постоянными
во времени параметрами).
Соотношение F.2) назовем характеристикой «вход — выход»
системы.
Предположим теперь, что значения выходного сигнала извест-
известны лишь на конечном интервале времени [tOi t]. В этом случае
значение выходного сигнала y(t) зависит не только от заданного
отрезка xft0 входного сигнала, но и от состояния z(t0) системы в
начальный момент t0:
y@-D,[z(y, *<o]. F.3)
Состояние системы также изменяется во времени согласно урав-
уравнению перехода
z(t) = Gt[z(t0), *{.]• F.4)
Для инвариантной во времени системы индекс t у функционалов
F, G и D должен быть опущен.
Соотношения F.3) и F.4) назовем характеристикой «вход —
состояние — выход» системы.
Система, у которой выходной сигнал y(t) зависит от значений
входного сигнала в моменты времени, предшествовавшие моменту
t наблюдения выходного сигнала, называется физически реали-
реализуемой динамической (инерционной или системой «с памятью»).
Характеристика такой системы представляется функционалом
F.2) или двумя функционалами F.3) и F.4).
Если значение выходного сигнала y(t) в момент наблюдения
определяется значением x(t) входного сигнала только в тот же
самый момент времени ty то система называется статической (неи-
(неинерционной или системой «без памяти»). В этом случае характе-
характеристика «вход — выход» системы представляется уже не функци-
функционалом, а функцией (в общем нелинейной)
УV) =$[*(*)]> teT, F.5)
где Т — счетное множество или континуум.
169
6.1.4. Аппроксимация характеристики «вход — выход» статиче-
статической системы. Нелинейную функцию f(x)y представляющую, харак-
характеристику статической системы, часто аппроксимируют элементар-
элементарными функциями, например степенными. В соответствии с теоремой
Вейерштрасса [23] любая функция, непрерывная на ограниченном
замкнутом интервале, может быть аппроксимирована с любой за-
заданной точностью полиномом, степень которого определяет точ-
точность аппроксимации. Таким образом, характеристика F.5) ста-
статической (инвариантной во времени) системы записывается в виде
полинома
0@-2А***@ F.6)
при подолнительном начальном условии лг(О)=О.
Для полиномиальной аппроксимации F.6) можно использовать
ортогональные полиномы (см. п. 2.5.1) или частичную сумму ряда
Маклорена. При этом константы hh, k=lyn, определяются коэф-
коэффициентами разложения функции f(x) в ортогональном базисе, а
при разложении в ряд Маклорена — по известной формуле
6.1.5. Аппроксимация характеристики «вход — выход» динами-
динамической системы. Для инвариантной динамической системы с дис-
дискретным временем функционал F.2), определяющий характеристи-
характеристику «вход — выход», можно представить в виде функции счетного
числа переменных
y(n)=j\[x(n),x(n-\),...,x(n-k),...]. F.7>
Здесь и ib дальнейшем для сигналов с дискретным временем ис-
используются обозначения x(tn)=x(n), y(tn) =y(n). При дискре-
дискретизации с периодом Т величина tn = nT.
Разлагая функцию многих переменных в кратный степенной
ряд, представим характеристику F.7) в виде
у(п)= 2М я-0+2 2 hijx(n-i)x(n-j) +
*=0 *=0 /=0
+ 2 2 2 hmx{n-i)x(n-j)x(n-k)+ ... F.8)
t-=o /=о fe=o
Заданная точность аппроксимации функции F.7) определяет
необходимое число слагаемых в F.8).
Для инвариантной динамической системы с непрерывным
временем функционал F.2) можно аппроксимировать с любой
заданной точностью функциональным рядом Вольтерра:
П оо оо
*=ю о
X х (t - и2)... х (* - uk) du± du2... duk. F.9)
170
Разработаны методы определения весовых коэффициентов h{,
hij, hah,... и весовых функций hk(uu u2,..., ии), k^l с помощью
ортогональных функций. Одним из них является метод Винера
'[1,24].
6.1.6. Линейные системы. На практике широко используется
подкласс линейных моделей систем. Система называется линей'
ной, если она удовлетворяет двум условиям: аддитивности
{принципу суперпозиции) и однородности.
Пусть y{(t) и y<2(t)—выходные сигналы системы при вход-
входных сигналах х\ (/) и X2(t) соответственно. Условие аддитивно-
аддитивности выполнено, если при входном сигнале x(t) =c\X\ (t) + С2#г@
выходной сигнал y{t)=Ciyi(t)+c2y2{t) для произвольных кон-
констант си с<2 и произвольных сигналах Xi(t), X2(t).
Пусть y(i)—выходной сигнал системы при входном x(t).
Условие однородности выполнено, если при входном сигнале
cx(t) выходной сигнал равен cy{i) inpn произвольной константе
с и произвольном сигнале x(t).
6.2. ЛИНЕЙНЫЕ СИСТЕМЫ С ДИСКРЕТНЫМ
ВРЕМЕНЕМ (ЦИФРОВЫЕ ФИЛЬТРЫ)
6.2.1. Характеристика «вход-выход». Линейная (динамиче-
(динамическая) система с дискретным временем характеризуется тем, что
значение у(п) выходного сигнала получается суперпозицией
(сложением) значений x{k) входного сигнала, умноженных на
весовой коэффициент h(л, к), зависящий в общем случае и от
момента воздействия сигнала x(k), и от момента наблюдения
сигнала у{п). Таким образом, сигнал у(п) на выходе линейной
системы с дискретным временем можно выразить через значения
x(k) сигнала на входе в виде суммы
«Ф)= 2 Л (л, k)x(k). F.10)
?=-оо
Функцию A (л, k) называют импульсной характеристикой линей-
линейной системы с дискретным временем, а сумму F.10) —сверткой
импульсной характеристики с входным сигналом. Для физиче-
физически реализуемой линейной системы А (л, k)=0 три k>n. В этом
случае из F.10) следует
У\(п)= 2 h (л, k)x{k). F.11)
/z=—оо
Если параметры линейной системы постоянны во времени
{т.е. она инвариантна), то ее импульсная характеристика зави-
зависит только от одного аргумента — разности л—k. Для таких сис-
систем соотношение F.10) преобразуется к виду
у(л)= 5 h(n-k)x{k) F.12
fc=—оо
171
или с учетом физической реализуемости
t/(/z)= S h(n-k)x{k), л = 0,1,2,... F.13)
Заменой индекса суммирования т = п—k соотношения F.12) и
FЛЗ) преобразуются к виду
у(п)= 2 h{m)x(n-m) F.14>
т=—оо
и соответственно, с,учетом физической реализуемости,
у(п) = 2 h(m)x(n-m), м = 0, 1,2,... F.15)
т=0
Формулы F.10) — F.15) описывают характеристики «вход—
выход» линейных динамических систем с дискретным временем.
Заметим, что F.15) совпадает с линейным членом разложения
F.8) характеристики «вход — выход» динамической системы об-
общего вида.
6.2.2. Передаточная функция. При анализе инвариантных ли-
линейных систем с дискретным временем вместо рассмотренных в.
п. 6.2.1 соотношений между входным и выходным сигналами
часто используют соотношения между ^-преобразованиями. Как
известно, ^-преобразование F(z) функции f(n) целочисленного
аргумента п
где z — комплексная переменная, причем функция F(z) опреде-
определена для тех значений z, при которых степенной ряд F.16) схо-
сходится. Обратным ^-преобразованием является
/ (п) = — \F (z) z"-1 dz, F.16a)
2n i с
где с — замкнутый контур в области сходимости, охватывающий
начало координат.
Основные свойства преобразования F.16) аналогичны свой-
свойствам преобразований Фурье и Лапласа. В частности, 2-преоб-
разование свертки двух функций целочисленного аргумента
равно произведению г-преобразований этих функций. Применяя
это правило к F.12) и обозначая через X(z), Y(z), H(z) 2-пре-
образования сигналов х(п), у(п) и импульсной характеристики
h(n), получаем
H(z) = Y(z)/X(z). F.17)
Функция H(z) называется передаточной функцией инвари-
инвариантной линейной системы с дискретным временем.
6.2.3. Характеристика «вход — выход» в форме разностного
уравнения. Полезной формой представления характеристик
«вход — выход» некоторых инвариантных физически реализуе-
172
мых линейных систем с дискретным временем (цифровых фильт-
фильтров) являются линейные разностные уравнения с постоянными
коэффициентами
s«i0(*-o=:sM(*-/). FЛ8>
причем ао=1, апф0.
Если в F.18) три ао=1, по крайней мере, еще при одном зна-
значении i и при одном значении / коэффициенты п{фО, Ь^фЪ, то
цифровой фильтр называют рекурсивным. В этом случае выход за-
зависит не только от входа, но и от предыдущих значений выхода.
Если же в F.18) a; = 0, i=l,/z, то цифровой фильтр называют не-
нерекурсивным. В этом случае выход представляет весовую сумму
входных величин [27].
Совершая г-преобразования над обеими частями уравнения
F.18) и учитывая, что г-преобразование функции f(k—т) со сме-
смещенным аргументом равно z~mF(z), получаем при нулевом началь-
начальном состоянии системы
Y(z)ia,z- =X{z)ib}z-i. F.19)
i=0 /=0
Из F.17) и F.19) следует, что передаточная функция линейной
системы, которая характеризуется уравнением F.18),
/—0
F.20)
Формула F.20) ери заданных коэффициентах а* и Ьг служит
основой для построения цифровых фильтров с минимальным чис-
числом сумматоров, усилителей и элементов задержки (см., напри-
например, \[25]).
6.2.4. Характеристика «вход — состояние — выход». Принимая
текущие значения выходного сигнала за переменные состояния,
можно заменить разностное уравнение F.18) м-го порядка систе-
системой п линейных разностных уравнений первого порядка, записан-
записанной в матричной форме (см., например, [16, 26], а также п. 6.3.5):
z(k + I) =Az(k) +Bx(k), F.21)
где z(k) — вектор-столбец состояний,
ГО 0
1 0
0 1
0 -а0 ~\
0 -ах
0 ~а2
L0 0 1 -пп-х-
Общее решение уравнения F.21)
В =
a1bn-b1
Ял-1 К — ЪП-\
где
п—1
t=0
F.22)
F.23)
173
Уравнение F.21) представляет так называемое каноническое
уравнение состояния линейной системы с дискретным временем.
Это уравнение совместно с уравнением
y(n)=Cz(n)+Dx(n), F.24)
где
С'=@, 0, ...,-\)9D = bn F.25)
представляет характеристику «вход — состояние — выход» [см.
F.3) и F.4)].
6.3. ЛИНЕЙНЫЕ СИСТЕМЫ С НЕПРЕРЫВНЫМ ВРЕМЕНЕМ
6.3.1. Характеристика «вход — выход». Как и для линейных
систем с дискретным временем, характеристика «вход — выход»
линейной системы с непрерывным временем представляется на ос-
основе принципа суперпозиции интегралом Дюамеля
]i)x(>z)d%. . F.26)
Функцию h(ty т) называют импульсной характеристикой линейной
системы с непрерывным временем, а интеграл F.26) — интег-
интегральной сверткой импульсной характеристики со входным сиг-
сигналом.
Для физически реализуемой линейной системы h(t, т)=0 при
%>t (значение y(t) в данный момент времени зависит только от
значений x(t)y предшествовавших моменту t). В этом случае верх-
верхний предел интегрирования в F.26) равен /:
\ т)*(т)йт. F.27)
Для линейных систем с постоянными параметрами импульс-
импульсная характеристика зависит только от разности t—т моментов на-
наблюдения на выходе и 'приложения воздействия на вход систе-
системы, т. е. h(t, x)=h{t—т). При этом формула F.26) преобразу-
преобразуется к виду
y(f)= ]h(i)x(t-x)dx. F.28)
— оо
Соответственно для физически реализуемых систем
y(t)= ]h(x)x(t~~%)dT. F.29)
о
Заметим, что F.29) совпадает с линейным членом функцио-
функционального ряда Вольтерра F.9).
6.3.2. Передаточная функция. По определению передаточная
функция fe(ico) и импульсная характеристика h(t) инвариантной
линейной системы с непрерывным временем являются парой пре-
преобразования Фурье
174
= ]h(t)exp(-ia>t)dt, F.30a)
—oo
J coOdco. F.306)
Обозначая через X(m) и Y(m) спектры (преобразования
Фурье) входного x(t) и выходного y{t) сигналов, получаем из
F.28) вследствие известного свойства преобразований Фурье
*(i©) = Y(i©)i/X(i©). F.31)
Модуль и аргумент передаточной функции к(ш) называют
амплитудно-частотной (или кратко частотной) С (со) и фазо-час-
тотной (или кратко фазовой) <р(со) характеристиками линейной
системы
*(i©)=C(©)exp(i<p(<o)). F.32)
Учитывая, что С (со) — четная, а ф(со) — нечетная функции, лег-
легко выразить импульсную характеристику через частотную и фа-
фазовую характеристики:
h(t)=— ?C (со) cos [со t + ф (со)] d со. F.33)
Шириной полосы пропускания частотной характеристики назы-
называют ширину основания прямоугольника, высота которого равна
максимальной ординате С2(со0), а площадь — площади под кри-
кривой квадрата частотной характеристики1
F.34)
б
6.3.3. Узкополосные линейные системы. Если частотная харак-
характеристика имеет резко выраженную область резонанса в окрест-
окрестности частоты ©о и если ((Оо»Ас, то линейная система с такой
характеристикой называется узкополосной.
Заменой переменной .интегрирования Q = со—соо приводим фор-
формулу F.33) к виду
Г i °°
1
Г С (Q + соо) sin [Q t + ф (Q + о)о)] d Q sin coo
' — С00
1 На практике часто удобно измерять ширину полосы линейной системы меж-
между точками, в которых усиление по мощности равно половине его максимального
значения или усиление по напряжению составляет 0,7 максимального. Для тео-
теоретических исследований удобнее пользоваться определением ширины полосы в
виде F.34). Однако оба способа в наиболее важных практических случаях дают
близкие результаты. Ширину полосы пропускания, определенную согласно F.34),
иногда называют эффективной.
175
Для узкополосной системы нижние пределы интегрирования
в интегралах, заключенных б фигурные скобки, с -малой погреш-
погрешностью можно распространить до —оо. Тогда, обозначая
К @ = -^ ]СО (Q) sin [Q t + ф0 (Q)] d Q,
cos
получаем
h(t) =hc(t) cos coot—hs{t)sin ®oi =
= ho(t)cos[G>ot+yo(t)]9 F.35)
где
ho{t) = [h\{t + h\{t)yi\ F.35a)
i|)o @ = arctg [hs (t) I hc (t) ]. F.356)
Если частотная характеристика симметрична, а фазовая —
антисимметрична относительно резонансной частоты ©о, то hs(t) =
= 0, я|;о(/)^О и импульсная характеристика узкополосной линей-
линейной системы
0t, F.36)
т. е. представляет медленно меняющуюся функцию hc(t) с высо-
высокочастотным гармоническим заполнением.
Ширина полосы пропускания узкополосной линейной системы
в соответствии с определением F.34)
Ao = ]cs(O)dG/Cg@). F.36a)
о
6.3.4. Характеристика «вход — выход» в форме дифференци-
дифференциального уравнения. Полезной формой представления характерис-
характеристики «вход — -выход» .некоторых инвариантных, физически реали-
реализуемых линейных систем с непрерывным временем являются обык-
но(венные линейные дифференциальные уравнения с постоянными
коэффициентами
= 2 6,-^-, F-37)
dtk r=o df
причем ап=1, Ф
Совершая преобразование Фурье над обеими частями уравне-
уравнения F.37), получаем при нулевом начальном состоянии системы
У 0 ©) 2 (i ®)k ah = X(i со) 2 (i ®У Ьт. F.38)
Из F.31) и F.38) следует, что передаточная функция физически
176
реализуемой линейной системы с постоянными параметрами пред-
представляет дробно-рациональную функцию переменной ив:
k[(i о>) = s (W К I i (i co)ft aft. F.39)
г=0 / fe=0
Соответственно частотная и фазовая характеристики такой ли-
линейной системы будут дробно-рацжшальными функциями часто-
частоты <о [ом. F.32)].
6.3.5. Характеристика «вход — состояние — выход». Введем
вспомогательный спектр
п
2 (i co)fe afe. F.40)
Тогда согласно F.38) запишем два уравнения:
2 0©)*U(io>)ak=X(iсо), F.41а)
2 (i co)r U (i со) br = У (i со), F.416)
которым соответствуют два дифференциальных уравнения
iah^f- = x(f), F.42а)
hAj^} F.426)
r=0
w
(без ограничения общности выводов полагаем в F.38) пг = п).
Определим переменные состояния следующим образом:
F.43)
Тогда из F.42а) и F.426) получим (ап = 1)
^Р ^ (t) + x(t)9 F.44)
dtn
F.45)
r=0
Линейные дифференциальные уравнения F.43), F.44) перво-
первого порядка относительно переменных состояния вместе с уравне-
уравнением F.45) определяют характеристику «вход — состояние —
выход» физически реализуемой, инвариантной линейной системы
177
с непрерывным временем. Она может быть представлена в сле-
следующей матричной форме '[ср. с F.21)]:
dz(t)
dt
F.46)
F.47)
где
A =
О
О
6
1
Q
6
— ап —I
0 ..
1 ..
о г.;
— а, ... —
О
О
1
CLn-Ч
О
О
О
В =
F.48a)
C'=(bo—a0bn, Ъх—пхЪп, ..., bn-i—an-ibn), D = bn. F.486)
Заметим, что в том 'случае, когда правая часть F.37) не со-
содержит производных от входного сигнала (Ьг=0, г^1, Ьо=1), то
переменные состояния совпадают с выходным сигналом y(t) и
его производными [см. F.426), F.43)].
Уравнение F.46) представляет так называемое каноническое
уравнение состояния линейной -системы с непрерывным временем.
Общее решение этого уравнения
z (t) = Ф (t- g z (/0) + J Ф (t-x)Bx (x) dx, F.49)
to
где Ф@ =ехр(А^).
Отметим также, что приведенные здесь результаты легко обоб-
обобщаются на линейные системы с переменными во времени пара-
параметрами, когда коэффициенты уравнения F.37) зависят от 'вре-
'времени. Коэффициенты уравнений F.46) и F.47) становятся функ-
функциями времени, но вычисляются ino формулам F.48а и б) с за-
заменой аи и br ea ak{t), br(t).
6.4. ТИПОВОЕ ЗВЕНО РАДИОТЕХНИЧЕСКИХ УСТРОЙСТВ
6.4.1. Определение типового звена. Преобразование сигналов
во многих аналоговых радиотехнических устройствах состоит из
трех последовательных этапов: линейного инерционного преобра-
преобразования входного сигнала, нелинейного неинерционного и после-
последующего линейного инерционного преобразований. Назовем сис-
систему, выполняющую указанные преобразования, типовым звеном
радиотехнических устройств. Эта система состоит из последова-
последовательно соединенных входной линейной динамической системы, не-
нелинейной статической системы и выходной линейной динамичес-
динамической системы (рис. 6.1).
6.4.2. Характеристика «вход — выход». Обозначим через Ы(и)
импульсную характеристику входной линейной системы f(z) —
характеристику нелинейной системы и h2{u) — импульсную ха-
178
x(t)
Линейная
система
Нелинейная
система
Линейная
система
y(t)
Рис. 6.1. Типовое звено радиотехнических устройств
рактеристику выходной линейной системы. Тогда связь сигнала
y(t) «а выходе типового звена с сигналом ^(О'на входе определя-
определяется следующим соотношением:
у@= ]f\ ]h1{u-v)x{v)dv\h2{t-u)du.
F.50)
Если алпроксимировать характеристику нелинейной системы
полиномом п-й степени, то F.60) можно преобразовать к виду
F.51)
= 2 ak \...\h1{u-vl)...hl{u-vh)x
Xh2(t — u)x (vx)... x (vk) dvx... dvk du,
где ak — коэффициенты аппроксимирующего полинома и f@)=0.
Заменив переменные, нетрудно записать эту формулу иначе:
..., uk)x(t-u1)...x(t-uk)du1...duk, F.52)
k=\
где
) = jftj. (и! - 2)... ftx (ите - z) h2 (z) dz,
= l, п.
F.53)
Формула F.52) является частным случаем ряда Вольтерра F.9),
в котором весовые функции полностью определяются импульсны-
импульсными характеристиками hi (и), h2(u) элементов типового звена и
коэффициентами а&, Л=1, я, полинома, аппроксимирующего не-
нелинейную характеристику f{z).
6.4.3. Усилитель — квадратичный детектор — фильтр. В каче-
качестве примера типового звена радиотехнических устройств рас-
рассмотрим укрупненную структурную схему приемника (см. рис.
6.1), в которой усилитель промежуточной частоты (УПЧ) пред-
представляет входную линейную систему, квадратичный детектор —
иелинейную статическую систему и фильтр — выходную линейную
систему. Записывая характеристику квадратичного детектора в
нормированной форме у=х2 получаем из F.52) следующее со-
соотношение вход — выход для рассматриваемого типового звена:
F.54)
179
где
K(u,v)= ]h1(u-z)hL(v-z)h2(z)dz. F.55)
—oo
Выражение F.54) можно преобразовать к сумме однократных
интегралов. Для этого заметим, что ядро К (и, v) двукратного ин-
интеграла — непрерывно и симметрично, т. е. К(и, v)=K(v, и).
Известно, что такое ядро (функцию двух переменных) можно
разложить в ряд по ортогональным функциям (одной перемен-
переменной)
WW , F.56)
где <рг(#)> hi — собственные функции и собственные числа одно-
однородного интегрального уравнения
] y)<p(y)dy, F.57)
причем Яг>0. Заметим, что разложение F.56) аналогично раз-
разложению D.57) корреляционной функции В {и, v) случайного
процесса, которая также непрерывна и симметрична.
После подстановки F.56) в F.54) переменные интегрирова-
интегрирования и и v разделяются, и сигнал на выходе представляется в
виде суммы
У @ = 2 -р- [ ? <?t (и) х (Г- и) du\\ F.58)
6.5. ДВА СПОСОБА ОПИСАНИЯ СИСТЕМ
ПОД ВОЗДЕЙСТВИЕМ СЛУЧАЙНЫХ ПРОЦЕССОВ
В [16] предложено различать два способа описания системы
лод воздействием случайного процесса. При одном из них, назы-
называемом прямым описанием, устанавливается связь выходного и
входного случайных процессов в форме функциональных зависи-
зависимостей, представленных стохастическими разностными или диффе-
дифференциальными уравнениями. При другом способе, называемом
косвенным описанием, устанавливается связь между вероятност-
вероятностными характеристиками случайных процессов на входе и выхо-
выходе системы.
Задачи анализа, которым посвящены последующие главы пер-
первой части этой книги, состоят в (получении косвенного описания
•системы при известном ее прямом описании. Более трудными яв-
являются задачи получения прямого описания системы ,по задан-
заданному косвенному, которые в общем случае не имеют однозначно-
однозначного решения. Задачи синтеза могут быть отнесены ik такому клас-
классу задач. ;
180
Глава 7
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ;
В ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ
(ИНЕРЦИОННЫХ) СИСТЕМАХ
7.1. ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ
ПОСЛЕДОВАТЕЛЬНОСТЕЙ В ДИКЕЙНЫХ СИСТЕМАХ
С ДИСКРЕТНЫМ ВРЕМЕНЕМ
7.1.1. Среднее значение и корреляционная функция про*-
цесса на выходе системы. Линейная система с дискретным време-
временем и с им/пульсной характеристикой h (n, k) преобразует соглас-
согласно F.10) случайную последовательность i{n), воздействующую на
ее вход, в другую случайную последовательность т)(я), которая
является сверткой импульсной характеристики со входной после-
последовательностью:
т](п)= ? h(n, k)l(k). G.1)
Бесконечная сумма G.1) случайных величин предполагается схо-
сходящейся в среднеквадратическом смысле (см. п. 3.4.1).
Обозначим через а$ (п) и В% (пу k) среднее значение и корре-
корреляционную функцию входной последовательности
Ч (") = rn, {I (n)}t Bs {n, k) = тг {I (n) I (k)}. G.2)
Из G.1) непосредственно следует связь между средними значе-
значениями и между корреляционными функциями случайных после-
последовательностей на входе и на выходе линейной системы с диск-
дискретным (временем:
ац(п)= 2 А (я,'*)<%(*), G.3)
ОО ОО
Вц(п, т)= 2 2 А (л, k^)h(m, k2)B$(kly k2). G.4)
ki=-—oo k2=—'O°
Дисперсия выходной последовательности
ji2T1 (п) = Вц (п, п) - [от, (п)]2 =2 2 А (л, kx) х
kt=—со /г2=— оо
X h (я, k2) B% (klt k2) - Г S h (n, k) a% (k) Г. G.5)
Из G.5) следует, что для определения дисперсии выходной
последовательности недостаточно знать только дисперсию вход-
входной последовательности, но необходимо задать также и входную-
корреляционную функцию.
181
Из G.1) находим, кроме того, выражение для взаимной кор-
реляциояной функции входа и выхода линейной системы
Вь(п, m)=m1{E(/i)i|'(m)}= 2 Цт, k) B8(n, k). G.6)
fc=-oo
Для линейных систем с постоянными во времени параметра-
параметрами (инвариантных систем) и для входной случайной последова-
последовательности, стационарной в широком смысле, приведенные соот-
соотношения имеют следующий вид:
аХ[Щ=а1 2'*(*). G.7)
В*(п)= 2 S h(i)h(i-j)Bt{n-j), G.8)
i=—оо /«=—»оо
f%,= S 2 h(i)h(i-j)B%U)-\ai 2 Л(*)"Г. G-9)
t=s—оо /=—ОО L &=—оо J
Ябл(>0= 2 h{k)B%{n-k). G.10)
Заметим, что формулу G.8) можно представить в виде
% -j), G.11)
/=—оо
где
g(i)= 2 h{i)h(i-j) G.12)
fs—,00
— свертка импульсных характеристик линейной системы.
Для того чтобы выполнить условие физической реализуемости
линейной системы, необходимо в G.3)—G.6) положить h(n, k) =
= 0 при k>n, 2l в G.7) —G.12) положить h(k)=O при &<0.
7.1.2. Спектральная плотность мощности случайной последова-
последовательности. В п. 4.3.5 была определена спектральная плотность
мощности стационарного в широком смысле случайного процесса
с (непрерывным временем. Определим теперь эту величину для
случайной последовательности ?(я).
Рассмотрим усеченную реализацию стационарной в широком
смысле случайной последовательности g(fe>@), l{k)(\), ..., l{k){N—
— 1) и введем ^-преобразование этой реализации
3*>(*) = Ni\{k){n)z-\ G.13)
/г=0
тде z — комплексная переменная.
Спектральная плотность мощности усеченной реализации
(y G.14)
182
а спектральная плотность мощности Sg (z) случайной последова-
последовательности 1(п) равна пределу при W->oo среднего значения этой
величины:
Se(z) = lim/14 {Ф(г)} = lim ±-m1 {Z{Nk)(z)Z{Nk) (±)\. GЛЬ}
Из G.13) —G.15) следует
Se (z) = lim J- s Nilmi {I (n) I (m)} 2-е—) =
N->oo IV n==Q m==Q
= Hm 4-2 2 ('lm)
N N
и так как суммируемые величины зависят только от разности
индексов суммирования, то двойная сумма 'Приводится к простой
сумме. После перехода к пределу при iV-^oo получаем оконча-
окончательно
St(z)= 2 Вг(к)г-к. G.16>
/г=-оо
Как правило, спектральная плотность мощности вычисляется
на единичной окружности г = ехр(ш):
= 2 Вб(*)ехр(-1*©), |со|<я; G.17)
где со — «безразмерные» частоты.
Корреляционная функция В% (k) случайной последовательнос-
последовательности определяется по заданной спектральной плотнасти мощности
обратным преобразованием Фурье:
Вг (k) = — JSg (со) exp (i k со) dсо. G.18)
Формулы G.17) и G.18) являются аналитическим представле-
представлением теоремы Хинчина — Винера для случайных последователь-
последовательностей (см. п. 4.3.6).
7.1.3. Спектральная плотность мощности на выходе линейной
системы с дискретным временем. Выполним ^-преобразование от
обеих частей равенства G.11). Так как свертке функций соответ-
соответствует произведение их ^преобразований, то, учитывая G.16),,
найдем из G.11) связь между спектральными плотностями мощ-
мощности случайных последовательностей на входе и на выходе ин-
инвариантной линейной системы с дискретным временем:
z), G.19)
где Н(г) — передаточная функция линейной системы (z-преобра-
зование импульсной характеристики).
С помощью G.17) можно получить эквивалентное G.19) вы-
выражение для спектральной плотности мощности, которое чаще
используется при анализе линейных систем с дискретным време-
временем:
S4 (со) = | Н [exp (i со)] |2 Ss (со), G.20)
где |//[exp (ico)] |2 — квадрат амплитудно-частотной характерис-
характеристики системы.
Основываясь на G.20) с учетом G.18), можно определить
корреляционную функцию (выходной последовательности
B^{k) = — f |#[exp(icD)[|2S*((D)exp(i?G))dco. G.21)
Средняя мощность последовательности на выходе системы
Вц @) = —!— f |Н [exp (i со)] |2 Si (со) d со, G.22)
7.1.4. Воздействие последовательности с некоррелированными
значениями на линейную систему. Предположим, что на входе
инвариантной линейной системы с дискретным временем действу-
действует случайная, стационарная в широком смысле, центрированная
последовательность 1(п) с некоррелированными значениями (см.
п. 5.1.4). Корреляционная функция такой последовательности
Bg(я-Л) = тг{I(п)I(/О) = о\8nk = № П2 k* G.23)
где a2g — дисперсия последовательности, 6П& — символ Кроне-
кера.
Из G.8) и G.23) следует, что в рассматриваемом случае кор-
корреляционная функция последовательности г\{п) на выходе линей-
линейной системы [см. также G.12)]
l n) = olg(n). G.24)
Ясно, что при центрированной последовательности на входе
линейной системы последовательность на выходе также центри-
центрирована [см. G.7)]. Дисперсия последовательности на выходе ли-
линейной системы согласно G.24)
а2
G.25)
Из G.17) и G.23) видно, что спектральная плотность мощнос-
мощности случайной последовательности с некоррелированными значе-
значениями постоянна на всех частотах:
o2. G.26)
Тогда из G.20) находим
S4(co)=o!|tf[exp(icD)]|2, G.27)
т. е. нормированная спектральная (плотность мощности Sn (o))/a3|
Л 84
на выходе линейной системы, когда на ее входе действует слу-
случайная последовательность с некоррелированными значениями,,
совпадает с квадратом амплитудно-частотной характеристики
системы.
7.1.5. Реакция рекурсивного фильтра на входную некоррели-
некоррелированную последовательность. Пусть на входе рекурсивного циф-
цифрового фильтра действует стационарная в широком смысле цент-
центрированная последовательность ?(/z) с некоррелированными зна-
значениями. Связь выхода ц(п) со входом 1(п) рекурсивного фильт-
фильтра определяется стохастическим линейным разностным уравнени-
уравнением [см. F.18)]
2*i п№-0 = 2**6 (*-/)• G.28)
Общее, достаточно громоздкое решение уравнения G.28) приве-
приведено в [28]. При т = 0 это уравнение называют уравнением авто-
авторегрессии. Рекурсивный фильтр первого порядка можно описать
простейшим уравнением авторегреосии
/г>1, |Я|<1, G.29)
решение которого, как нетрудно доказать, имеет вид
Я(л) = Лтт|(л-т)+/пЛТ2ЯгЕ(л-г)> т= 1,2,... G.30)
Корреляционная функция последовательности ц(п)
Въ (/г, т) = mL {ч (п) т| (т)} = Хт тх {Л2 Щ. G.31)
Из G.31) следует, что последовательность на выходе рекурсивно-
рекурсивного фильтра 1естационарная.
При т-±оо из G.30) получаем стационарное решение уравне-
уравнения G.29):
-Я2 2 Vg(rt-r). G.32)
r=0
Ряд G.32) сходится в среднеквадратическом.
Стационарное значение дисперсии последовательности [см„
G.23)]
оо оо ,
mi (л2 (п)}= ^ 1 ~~ ^2) 2 2 ^ ^i {? (Л — 0 ^ (п ~ ^)} ^
г=0 /г=0
00 00
откуда следует
|оо
185
Подставляя G.33) в G.31), находим корреляционную функцию
лредельной стационарной выходной последовательности
ВХ[{т) = %то\. G.34)
Если выходная последовательность гауссовокая, то в предель-
предельном случае согласно G.32) и G.34) выходная последовательность
тоже гауссовокая и марковская. Таким образом, при воздействии
на вход рекурсивного фильтра первого порядка центрированной
стационарной, гауссовской последовательности с некоррелирован-
некоррелированными (а следовательно, независимыми) значениями предельная
последовательность на выходе фильтра — центрированная, ста-
стационарная, гауссовская, марковская.
7Л .6. Реакция нерекурсивного фильтра на входную некоррели-
некоррелированную последовательность. Пусть на входе нерекурсивного
цифрового фильтра действует стационарная в широком смысле
дентрированная последовательность ? (п) с некоррелированными
значениями. Связь выхода ц(п) со входом §(я) нерекурсивного
фильтра определяется уравнением
Л(л)= I>bkl(n-k), G.35)
которое называют уравнением скользящего среднего.
Корреляционная функция последовательности г\{п)
т т
и так как mi{l(n—k)l(n + s—r)} = G2i6n-h,n+s-r, то
Bn{s) = ol% bkbk+s. G.36)
Дисперсия выходной последовательности
О2 = Ot У, Ob. (/ .о/)
Таким образом, при воздействии на вход нерекурсивного
фильтра стационарной б широком смысле, центрированной после-
последовательности с некоррелированными значениями последователь-
последовательность на выходе фильтра также центрирована и стационарна в
широком смысле, а ее корреляционная функция и дисперсия оп-
определяются по формулам G.36) и G.37).
7.2. ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ
В ЛИНЕЙНЫХ СИСТЕМАХ С НЕПРЕРЫВНЫМ ВРЕМЕНЕМ
7.2.1. Среднее значение и корреляционная функция процесса
на выходе системы. Линейная система с непрерывным временем
и с импульсной характеристикой h(t9 т) преобразует согласно
F.27) случайный процесс, поданный на ее вход, в другой слу-
186
чайный процесс ?@> который является интегральной сверткой
импульсной характеристики с входным процессом
?(')= ]b(t, тI(т)Aч. G.38)
—оо
Интеграл G.38) определяется в среднеквадратическом смысле
(см. п. 3.4.1).
Обозначим через а\ (t) и Bg (tu t2) среднее значение и корре-
корреляционную функцию процесса на входе линейной системы. Из
G.38) непосредственно следует
] G.39)
v2)dVldv2. G.40)
Средний квадрат процесса на выходе системы
Bt (t, t) = ] ]h (t, Vl) h (t, v2) B? (olt v2) dv1 dv2, G.41)
—oo —oo
а дисперсия
-fee@1я- G-41а>
—OO —oo
Для стационарного в широком смысле процесса %(t) на входе
линейной системы формулу G.40) можно переписать в виде
Bt(tl9 t2)= ] ]h(tl9 vjh(t2, vJBifa-vJdv^. G.42)
—oo —oo
Из G.42) видно, что процесс на выходе линейной системы с
переменными параметрами нестационарен даже тогда, когда на
входе его действует стационарный случайный процесс.
Используя G.38), находим взаимную корреляционную функ-
функцию процессов на входе и на выходе линейной системы:
v)dv. G.43)
Рассмотрим теперь линейные системы с постоянными парамет-
параметрами. В этом случае из G.40), заменяя переменные u=t\—vu
v = t2—v2y находим
Bi {tl9 t2) = J ]h(u)h{v)BS(t±-u,t2-v) dudv. G.44>
—oo —oo
Бели процесс на входе линейной системы стационарен (по край-
крайней мере, в широком смысле), то
J ]h(u)h(v)Bi(u-v + x)dudv9 G.45>
=--оо —оо
18Г
\h(u) du, G.45а)
oo
4 G.456)
В этом случае процесс на выходе линейной системы также ста-
стационарен в широком смысле.
Формулу G.45) можно представить в виде
6 ]-z)dz, G.46)
—oo
•где
g(z) = ]h(u)h(u-z)du. G.47)
—oo
В рассматриваемом случае взаимная корреляционная функция
процессов на входе и на выходе линейной системы
SttW= ]h{u)Bk{x-u)du. G.48)
—oo
Если в G.45) вместо h(u)h(v) подставить (произведение
hi(u)h2(v) импульсных характеристик двух линейных систем, то
получим формулу взаимной корреляционной функции В^2 (т)
процессов t>i(t) и 5г@ на выходах этих систем, когда на их вхо-
входе действует процесс ?(t).
Чтобы выполнить условие физической реализуемости линей-
линейной системы, необходимо в G.39) — G.41) положить h(ty т)=0
при т>«*, а (В G.44) —G.48) h(u)=0 при м<0.
7.2.2. Спектральная плотность мощности процесса на выходе
линейной системы. Преобразованием Фурье от обеих частей G.45)
находим спектральную 'плотность мощности стационарного в ши-
широком смысле случайного процесса на выходе линейной системы
с 'постоянными параметрами
Sz (со) = 2 JBs (т) ехр (- i от) da =
—oo
oo oo oo
= 2 j
Заменяя переменную под знаком интеграла z=x—v + u и учиты-
учитывая F.30а) и D.80), устанавливаем связь между спектральными
плотностями мощности процессов на входе и на выходе линейной
системы:
оо оо
S?r((o)= j h(и) ехр (i со и) du ^h(v)exp(—i(dv)dvx
оо —оо
х2 Jfis(z) ехр( — icoz)dz = k(i со)k (- iсо)S*(со),
—oo
188
и так как &(ico)fe(—ico) = |&(ico) |2 = С2(<со), то
S^((o) = C2(co)Sg((o), G.49)
где C(ico) — частотная характеристика линейной системы.
Формула G.49) представляет закон преобразования спектраль-
спектральной плотности мощности стационарного случайного процесса при
ею прохождении через линейную систему с частотной характерис-
характеристикой С(со). Фазовая характеристика линейной системы, как и
следовало ожидать, не влияет на этот закон преобразования К
Из D.81) и G.49) следует, что корреляционная функция слу-
случайного процесса на выходе линейной системы
Bj. (т) = — jSs (со) С2 (со) cos сот d со. G.50)
Из G.50) и G.45) видно, что средняя мощность процесса на
выходе лимейной системы
= J ]Bi{v-u)h(v)h{v)dudv. G.50а)
«—оо —оо
Таким образом, задача о преобразовании спектральной плот-
плотности мощности стационарного случайного процесса и его корре-
корреляционной функции при прохождении через линейные системы
решается полностью формулами G.45) — G.50), если заданы час-
частотная (или импульсная) характеристика системы и спектраль-
спектральная плотность мощности (или корреляционная функция) процес-
процесса на входе.
В соответствии с D.94) взаимная спектральная плотность
процессов на входе и на выходе системы
Sgs (со) = 2 У Jh (и) Б| (т - и) ехр (- i сот) dudx = k (i со) Si (со), G.51)
—оо
откуда следует
—оо —оо
. G.51а)
Нетрудно доказать, что взаимная корреляционная функция и
взаимная спектральная /плотность процессов на выходах двух
линейных систем ic .передаточными функциями &i(ico) и к2(ш),
когда на их входы действует процесс l(t) с корреляционной
1 Более элементарное доказательство формулы G.49) следует непосредствен-
непосредственно из определения спектральной плотности мощности (см. п. 4.35). Так кал
^ (со) =Z<7|)(со)?(№)), где Z^cd) и Z^ (cd) — преобразования Фурье от
и ?г<к)@, то — 1Z(/^ (о>) |2= — izy|>(co) I2C2(o>). Усредняя и переходя
к пределу при Г->оо, получаем G.49).
189
функцией Bi (т) и со спектральной плотностью мощности Si (со),
рав/ны
Яьс.(*)= I J/ii^^^Bg^-u+T)^^, G.516)
—оо —оо
&Ъ I, И = *i (- i ©) ^2 (I со) Sg (со). G.51в)
7.2.3. Воздействие белого шума на линейную систему. Пусть
на входе линейной системы действует белый шум — стационар-
стационарный в широком смысле случайный процесс с равномерным на
всех частотах энергетическим спектром Sfc(co)=iWo, которому
согласно D.116) соответствует корреляционная функция В\ (т) =
=JV06(t). Тогда, используя G.42) и фильтрующее свойство дель-
дельта-функции (см. Приложение 1), нетрудно найти выражение для
корреляционной функции процесса на выходе линейной системы,
на вход которой действует белый шум:
Bl (tl9 t2) = #0 ]h (t, v) h (t2y v) dv, G.52)
причем для физически осуществимой системы
?M'i> t2) = NQ ]h(ti9 v)(t2, v)dv, /2>/x. G.52a)
—oo
При этом среднее значение квадрата процесса на выходе
В^ (/, 0 = тх {g2 (t)} = NQ ]h2 (t, v) dv. G.53)
— oo
oo
Отметим, что при условии j h2(t, v)dv<.oo процесс t,(t) на
—tOO
выходе линейной системы непрерывный в среднеквадратическом
[см. D.135)], в то время как процесс на входе — белый шум —
этим свойством не обладает.
Используя G.43), а также фильтрующее свойство дельта-
функции, нетрудно убедиться, что
*«&. t2)=Noh(t2i у. G.54)
Таким образом, имеется простой корреляционный метод опре-
определения импульсной характеристики h(?2, t\) линейной системы:
если на вход системы подается белый шум, то взаимная корреля-
корреляционная функция процессов на входе (при Afo=l) и на выходе в
точности совпадает с h(t2, U).
Для линейных систем с постоянными параметрами из G.52)
следует [см. также G.47)]
Bt(*)=Nog(T) = NQ ]h(v)h(v-T)dv =
—оо
= 1± | С2 (ю) Cos сот d со, G.55)
я о
190
G.55a)
О
Следовательно, корреляционная функция белого шума на вы-
выходе линейной системы с постоянными параметрами с точностью
до постоянного множителя совпадает со сверткой импульсных
характеристик системы.
Из G.49) находим спектральную плотность мощности случай-
случайного процесса на выходе системы, когда на ее вход действует бе-
белый шум:
G.56)
т. е. эта спектральная плотность с точностью до постоянного мно-
множителя совпадает с квадратом частотной характеристики системы.
Из G.55а) и G.56) следует, что рассматриваемый процесс t,(t)
на выходе линейной системы будет непрерывным в среднеквадра-
тическом, если
и дифференцируемым в среднеквадратическом, если
Jco2C2(o))dco<oo.
Отношение средней мощности производной ?'(*) к средней
мощности процесса ?@ (см. п. 4.5.4)
со2 = Bv @)/Вс @) = Jco2 С2 (со) dсо / jC2 (со) dco. G.57)
7.2.4. Формирующий фильтр. Из G.55) следует, что стацио-
стационарный в широком смысле случайный процесс ?(#) с корреляци-
корреляционной функцией Bi (т) можно рассматривать как реакцию на
воздействие белого шумя единичной интенсивности линейной сис-
системы с импульсной характеристикой /t? (т), удовлетворяющей ин-
интегральному уравнению
\h (v) h (v - т) dv = Bi (т). G.58)
—с»
Такую линейную систему называют формирующим фильтром. Про-
Процесс t,(t) на выходе произвольной линейной системы с импульс-
импульсной характеристикой Л(т), когда на ее выходе действует процесс
?(?), можно рассматривать как реакцию на входной белый шум
v(?) линейной системы, представляющей последовательное соеди-
соединение формирующего фильтра и данной линейной системы (рис.
7Л,а):
°x)l(x)d%= У y/i(/-T)A5(T-M)v(«)dadT G.59)
—оо —оо
191
a)
fitt)
Ott)
gtt)
Рис. 7.1. Последовательное соединение формирующего фильтра с линейной си-
системой (а) и эквивалентная линейная система (б)
или как реакцию на воздействие белого шума v(/) линейной сис-
системы с импульсной характеристикой (рис. 7.1,6):
= lh(t-u)hi(u)du.
G.60)
Вместо решения интегрального уравнения G.58) для опреде-
определения импульсной характеристики формирующего фильтра можно
сначала найти передаточную функцию k\ (ico) этого фильтра из
уравнения \
где Si (со) — спектральная плотность мощности формируемого
процесса. Эта задача сводится к факторизации функции 5g (со),
т. е. к разложению ее на два сомножителя Si (со) =Sg+(co)Sg~(co)f
которые содержат все полюсы в верхней и в нижней полуплос-
полуплоскостях соответственно, причем &(ico) = S|+(co) (см., например,
tie]).
Стационарный в широком смысле процесс с рациональной
спектральной плотностью мощности может воспроизводиться фи-
физически реализуемым формирующим фильтром (рис. 7.2), струк-
структура которого определяется дифференциальным уравнением
F.37), где Ьг=0, г^1 и x(t) — белый шум.
7.2.5. Воздействие белого шума на узкополосную линейную
систему. Предположим, что белый шум действует на вход узко-
узкополосной системы с симметричной относительно центральной час-
частоты ©о частотной характеристикой. В этом случае корреляцион-
корреляционную функцию В^ (т) процесса ?@ на выходе линейной системы
в соответствии с F.35) и G.55) можно представить в виде
В1 (т) = -у" ]hc (v) К {v + т) [cos со0 т + cos B©0 v + о)о тI do,
и так как hc(v) — функция, медленно изменяющаяся по сравне-
сравнению с cos cdot, то интегралом
со
{u + т)cosB«>ov +(dot)dv можно пренебречь, т. е.
В;(т) = —lcoscd0t $hc(v)hc(v + i)dv =
—oo
= -TL?c('r)cos(B0T.
G.62)
192
i
J
Рис. 7.2. Структурная схема формирующего фильтра
Так как свертка импульсных характеристик равна преобразова-
преобразованию Фурье от квадрата частотной характеристики, то, как вид-
видно из G.62),
9 Л/ °°
(т) = -=^- cos оH т \С\ (Q) cos От d Q,
G.63)
где C0'(Q)=C(Q + coo), Q = co—coo.
Из G.62) и G.63) следует, что на выходе узкополосной ли-
линейной системы, когда на ее вход действует белый шум, имеет
место узкополосный случайный процесс. Условиями непрерывнос-
непрерывности и дифференцируемое™ в среднеквадратическом являются со-
соответственно
\(Q) du< оо.
(Q)dQ
В этом случае отношение средней мощности 'производной %'{t) к
средней мощности процесса ?(/) [ср. G.57)]
Ш2 = Ш2 + JQ2 Со (Q) dQ I JCq (Q) d Q G>64)
0 /0
7.2.6. Интегрирующая цепь. Передаточная функция этой цепи
(при
а квадрат частотной характеристики
Ширина полосы пропускания в соответствии с F.34)
Дс = Т , Л". .. = ост/2.
1 Так как в этом случае /z(«)=aexp(—аи), и>0, то для того, чтобы процесс
«интегрировался» рассматриваемой схемой, интервал корреляции процесса дол-
должен быть много меньше постоянной времени схемы, т. е. то<#С.
7—87 193
о 1
2 J ar
a)
Рис. 7.3. Нормированная корреляционная функция (а) и спектральная плотность
мощности (б) процесса на выходе интегратора
Спектральная плотность мощности, корреляционная функция
и нормированная корреляционная функция процесса на выходе
интегрирующей схемы, когда на вход действует белый шум (рис.
7.3), согласно G.56) и G.55) определяются следующими выра-
выражениями:
Sc(co) =
1 + (со/аJ
iV0 °j? COS COT
1 -f (©/а)*
= ехр(-а|т|).
Интервал корреляции
схемы
G.65)
¦ а|т|), G.66)
Z
G.67)
процесса на выходе интегрирующей
1
т0 = [ ехр (— ат) dx = — = .
5 а 2ДС
Хотя лроцесс на выходе схемы в этом случае непрерывен в
среднеквадратическом, он не дифференцируем (см. п. 4.5.4). Дей-
Действительно, средняя мощность процесса на выходе Б$ @) =
=Noa/2 = NoAc/n конечна, а интеграл
00 °° гл2
JGJSC(CD)d(D = ^' Г ^
о о L'
расходится (производная корреляционной функции терпит разрыв
при т = 0).
Заметим, что зависимости корреляционной функции и спект-
спектральной плотности не отличаются по виду от соответствующих
зависимостей на рис. 5.4 и 5.5. Бели белый шум нормальный, то
лроцесс на выходе интегрирующей цепочки нормальный марковс-
марковский.
7.2.7. Одиночный колебательный контур. Передаточная функ-
функция одиночного контура, образованного последовательным соеди-
соединением катушки индуктивности L, конденсатора С и резистора с
сопротивлением /?,
194
где шо= 1/V^LC — резонансная частота я d=RV C/L
ние — величина, обратная добротности Q контура.
Квадрат частотной характеристики контура
затуха-
Используя F.34), находим ширину полосы пропускания
При большой добротности Q частотная характеристика имеет
резко выраженную область резонанса в окрестности соо. Тогда
контур узкополосный и для него
= со —со0
Спектральная плотность мощности процесса на выходе такого1
контура, когда на входе действует белый шум (рис. 7.4,6),
St(»)= N*<!2 , G.68)
а корреляционная функция в соответствии с G.63) (рис. 7.4,а)
В^ (т) = ° ехр (— E |т|) cosoH т, G.69)
#сг(т) = ехр (- р|т|) cos о)от. G.70)
Процесс на выходе узкополосного колебательного контура уз-
кополооный, он непрерывен в среднеквадратическом, но не диф-
дифференцируем, так как В; @) =^0<D20i/iDp) =Q2p, а интеграл
1 1—R2 ^ расходится. Интервал корреляции процесса то= 1/р.
7.2.8. Многокаскадный резонансный усилитель. Известно, что
форма частотной характеристики многокаскадного усилителя с
увеличением числа каскадов приближается (при некоторых ус-
-Z ~7 О / 2 п)-аH
Рис. 7.4. Нормированная корреляционная функция (а) и спектральная плотное гь
мощности (б) процесса на выходе колебательного контура
7* !95
ловиях) к гауссовской кривой: С(со)=ехр[—(со—ооJ/2р2] ^поло-
^полоса которой связана с параметром р соотношением ДС = Р У п. По-
Подобная частотная характеристика является идеализацией, так как
линейная система с такой характеристикой физически неосущест-
неосуществима.
Спектральная плотность мощности на выходе такой системы,
когда на вход действует белый шум, представляется гауссовской
кривой
S;(co) = 2W0exp[-((o-(o0J/P2]. G.71)
Заметим, что и спектр G.71) не является, строго говоря, спек-
спектром стационарного случайного процесса, так как 5^(со) не чет-
четная функция огно^кгельпо начала координат. Для того чтобы
спектр был симметричен относительно частоты со = 0, необходимо
задать квадрат частотной характеристики в виде суммы
ехр[—(о—сооJ/р2]+ехр[—(со + о)оJ/Р2]. Однако при соо>р, т. е.
для узкополосного усилителя, влияние второго слагаемого незна-
незначительно.
В соответствии с G.63) корреляционная функция и нормиро-
нормированная корреляционная функция процесса на выходе узкополос-
узкополосного усилителя
В1 (т) = -М- exp ( —^-) cos o)o т, G.72)
RrlT) = exp (' - -^- ) cos coo т. G.72а)
Процесс на выходе узкополосного многокаскадного усилителя,
когда на его вход действует белый шум, — узкополосный. Он не
только непрерывен, но и дифференцируем в среднеквадратичес-
ком (любое число раз), так как конечны средние мощности про-
процесса и его производных.
Из G.72) получаем
а из G.57) находим
Интервал корреляции процесса
7.2.9. Идеальный фильтр. Уравнение частотной характеристи-
характеристики идеального фильтра имеет вид
[О, |со-а>о1>Дс/2.
196
При Дс<Ссоо фильтр — узкополосная линейная система Прямо-
Прямоугольная частотная характеристика линейной системы, как и ха-
характеристика, имеющая форму гауссовской кривой, представляет
собой математическую идеализацию, не осуществимую физически.
Однако частотные характеристики некоторых реальных фильтров
с сосредоточенными параметрами достаточно близки к прямо-
прямоугольной.
Спектральная плотность мощности, корреляционная функция
и нормированная корреляционная функция процесса на выходе
идеального фильтра, когда на вход действует белый шум (рис.
7.5):
'°V0, |o-©0|<ittl'2t (?74.
|со-соо|>±~/2.
т) = sin ^—9. Cos coo x, G.75)
# (T) = sin(TAc/2> cos co0 т. G.75a)
& (тДс/2) °
Заметим, что выражение G.75) такого же вида, как и G.63),
т. е. представляет произведение медленно меняющейся функции
sln*T ' на «высокочастотное заполнение» coscoox, хотя оно
тЛс/2
справедливо для любых соо и Ас, а не только для узкополосных
фильтроъ. Однако указанная особенность имеет место лишь для
прямоугольной частотной характеристики.
Рассматриваемый процесс на выходе идеального фильтра диф-
дифференцируем в среднеквадратическом (любое число раз). Сред-
Средние мощности процесса и его производной определяются по фор-
формулам
^@)=А'0Дс/л, Bv@)=G>*Bi@)9 G.76)
где
о Ас/2 А2
-i- j co2dG)=co2 + —. G.76а)
Дс о 12
Интервал корреляции процесса
Штриховая кривая на рис. 7.5,6 соответствует низкочастотно-
низкочастотному фильтру (соо = 0).
Корреляционная функция в этом случае имеет вид
G.77)
7.2.10. Ограниченный по спектру белый шум. Так как реаль-
реальные процессы (сигналы, помехи, шумы) имеют конечную мощ-
мощность, то белый шум представляет лишь идеализированную мо-
197
Рис. 7.5. Спектральная плот-
плотность мощности (а) и нор-
нормированная корреляционная
функция (б) процесса на вы-
выходе идеального фильтра
\
c \
- *6-
Zx/Л
\
~z
\
\
ж
дель. Реальный шум ограниченной мощности можно рассматри-
рассматривать как реакцию формирующего фильтра на воздействие белого
шума. Простейшей моделью такого шума служит ограниченный
белый шум — стационарный в широком смысле случайный про-
процесс с равномерной в полосе частот )|со|^Д спектральной плот-
плотностью мощности. Формирующим фильтром такого ограниченного
белого шума служит идеальный фильтр нижних частот.
Нормированная корреляционная функция ограниченного бело-
белого шума [см. G.77)]
R (т) = sin (тЛ) / (tA) G.78)
обращается в нуль в точках т=лл/Д, я = ±1, ±2, ... Таким обра-
образом, два значения ограниченного белого шума, разделенные ин-
интервалом времени ял/Л, некоррелирова'ны. Для гауссовского бе-
белого шума эти значения независимы.
Функции G.78) соответствуют собственные функции и собст-
собственные числа
-оо</<оо, *ft = -^-. G.7»)
Некоррелированными координатами ограниченного белого шу-
шума l{t) являются случайные величины (см. п. 4.5.6)
1Г^ dt = К liV,Б ( ТП )• G-80)
а его ортогональное разложение на всей оси времени
G.81)
представляет ряд Котельникова [см. D.169)], в котором величи-
величины Ik определяются по формуле G.80).
198
Для ортогонального разложения ограниченного белого шума
на конечном интервале (О, Т) необходимо использовать так на-
называемые сфероидальные функции, представляющие собственные
функции интегрального уравнения
f ilt)k \ G.82)
(t-y)
7.3. РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ СЛУЧАЙНОГО
ПРОЦЕССА НА ВЫХОДЕ ЛИНЕЙНОЙ СИСТЕМЫ
7.3.1. Характеристика задачи. Как следует из результатов,
приведенных в § 7.1, 7.2, задача определения корреляционной
функции и спектральной плотности мощности процесса на выхо-
выходе линейной системы является достаточно простой и не требует
знания функций распределения вводного процесса. Значительно
сложнее определить функции распределения случайного процесса
на выходе линейной системы.
Только в частном случае, когда процесс ?(/) на входе линей-
линейной системы гауссовский, указанная задача решается лросто. Слу-
Случайный процесс ц{п) на выходе линейной системы с дискретным
Бременем представляет предел при N-+oo (в среднеквадратичес-
ком) суммы 2 h(n, &)?(?)> а случайный процесс ?•(*) на выхо-
де линейной системы с непрерывным временем — предел в сред-
неквадратическом интегральной суммы 2 h(t, тн)I(th) (tVh—
+i, при max|xW-т^-йЦсм. G.1) и G.38)].И
k
в том и б другом случаях входные случайные величины
?(ть), k=—N9 N, представляют совокупности зависимых гауссовс-
мих случайных величин. Так как линейная комбинация произволь-
произвольно зависимых гауссовских случайных величин также гауссовская
случайная величина (см. п. 3.3.8), то распределения рассматри-
рассматриваемых сумм при любом N гауссовские (нормальные). Следова-
Следовательно, распределение вероятностей случайного процесса на выхо-
выходе линейной системы, когда на ее вход действует гауссовский
случайный процесс, нормальное. При этом преобразуются лишь
корреляционные функции и спектральные плотности мощности в
соответствии с приведенными ранее формулами.
Заметим здесь, что «гауссовость» (нормальное распределение)
белого шума устанавливается по нормальному распределению
процесса на выходе линейной системы, когда на ее входе дейст-
действует белый шум.
^Уже отмечалось, что типичным для радиотехнических уст-
устройств является анализ линейной системы, расположенной после
нелинейного элемента. Поэтому даже тогда, когда нелинейному
преобразованию подвергается гауссовский случайный процесс,
199
процесс на входе последующей линейной системы уже не явля-
является гауссовским.
Задача о преобразовании функций распределения в линейной
динамической (инерционной) системе, когда на входе ее действу-
действует негауссовский случайный процесс, чрезвычайно трудна. Как бы-
было показано в п. 3.1.4, для определения одномерной плотности
линейной комбинации п случайных величин (т. е. процесса на
выходе линейной системы с дискретным временем) необходимо
вычислить п—1-1кратный интеграл. Еще более сложной является
эта задача в случае линейной системы с непрерывным временем.
Приемлемого для ^практического использования точного решения
этой задачи до сих лор нет.
• * Существует несколько приближенных методов решения, каж-
каждый из которых базируется на специальных предположениях ве-
вероятностных характеристик входного случайного процесса и
свойств самой линейной системы. В гл. 11 будет рассмотрена эта
задача в предположении, что процесс на входе линейной системы
является квадратом гауссовского случайного процесса. Здесь же
рассмотрим общий приближенный метод, основанный на вычис-
вычислении моментов процесса на выходе линейной системы. Ради уп-
упрощения изложения ограничимся приближенным определением
одномерной функции распределения стационарного процесса на
выходе линейной системы с постоянными параметрами. Обобще-
Обобщение на многомерные функции и нестационарные процессы не
встречает принципиальных трудностей, хотя сложность вычисле-
вычислений может оказаться непреодолимой.
Приближенный метод решения рассматриваемой задачи с ис-
использованием модели так называемых линейных случайных про-
процессов лредложен в [16].
7.3.2. Связь моментов процесса на выходе линейной системы с
моментными функциями процесса на входе. Из F.14) и F.28) на-
находим соотношения, связывающие моменты процесса на выходе
линейной системы с постоянными параметрами с моментными
функциями входного стационарного случайного процесса и им-
импульсной характеристикой системы.
Для линейной системы с дискретным временем
оо со
2 ... 2 Л(гх)...
... h (rk) I (n - г,)... Цп - rh) J, k = 1, 2, 3,... G.83)
Обозначая через тк% (ги ..., гк) =т\{1{п—г{) ...Цп—rk)} момент-
ную функцию входной последовательности, получим «з G.83)
mkn= 2 - 5 h(r1)...h(rk)mki(rl,...,rk),k = 1,2,3,..., G.84)
Г1=—оо r\=—°°
т. е. для определения ^-мерной моментной функции выходной по-
200
следовательности необходимо знать fe-мерную функцию распре-
распределения входной последовательности.
Для линейной системы с непрерывным временем
G.85)
— оо —оо
XI It - uL)... l(t~uk)du1...duh\, k = 1, 2, 3...
Обозначая через mfej (ыь ..., uh) =mi{l(t—щ) ...\{t—uk)} мо-
ментную функцию входного случайного процесса, получаем из
G:85)
оо оо
—оо —оо
mki{uly:.i uk) <1иг...Aик, fe = l, 2, 3,...
G.86)
Как и для системы с дискретным временем, для определения
величины niki необходимо знать fe-мерную функцию распределе-
распределения входного случайного процесса.
Заметим, что при k=l и & = 2 формулы G.84) и G.86), как и
следовало ожидать, соответствуют формулам G.7), G.9), G.45а, б).
7.3.3. Аппроксимация одномерного распределения вероятностей
процесса на выходе линейной системы рядами по ортогональным
полиномам. Используя ограниченное число моментов процесса на
выходе линейной системы, определенных по формулам п. 7.3.2,
можно получить с допустимой погрешностью приближенное пред-
представление об одномерном распределении вероятностей указанного
процесса на основе ортогонального разложения его плотности ве-
вероятности (см. § 2.5).
Как и в п. 2.5.2, будем предполагать, что рассматривается ап-
аппроксимация плотности центрированного процесса после того, как
вычислены средние значения и дисперсии процесса на выходе ли-
линейной системы.
Из B.87), перегруппировывая члены ряда для усиления его
сходимости и используя связи моментов с кумулянтами (см. п.
3.3.2), получаем аппроксимацию искомой плотности вероятностей
в форме ряда Эджворта:
G-87)
где Кг = к — коэффициент асимметрии, к*=у — коэффициент экс-
эксцесса.
201
Аналогично из B.92) и B.95) можно получить аппроксима-
аппроксимацию рядами по полиномам Ляггера и Чебышева. Иногда для ап-
аппроксимации используют систему плотностей Пирсона, парамет-
параметры которой полностью определяются кумулянтами первых четы-
четырех порядков (см., например, [6]).
7.3.4. Интегрирование телеграфного сигнала. Проиллюстрируем указанный
метод определения распределения на выходе линейной системы на примере
случайного стационарного в широком смысле телеграфного сигнала (см. задачу
5.6), который состоит из прямоугольных посылок случайной длительности, при-
принимающих два значения: h и —h (далее полагаем h—\, что несуществен«о).
Пусть случайный телеграфный сигнал |(f) поступает на вход ЯС-штеграгора
(см. п. 7.2.6). Найдем моменты одномерного распределения «а его выходе. Для
этого .в соответствии с п. 7.3.2 необходимо найти сначала mxfe(t—щ) ...?(/—
—Uk)}. Используя результаты задачи 5.6 и применяя метод полной матема-
математической индукдаи, получаем
% К (<-«i)...S ('-«*)> =
k —• четное,
(ехр(-2Я2
= j I *=
7.88)
О , &—-нечетное,
i при
Щ {I Р - "i)...E (* — "к)} = mhl («i,..., uk) =
[ 0 , k — нечетное,
где X — среднее число перемен знаков телеграфного сигнала в единицу вре*
Из G.86) и G.89) следует прежде всего, что плотность вероятности про-
процесса иа выходе любой линейной системы, когда на ее вход поступает телег-
телеграфный сигнал, симметрична всегда, так как mk^ =0 при к — нечетном, т. е.
моменты нечетного порядка это'го распределения обращаются в нуль.
Импульсная характеристика /?С-интегратора
Л(ы)=аехр(—аи)у w>0, a=l[(\RC). G.90)
Подставляя G.89) и G.90) в G.86), получаем для k четного
ооо I /=i t=i J
XdUkduk_l...du1. G.91)
Из G.91) при k=2 находим дисперсию процесса на выходе интегратора
1н = даС= 1+ц/а • G-92)
202
Для вычисления интеграла G.91) при произвольном конечном k снова
можно использовать метод полной математической индукции. В результате
- G-93)
Заметим, что величина Я/а равна отношению ширины полосы частот спект-
спектра телеграфного сигнала к ширине полосы частот /?С-интегратора.
Используя элементарное соотношение для гамма-функции Т(х+\)=хТ(х)
и определение бета-функции [см. A.23в)], можно формулу G.93) представить
в виде
,i2r = B(r + Va, Va)/B(V2, Wa). - G.94)
Нетрудно убедиться, что G.92) получается из G.94) при г—1. Сравнивая
G.94) с D6) задачи 2.2, убеждаемся, что моменты 2г-го порядка исследуемого
процесса совпадают с моментами r-го порядка случайной величины т), имеющей
бета-распределение. Таким образом, моменты процесса на выходе интегратора
представляют моменты случайной величины fc= ±V~i\, распределение которой
получаем из формулы Dа) задачи 2.2. Так как в рассматриваемом случае а=
«1/2, Ь = Я/а, то, используя известное правило определения распределений при
функциональном преобразовании случайной величины, получаем одномерную
плотность вероятности процесса на выходе интегрирующей схемы, когда на ее
вход действует телеграфный сигнал:
Эта плотность зависит только от одного параметра Я/a — отношения полосы
энергетического спектра телеграфного сигнала к полосе интегрирующей схемы.
Функцию распределения процесса на выходе интегратора нетрудно выразить
через неполную бета-функцию.
При Я/а =1/2 из G.95) лолучаем плотность вероятности синусоиды со слу-
случайной, равномерно распределенной фазой (см. задачу 3.8)
Нетрудно найти коэффициент эксцесса распределения G.95)
6
и записать первые дба члена ряда G.87)
где г=у/У Ь+2Х!а.
При Я/а->оо для узкополосного интегратора приходим к нормальному рас-
распределению.
Для широкополосного интегратора Я/а<1, ?A/2, Я/а) «Я/а и из G.95) на-
находим
W, (у) « — A - у^-К |у\ < 1. G.98)
w a
203
При Х/а-Ю из G.98) получаем плотность вероятности телеграфного сигнала
1Р|(у)-=[в(у-1)+в@+1)]/2. G.99)
Заметим, что при Х=а распределение сигнала на выходе интегратора рав-
равномерное, при Л = 2а— параболическое, а при А, = За/2—эллиптическое.
Интересно отметить, что распределение вида G.95) характеризует также
процесс на выходе рассмотренного ^С-ингегратора, если на его вход действует
процесс, равный sgn?(/), причем ?(/)—гауссовский случайный процесс, нор-
нормированная корреляционная функция которого /?|(т)=ехр(—C|т|), C>0, а
sgnx=xl\x\. Если обозначить ц = а/р, то, как показано в [29], распределение
процесса на выходе интегратора получается из (G.95) заменой X.la величиной
7.3.5. Нормализация случайного процесса на выходе фильтра.
Как отмечалось в п. 7.3.4, процесс на выходе низкочастотного
фильтра (интегратора) приобретает свойства гауссовского процес-
процесса, когда отношение ширины полосы частот фильтра Дф к шири-
ширине полосы частот энергетического спектра входного процесса Д
стремится к нулю. Эта тенденция к нормализации, т. е. к прибли-
приближению распределения процесса на выходе низкочастотного филь-
фильтра к нормальному (гауссовскому), имеет общий характер при
Дф/Д^-^О, что является следствием центральной предельной теоре-
теоремы для стационарных случайных процессов, удовлетворяющих ус-
условию сильного перемешивания (см. п. 5.2.7).
Качественно явление нормализации можно объяснить следую-
следующим образом. Допустим, что в реальных ситуациях центрирован-
центрированный процесс на входе i(t) принадлежит классу Т — зависимых
процессов (см. п. 4.2.9). Интервал корреляции входного процесса
Т(<С7\ откуда следует, что полоса частот энергетического спектра
Д|<С1/Т, причем Si @)=7^=0. Предположим, что процесс ?(/) на вы-
выходе фильтра можно аппроксимировать суммой независимых слу-
случайных величин
С@ = 2 h(t-kT)i(kT)9
так как ^,(пТ) и Ё,(гТ) при пфт независимы. Условия центральной
предельной теоремы будут выполнены, если I>h2(t—kT) <оо
k
и h(u) —медленно меняющаяся на интервале Т функция. Послед-
Последнее условие означает, что полоса частот фильтра Дф<С1/71<С\Дб
или Дф/Д& <С1. Строгое доказательство нормализации Г-зависимых
процессов на выходе низкочастотного узкополосного фильтра при-
приведено в [30].
7.4. ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ
В ЛИНЕЙНЫХ СИСТЕМАХ СО СЛУЧАЙНЫМИ
ПАРАМЕТРАМИ
7.4.1. Характеристика системы. В § 7.1—7.3 рассматривались
случайные процессы, проходящие через линейные системы, харак-
характеристики которых представлялись заданными детерминированны-
204
j функциями. Наряду с этим следует также исследовать харак-
характеристики процессов на выходе линейных инерционных систем, па-
параметры которых случайны. Примерами таких систем являются
большинство каналов, в которых происходит распространение ра-
дибсигналов от передатчика к приемнику.
За характеристики линейной системы примем импульсную ха-
характеристику h(tt т) и передаточную функцию &(ico, t), однако в
отличие от предыдущего эти функции соответственно для каждой
величины т и для каждой частоты со, рассматриваемых как дейст-
действительные параметры, представляют случайные процессы. Эти ха-
характеристики представляют пару преобразований Фурье
А (/, * — и) = — ] k (ice, /) exp (icott) dco. G.100a)
&(ico, t)= ] h(t, t-u) exp (- icou)du. G.1006)
где интегралы определены в среднеквадратическом.
Корреляционную функцию линейной системы со случайными
параметрами определим следующим образом:
Вс (tlt t2t со,, оJ) - тг {k (io)!, tx) k (ico2, Q. G.101)
Для стационарных (в широком смысле) линейных систем
?с(т, cD)=mi{?(i(o, t)k{—ico, t+%)}=Bc(%, —со). G.102)
В этом случае можно также характеризовать линейную систе-
систему преобразованием Фурье по т от 5с(т, (o/)exp(ico/T), вводя час-
частотную функцию двух переменных
Г (со, со')= J Бс(т, со') exp {i (со' - со) т} dx. G.103)
— оо
Заметим, что для линейной системы с постоянными парамет-
параметрами &(ico, /)=&(i(o) и, следовательно,
?с(т, со) = |^(ico) |2 = C2(co), G.104)
т. е. не зависит от ти совпадает с квадратом частотной характе-
характеристики системы. Функция Г (со, о/) переходит при этом в
Г (со, со') = С2 (со) [ exp (i (со' - со) т} dx = 2дС2 (со) б (со' - со). G.105)
— оо
7.4.2. Корреляционная функция процесса на выходе системы.
Воспользуемся введенными вероятностными характеристиками ли-
линейной системы со случайными параметрами для определения кор-
корреляционной функции процесса на выходе такой системы, когда
на вход ее поступает случайный процесс ?@> корреляционная
функция которого равна 5g(^, t2). Запишем общее соотношение,
205
связывающее процесс на выходе линейной системы с процессом
на входе:
= J HU тN(т)Л, G.106)
«О i
где интеграл понимается в среднеквадратическом.
Теперь выражение для корреляционной функции процесса
?), можно представить в виде
] h(tlt u)h(t2, v)l(u)l(v)dudv\. G.107)
J
В дальнейшем будем предполагать, что случайный процесс ()
и случайная импульсная характеристика линейной системы ста-
статистически независимы. Тогда из G.107), изменяя порядок интег-
интегрирования и усреднения, а также заменяя и на U—и, v на U—v,
получаем
X ВЕ ft - ы, *, - v) dudv. G.108)
Выразим ковариацию импульсных характеристик системы че-
через корреляционную функцию системы. Используя G.101) и
G.100а), находим
*i, ti-u)h(tv t2-v)} =
^ J^oCi. ^i. ®i. «Jejtp [!(«>!«+ 09,0I*0! A»». G.109)
и, подставляя G.109) в G.108), получаем
2, ®i. co2)x
—OO —OO
X Bg (/x — w, <2 — t;) exp [i ((ог w + oJ v)] dcox dco2 d« dt;. G.110)
Если процесс на входе стационарный в широком смысле, то
Btih-u, t2-v) = Bl(x+u-v), * = tt-tl9 G.111)
и тогда из GJ110), изменяя порядок интегрирования, находим, что
внутренний интеграл по ми и можно 'выразить через спектраль-
спектральную плотность мощности Sg (со) .процесса на входе следующим
образом (см. также Приложение 1):
* ОО ОО
— J j Bz(t + u — v)exp[i((oxи+ co2v)]dudv
ОО ОО
ОО ОО
1 " "" 'T+z)expaa>1z)exp[iv(<i>1+(i>i)]dzdv-
—ОО —ОО
1
4л
206
i) exp (- i cox t) б (со, + co2). G.112)
Подставляя G.112) в G.110) и используя фильтрующее свойство
дельта-функции, окончательно получаем
G.113)
Для стационарной (в широком смысле) системы [см. G.102)]
В1 (т) = — ]вс(т, со)S|(со)exp(i©т)do). G.114)
4зХ -оо
7.4.3. Спектральная плотность мощности процесса на выходе
системы. В соответствии с G.114), используя теорему Хинчина —
Винера, находим
G.115)
—оо —оо
Вводя функцию Г (со, со') [см. G.103)], получаем
Sc (со) = JL jr (со, со'M6(со') Йсо'. G.116)
Из G.116), как частный случай для линейной системы с по-
постоянными параметрами, следует формула G.49). Действительно,
подставляя G.105) в G.116) и используя фильтрующее свойство
дельта-функции, приходим к G.49).
Используя G.115), а также теорему Хинчина — Винера, мож-
можно выразить корреляционную функцию процесса на выходе линей-
линейной системы через корреляционные функции системы и процесса
на входе:
Bc(T) = — У У5сК coM$(tt)exp[i(T-a)o)]dttdco==
= ]Bl(u)Fc(u, t)du, G.117)
—оо
где
Fc(u, т)=—- ]вс(т, co)exp[i(T-«)co]dco. G.118)
^Л —00
7.4.4. Частные случаи входного процесса. Если на вход систе-
системы со случайными параметрами действует белый шум со спект-
спектральной плотностью S|(со) =2^0, то из G.114) и G.116) находим
Вс (т) = A- JBC (т, со) exp (i о)т) Ло, G.119)
•—оо
St (со) = Л±- 7Г (со, со') d со'. G.1201
"¦"ОО
207
Для входного процесса, представляющего гармоническое коле-
колебание постоянной амплитуды а0, частоты со0 и случайной ф^зы,
распределенной равномерно на интервале (—я, л;), имеем в со-
соответствии с D.119)
СО = К/2) Вс (т, соо) cos ©0 т, (?. 121)
o, со0)+Г(со, -со0)]. G.122)
7.4.5. Случайная задержка. Предположим, что передаточная
функция линейной ристемы со случайными параметрами представ-
представляется в виде
?(ico, f)=exp[—icori@], G.123)
где r\(t)—стационарный случайный процесс. Тогда в соответст-
соответствии с G.100а)
h(t, t-u)=6[4(t)-u\
и из G.106) следует
G.124)
Таким образом, линейная система с характеристикой G.123)
осуществляет задержку значений случайного процесса l{t) на
случайную величину r\{t).
Найдем выражение корреляционной функции рассматривае-
рассматриваемой линейной системы. Согласно G.102) имеем
Вс(%, co)=m1{exp(io)[ii(/ + T)— r\(t)]}
или
Вс(т, а>)=-.в2Л(-ю, со, т), G.125)
где 02П (v\, v2i т) —двумерная характеристическая функция ста-
стационарного случайного процесса r\(t).
Предположим теперь, что процесс г](/) гауссовский, центриро-
центрированный. Тогда, используя E.146), находим из G.125)
Вс (х, ш) = ехр {- а2 оJ [1 - Я„ (т)]}, G.126)
где /?л (т), а2,) — нормированная корреляционная функция и дис-
дисперсия гауссовского случайного процесса r\(t).
Заметим, что при любом фиксированном значении со функция
#с(т, со) изменяется от единицы при т = 0 до ехр(—а^со2)^! при
т->оо.
В соответствии с G.114) корреляционная функция процесса
Bt (т) = -i- ]Ss (со) exp (i сот - ст2 ш2 [1 - /?ч (т)]} d 0. G.127)
Из G.127) следует, что средняя мощность В^ @) процесса
равна средней мощности исходного процесса %(t).
208
? другой стороны, по формуле G.118) находим
Fc\0t -и)= ' ехр { (и ~ тJ 1. G.128)
Подставляя G.128) в G.117), получаем
Г du. G.129)
Если случайный процесс ?(/) представляет белый шум со
спектральной плотностью Sg(co)=2Ar0, то из G.127) следует
\ . G.130)
Из G.130) видно, что 5^@) неограниченно, т. е. средняя мощ-
мощность процесса на выходе системы остается бесконечной, как и у
процесса на входе (белого шума). Однако в отличие от входного
дельта-коррелированного процесса значения процесса на выходе
прит>0 коррелированы.
Если случайный процесс ?(/) представляет профильтрованный
белый шум со спектральной плотностью Si (со) =2Л^оехр (—02/Р2)
(см. п. 7.2.8), то из G.127) видно
т) = No Dя{Р* + [1 - Дч (т)] o*})-
хехр ( —\. G.131)
7.4.6. Гармоническое колебание, модулированное по фазе гаус-
совским случайным процессом. Предположим, что гармоническое
колебание постоянной амплитуды ао, частоты соо со случайной фа-
фазой, распределенной равномерно на интервале (—я, я), модулиро-
модулировано по фазе гауссовским центрированным стационарным случай-
случайным процессом. Тогда G.124) запишется в виде
t(O=0oCOs[<DOf + q>—л @1- G.132)
Спектральная плотность мощности немодулированного квазиде-
терминированного гармонического колебания [см. D.119)]
S* (со) = nal [б @ - ©0) + б (со + ю0)]. G.133)
Подставляя G.133) в G.127), получаем
В1 (т) = (fl2/2) ехр { - о2 cog [ 1 - Дл (т)]} cos озо т. G.134)
209
Используя теорему Хинчина — Винера, находим спектральную
плотность мощности модулированного (Процесса
00
5; (со) = 2а\ J ехр { — а^ аJ [ 1 — R^ (т)]} cos coo т cos сот d т =
о
= а\ jexp {-о2оз2[1 —^ (т)]} cos (со - со0) т d т +
J G.135)
Предположим, что изменения 7?л (т) медленные по сравнению
с cos соот, т. е. что спектр модулирующего процесса низкочастот-
низкочастотный и ширина полосы этого спектра много меньше несущей час-
частоты (оо. Тогда вторым интегралом в G.135) можно пренебречь по
сравнению с первым и получить
5с(со) = ^]ехр{-о2©»[1-/?л(т)]}со8(со-0в)т?«т. G.136)
о
Интеграл в правой части G.136) сходится при ю^соо и неограни-
неограничен при о) = (оо, что указывает на наличие дельта-функции (дис-
(дискретной линии) в спектре процесса t>(t) при со = соо. Переписывая
G.136) в виде
оо
со) = а0 ехр ( - о^ cog) J cos (со - соо) т d т +
о
- ехр {- о2 cog}] cos (со - о)о) т d т,
представим спектр как сумму дискретной и непрерывной частей
Sc(©) = яа2ехр (-О2со2) б(со-(о0) +
+ а% ехр (- а2 cog) ][ехр {о% cog /?л (т)} - 1J cos (ш - соо) т d t. G.137)
о
При ало)о>1 интенсивность дискретной составляющей спект-
спектра пренебрежимо мала, а для непрерывной части можно полу-
получить простое приближение. Разлагая в показателе экспоненты в
подынтегральном выражении Ry\(x) в ряд Тейлора, ограничива-
ограничиваясь двумя первыми членами и предполагая дифференцируемость
т](/) в среднеквадратическом, получаем при a^c^l
(ю)явпр ~ а\ /я/2/(оч соо щ) X
210
ХГаким образом, в рассматриваемом случае спектр модулиро-
модулированного по фазе колебания непрерывный и имеет форму гауссо-
гауссовой кривой с вершиной в точке со=юо. Ширина полосы этого спект-
спектра ра^на сгт)(ОоС01]/2я. Заметим, что в рассматриваемом случае га-
уссовская форма спектра процесса ?(/) получается три любом
спектре процесса r\(t) и зависимость S;(co) от энергетических ха-
характеристик процесса r\(t) определяется только значением соь
Если arjcoo^'l, то, разлагая показатель экспоненты в подын-
подынтегральном выражении G.137) в ряд по степеням Rr\ и ограничи-
ограничиваясь линейным приближением, находим
l о l 1R* W cos (<° " ^о) *d *> G-139)
о
откуда следует -'1
S| (со) = я а\ ехр ( - о* cog) б (со - соо) + -^- со* S4 (со - ©0). G.140)
Таким образом, в первом приближении при ачсоо<С1 спектр,
получаемый в результате фазовой модуляции гармонического ко-
колебания гауссовским процессом, представляет суперпозицию ди-
дискретной линии исходного гармонического колебания и спектра
модулирующего процесса, смещенного по оси частот на значение,
равное частоте со0 несущего колебания и умноженное на постоян-
постоянный масштабный коэффициент (#осооJ/2.
7.5. ЗАДАЧИ
7.1. Доказать, что спектральная плотность мощности и корреляционная
функция процесса на выходе дифференцирующей #С-цепи, когда на входе дей-
действует белый шум со спектральной плотностью 2No, равны
5С (») = 2N0 (co/a)«/[ 1 + (<»/aK], Aа)
^ A6)
7.2. Показать, что при произвольной добротности Q выражения нормиро-
нормированной корреляционной функции процесса на выходе последовательного оди-
одиночного контура, когда на его входе действует белый шум, имеют вид:
при Q>l/2 (колебательный режим)
j B)
при Q = 1/2 (граница колебательного и апериодического режимов)
*(т)=ехр(-Р|т|)A + р|т|). C)
211
при Q<l/2 (апериодический режим)
© = P«_wg>0, D)
где P=/?/BL)=cdo/BQ).
Убедиться, что формулы B) — D) сохраняют вид также и для контура,
образованного параллельным соединением конденсатора, катушки индуктивно-
индуктивности и резистора.
7.3. Используя выражение для квадрата частотной характеристики двух
связанных одинаковых узкополосных контуров
СЦ«>)=С2о[(х2—\2—\J+4х2]-\ E)
где
jc= (со/2р) A— соУсо2), Eа)
P=1?/BL), co2o=i/(LC), E6)
X — отношение коэффициента связи между контурами к затуханию, найти
нормированную корреляционную функцию процесса на выходе связанных кон-
контуров, когда на входе действует белый шум
R (т) = ехр ( — Р|т|) ( cos РЯт + -г- sin f>X |т| J cos соот.
F)
7.4. Нормированную корреляционную функцию белого шума, прошедшего
линейную систему с сосредоточенными параметрами, передаточная функция
которой — дробно-рациональная функция
jfe(io>) = G(icD)/V(icD)> G)
где G(p) и V(p)—многочлены степени тип соответственно (m<n), пред-
представить в виде:.
п
= 2 ехр(- ру |т|) (AcjCQs®jx+ ASjsma>j |т|); (8)
если все корни многочлена V(p) простые,
k vr
ЛМ=2 2 ехр(-рг|т|)(Л^со8©гт
г=1 /=1
если многочлен V(p) имеет k различных корней, причем корень о)г имеет
кратность vr.
7.5. На вход колебательного контура большой добротности (Q^>1) с им-
импульсной характеристикой
А(О=а>0ехр(—pf)sina>of, *>0, A0)
(Q, ©о и р определены в п. 7.2.3) действует аддитивная смесь детерминиро-
детерминированного сигнала s {t) — aosm aot и белого шума с интенсивностью 2W0. Доказать,
212
что отношение квадрата амплитуды сигнала к мощности шума на выходе кон-
контура через интервал времени Т после включения (при условии mqT^I)
С _ ajj[l-exp(-prI
7.6. Пусть на входе интегрирующей RC-nenn действует стационарный слу-
случайный процесс с корреляционной функцией
В+ (т) = о| ехр ( — Р|т|), Р>0. Вывести следующее выражение нормированной
корреляционной функции процесса 5@ на выходе интегрирующей цепочки:
— Э|т|) — Рехр( —а |т|)], а = -^-. A2)
С
*> а — р
Показать, что дисперсия процесса на выходе
03)
7.7. Используя выражение четырехмерной характеристической функции га-
уссовского центрированного стационарного процесса, показать, что четвертый
смешанный момент процесса
-тО, A4)
где В(т)—корреляционная функция процесса.
Убедиться, что из A4) следует очевидная формула для четвертого момен-
момента гауссовского процесса на выходе линейной системы с частотной характе-
характеристикой С (со)
1 °° \2
jS(G))C2(«)d« , A5)
2п о /
где S(o))—спектральная плотность мощности гауссовского процесса на входе
линейной системы.
Глава 8
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ
В НЕЛИНЕЙНЫХ СТАТИЧЕСКИХ
(БЕЗЫНЕРЦИОННЫХ) СИСТЕМАХ
8.1. ЭНЕРГЕТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ПРОЦЕССА
НА ВЫХОДЕ НЕЛИНЕЙНОЙ СИСТЕМЫ
8.1.1. Общие соотношения. В линейных системах корре-
корреляционная функция и спектральная плотность мощности выход-
выходного процесса однозначно определяются характеристикой систе-
системы и корреляционной функцией (или спектром) процесса на ее
213
входе (см. § 7.1, 7.2). Для определения энергетического спектра
случайного процесса и его корреляционной функции на выходе не-
нелинейной системы необходимо знать, по крайней мере, двумерное
распределение входного случайного процесса.
Как отмечалось в п. 6.1.3, значение процесса на выходе ста-
статической нелинейной системы в произвольный момент времени t
определяется значением процесса на входе системы только в тот
же самый момент времени t. Поэтому нет необходимости анали-
анализировать преобразование случайных процессов в статических не-
нелинейных системах раздельно для случайных процессов и .непре-
.непрерывных случайных последовательностей. Приводимые далее ре-
результаты применимы и для непрерывного, и для дискретного вре-
времени.
Пусть известны характеристика вход-выход нелинейной ста-
статистической системы [см. F.5)]
УЧ(х) (8.1)
б двумерная плотность вероятности w2(x\, *2, t\, t2) случайного
процесса ?(./) на входе системы. Тогда, используя приведенные в
гл. 3 правила нахождения средних значений функции случайных
величин, для корреляционной функции случайного процесса ^(t)
на выходе нелинейной системы получаем
2. *i> Qdx,dx2. (8.2)
—00 — 00
Бели l(i) —стационарный случайный процесс, то стационарен
также и -процесс t,{t)=f[l(t)] на выходе нелинейной статической
системы, а его корреляционная функция
(8.3)
—00 —00
Если в интеграле (8.3) заменить w2(xu х2, т) =w\(xi)w\(x2), т->
-^оо, и w2(xu х2, т) =wi(x\)8(x\—х2), т = 0, то получим соответст-
соответственно выражения для среднего значения и второго момента ста-
стационарного процесса на выходе [см. также C.14)]:
Щ {/[?(')]= ]fi(x)w1(x)dx. (8.5)
Аналогично, если существует k-и момент процесса ^@» то
mAflUt)}= ]fk(x)w1(x)dx. (8.5a)
— CXD
214
Найдя корреляционную функцию стационарного случайного
процесса на выходе нелинейной системы, можно, используя тео-
теорему Хинчина — Винера, т. е. совершая преобразование Фурье,
получить спектральную плотность мощности этого процесса. Од-
Однако непосредственно вычислить интеграл (8.2) или (8.3), как
правило, очень сложно. Поэтому целесообразно предварительно
преобразовать его так, чтобы разделить переменные интегрирова-
интегрирования в двойном интеграле. Далее рассматриваются некоторые об-
общие методы вычисления интегралов вида (8.2). Отметим, что эти
методы пригодны также для вычисления взаимной корреляцион-
корреляционной функции процессов и на выходе двух нелинейных систем, если
известны совместная двумерная плотность вероятности процессов
на входах этих систем и их характеристики. Выражение для ука-
указанной взаимной корреляционной функции имеет вид
(8.6}
—сю —оо
Формула (8.2) является частным случаем (8.6), когда f\ = f2 и
?i = g2- Если /2(^2) =#2> то (8.6) дает выражение взаимной корре-
корреляционной функции процессов на входе и на выходе нелинейной
системы (при 1\ = 12=1)-
8.1.2. Прямой метод вычисления корреляционной функции.
Этот метод основан на разложении двумерной плотности вероят-
вероятности процесса на входе нелинейной системы в ряд, т. е. на ис-
использовании результатов п. 2.5.5. Пусть w\(x, t)—одномерная
плотность вероятности, соответствующая двумерной плотности ве-
вероятности w2(xi, x2t U, t2) процесса на входе нелинейной системы.
Примем w\ (x, t) за весовую функцию и построим совокупность
нормированных ортогональных полиномов Qn(x, /), которые дол-
должны удовлетворять условию ортогональности
J<M*. t)Qn(xt t)Qm(xy t)dx = 8nmy
—00
где bum — символ Кронекера.
Двумерную плотность вероятности w2{x\, x2, tu t2) можно раз-
разложить в двойной ряд по этим ортогональным полиномам [см.
B.96)]
w2(xlt *2I tlt t2) = w1(x1, t1)w1(x.i, Qx
X S I anm(tu t2)Qn(xlt tx)QmUb, t2)dXldx2. (8.7)
n=0 m=0
Коэффициенты апт могут быть определены умножением обеих
частей (8.7) на Qk(x\, t\)Qi(x2, t2) и интегрированием с использо-
использованием условия ортогональности. Тогда
«пт&ЛН I !<М*1э Ъ> tl9 t2)Qn{xl9 t1)Qm(x2, tjdx^xt. (8.8)
—о© —00
215
Во многих практически важных случаях
anm{t\, t2)=an(tu к)Ьптп. (8.8а)
Для этого класса распределений формулы (8.7) и (8.8) упро-
упрощаются [ср. B.98), B.99)]:
w2(xlt х2, tl9 t2) = w1{x1, tl)w1(x2, t2)x
X 2 вп&. *2№п(Хг, tJQn(x29 t2), (8.9)
rc=0
flnCi, У= I ]w2(xx, x2, tl9 t2)Qn(xlf t1)Qn(x29t2)dxldx2. (8.10)
—oo —oo
Подставляя (8.9) в (8.2) и разделяя переменные интегриро-
интегрирования, получаем
Bi ft, к) = 5 сп (tt) cn (*2) an (tlt tt), (8.11)
n=0
где
1Qn(x, QWiix, t)dx. (8.12)
Формула (8.11) описывает корреляционную функцию случай-
случайного процесса на выходе нелинейной системы в виде ряда функ-
функций an(t\, t2), которые определяются только корреляционными ха-
характеристиками процесса на входе, но не зависят от вида нели-
нелинейности.
Рассмотренный метод вычисления корреляционной функции на
выходе нелинейной системы назовем прямым.
Если случайный процесс на входе нелинейной системы стацио-
стационарный, то W\(x, t) не зависит от времени t, a w2(xu x2, tu U)
обусловлено только x = t2—1\, и тогда (8.11) может быть записано
в виде
Яг(т) = 2 clan{x), (8.13)
где
fln(x)= J ]w2(xv x2t x)Qn(x1)Qn(x2)dx1dx2y (8,14)
w^dx. (8.15)
—oo —oo
2.1.3. Спектральная плотность мощности процесса после нели-
нелинейного преобразования. Из (8.13), используя теорему Хинчина —
216
Винера, находим спектральную плотность мощности процесса на
выходе нелинейной системы
StH=2 c2gn(co)f (8.16)
где
gn (со) = 2 ]ап (т) ехр ( - i сот) dx. (8.17)
—сю
Из (8.16) и (8.17) непосредственно следует, что широкополос-
широкополосный стационарный случайный процесс после нелинейного неинер-
неинерционного преобразования также стационарный и широкополосный.
Рассмотрим теперь нелинейное неинерционное преобразование
узкополосного случайного процесса. В этом случае в соответствии
с D.111) корреляционная функция процесса на входе нелиней-
нелинейной системы
(т) = Вс (т) cos со0 т + Bs (х) sin соо т =, Во (х) cos [со0 х - % (х)], (8.18)
где Во(х) и г|H(х)—функции, медленно меняющиеся по сравне-
сравнению с cos ©от.
Предположим, что в (8.17)
ап (х) = Фп [В6 (х))] = Фп {Во (х) cos К х - % (х)]}. (8.19)
Разлагая (8.19) по косинусам кратных дуг, получаем
ап W = Ао (х) + s Ar (x) cos [г со0 х - -фг (х)]. (8.20)
Подставляя (8.20) в (8.17) и собирая все члены при одинако-
одинаковых гармониках частоты соо, можно корреляционную функцию уз-
каполосного процесса после нелинейного преобразования предста-
представить в виде
-%(x)], (8.21)
а соответствующую спектральную плотность мощности — в виде
5? (со) == So (со) + S, (со) + S Sr (со). (8.22)
Характерной особенностью выражения (8.21) является то, что
функции Вг(х) и г|)г(х)—медленно меняющиеся по сравнению с
cos со0т. Это соответствует тому, что спектр узкополосного стацио-
стационарного случайного процесса после нелинейного неинерционного
преобразования представляет последовательность разделенных
друг от друга спектральных полос (рис 8.1), которые расположе-
расположены в области низких частот1 [спектр S0(co)], около несущей чав-
1 В эту область входит и дельта-функция при со=0, соответствующая по-
постоянной составляющей. Штриховой линией на рис. 8.1 изображен спектр слу-
случайного процесса на входе нелинейной системы.
217
к"
\
'Sg(uj)
1
\
Л
/1
\ \
х
\ У
\
_J ^
V
;
' \ 8я(ы)
Q)q
20)д
ЗьH
со
Рис. 8.1. Спектральная плотность мощности узкополосного процесса после нели-
нелинейного преобразования
тоты [спектр Si (со), где сосредоточен также спектр и входного
процесса] и в высокочастотных областях около гармоник несущей
(спектры Sr(co) при г^2). Их можно разделить при помощи по-
полосовых фильтров, каждый из которых позволяет охватить дан-
данную полосу и не пропустить заметную часть спектра соседних по-
полос. Низкочастотный спектр наиболее интересен при демодуля-
демодуляции, в то время как спектральная полоса около несущей важна
для изучения таких процессов, как модуляция и гетеродинирова-
ние.
8.1.4. Метод контурных интегралов. Второй способ вычисления
интеграла (8.2) заключается в использовании представления ха-
характеристики нелинейной системы контурным интегралом
f(x) =
i и) exp (i xu) du,
где
g (i и) = §f (x) exp (- i xu) Ax.
(8.23)
(8.24)
Подставляя (8.23) в (8.2) и меняя порядок интегрирования,
находим
X У ]a>2(*i. *2> tu t2) exp [i(x1u1 + x2u2)]dx1 dx2du1du2.
—oo —oo
Внутренний интеграл <по х\ и х2 представляет двумерную ха-
характеристическую функцию 02(^1, w2» tu U) процесса на входе не-
нелинейной системы. Тогда
("i. . k, k)dUldu2. (8.25)
218
Если процесс на входе стационарный, то
^2)e2(u11 u2, T)dUldu2. (8.26)
Если в (8.26) заменить 02 (U\, u2, т) =Q\(u\)Qi(u2) при т-^оо,.
то получим [ср. с (8.4)]
Для разделения переменных интегрирования в (8.25) можно*
как и в п. 8.2.1 при прямом методе, разложить 02(щ, u2y U, tt)
в ряд по ортогональным полиномам, соответствующим одномер-
одномерной характеристической функции, а в некоторых случаях в степен-
степенной ряд Тейлора.
Нельзя дать общей рекомендации, когда для вычисления кор-
корреляционной функции процесса на выходе нелинейной системы'
применять прямой метод, а когда метод контурных интегралов.
Такая рекомендация зависит от вероятностных характеристик,
входного процесса и от характеристики нелинейной системы. Если
потребуется дополнительное усреднение по времени корреляци-
корреляционной функции выходного процесса, может оказаться предпочти-
предпочтительнее метод контурных интегралов для нестационарных про-
процессов.
8.1.5. Метод производных. Этот метод основан на обобщении?
на случайные процессы кумулянтных уравнений C.736), C.84г)
[31]. Так, для стационарного процесса на входе статической не-
нелинейной системы из C.736) получаем дифференциальное урав-
уравнение, связывающее средние значения процессов на входе и вы-
выходе системы
|^ ]fnHx)w1(x)dx, (8.28).
а из C.84г) — дифференциальное уравнение, связывающее корре-
корреляционные функции на входе и на выходе системы:
) = 7 Т//(я)(^1)/(я)(^2)^2(^1. *2. T)d^dx2. (8.29)
Конечно, уравнения (8.28) и (8.29) можно использовать для
определения среднего и корреляционной функции процесса на вы-
выходе нелинейной системы, если правые части этих уравнений кон-
константы или содержат в явном виде соответственно среднее и кор-
корреляционную функцию процесса на входе. Эффективность метода
производных будет показана в гл. 9 для гауссовского процесса
ьа входе нелинейной системы.
В этом случае метод производных часто позволяет получить
выражение корреляционной функции процесса на выходе нелиней*
ной системы в замкнутой форме, а не в виде бесконечного ряда
219
[см. (8.11)}. Однако с помощью представления в виде ряда можно
гораздо проще выполнить преобразование Фурье корреляционной
функции, необходимое для определения спектральной плотности
мощности [см. (8.17)].
8.2. РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ ПРОЦЕССА
НА ВЫХОДЕ СТАТИЧЕСКОЙ НЕЛИНЕЙНОЙ СИСТЕМЫ
8.2.1. Общие соотношения. Точное определение функции рас-
распределения процесса на выходе динамической (даже линейной)
системы представляет в общем случае практически неразрешимую
задачу (см. § 7.3). Для статической системы эта задача решает-
решается точно и в замкнутой форме для функции распределения любо-
любого порядка путем использования результатов, приведенных в
п. 3.1.12.
Пусть известны характеристика (8.1) статической нелинейной
системы и многомерная плотность вероятности wt(xi9..., xn,
*i,..., tn) случайного процесса l(t) на входе системы. Обозначим
через lk = l(tk) и через t)k=t>(tk)i k=\t п. Задача состоит в опре-
определении совместной плотности совокупности случайных величин
?л, k=l, /г, получаемых в результате нелинейного преобразования
?*=/(?*). k=l9n. (8.30)
Преобразование (8.30) представляет частный случай C.23),
когда преобразованная k-я переменная зависит только от k-и
входной переменной. Если фг(Уь)—f-я ветвь обратного преобра-
преобразования, то из C.25) в рассматриваемом случае находим простое
выражение якобианов преобразования
fl_uM.>f_lt2f... (8.31)
ft=l dVh
Тогда из C.26) получаем решение рассматриваемой задачи в
форме следующего соотношения между плотностями вероятностей
процессов на входе и выходе нелинейной системы:
П
= 2 Щ [ф* (f/l), - » Фг (Уп)> *1> - » У П
i k=l
(8.32)
Заметим, что корреляционную функцию и спектральную плот-
плотность мощности процесса на выходе нелинейной системы можно
определять после того, как найдено, по крайней мере, двумерное
распределение этого процесса. Однако, если по условию задачи
требуются только энергетические характеристики выходного про-
процесса, часто проще воспользоваться результатами § 8.1, не вычис-
вычисляя предварительно двумерного распределения.
220
Наконец, отметим, что нелинейное неинерционное преобразо-
преобразование случайного процесса не вносит дополнительных вероятно-
вероятностных временных связей. Точнее говоря, если процесс до неинер-
неинерционного преобразования полностью характеризовался п-мерным
распределением, то и после преобразования он будет полностью
характеризоваться распределением п-го порядка. Например, мар-
марковский процесс после нелинейного неинерционного преобразова-
преобразования (монотонного) останется марковским. В противоположность
этому динамические системы вносят дополнительные вероятност-
вероятностные связи. Так, профильтрованный белый шум оказывается кор-
коррелированным, а процесс на выходе линейной системы, когда на
входе действует марковский процесс, уже не является марковским
8.2.2. Распределение квадрата случайного процесса. Исполь-
Используем общую формулу (8.32) для определения двумерной плотни-
сти вероятности квадрата ti(t)=li2(t) случайного процесса ^(t).
Одномерная плотность вероятности квадрата случайного процес-
процесса получается из C.11) заменой w\ (x) на W\(x, t).
Обозначим через w2{x\, х2у t\, t2) и W2(yu у2у tu t2) двумерные
плотности вероятности случайного процесса и его квадрата соот-
соответственно. Так как функция, обратная у=х2у двузначна, то каж-
каждой точке с координатами f/i>0, у2>0 будет соответствовать че-
четыре точки в плоскости (хи х2)\
= - V7»
(8-33)
Так как
<*У1
dy.
dx2l
dx2
то в соответствии с (8.32) находим
-VFi. tlt
Vyl, h, t*)
, k, t2)
, tlt
(8.34)
Если процесс на входе стационарный, то двумерные плотности
вероятности процессов на входе и на выходе нелинейной системы
зависят только от временного параметра сдвига r=t2—U. При
т-voo w2{x], х2, т) =Wi(xi)wi(x2) и тогда из (8.34) получим
что согласуется с C.11).
221
8.2.3. Линейный детектор. Найдем двумерную плотность веро-
вероятности случайного процесса на выходе линейного детектора с ха-
характеристикой
у =f(x)=\X~X<» X>X°> (8.35)
10, *<%
Обозначив
получим (см. п. 3.4.6)
откуда выразим двумерную плотность вероятности ^2 (f/uf/2, ^ь ^2)
процесса на выходе линейного детектора через двумерную плот-
плотность вероятности w2(xu х2у U, t2) на входе:
^^2 (i/i. #2. 'ь *2) = «Ъ G/i + *о> J/2+% '1. '2) +
({/2)
tlt x2, tu t2)dxl(lx2, уг>0, у2>0. (8.36)
—oo —oo
Интегрируя по любой из переменных ух и у2, получаем одно-
одномерную плотность вероятности процесса после линейного детекти-
детектирования
W,(yy t) = wi(x0 + у, t) + 6{y) ]V(*. f)d*> У>°- (8.36a)
—oo
Эта формула является частным случаем C.136) при v=l.
8.3. КВАНТОВАНИЕ СЛУЧАЙНОГО ПРОЦЕССА
8.3.1. Характеристика квантователя. В цифровых системах пе-
передачи информации аналоговый сигнал подвергается дискретиза-
дискретизации во времени и квантованию по уровням в аналого-цифровом
преобразователе (АЦП). При квантовании динамический диапа-
диапазон значений аналогового сигнала делится на ряд дискретных
уровней. Если сигнал квантуется на М уровней, то характеристи-
характеристику амплитудного квантователя можно записать в виде (рис. 8.2):
Q(x) = ah, если xefe-i, zk]y й«-1, М (8.37)
222
ff
"и
1
1
1
1
1
\%M-1 _
X
Рис. 8.2. Характеристика амплитудного квантователя
ИЛИ
M-l
-ah) u(x-гк),
(8.37а)
где н(#) — функция единичного скачка.
Таким образом, закон амплитудного квантования определяется
двумя векторами: вектором уравнений a=(ai, ..., ам) и вектором
граничных точек интервалов квантования z=(—00=2:0, zu ...
..., 2м-ь 2м=°°). Если шаг квантования 6=aft+i—ah постоянный,
то квантование называют равномерным.
Механизм квантования сигнала в АЦП сводится к тому, что
вместо данного мгновенного значения сигнала формируется зна-
значение ближайшего дискретного уровня. Квантование сигналов по
уровням позволяет эффективно подавлять помехи, если только
среднеквадратическое значение помех мало по сравнению с раз-
разностью между дискретными уровнями. Квантование приводит к
искажениям сигнала, которые называют шумами квантования.
Квантование сигналов по уровням лежит в основе всех систем с
импульсно-1кодовой модуляцией (ИКМ).
При равномерном квантовании шум квантования, т. е. разность
между исходным и квантованным сигналами, можно рассматри-
рассматривать как результат преобразования исходного сигнала в нелиней-
нелинейном элементе с пилообразной характеристикой, изображенной на
рис. 8.3:
f(x)=x—mb, (8.38)
(т— 1/2N<х^ (m+l/2N, m=0, ±1, ±2,...,
где б — разность между последовательными дискретными уров-
уровнями.
Функцию f(x) как периодическую с периодом б можно разло-
разложить в ряд Фурье:
(8.39)
223
Рис. 8.3. Пилообразная
характеристика
8.3.2. Корреляционная функция шумов квантования. При рав-
равномерном квантовании, используя (8.39), можно представить кор-
корреляционную функцию шумов квантования ^(t) в виде
;d. ',) = ( — ) 2 S(-l)n+4 i JX
V л / nk
x2, *lt
(8.40)
где t^2(^i, #2, ^i, ^2) —двумерная плотность вероятности исходного
квантуемого сигнала.
Интеграл в (8.40) выражается через двумерную характеристи-
характеристическую функцию 02 @1, v2i /ь /2) сигнала
—00 —схэ
N| _ 0 ( -2— — f /
Подставляя (8.41) в (8.40), получаем
X<
Sf, 2f. <„
(S.42)
где штрих означает, что из суммы исключен член при /i=fc=0.
Формула (8.42) — общее выражение корреляционной функции
шумов квантования при произвольном распределении вероятно-
вероятностей квантуемого сигнала.
8.3.3. Взаимная корреляционная функция шумов квантования
и квантуемого сигнала. Используя (8.39), нетрудно также полу-
получить выражение для взаимной корреляционной функции шумов
квантования и квантуемого сигнала |(/). В соответствии с опреде-
определением взаимной корреляционной функции
х19 х2У tlt t2)dxldx2 =
—00 —00
224
= A 2 (_ 1)*-»-i- 7 ]xisinB-^-)w,(x1, x2, tv t2)dXldx2.
Я k—\ k — oo —oo \ О /
(8.43>
Интеграл в (8.43) выразим через производную от двумерной
характеристической функции квантуемого сигнала:
2(x1, x2i tl4 t2)dx1dx2 =
—oo —oo
--f-ea(«, -2-f,tvt2)] . (8.44)
Подставляя (8.44) в (8.43), получаем
. (8.45)
U=Q
8.4. ЗАДАЧИ
8.1. Показать, что взаршная корреляционная функция процессов t]i (/)=»:
g it t \ _ v c (Me (/<>) a (^ , M A)
где
B)
C)
bt,, D)
" » » «^ M/ I 1 0 & W "
— OO OO
Qni(xu /i), Qn2(-^2, ^2) —семейство ортогональных полиномов для весовых
функций w^x (xi, t\) и Wz2 (л'2, t2) соответственно (условие (8.8а) сохраняется).
8.2. Пусть двумерное распределение случайного процесса 5@ удовлетворя-
удовлетворяет соотношению
Показать, что взаимная корреляционная функция центрированного процес-
процесса l(t) и процесса на выходе нелинейной неинерционной системы r\(t) =/
когда на входе действует ?@>
8—87 225
где
оо
с= ^(x-al)f(x)wl(K)dx. G)
ОО
Обратить внимание, что для симметричного распределения (с нулевым сред-
средним) и симметричной характеристики нелинейности процессы ?(/) и Л @ на вхо*
де и на выходе системы некоррелированы. Убедиться, что гауссовский случай-
случайный процесс удовлетворяет условию E).
8.3. Обозначим через В\(х) и ?2(т) корреляционные функции процессов на
выходах одно- и двуполупериодного линейных детекторов, когда на их входах
действует процесс ?(/), удовлетворяющий условию E). Доказать, что
f (8)
где
оо
с= JlxIfx-agJwgMd*. (9)
Рассмотреть случай симметричного распределения %(t) и убедиться, что в
этом частном случае
?2(t)=4?i(t)-S*(t). A0)
8.4. Показать, что одномерная плотность вероятности процесса t>(t) на вы-
выходе симметричного ограничителя с характеристикой
fM«sgn(*-*o) A1)
имеет следующий вид:
wl(x)^[l-Fl(x0))d(x-l) + Fl(xQ)^(x+lI A2)
где Fъ(х) —функция распределения процесса на входе.
Убедиться, что среднее и дисперсия процесса на выходе ограничителя
A4)
Глава 9
ПРЕОБРАЗОВАНИЯ ГАУССОВСКИХ ПРОЦЕССОВ
В СТАТИЧЕСКИХ (БЕЗИНЕРЦИОННЫХ)
НЕЛИНЕЙНЫХ СИСТЕМАХ
9.1. АНАЛИЗ ЭНЕРГЕТИЧЕСКИХ ХАРАКТЕРИСТИК
ПРЯМЫМ МЕТОДОМ
9.1.1. Общие соотношения. Ранее отмечалось, что за-
задача анализа прохождения (косвенного описания) гауссовского
случайного процесса через линейные системы сравнительно про-
226
стая, так как процесс на выходе сохраняет при этом нормальное
распределение; изменению подвергаются лишь корреляционная
функция и соответствующая ей спектральная плотность мощности.
Все необходимые для расчетов формулы содержатся в гл. 7. По-
Поэтому основной интерес представляет задача о нелинейных пре-
преобразованиях гауссовского случайного процесса.
Ограничимся изучением, главным образом, корреляционной
функции и спектральной плотности мощности процесса на выходе
нелинейной статической системы. Для этого используем общие ме-
методы, указанные в гл. 8. Лишь в § 9.4 рассмотрим несколько при-
примеров определения функций распределения гауссовского процес-
процесса после нелинейного преобразования.
Пусть на входе нелинейной статической системы действует слу-
случайный процесс, представляющий сумму детерминированного про-
процесса s(t) и стационарного гауссовского случайного процесса %(t)
с нулевым средним значением, дисперсией а2 и нормированной
корреляционной функцией R (т). Двумерная плотность вероятно-
вероятности этого процесса (см. п. 5.2.1)
W(X * ^ *) Х
X схр / Г(** ~ fllJ ~ 2R {Xl ~~ai) (*2 ~ п2) + (*2 ~ а*J \ Г9 П
1 { 2а2A_#2) Г 1 • ;
где ai = s{ti),i=U 2, R = R(T), %=t2—U.
Подставляя (9.1) в (8.2) и заменяя переменные интегрирова-
интегрирования (xi—ai)/o=uu (х2—а2)/о=и2, получаем выражение для кор-
корреляционной функции случайного процесса на выходе нелинейной
системы с характеристикой y=f{x), если на входе его действует
аддитивная смесь детерминированного и стационарного гауссов-
гауссовского процессов:
u2 + ul
J ]f(ou1-al)f(ou2 +
2} du, du2. (9.2)
2AД2)
Для вычисления интеграла в (9.2) воспользуемся методом,
указанным в п. 8.1.2. Так как одномерная плотность вероятности
стандартного нормального распределения
то, принимая функцию (9.3) в качестве весовой, найдем, что со-
соответствующей совокупностью ортогональных полиномов являют-
являются полиномы Эрмита Нп(х)у я^О [см. B.83)]. Разложение дву-
8* 227
мерной плотности вероятности стандартного нормального распре-
распределения имеет следующий вид1:
^rexpi-
2 A-Я2) I
При сравнении (9.3) с (8.9) необходимо иметь в виду, что по-
полиномы Эрмита нейормированы. Необходимо подставить
Заменяя экспоненциальную функцию под знаком интеграла
(9.2) ее разложением в ряд (9.3), меняя порядок суммирования и
интегрирования и, замечая, что при этом переменные интегриро-
интегрирования разделяются, находим [ср. с (8.11)]
В &, У = 5 сп (у сп (t2) -51М., т = *2 - *Л (9.4)
где
сп @ = -т=г- Jf (а " + fl) нп (и) ехр ( - -^-Л da, а = s (/). 1(9.5)
Если детерминированное слагаемое обращается в нуль, то из
(9.5) определяем корреляционную функцию процесса на выходе
нелинейной системы, когда на вход ее действует центрированный
стационарный гауссовский процесс
в(х)=% с2п^?-> ад
n=0 nl
где
сп = -т=г ]/ (о и)Нп (и) е-/2 da. (9.7)
По теореме Хинчина — Винера, производя преобразование Фу-
Фурье обеих частей равенства (9.6), получим спектральную плотность
мощности процесса на выходе нелинейной системы
I
5 (со) = 4 2 — I Rn (т) cos сот d т, (9.8)
/г=0 П\ 0
где jR(t)—нормированная корреляционная функция гауссовско-
го процесса на входе системы.
1 Выражение (9.3) можно без труда получить, если воспользоваться инте-
интегральным представлением двумерной нормальной плотности распределения при
помощи двумерной характеристической функции. Разлагая в подынтегральном
выражении в ряд экспоненциальный множитель, содержащий произведение пе-
переменных, можно выразить интеграл через полиномы Эрмита.
228
Первый член в ряде (9.8) соответствует постоянной составля-
составляющей (дискретная часть спектра), а сумма остальных членов —
непрерывной части спектра случайного процесса на выходе сис-
системы.
9.1.2. Корреляционная функция процесса на выходе нелиней-
нелинейной системы, когда процесс на входе узкополосный. Пусть спектр
стационарного гауссовского процесса узкополосный, т. е. сосре-
сосредоточен в относительно узкой полосе частот около высокой часто-
частоты соо, на которой спектральная плотность максимальна и относи-
относительно которой спектр можно считать симметричным. В соответ-
соответствии с D.103) нормированную корреляционную функцию такого
узкополосного стационарного случайного процесса можно предста-
представить в виде
J?(T)=i?0(T)cosco0T, (9.9)
где
/?0(т)= J 5* (со) cos сот d со / Js*(co)<ico, (9.9а)
—оо / —оо
S* (со) — спектр узкополосного процесса, смещенный в область
низких частот.
Подставляя (9.9) в (9.6), находим
00 с2
В (т) = S — Rno (т) cos" coo т. (9.10)
Заменим степени косинусов в (9.10) суммой косинусов кратных
дуг по известным формулам
сев2** = 2-2* Р^1 2 ( 2п \cos2(n-k)x + ( 2/l\j, (9.11а)
П—1 / п~ t \
cos2"-1 х = г-*2"-1) 2 ) cos Bл - 2k - 1) х. (9.116)
k I
Тогда выражение (9.10) корреляционной функции процесса на
выходе нелинейной системы примет вид
2п
n=o B/гI22
оо п-\ С2п—1 [ _
(т) cos Bп — 2k — 1) coft
ri=i /fe=o Bn— 1)! 2^~х
с2 BП)
оо п— 1 С2п I м I
2 2 ^ tj\9^, /?о" (х) cos 2(n-k) <oo т. (9.12)
229
Обозначив г=п—k и изменив порядок суммирования в двой-
двойных суммах, находим
с2 Bп
2п)
веч-2 "v
2
„=о Bга)
С2
¦?,* m-X^ ^-'^{2r~
с2
+ 22
r==in=r Bл)!22я
Обозначая
_LZ_^(T)cos2roHT. (9.13)
()
С) = 2 {П! RT С), (9. На)
n=o B/t)L22n
2 /2«-1\
2г-1 с) = s Vn7; ^о" о. о.
Bl)!22ra2
. ^(т)' (9Л4в)
n=r Bn)ll
перепишем (9.13) в виде [ср. (8.21)]
В (Т) = Во (Т) + Вг (Т) COS 0H T + ? #2г-1 (Т) COS BГ - 1) @0 Т +
оо
+ 2^2r(T)cos2rco0T. (9.15)
9.1.3. Спектральная плотность мощности процесса на выходе
нелинейной системы, когда процесс на входе узкополосный. По те-
теореме Хинчина — Винера из (9.15) находим спектральную плот-
плотность мощности процесса на выходе нелинейной системы, когда
процесс на входе узкополосный гауссовский случайный
S (со) = адсо) + Sx (со) + 5 S2r_i (со) + 5 S2r (со), (9.16)
где
„2
BП)
„=о Bn)l 2
50 (©) = 4 S ^bL f /??" (т) cos сот dt, (9.17а)
о Bn)l 22" oJ
230
52r M = 4 2 ——LZ- f RT (t) cos 2rcoo т cos cox dx. (9.17r)
B)! 22" о
S1 (со) = 4 у к——lJ— lRln~l (x) cos co0 x cos cox dx, (9.176)
n=\ Bn - 1)! 22"~2 о
/2n-l\
oo 2m—1 \ у. r I °°
S2r-i(co) = 4 2 —==—-— f/?o(x) cos Br—1)(dot cos cord t,
n=r Bn-\)\22n~2 о
(9.17b)
2л \
—— \f2n'
n=r B/2)! : "
Первый член в (9.16) представляет низкочастотную часть спек-
спектра (так называемого видеоспектра) случайного процесса на вы-
выходе нелинейной системы. Второй член соответствует части спект-
спектра выходного процесса, расположенной около частоты соо, где со-
сосредоточен спектр и выходного процесса. Остальные члены в (9.16)
соответствуют высокочастотным частям спектра процесса на вы-
выходе нелинейной системы, расположенным около гармоник часто-
частоты соо.
Рассмотрим более подробно низкочастотную часть спектра. Из
(9.17а) следует, что для ее вычисления необходимо определять
обратные преобразования Фурье от У?02п(т). Чем больше п, тем
меньше спектральные плотности, соответствующие /?о2п(т), но тем
шире становится полоса частот, занимаемая спектром. Для боль-
больших п вычислить составляющую спектра, соответствующую
i?o2n(T)> сложно. Однако функция Ro2n(t) убывает так быстро,
что можно применить подходящую аппроксимацию. Заменив пе-
переменную интегрирования т на х/уг2п и ограничившись в разло-
разложении /?о (я/У^п) двумя первыми членами, получим
— 1\
2R о L
б У2п б
2 1 /~ / 0J
^ '¦—
со.
COS ( -^L
где co2* = — R"o@).
Для процесса с равномерным в полосе А спектром
0J =
тД/2 7 * 12
Следовательно, при
(^^/e>p(^y (9.18)
На рис. 9.1 показаны составляющие низкочастотного спектра. При
л>1 использовалась приближенная формула (9.18).
231
-Ъ -2 -1 О 1 2 J 2GJ/A
Рис. 9.1. Составляющие низкочастотного спектра
9.1.4. Линейный детектор. В качестве первого примера, иллю-
иллюстрирующего изложенный метод, рассмотрим, как преобразуются
корреляционная функция и спектр стационарного гауссовского
случайного процесса линейным детектором, характеристика кото-
которого
y = f(x)--
К.
(9.19)
(постоянный множитель при х принят равным единице, что несу-
несущественно, так как он играет роль масштаба и всегда может быть
учтен в окончательных результатах).
Коэффициент сп в ряде (9.7) в рассматриваемом случае пред-
представляется интегралом
4n(x)e-x°'2dx. (9.20)
cn^J*tfn<x)ed*.
1/2я о
При п=0 и п=\ получаем непосредственно из (9.20)
= —2— Т*2
-—)dx = —.
2 ) 2
(9.20а)
(9.206)
/При
интегрированием по частям имеем
У2л
= (-1)"
dn~2 ехр (-
dxn~2
или
232
(9.20в)
Подставляя (9.20а — в) в (9.6), находим
] (9.21;
\l+R{)+ 5 п2
2я [ 2 п=2 п\
Имея в виду, что
Я2Л@) = (—1)*B*—1)!!, H2k-l@)=0> (9.22)
получаем следующее выражение для корреляционной функции
стационарного гауссовского случайного процесса, прошедшего че-
через линейный детектор:
i i 1B?Г' 4 (9-23)
Заметим1, что ряд (9.23), кроме первой степени нормированной
корреляционной функции входного гауссовского процесса, содер-
содержит только четные степени ^(т). Он может быть просуммирован,
и тогда в конечном виде
В(т) = -?- {[-5- + arcsin#(т)] Д (т) + 1Л—Д»(т) j. (9.24)
Из (9.24) находим среднюю мощность процесса на выходе ли-
линейного детектора В@)=а2/2. Так как квадрат постоянной сос-
составляющей согласно G.20а) с2о = а2/Bтс), то дисперсия процесса
на выходе линейного детектора
fx2 = ^=^ а2 « 0,341 о2. (9.25)
Заметим, что если в разложении (9.23) ограничиться только пер-
первыми тремя членами для подсчета средней мощности, то
\2я 4 4
откуда
и « G2 Л±1 « 0,329 о2, (9.25а)
4я
что отличается от точного значения (9.25) только на 3%.
9.1.5. Линейное детектирование узкополосного процесса. Если
спектр стационарного гауссовского процесса сосредоточен в отно-
1 То, что корреляционная функция рассматриваемого процесса на выходе
линейного детектора не содержит других нечетных степеней R, кроме первой, не
является неожиданным. Действительно, (9.19) можно представить в виде суммы
двух функций нечетной и четной составляющих f(x)=x/2+\x/2\. Тогда f(x\)X
Xf{x2) = {xiX2+\xi\\x2\+Xi\x2\-\-X2\xi\)!4 и при подстановке в (9.2) при ai —
= 02 = 0 первый член соответствует первой степени R, второй член — всем ос-
остальным четным степеням R, а последние два при интегрировании равны нулю.
Обобщения указанного свойства даны в [32].
233
сительно узкой полосе около высокой частоты соо, то в соответст-
соответствии с (9.15) и (9.23)
В (т) = Во (т) + — Ro (т) cos со0 т + 2 В2Т (т) cos 2r ©0 т, (9.26)
4 г=1
где
Г
[Bл-3)!!]»
(9.27)
, со [B/1—1)!!]» (
R (т\ — ° V \ п — г j rfin , . /q 2Q\
&2r \V = -Г— Zj Z~~i ^° * '" (y.ZOJ
2я _ Bм)! 2
Ряд (9.27) может быть просуммирован:
Во (т) = — [2Е (#0) - A - /?$ К (/?0)], (9.29)
где K(Ro) и ЕG?о) —полные эллиптические интегралы соответст-
соответственно первого и второго рода.
После преобразования Фурье функции Во (т) получим низко-
низкочастотную часть спектра процесса на выходе линейного детектора.
Первый член в разложении (9.27) даст дискретную линию при
со = 0, соответствующую постоянной составляющей, а сумма пре-
преобразований Фурье четных степеней нормированной корреляцион-
корреляционной функции Ro (т) — непрерывный спектр.
На рис. 9.2 показан непрерывный низкочастотный спектр про-
процесса на выходе линейного детектора, когда спектр гауссовского
стационарного процесса на входе равномерный в полосе, ширина
который равна Д. Ряд по степеням Ro в (8.27) сходится так быст-
быстро, что для вычисления спектра можно практически ограничить-
ограничиться только членом R2o. Тогда для рассматриваемого случая низко-
низкочастотная часть непрерывного спектра будет иметь вид прямо-
прямоугольника с основанием А. Этот приближенный спектр обозначен
на рис. 9.2 штриховой линией (ср. рис. 9.1). Сравнение с точным
спектром показывает вполне удовлетворительное приближение.
Отношение площадей непрерывных спектров, т. е. мощности, сос-
сосредоточенной в низкочастотной области — точного и приближен-
приближенного— равно 1,1, а спектральная плотность при оз = 0 (интервал
корреляции) для точного спектра на 6% больше, чем для приб-
приближенного. В отличие от приближенного, точный низкочастотный
спектр содержит частоты выше А, но интенсивность их пренебре-
пренебрежимо мала.
Второй член —Ro (т) cos coot в выражении (9.26) соответствует
4
неискаженному (с точностью до постоянного множителя) воспро-
воспроизведению на выходе линейного детектора спектра стационарного
гауссовского случайного процесса.
234
Sofa)),
Рис. 9.2. Низкочастотный спектр про-
процесса на выходе линейного детектора
Последующие члены
В2г (т) cos 2гсоот в выражении
(9.26) соответствуют высоко-
высокочастотным частям спектра про-
процесса на выходе линейного де-
детектора, расположенным око-
около четных гармоник частоты
0о- Интервал корреляции и со-
соответственно спектральные
плотности при co = 2r wo резко
убывают с возрастанием номе-
номера 2г гармоники, так как в вы-
выражении В2г(т) [см. (9.28)]
наименьшая степень Rq(t) рав-
равна 2г. Площади непрерывных
спектров (т. е. мощности), расположенных около гармоник соо,
убывают обратно пропорционально величине Г2Bг+3/2).
9.1.5. Аппроксимация нелинейной характеристики степенным рядом. Пусть
функцию f{x), дающую аналитическое представление характеристики нелиней-
нелинейного элемента, непрерывную вместе со своими производными, можно разло-
разложить в ряд Маклорена
xk
/М=2 — fU)(o). (9.зо)
k kl
Тогда часто (например, при двухполупериодном детектировании) нелинейная
характеристика f (х) аппроксимируется многочленом
2k (9.31)
коэффициенты которого должны быть равны соответствующим коэффициентам
ряда (9.30). При такой аппроксимации нетрудно определить коэффициенты сп
в ряде (9.4). Эти коэффициенты получаются из интеграла (9.5), который в рас-
рассматриваемом случае имеет вид 4
@
(9.32)
Интеграл в (9.32) легко вычисляется, если представить подынтегральную функ-
функцию как производную по параметру s. Тогда2
1 Практически сумма по k будет содержать лишь небольшое число членов.
Это будет означать, что коэффициенты ал, начиная с некоторого k = m+l, обра-
обращаются в нуль. Для общности суммируем по всем положительным k.
2 Заметим, что Ci=dco/ds, C2=dci/ds, ..., Cn^dcn-i/ds, т. е. каждый последу-
последующий коэффициент получается дифференцированием по s предыдущего.
235
где M-v_? — момент (v—&)-го порядка нормального распределения с единичной
дисперсией и нулевым средним. Выполняя дифференцирование по s и исполь-
используя C.76), находим
00 °° /?_L_2r\ k\ Bг 1)!!
или после замены индекса суммирования *
(п+ 1)\ Bг— 1)!!
2j 2j an+/+2ra „, , s • (9-33)
Необходимо иметь в виду, что при г = 0 принято Bг—1)!! = 1. Далее следует
усреднять произведения cn{t)cn(t+x) по времени. Обозначая
т/2
Ь, . (т)= lim(a/l+/2 Г) f s^WAs^^ + t)^, (9.34)
1 2 Г->оо ^2
находим из (9.4) и (9.33) усредненную корреляционную функцию процесса на
выходе нелинейной системы
ОО ОО оо ОО ОО
В* (Т) — V У У У У п п fT2n-H1+/2+2(r1+r2)v
D К*) — Zj Zj Zj Zj Zj «л4-/1+2г1 «„+/24-2Г2a x
/1=0 rx=0 r2=0 /x=0 /2=0
x mBr2-l)n
/j! /2! til *¦ 2
Дискретной части спектра соответствуют (в смысле преобразования Фурье)
члены при л=0, непрерывной части — члены при л>0.
Если детерминированная часть гауссовского процесса на входе системы от-
отсутствует, то в (9.35) исчезают все члены, за исключением тех, для которых
/1 = /2=0. Тогда из (9.35) находим корреляционную функцию стационарного
гауссовского случайного процесса, прошедшего через систему, нелинейная ха-
характеристика которой аппроксимируется степенным рядом (9.31):
п=0 г!=0 г2=0
Xa2(n+rj+r2) i iw ] Bгх — 1I1 Bга — 1)!! л!
\ п I \ п )
Так как суммированием по г\ и Гг разделяется, то получаем
оо Г оо
b (т) = 2j n\H (т) 2л ап+
Выпишем несколько первых членов суммы (9.36), пренебрегая членами при
[ +(
л=0 Lr=O \ П
(т)
+6а4а4J+6#3(т) (а3а3+1Оа5(т5J+24^4^) (а4а4J+120^5(т) (а5а5J. (9.37)
1 Формулу (9.33) следует использовать при п=0, а последующие коэффици-
коэффициенты сп при /г>1 находить последовательным дифференцированием dcn-i/ds=cr>.
236
В выражении (9.37) первый член характеризует мощность постоянной со-
составляющей, второй соответствует неискаженному воспроизведению входно-
входного спектра на выходе нелинейной системы, а последующие члены описывают
продукты нелинейных искажений этого спектра второго, третьего и более вы-
высоких порядков.
9.1.6. Квадратичный детектор. Используем общее соотношение
(9.37) для анализа энергетических характеристик случайного про-
процесса на выходе квадратичного детектора, когда на его вход дей-
действует гауссовский случайный процесс, представляющий сумму
детерминированного сигнала и гауссовского стационарного шума.
Полагая, что характеристика квадратичного детектора
x29 (9.38)
находим из (9.33) при а2=1 и ат = 0,
c0{t)=o2+s2{t), ci(t)=2os(t), c2 = 2o2 (9.39)
и cn(t) = 0 при л^З.
Обозначим
1 Т/2
\F, = 1im — J s2(/)d/, (9.40a)
1 7/2
5e(x) = lim — J s(tf)s(f+T)df, (9.406)
7"->оо i 7Y2
1 7-/2
5s2 (т) = lim — J s2 (/) s2 (/ + т) d/. (9.40b)
Величина Ws представляет среднюю мощность детерминиро-
детерминированной части процесса; Bs(x), Bs2(x) —соответственно временные
корреляционные функции процесса s(t) и его квадрата 52(^).
Применив введенные обозначения, можно выражение усред-
усредненной корреляционной функции случайного процесса, полученно-
полученного в результате квадратичного преобразования гауссовского про-
процесса, представить в виде [см. (9.35)]
5* (т) = а2 (о2 + 2WS) + Bs2 (т) + 4BS (т) R (т) + 2о4 R2 (т). (9.41)
Каждое слагаемое в (9.41) имеет ясную физическую трактов-
трактовку: первое соответствует мощности постоянной составляющей, вто-
второе— дискретной части спектра, а последние два — непрерывной
части спектра.
Постоянная составляющая создается как детерминированной,
так и случайной частью процесса на входе, причем доля посто-
постоянной составляющей от детерминированной части равна 2o2W89
доля от случайной части — а4.
Дискретный спектр после квадратичного преобразования вос-
воспроизводит спектр квадрата детерминированной составляющей
входного процесса. Непрерывный спектр после квадратичного пре-
преобразования содержит комбинационные гармоники от взаимных
237
биений компонент случайной части [член 2а4/?2 (т)] и компонент
детерминированной и случайной частей [член 4В^(тO?(т)].
При квадратичном детектировании стационарного центрирован-
центрированного гауссовского процесса с корреляционной функцией а2^(т) в
соответствии с (9.41) корреляционная функция процесса на выхо-
выходе детектора
Я(т)=а4[1+2Я2(т)], (9.42)
причем среднее и дисперсия процесса на выходе
а^ = о\ а2 = 2а4, . (9.42а)
а нормированная корреляционная функция R% (т) = /?2(т).
9.1.7. Двухполупериодное квадратичное детектирование суммы
амплитудно-модулированного сигнала и гауссовского шума. Пред-
Предположим, что детерминированная часть гауссовского процесса пред-
представляет собой амплитудно-модулированный сигнал
s(t)=u(t)cos(o0t9 (9.43)
причем наивысшая гармоника в спектре огибающей u(t) гораздо
меньше несущей частоты со0.
Предположим, что стационарное слагаемое гауссовского про-
процесса представляет шум, спектр которого сосредоточен в относи-
относительно узкой полосе около той же высокой частоты соо- Восполь-
Воспользуемся результатами п. 9.1.6 для решения задачи о квадратичном
детектировании амплитудно-модулированного сигнала в присутст-
присутствии аддитивного гауссовского шума. Очевидно, что для восстанов-
восстановления низкочастотной огибающей u(t) из радиосигнала детектор,
помимо нелинейного элемента, должен содержать фильтирующий
элемент, выделяющий низкочастотные и подавляющий высокоча-
высокочастотные компоненты.
Из (9.40а—в) с учетом узкополосности сигнала находим:
7—>оо 1 Т/2
(9.44)
где Ви@)—средняя мощность модулирующего сигнала;
1 1 т/2 1
Bs (т) = — cos со0 т lim — Г и (/) и (t + т) dt = — Ви (т) cos соот,
2 7*->оо Т j, 2 2
(9.45)
где Ви(%)—временная корреляционная функция модулирующего
сигнала;
Bs,(t) = — A+ — cos2co0t) lim— j u2{t)u2{t + T)dt =
(+ —cos2co0t^Bu2(t). (9.46)
238
Подставляя (9.44) —(9.46) в (9.41) и учитывая, что /?(т)
Y=#o(t)COSO)ot, получаем
В* (т) =о*+о2 Ви @) + -±- Ви> (т) + о2 Ви (т) #0 (т) + а4 Д2 (т) +
+ \±- Ви> (т) + а2 Ви (т) #0 (т) + о4 Щ (т) 1 cos 2coo т. (9.47)
д!ри отсутствии сигнала из (9.47) следует
В (т) = а4 [ 1 +R\ (т) +Я20 (т) cos 2со0т]. (9.48)
В отличие от линейного детектора [см. (9.26)], для которого
выходная корреляционная функция шумов выражается бесконеч-
бесконечным рядом по степеням RQ (т), корреляционная функция шумов на
выходе квадратичного детектора не содержит степени Ro{t) вы-
выше второй.
Использовав выражение (9.48) для корреляционной функции
и произведя преобразование Фурье, можно определить спектраль-
спектральную плотность мощности процесса на выходе квадратичного де-
детектора.
Среднее и дисперсия шумов на выходе квадратичного детек-
детектора определяются по формулам (9.42а).
9.2. АНАЛИЗ ЭНЕРГЕТИЧЕСКИХ ХАРАКТЕРИСТИК
МЕТОДОМ КОНТУРНЫХ ИНТЕГРАЛОВ
9.2.1. Общие соотношения. Предположим, что характеристика
нелинейной системы допускает представление контурным интегра-
интегралом (8.23). Воспользуемся формулой (8.25) для корреляционной
функции случайного процесса на выходе нелинейной системы при
условии, что на ее вход действует случайный процесс, представ-
представляющий аддитивную смесь детерминированного сигнала s(t) и
гауссовского центрированного стационарного процесса с диспер-
дисперсией а2 и нормированной корреляционной функцией R(t;).
Подставляя в (8.25) выражение двумерной характеристической
функции случайного процесса {см. E.10)], получаем
t) = -^] J г(i ttx)g(i Wa) exp
t) % u2 + и*) ] du, du2. (9.49)
В интеграле (9.49) только множитель exp[i (a1Ui-\-a2u2)] со-
содержит величины cti = s(t) и a2=s(t-\-x), зависящие от времени.
Поэтому при усреднении во времени корреляционной функции
б(т, t) усредняется только этот множитель. Обозначая
1 Т/2
Ss{uly u29 x) = lim — f expfifs^tti+s^ + T)^]}^, (9.50)
находим из (9.49) следующее выражение усредненной корреляци-
239
онной функции случайного процесса на выходе нелинейной си-
системы
^2)e8(u1, и2, т)х
х
[ - -у ( и] + 2R (т) и, и, + ц2) ] d«x du2. (9.51)
Рассмотрим более подробно частный случай, когда s{t) —
=acos{2nt/T). Из (9:50) находим
в8 (Ul, и2, т) = Jo [а ( и\ + и» + 2Й1 н2 cos ^- I/2 ]. (9.52)
На основе известной в теории функций Бесселя теоремы сло-
сложения, можно представить (9.52) в виде ряда
.(«i, «2, х)= 2 (- l)nen/n(a"i)^»(a«s)cos(^), (9.53)
где 8о= 1, 8п = 2 при ^
Если теперь подставить (9.53) в (9.51) и использовать, кроме
того, разложение сомножителя ехр[—а2^(т) Wi?/2] в ряд
оо 2/г .
k=0 kl
то в двойном интеграле (9.51) окажется возможным разделить
переменные интегрирования и представить усредненную по вре-
времени корреляционную функцию в виде
Я*(т)=5 2 en-^^^(T)cosB-^V (9.54)
где
^4^a^fya, (9.55)
В сумме (9.54) группа членов, для которых й = 0, соответству-
соответствует дискретной части спектра. Величина /i2no равна интенсивности
дискретной части этого спектра на частоте 2пп/Т. Остальные чле-
члены при 1гфО соответствуют непрерывной части спектра.
Если в (9.55) положить а=0, то найдем корреляционную функ-
функцию процесса на выходе нелинейной системы, когда на его вход
действует стационарный гауссовский процесс. В этом случае
hnk=0 при п^ 1 и
В(г)= 2 -^ hlkRk(T), (9.56)
где
1 Ъ I О ^ tip' \
1л — ______ (*or/i tj\ <( руп I \ Htj (Q ^7^
2я c \ 1 1
240
Заметим, что если в (9.57) заменить g{iu) его интегральным пре-
преобразованием (8.24), а также воспользоваться соотношением
А с к I • °2 и2
dxk
(9.57а)
то можно убедиться, что величина Gkhok в разложении (9.56) сов-
совпадает с коэффициентом сп разложения (9.7), полученным пря-
прямым методом.
Из (9.54) видно, что определение спектральной плотности мощ-
мощности суммы периодического сигнала и стационарного гауссов-
ского процесса после нелинейного преобразования сводится к вы-
вычислению преобразований Фурье от степеней нормированной кор-
корреляционной функции гауссовского процесса и интегралов (9.55),
которые зависят только от характеристики g{\u) нелинейной си-
системы.
9.2.2. Узкополосный гауссовский процесс. Предположим, что
спектр стационарной части гауссовского процесса сосредоточен в
узкой полосе около частоты соо=2яГ гармонического сигнала.
Тогда i?(T)=i?o(T)coso)oT и из (9.54) получаем
Я* (т) = 2 2 ^^- h2nk Rk0 (т) cos" о)о т cos n ю0 т. (9.58)
Заменяя степени косинусов суммой косинусов кратных дуг по фор-
формулам (9.Па,б) и совершая те же преобразования, что и в п. 9.1.2,
нетрудно преобразовать (9.58) к выражению, аналогичному (9.15):
м=0 . п=0
4 2 Se{5
4 2 Sn{2rifn()[(+r— l)»0T+cos(rt—2r+l)coox] +
2 n=0r=l
+ B2r, n (t) [cos (n + 2r) coo t + cos (n - 2r) ю0, т]}, (9.59)
где
Bn (x) = S -?- ^f ^. 2* ^o* (x). (9.60a)
Взг-i. n (x) = 2 -^^7 ^Ef2 Л». »-i ^o* (x), (9.606)
241
В», п (т) = Д -^ ^=^ hi, 2ft Rf (t). (9.60b)
Спектральная плотность мощности процесса на выходе нели-
нелинейной системы получается преобразованием Фурье от В*(т).
Дискретная часть этого спектра соответствует первой сумме в
(9.59), остальные члены этого выражения описывают непрерывную
часть.
9.2.3. Однопо'лупериодный детектор. Рассмотрим однополупе-
риодный детектор, характеристика которого имеет вид
(9.61)
IU, х <С Xq.
Соответствующая f(x) функция g(iu) равна а° . *vv^ ' ехр( — ixQu),
а контур с совпадает с действительной осью, огибая лишь начало
координат по полуокружности в нижней полуплоскости. В этом
случае коэффициенты (9.55) выражаются интегралами вида
Jv {аи) exp ( - i x0 и - ^ \d u9 (9.62)
которые можно вычислить, разлагая exp (—ixqu) и /п(ям) в сте-
степенные ряды по ми заменяя- v = u2tпосле чегозадача сводится к вы-
вычислению контурных интегралов
совпадающих с известным интегральным представлением гамма-
функции.
Если сигнал отсутствует (а=0), величины /in&=0 при \
а при /г=0 в соответствии с (9.62)
и при k^v-\-l [см. (9.57а)]
9.2.4. Идеальное ограничение стационарного гауссовского шума.
Рассмотрим корреляционную функцию и спектральную плотность
мощности процесса на выходе идеального ограничителя, характе-
характеристика которого является частным случаем (9.61) при v=0, т. е.
f(x)=\a°* Х>Х°' (9.64)
10, х<х0,
при условии, что ограничению подвергается стационарный цент-
центрированный гауссовский шум. Из (9.63) для v=0 находим при
А1
242
2a2
(9.65)
Постоянной составляющей соответствует член при k=0, рав-
равный [fcp. A3) в задаче (8.4)]
ftoo^=ad[l— F (xofa) ], (9.66)
где F(x) — интеграл Лапласа.
Подставляя (9.65) и (9.66) в (9.56), определяем корреляцион-
корреляционную функцию процесса на выходе идеального ограничителя:
О* J k=\ \ О k\
(9.67)
:(—l)nB/i—1)!!, Я2п_!@)=0,
При хо = О, учитывая #2я@)
получаем
4
Просуммировав ряд (9.68), находим
а2 Г 9 1
В(т) =—- 1 + — arcsin/?(x) .
4 я
(9-68)
(9.69)
Из (9.69) следует, что нормированная корреляционная функция
(т) процесса на выходе ограничителя
#?(T) = arcsin#(T), (9.69а)
9.2.5. Идеальное ограничение узкополосного гауссовского шума.
Пусть на вход идеального ограничителя действует узкополосный
стационарный гауссовский шум, спектр которого расположен в
узкой полосе вблизи частоты ©о. Тогда, используя (9.55) (при
а=0), (9.59) и (9.65), находим корреляционную функцию про-
процесса на выходе идеального ограничителя
2
г=1
2Jfe — iv
2 2ft-2(vj-^z
k=r
—
B^—1I 22^-2
2k
k-r
r,2k—l
cosBr—
cos2rco0TJ .
(9.70)
1 Заметим, что (9.69) получается непосредственным интегрированием (9.2)
лри а=0, если перейти к полярным координатам. Это один из редких примеров,
когда можно обойти представление в виде ряда корреляционной функции после
нелинейного преобразования.
243
Из (9.70) преобразованием Фурье можно определять спектр
предельно ограниченных шумов, который имеет характерный для
нелинейных преобразований вид (кроме постоянной составляю-
составляющей) , т. е. состоит из полосы в области нижних частот и полос,
расположенных около частоты а>о и гармоник этой частоты (см.
рис. 8.1).
Исследуем подробнее ситуацию, когда среднеквадратическое
значение шумов много больше высоты уровня ограничения aS>JCo.
Так как полином Hk(x0/o) при четном k содержит только четные,
а при нечетном — только нечетные степени Хо/о, то, пренебрегая
степенями xo/g выше первой, для рассматриваемого случая полу-
получаем
+
2л
+ 2
Bл—1)!!
2п— 1
п — г
1) , 1
J
COS ©0 Т +
г=2
«о*о
2яст
Bп - 1)! г
2п-2
(т)
cosBr-l)©0T| +
п2/г
[Bя— 1I1]«
2 •
.п=г
2п
п — г
Bп)\ 2
,2/2—1
ЯГ (г)
cos 2r o)ft
(9.71)
Из (9.71) следует, что при хо = О спектр ограниченных шумов
сосредоточен только в окрестности несущей частоты ©о и ее не-
нечетных гармоник (см. члены, заключенные в первую фигурную
скобку). При х0Ф0, но хо<^a появляются комбинационные спект-
спектральные составляющие в видеополосе и в полосах, расположенных
около четных гармоник, но энергия, соответствующая этим частям
спектра, много меньше, чем в полосах около нечетных гармоник<оо.
Спектр в окрестности несущей частоты соо определяется преоб-
преобразованием Фурье выражения
Bi (ti =
[Bп —
п— 1
(т)
cos соо т.
(9.72)
244
9.3. АНАЛИЗ ЭНЕРГЕТИЧЕСКИХ ХАРАКТЕРИСТИК
МЕТОДОМ ПРОИЗВОДНЫХ
9.3.1. Общие соотношения. Рассмотрим вновь нелинейное пре-
преобразование в системе с характеристикой y=f(x) суммы детер-
детерминированного процесса и стационарного центрированного гаус-
совского процесса с дисперсией а2 и нормированной корреляцион-
корреляционной функцией R{%). Для определения корреляционной функции
процесса на выходе системы используем метод производных (см.
п. 8.15). В этом случае имеет значение зависимость корреляцион-
корреляционной функции процесса на выходе системы от R=R(%), которую
обозначим B(R). Для рассматриваемой задачи из (8.29) находим
rfik—2 оо оо
f(w/W
+ (x2 - a2f]} dxx dx2i k = 1 > 2,..., (9.73)
где ai=s(ti), a2 = s(t2), R=R(x), %=t2—U.
Таким образом, вычисление корреляционной функции процес-
процесса, возникающего после нелинейного безынерционного преобра-
преобразования гауссовского случайного процесса, сводится к решению
обыкновенного дифференциального уравнения k-то порядка вида
~- =Ф(#), где O{R) представляют правую часть (9.73).
dRk
Для того чтобы проинтегрировать это уравнение, необходимо
задать k граничных условий. Такими условиями являются значе-
значения функции B(R) и ее производных по R до (k—1)-го порядка
при R = 0 (т. е. при г-^оо) или при R=l (т. е. при т->-0). Из (9.73)
непосредственно получим
dr В (R)
dRr
где
= о» mrl mr2, r = 0,1 ,.,.,&- 1, (9.74)
m
Ti
= ^r- If fr\x) exp [ - (*~2giJ] dx, i = 1; 2. (9.74a)
Если f(x)= 2 dkxk, то f(n>(^) =dn/z! и из (9.73) следует
dU B {R) = {dn /г!J о2п. (9.746)
dRn
В этом случае корреляционная функция процесса, возникающего
после нелинейного преобразования гауссовского процесса, пред-
представляет полином п-й степени от Я(т). Так, используя (9.746) >
245
нетрудно получить формулу (9.43) для двухполупериодного квад-
атического детектора (п=2, d2=l) при граничных условиях
B(R = al = o* и hmB(R) =/и1{Б4(*)} = За4.
Пусть функция f(x) составлена из кусков полиномов, образу-
образующих в местах стыка угловые точки. Тогда при достаточно боль-
большом k производная fw(x) будет равна сумме дельта-функций и
вычисление интеграла (9.73) становится элементарным, если вос-
воспользоваться фильтрующим свойством дельта-функции и ее про-
производных (см. Приложение II.
9.3.2. Взаимна» корреляционная функция. Формулу типа (9.73)
можно использовать также для вычисления взаимной корреляци-
корреляционной функции на выходах двух нелинейных систем, если на их
входах действуют гауссовские процессы. Для этого под знаком
интеграла нужно место f(k)(Xi)f^(x2) подставить fi{h){xi)f2(k){x2),
где f\(x) и f2 {х) — характеристики систем. В частном случае
ft(x)=x находим взаимную корреляционную функцию процессов
на входе и выходе нелинейной системы, когда на ее вход дейст-
действует стационарный гауссовский процесс l(t) >[см. (9.73), k=l]:
-оо-оо
где w2{xu x2, т) —двумерная плотность нормального распределе-
распределения. Интегрируя по переменной xi, получаем
(9.75)
Правая часть (9.75) не зависит от R%. Поэтому, учитывая, что
lim B^(Ri) = а^, находим Bii(Ri) =cRi + аъа^. Если а? = 0, то
^ °
[см. F) в задаче (8.2)]
, (9.76)
9.3.3. Идеальный ограничитель. Проиллюстрируем метод про-
производных несколькими примерами определения корреляционной
функции процесса на выходе нелинейной системы, когда на входе
действует стационарный гауссовский случайный процесс с нулевым
средним, дисперсией а2 и нормированной корреляционной функ-
функцией R (т).
1 Фильтрующее свойство дельта-функций можно столь же эффективно при-
применить и для вычисления коэффициентов разложения (9.5) прямым методом. В
самом деле, заменяя полиномы Эрмита производными от экспоненциальной функ-
функции [см. B.83)] и интегрируя по частям k раз, получаем
Здесь так же, как и в (9.73), вычисления значительно упрощаются, если
представляет сумму дельта-функций.
246
Для идеального ограничителя с характеристикой (9.64) при
хо = О f/(x)=a06{x) и по формуле (9.73) находим
*Ш = "о Т ]ь(хг)б(х%)х
dR 2nY\-R* -?>-?>
2
хехр/ 1 / х? - 2Rx, x2 + х*\ dxx dx2 = ?° .
Так как при #->0 (т. е. при т-^оо) ЦтВ(/?)= ——, то
R-+0 4
<977а»
При симметричном ограничителе с характеристикой f(x)=aoX
Xsgn* f (x) =2ао6(х), и так как постоянная составляющая про-
процесса на выходе симметричного ограничителя равна нулю, то кор-
корреляционная функция на выходе
В (т) = ^- arcsin R (т), (9.776)
я
что совпадает с (9.69).
9.3.4. Линейный детектор. Для линейного детектора с характе-
характеристикой (9.19) f"{x) =6{x) по формуле (9.73) находим
(978
dRz 2л Yl—R2
Общее решение уравнения (9.78)
В (R) = -?— {R arcsin R + КГ=^ _ 1) + Cl R + с2. (9.78а)
Из граничных условий определяем константы с2 и
WmB(R) = c2=al=\ ^_Тхехр f --^-
R-+0 с [ о/2я о L 2^2
я о
а2 . о2 / л 1 \ , о2 .о2
= с1 Н1 Н^ Н
— — 1
\2 " У
2 Х 2я \2 " У 2я г 4 '
откуда следует, что Ci = a2/4. Учитывая полученные значения кон-
констант с2 и Си находим из (9.78а)
B(x) = — \^R(t) + R (t) arcsin R (т) + V 1-Я2(тI, (9.79)
2я L 2 J
что совпадает с (9.24).
Легко доказать, что для двуполупериодного линейного детектора
с характеристикой f(x) = \x\ можно использовать формулу (9.79),
247
если увеличить в четыре раза множитель перед квадратной скоб-
скобкой (см. задачу 9.5).
9.3.5. Однополупериодный квадратичный детектор. Рассмотрим
далее однополупериодный квадратичный детектор, характеристи-
характеристика которого
'«"If
В этом случае f{3)(х) =2б(х) и при условии, что гауссовский
процесс на входе детектора стационарный с нулевым средним, по
формуле (9.73) получим
d*B(R) = 2_ а4 (9 80)
dR3 л ~]/\ — Я2
Начальные условия имеют вид
4 ' dR r=o
Интегрирование уравнения (9.80) выполняется в элементарных
функциях
+ —arcsin R (т) + — R2 (т) arcsin R (т) ]. (9.81)
4 2 J
9.3.6. Сглаженный ограничитель. Рассмотрим пример, который
указывает на возможность вычисления правой части уравнения
(9.73) без применения дельта-функций. Найдем корреляционную
функцию процесса на выходе сглаженного ограничителя с харак-
характеристикой, описываемой функцией
/~п~ Х/A О) I tJ2 ^
-f 1 ехр(--^-Ы«, (9.82)
о \ ^ /
когда на входе этого ограничителя действует центрированный ста-
стационарный гауссовский процесс с дисперсией а2 и нормированной
корреляционной функцией /?(т). В этом случае
2л F V 2/2 а2
Тогда из (9.73) находим
X 2
2а2 A-Я2)
В результате вычисления интеграла находим
_^Б 2
d/? ~ я У(/2+ 1J-^2 '
248
В силу симметрии f(x) имеем В (R) |д=о = О. Тогда
Б(т)=— arcsin^-. (9.83)
я 1 + I2
При /-^0 формула (9.83) переходит в выражение нормирован-
нормированной корреляционной функции процесса на выходе идеального сим-
симметричного ограничителя (см. (9.776) приао = 1).
9.4. РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ
ГАУССОВСКОГО ПРОЦЕССА
ПОСЛЕ ЕГО НЕЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ
9.4.1. Распределение квадрата гауссовского процесса. Исполь-
Используем общую формулу (8.34) для определения двумерной плотно-
плотности квадрата суммы детерминированного процесса s(t) и центри-
центрированного стационарного гауссовского случайного процесса с дис-
дисперсией а2 и нормированной корреляционной функцией /?(т). По-
Получим
xexp - --•--• ¦ ¦ —\x
I 2o2 A — R2) J
v / Prn Г R Уш* 1 rh Г fa ~ ^52) УШ +(S2 - fei)Уу* 1 l
X 1 eXP L o2 A — tf2) J L a2(l _^2) J -Г
h[(-—S2 J\l—%) —— J}'
==^(т), si=s(t), s2=s(t+%).
Раскрывая гиперболические косинусы суммы и разности и груп-
группируя члены с косинусами и синусами, находим искомое выраже-
выражение двумерной плотности вероятности квадрата гауссовского слу-
случайного процесса
X
х (ch Г R УУ' у* 1 ch Г Vyi (Sl ~ R$2) I ch Г Vy>(S2-RSj) 1 i
X { cn L о* A - Я*) J Ctl L aMl--R2) JCtll- 02 (I-/?») J +
h
stl
ot(i_ Л.
X sh [^/[Tff ]}, Ух>0, t/2>0. (9.84)
Если детерминированная часть отсутствует (si = s2 = 0), то из
(9.84) получаем двумерную плотность вероятности квадрата ста-
стационарного гауссовского процесса
249
Одномерную плотность вероятности нетрудно определить из
(9.84), если устремить г->оо (R-+-0); тогда [ср. C.12)]
, у>0. (9.86)
При s = 0 из (9.86) получаем плотность вероятности квадрата
случайной величины, распределенной по нормальному закону с
нулевым средним [ср. C.12а) ]
Если s»a, в (9.86) гиперболичеокий косинус можно заменить его
асимптотическим приближением
Тогда формулу (9.86) можно переписать иначе:
9.4.2. Линейный детектор. Используем общую формулу (8.36)
для определения двумерной плотности вероятности процесса на
выходе линейного детектора, когда на его вход действует центри-
центрированный стационарный гауссовский процесс с дисперсией а2 и
нормированной корреляционной функцией /?(т). Получим
(у19 у2, т) = } ехр ( ! (уг + х0J -
x + Хо) (у2 + х0) + (у2 + Х0J]
+ t/2) )F Г
—^2)J L
(9.87)
где F(x) —функция Лапласа и К (ft, ft) —табулированный интег-
интеграл от двумерной нормальной плотности [см. B.736)].
В соответствии с (8.36а) одномерная плотность вероятности
процесса на выходе линейного детектора
W1(y) = -т=— ехрГ — ^ ~~ х°' 1 + 8(y)F(x0/o), y>0. (9.88)
250
9.5. КВАНТОВАНИЕ ГАУССОВСКОГО ПРОЦЕССА
9.5.1. Корреляционная фукнция шумов квантования. Исполь-
Используем общую формулу (8.42) для определения корреляционной
функции шумов квантования, если квантуемый сигнал ?(/) пред-
представляет центрированный стационарный гауссовский процесс с дис-
Лерсией а2 и нормированной корреляционной функцией Ri(%).
Получим
4я2 п=_оо k==_oo
Обозначив C=(б/аJ, запишем корреляционную функцию шу-
шумов квантования гауссовского случайного процесса в виде
|(9.89)
Предположим, что разность б между дискретными уровнями
много меньше среднеквадратического значения а сигнала. Это
предположение практически всегда осуществляется. Тогда C<С1.
Учитывая это неравенство, можно в (9.89) пренебречь двойны-
двойными суммами по сравнению с первой суммой и, заменив гипербо-
гиперболический синус его асимптотическим разложением (s\\ x~exj2y
х^>1), получить следующее приближенное выражение для кор-
корреляционной функции шумов квантования, достаточное для боль-
большинства практически интересных задач:
Вг(т) ж—— У. —ехр . (9.90)
Полная мощность шумов квантования (дисперсия ошибки
квантования)
ЗД-^Е—-^—==—• (9.91)
Нетрудно заметить, что в рассматриваемом случае дисперсия
ошибки совпадает с дисперсией случайной величины, распреде-
распределенной равномерно на интервале от нуля до б. Это объясняется
тем, что при малой разности между дискретными уровнями по-
погрешность квантования достаточно точно аппроксимируется от-
отрезками прямых линий за исключением тех случаев, когда сиг-
сигнал между дискретными уровнями проходит через экстремум.
9.5.2. Спектральная плотность мощности шумов квантования.
Предположим, что спектр исходного гауссовского процесса l(t)
равномерный в полосе 2Д. Так как при этом Rt (т) =sln T , из
тД
251
(9.90), используя теорему Хинчина — Винера, находим,
_sinrA\-jcoscoTrfT {992
' тД /J
тл j. sin TA
Разлагая функцию в ряд и ограничиваясь первыми дву-
двумя членами (что допустимо, так как подынтегральная функция в
(9.92) быстро убывает при возрастании тА), получаем
2я2п2т2Д2 \ .
cos сот ах.
Интегралы такого же типа, что под знаком суммы, уже встре-
встречались [см. G.72)]. Подставляя их в (9.92), находим спектраль-
спектральную плотность мощности шумов квантования
5, (со) = -**- УЖ | ± ехр ( ^- V (9.93,
5 V } я2 Д У 2л ^ Лз F V 8п2 я2 Д2 у1 V ;
Интервал корреляции шумов квантования можно найти из со-
соотношения [ср. D.88)]
_ Se@) з / зр у/2 °° ±_
Т°~4^@) "я2д1 2п) Дя» '
оо
и так как 2 1/л3«1,202, то
To^-fJf, (9.94)
т. е. интервал корреляции шумов квантования приблизительно в
12/}/р раз меньше, чем у квантуемого процесса.
При C<С'1 «корреляция между ошибками квантования в после-
последовательных отборах значений сигнала практически отсутствует.
Соответственно спектр шумов квантования при уменьшении раз-
разности между дискретными уровнями становится равномерным в
более широком диапазоне частот с одновременным уменьшением
максимума спектральной плотности.
9.5.3. Взаимная корреляционная функция шумов квантования
и квантуемого процесса. Если квантуемый процесс — центриро-
центрированный стационарный гауссовский процесс с дисперсией а2 и нор-
нормированной корреляционной функцией Ri{x), то
ди *\ ' б ' /«-о
и из (8.45) находим
(9.95)
252
т. е. взаимная корреляционная функция пропорциональна корре-
корреляционной функции квантуемого процесса [ср. (9.76)]. Заметим,
что при |3<С1, как это следует из (9.95), абсолютное значение вза-
взаимной корреляционной функции Вц (т) порядка 10~8 значений
корреляционной функции квантуемого процесса.
9.6. ЗАДАЧИ
9.1. Используя результаты п. 9.1.7, вычислить усредненную корреляцион-
корреляционную функцию и спектр случайного процесса на выходе двухполупериодного
квадратичного детектора, если на входе его действует сумма амплитудно-мо-
дулированного сигнала
s(t) —u0(l+mcos Q/)cos co0^ A)
и узкополосного гауссовского шума, спектр которого равномерный в полосе
«по—А/2, соо+А/2, причем A>2Q.
Показать, что в рассматриваемом случае усредненная корреляционная функ-
функция процесса на выходе детектора
1 Г / т2 \ I2 utm2
т2 \ I2
—JJ
+~rA+ir)cos2ci)()T+
-I- cos йт cos 2ш0т 4- cos 2 Qt cos 2coo t -f
4 64
+ и*о» Д, (т) (l +-y-cos Qt j + a* R20 (т) +
sin (тД/2)
B)
Дискретная часть спектра
~^Sa (со) = -j [2a^+ u\(\ +^")]б (со)+
ul m2 ui m4
-^~ 6((o-fi) + -^— 6(to-2Q)
( 1 + —— ) б (со — 2соо) +
uim*
¦ —— [б (со - 2соо - Q) + б (со ~ 2соо + Q)] +
253
Непрерывная низкочастотная часть спектра
SHH (со) = Si (со) +52 (со) +S3 (со),
где
Sx (со) =
I 0, со>А/2
52 (со) = (mV4) [5g (со + Q) + Sg (со - Q)],
10
D)
E)
F)
G)
, со>Д.
Доказать, что непрерывная высокочастотная часть SHB(co) спектра получа-
получается переносом SHh(co) в высокочастотную область на 2со0 и умножением на 1/2.
Показать, что в полосе видеочастот отношение /гВых мощности сигнала к
мощности шумов на выходе квадратичного детектора при
где /1вх = ио2/Bст2)—отношение сигнал-шум на выходе детектора.
9.2. Используя результаты п. 9.2.1, показать, что усредненная корреляци-
корреляционная функция процесса на выходе нелинейной системы, когда на вход ее дей-
действует сумма сигнала
= alCos {2nt/Ti) +a2cos {2nt/T2)
(8)
и гауссовокого стационарного шума с корреляционной функцией o2R(t) равна
где
hmnk = — Jff 0 «) иЛ ^m («1 и)/и (а2 «) е»Р ( — —r—)du,
zn с \ z /
(9)
A0)
g(iu) — преобразование Фурье характеристики f(x) системы.
9.3. Пусть на вход балансного модулятора (рис. 9.3) поступают два гаус-
совских стационарных и стационарно связанных случайных процесса с нуле-
нулевыми средними, дисперсиями а2, нормированными корреляционными и взаим-
взаимной корреляционной функциями jR(t) и /?1г(т). Показать, что корреляционная
функция процесса на выходе
24ft
[ЛМ
,2k
(Н)
Рис. 9.3. Функциональная
схема балансного моду-
модулятора
9.4. Двумерное распределение логарифмически нормального стационарного
случайного процесса ?(/)>0 имеет вид
1
-X
Хехр
( —
2лх1х2
— /?2(т)а2
- 2R (т) (In хг - a) (In х2 - а) + (In х2 - аJ) \.
A2)
Логарифм этого процесса In g(/) гауссовский со средним а, дисперсией
#2 и нормированной корреляционной функцией /?(т). Доказать, что корреля-
корреляционная функция l(t)
^(т)=ехр{2а+а2[1+#(т)]}. A3)
Получить из A3) выражения для среднего и дисперсии процесса (см. за-
задачу 3.12)
}(+2/2) A4a)
2-1). A46)
9.5. Показать, что корреляционная функция процесса на выходе двухполу-
периодного линейного детектора (рис. 9.4), когда на его входе действует ста-
стационарный гауссовокий шум с нулевым средним, дисперсией а2 и нормирован-
нормированной корреляционной функций R(x), имеет вид [ср. (9.24) и подстрочное при-
примечание там же]
2а*
В(т) = [R (т) arcsin R (т) + У1 - R* (т)].
A5)
9.6. На вход идеального ограничителя с характеристикой (9.64) при хо = О
действует сумма гармонического сигнала s(t) =asin co0/ и гауссовского стаци-
стационарного шума. Доказать, что в этом случае коэффициенты hnh в общей фор-
формуле (9.58) корреляционной функции процесса на выходе нелинейной системы
равны [см. (9.62)]
*п с \ I I
'Т/2 '•*¦
2п\
TF X
A6)
где iFi(^, ^, z) — гипергеометрическая функция.
9.7. Доказать, что корреляционная функция про-
процесса на выходе ограничителя с линейным участ-
участком, характеристика которого
С —а, х< — а0,
/(*)={ х, IxKocq,
V а0, л; > а0,
Рис. 9.4. Характеристика
цвухполупериодного ли-
линейного детектора
255
когда на его вход действует стационарный центрированный гауссовокий про-
процесс, имеет вид
2G2 " " ^ ~ " ' A7)
где а2, jR(t) —дисперсия и нормированная корреляционная функция гауссов-
ского процесса.
Глава 10
ОГИБАЮЩАЯ И ФАЗА УЗКОПОЛОСНОГО
СЛУЧАЙНОГО ПРОЦЕССА
10.1. ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ
ОГИБАЮЩЕЙ И ФАЗЫ
10.1.1. Определение огибающей и фазы. При некоторых
весьма общих предположения^1 можно по заданному случаймому
стационарному процессу ?(/) с помощью преобразования Гильбер-
Гильберта образовать новый, сопряженный ?(/), стационарный случайный
процесс (см. Приложение II)
т|(/) = —lim r-iilLdT. A0.1)
Я 7->оо _дт t — T
Сходимость интеграла A0.1) понимается в среднеквадратическом
смысле. Тогда случайный процесс §(/) и ему сопряженный можно
представить в виде [см. E) и F) в Приложении II]2:
l(t)=E(t)cosO(t), A0.2)
4(t)=E(t)sin ФУ), A0.3)
откуда следует
2, (Ю.4)
A0.5)
Определенные таким образом случайные процессы E(t) и
называются соответственно огибающей и фазой случайного
процесса {
1 Достаточным условием существования процесса, сопряженного процессу
?(/), является равенство нулю постоянной составляющей. Для эргодических про-
процессов достаточно предположить, что Wi{?(/)}=0.
2 Если среднее отлично от нуля, то понятия огибающей и фазы относятся
к отклонению ?(/) от среднего.
256
Заметим, что из A0.4)следует E(t)^\j(t)\, т. е. случайная
функция 1A) нигде не пересекает случайную функцию E(t).
Кроме того, ЕЕ' = \&' + цт\\ и поэтому в точках, где %(t)=E(t),
т. е. п (^) =0, имеет "место равенство ?'@=?'@- Таким образом,
случайная функция l(t) не пересекает E(t), а в точках соприкос-
соприкосновения имеет общие касательные. Указанные свойства объясня-
объясняют смысл принятого для случайной функции E(t) названия оги-
огибающей l(t).
При представлении случайного процесса ^(t) в виде A0.2) он
может рассматриваться как гармоническое колебание, модули-
модулированное по амплитуде и фазе случайными функциями E(t) и
Ф@-
Используя свойство преобразования Гильберта, выраженное
формулой C) Приложения II, находим, что спектральная плот-
плотность мощности, а следовательно, и корреляционная функция слу-
случайного процесса r\(t), сопряженного с ?(/), совпадает со спект-
спектральной плотностью мощности Sg(co) [корреляционной функцией
Въ(%)] случайного процесса l(t). Взаимная корреляционная
функция двух сопряженных процессов
Допуская возможность изменения порядка интегрирования и ус-
усреднения, получаем
iJ^d A0.6)
т — о
Таким образом, взаимная корреляционная функция В^ (т) и кор-
корреляционная функция Въ(х) являются парой преобразований
Гильберта. Снова используя C) Приложения II, находим, что
взаимная спектральная плотность двух сопряженных процессов
(со)= — i Si (со) sgn со. A0.7)
Из A0.6) и A0.7) находим связь между взаимной корреляцион-
корреляционной функцией и спектральной плотностью мощности процесса
т) = - ВЛ? (т) - — ?Sg (со) sin сот d со. A0.8)
2я 0
Из A0.8) следует, что взаимная корреляционная функция сопря-
сопряженных случайных процессов нечетна, а при т = 0, т. е. в совпа-
совпадающие моменты времени, эти случайные процессы некоррелиро-
ваны. Если l(t)—стационарный гауссовский случайный процесс,
то и r\(t) —стационарный гауссовский случайный процесс и сов-
совместное распределение g(f) и r\(t) нормальное, причем в совпа-
совпадающие моменты времени эти процессы независимы.
10.1.2. Представление узкополосного процесса. Возможность
представления случайного процесса в виде A0.2) не налагает ка-
9-87 . 257
ких-либо существенных ограничений на спектр процесса. Однако
практически особый интерес и наглядность рассматриваемое
представление приобретает для узкополосных процессов.
Пусть соо — некоторая частота в полосе, где в основном со-
сосредоточен узкополосный спектр случайного процесса l(t). По-
Положим1
A0.9)
Подставляя A0.9) в A0.2), получаем следующее представле-
представление узкополосного случайного процесса:
A0.10)
Вводя квадратурные составляющие
A(t)=E(t)cosy(t), C(t)=E(t)sin<p(t)t A0.11)
находим
t(t)=A(t)cos®0t + C(t)sm<oot. A0.12)
Аналогично для сопряженного процесса из A0.3) получаем
t\(t)=A(t)smfj)ot— C(t)cosa>0t. A0.13)
Из A0.10) следует
A0.14)
A0.15)
Здесь огибающая E(t) и фаза cp(tf) уэкополосного случайного
процесса определены как нелинейные безынерционные преобра-
преобразования квадратурных составляющих A(t)9 C(t) в отличие от
соотношений A0.4), A0.5), которые определяют огибающую и
фазу как нелинейные инерционщые преобразования исходного
процесса ?@> так как сопряженный процесс r\(t) представляет
реакцию линейного (физически нереализуемого) фильтра на
входной процесс l(t).
Иногда удобно бывает записать выражение A0.10) как дей-
действительную часть некоторой комплексной величины
где
A0Л7>
— комплексная огибающая узкополосного случайного процесса
6@.
1 Иногда под фазой узкополосного процесса подразумевают величину Ф(/) =
«ооо?—ф@- Во избежание ошибок следует иметь в виду, что здесь фаза — толь-
только случайная функция q>(/). Так как на практике измеряется не абсолютное зна-
значение Ф(/), а разность, то представляет интерес изучение статистических харак-
характеристик величины ф(/).
258
Из A0.12) и A0.13) следует
A(t)=l{t)cos<Qot+i\(t)sm<o0t, A0.18)
A0.19)
В принципе приведенные здесь соотношения верны не только для
узкополосных процессов, так как при их выводе предположение
об узкополосности не использовалось. Однако, как будет пока-
показано далее, полезность этих соотношений обнаруживается для
узкополосных процессов.
10.1.3. Корреляционные функции квадратурных составляю-
составляющих. Обозначим через ВА(%), /?с(т), Sac(t), Вса(т) корреляци-
корреляционные и взаимные корреляционные функции квадратурных со-
составляющих A(t) и C(t). Тогда из A0.18) и A0.19) находим
A0.20)
=— Вел (%)=ml{Ut)l(t+x)}sm со0т—ml{l(t)r\(t +
—5^(t)coso)oT. A0.21)
Из A0.20) и A0.21) следует
В г (т) = В а (т) cos соот+Вас (т) sin со0т. A0.22)
Выражая корреляционную и взаимную корреляционную функ-
функции Bg(t) и В п(т) через спектр Si (со) процесса %(t)9 получаем
из A0.20)
В а (т) = Вс (т) = — ] 58 (со) cos (со - соо) т d со. A0.23)
Для узкополосного процесса l(t) из A0.23) с пренебрежимо
малой погрешностью следует приближенное равенство
ВА (т) = Вс(т) « — JS* (со)coscotdco, A0.24)
—оо
где S*?(со) —спектр процесса g(f), сдвинутый в область нижних
частот (см. п. 4.4.1).
Из A0.23) следует, что дисперсии1 случайных процессов A(t)
и C(t) равны между собой и равны дисперсии процесса l(t):
BA@)=Bc@)=Bi@), A0.25)
откуда следует также [см. A0.14)]
m{{E2(t)}=2Bi@). A0.26)
Анализ формулы A0.24) показывает, что для узкополосного
процесса l(t) корреляционные функции квадратурных составля-
составляющих A(t) и C(t) медленно меняются по сравнению с coscoo*.
Учитывая связь огибающей E(t) и фазы ср(?) с квадратурными
составляющими A(t) и C{t), заключаем, что корреляционные
1 Так как средние процесса ?(/) и сопряженного r\(t) равны нулю, то, как
видно из A0.18) и A0.19), средние процессов A(t) и C(t) также равны нулю.
9* 259
функции огибающей E(t) и фазы ф(?) также медленно меняются
по сравнению с cos coot, а их спектры сосредоточены в низкочас-
низкочастотной области. Таким образом, узкополосный случайный про-
процесс носит характер высокочастотного колебания с несущей час-
частотой соо и медленно меняющимися огибающей и фазой [см.
A0.12) и A0.22)].
Для взаимных корреляционных функций процессов A(t) и
C(t) имеем из A0.21)
5лс(т) = ~ ВСА (т) = -i- fSg(со) sin (со -соо) tdco. A0.27а)
о
f
о
Для узкополосного процесса из A0.27а) с пренебрежимо малой
погрешностью следует [см. A0.24)]
Вас М = - ВСА (т) = — ?S* (со) sin сот d со. A0.276)
Из A0.276) следует, что при т = 0, т. е. в совпадающие момен-
моменты времени, случайные процессы A(t) и C(t) всегда некоррели-
рованы. Если %(t)—стационарный гауссовский случайный про-
процесс, то квадратурные составляющие A(t) и C(t) также являют-
являются стационарными гауссовскими случайными процессами, неза-
независимыми в совпадающие моменты времени.
Заметим, что из A0.24) и A0.276) следует, что
ВА (Т) + ВАС (Т) = f-^- I Sl И COS COT d Col' +
Корреляционные функции производных A'(t) и C'(t)
BA,(<x) = Bcb)= -В\(т)= -B-(t)-
- — J(co - cooJ 5g (со) cos (со ~ со0) т d со, A0.29)
а дисперсия этих производных
_Я^@)= -5^@) = —J@-cooJ5|(co)dco. A0.30)
Нетрудно также получить выражение для взаимных корреля-
корреляционных функций A{t) и C'(t),A'(t) и С@
Вас>@)=>-Ва>с@) =
= тх {A (t) С (t)} =-mi(A' (t) С (t)} = B'AC @) =
где ювр = 1 & S\ (со) d© / Js6 (oa) d©. A0.31a)
260
Если спектр S^(co) симметричный и со0 совпадает с централь-
центральной частотой спектра, то из A0.24) и A0.27) находим (см.
и 4.4.1):
ВА (т) = Вс (т) = — j S* (со) cos сот 4® = а0 (т), A0.32)
JX 0
) = 0. A0.33)
Из A0.22) и A0.32) следует, что корреляционная функция уз-
узкополосного случайного процесса ?(/) с симметричным относи-
относительно центральной частоты спектром В|(т) =a0(t)cos соот, что
совпадает с D.103). При этом, однако, выясняется физический
смысл функции ао(т) в D.103), которая является корреляционной
функцией для каждого из медленно меняющихся процессов A (t)
и C(t), связанных с узкополосным процессом l(t) соотношения-
соотношениями A0.18) и A0.19).
10.1.4. Огибающая и фаза суммы узкополосных случайного и
детерминированного процессов, В соответствии с A0.12) стацио-
стационарный узкополосный случайный процесс можно представить в
виде
где A(t) и C(t)—стационарные и стационарно связанные слу-
случайные процессы, корреляционные функции которых медленно
меняются за один период 2я/соо.
Пусть детерминированный процесс s(t) представляет высоко-
высокочастотное колебание частоты соо, модулированное по амплитуде и
по фазе, т. е.
5(/)=r/(Ocoscoo^ + ^(^)sin(oo^ = a(/)cos[co0^—Ф*@], A0.34)
где a(t) = [u2(t)+v2(t)]W и Q8(t) =arctg[u(t)/u(t)] — огибающая
и фаза узкополосного детерминированного процесса. Сумму слу-
случайного |(/) и детерминированного s(t) процессов
l{t) = [A(t)+u(t)]cos<uot+[C(t)+v(t)]sinG>ot A0.35)
можно представить в виде
t(t)=E(t)cos[®ot—<p{t)], A0.36)
где E(t) и ф(^)—огибающая и фаза случайного процесса t,(t),
определяемые по формулам
i\ A0.37)
. A0.38)
A(t)+u(t) '
10.1.5. Распределение вероятности огибающей и фазы. Для
определения многомерной плотности вероятности огибающей
E(t) и фазы ф(/) узкополосного процесса A0.35), воспользуемся
общим методом, указанным в п. 3.2.2.
Пусть t02n(*h... ,хп, У и - ,Уп, tu ..., tn) — совместная плот-
плотность вероятности значений A(t) и C(t) в п моментах времени.
261
Для того чтобы найти многомерные плотности вероятности оги-
огибающей и фазы, перейдем в соответствии с A0.37) и A0.38) в
указанном совместном распределении к полярным координатам
—Vh, k=l,n, A0.39)
где uh = u(tk), vh = v(th).
После такой замены вместо совместной плотности, зависящей
от переменных Л'ь... ,лгп, Уи — ,Уп, получаем 2я-мерную совмест-
совместную плотность вероятности огибающей и фазы, зависящую от пе-
переменных ги ..., rn, <h,..., ®п'.
..., г и cos $п—ип> rx sin til—vu .„, rn sin ftn—Vn, tif ..., tn),
A0.40)
где
y #1»...» Уп)
J =
— якобиан преобразования A0.39).
Подставим A0.39) в A0.41), проведем дифференцирование и
вычислим детерминант
, f = T7n. A0.42)
T
о
Многомерная плотность вероятности огибающей получается
л-кратным интегрированием A0.40) по переменным ®и...91&п'-
Wn(rl9...9 rnt /lt...f tn) =
T Jfw2n(rl9^rn9 *,,,., *ni tl9Sn9 tn)d^.d^n rt>0. A0.43)
о
Интегрируя A0.40) по переменным гь... ,rn, находим много-
многомерную плотность вероятности фазы
Уп (*!,»., О». *i~, <»)-
JJl Гп,
о о
Xdrv,,drn, |Oj|<n, t = l, n. A0.44)
В некоторых задачах нелинейного преобразования огибающей
решение может быть получено иногда быстрее при помощи ха-
характеристической функции. Характеристическая функция про-
процесса f[E(t)]
в»(»i,.-«, vn, tu.-.., /n) =
5„. Jexp[i 2fj(K^
—те —со L *=1
*"> xnr J/i>--» Уп> 'i» — » tn)dx1^dxndyx.-ndyn. A0.45)
262
Заметим, что из-за сложности нелинейной функциональной
зависимости огибающей E(t) и фазы ф(?) от §(/) невозможно ис-
использовать результаты § 8.1 для определения корреляционных
функций и спектральной плотности мощности огибающей и фа-
фазы. Поэтому для определения энергетических характеристик оги-
огибающей и фазы следует предварительно по формулам A0.43) и
A0.44) найти их двумерные плотности вероятности, а затем вы-
вычислить корреляционные функции и по теореме Хинчина — Вине-
Винера спектральные плотности мощности.
10.1.6.Совместные плотности вероятности огибающей и фазы
узкополосного гауссовского процесса. Покажем, как использует-
используется общий подход, указанный в п. 10.1.5, к нахождению совмест-
совместных плотностей вероятности огибающей и фазы на примере гаус-
гауссовского случайного процесса, состоящего из детерминированной
и стационарной частей [см. A0.35)]. Как было показано в
п. 10.1.3, квадратурные составляющие A(t) и C(t) гауссовского
стационарного процесса также гауссовские процессы, независи-
независимые в совпадающие моменты времени, причем их дисперсии сов-
совпадают с дисперсией а2 исходного процесса. Поэтому совместное
распределение A(t) и C(t) в момент времени t равно произведе-
произведению одномерных плотностей вероятности этих случайных функ-
функций
w2(x, */)=—— ехрГ- х2+У*\ A0.46)
Заменяя в соответствии с A0.39) при п=\
х=гсо$>$—и, y = rsmft—v, A0.47)
получаем совместную плотность вероятности огибающей E(t) и
фазы ф(/) в момент времени t:
W2(r, fl, t)= 1
X exp[ l— {(r cos ft - uf + (r sin ft - vf}]. A0.48)
Интегрируя A0.48) no ft, находим одномерную плотность ве-
вероятности огибающей, а интегрируя по г, — одномерную плот-
плотность вероятности фазы. Для определения двумерных распреде-
распределений необходимо предварительно определить совместную плот-
плотность вероятности случайных функций A(t) и C(t) в два момента
времени t и ?+т, которая представляет четырехмерную плотность
нормального распределения с нулевыми средними и дисперсией
а2. Соответствующая этому распределению нормированная корре-
корреляционная матрица (см. п. 5.2.1) имеет вид
0
263
где Дс(^) и Я6(%)—соответственно нормированная корреляцион-
корреляционная функция квадратурных составляющих A(t) и C(t) и их нор-
нормированная взаимная корреляционная функция. Связь величин
^с(т) и Rs(x) со спектральной плотностью мощности исходного
гауссовского процесса описывается формулами [см. A0.23) и
A0.27)]
= J Si (со) cos (со — ©0) т d со / J Si (со) dco, A0.50)
j Si (©) sin (© .. ©0) т d со / Jss (со) do. A0.51)
о
Обозначая
R2o(t)=iR2c(x)+R2s(t), A0.52)
находим из A0.49) детерминант и алгебраические дополнения
матрицы К:
D=[1-#20(t)]2, Du=D22 = D2S = D44=1-R%(t),
ZI2 = D21=ZK4=/L3 = 0, D13=ZKi=—^с(т) [1—Л2о(тK,
Используя E.8), можно определить четырехмерную совмест-
совместную плотность вероятности квадратурных составляющих A(t) и
C(t) в моменты времени / и /
«К*. ,„ „. Л. ,)
- 27?с (хг% + уг у2) - 2R8 (х, у2 - х2 Уг)] J. A0.53)
Заменяя в соответствии с A0.39) при п — 2
2—f2. A0.54)
где U\ = u(t)y U2=u(t+x)t Vi = v(t), v2 = v(t+x)f получаем сов-
совместную плотность вероятности огибающей E(t) и фазы ф(^) в
два момента времени t и t+x рассматриваемого узкополосного
гауссовского процесса
264
Wt(rlt К rv %, t, т) = - г*г* x
Bяо«)« (l-R20)
X exp/ ~' [(rx cos dx - Ul)a + (r, sin ^ - Vl
\ 2*(iRl)
+ (r2 cos #2 - M2)a + (r2 sin fl2 _ v2J -
- 2Re [(r1 cos ¦&! - u,) (r2 cos #2 - и2) +
+ (rx sin ^x - Vl) (r2 sin 02 — u2) -
- 2i?e [(^ cos ^ - ux) (r2 sin fl2 - v2) -
- (r2 cos % - ua) (rx sin 0x -1»!)
или после элементарных преобразований [см. A0.34) и A0.52)]
WA(rl9 *lf r2, *2, /, т) = ^ -X
^^""^)] I
Хехр{"" 2а»(/-/г2) [r? + 1"-2^^^cos^^^""^)] Iх
X exp { ~——- [а\ + а\ ~- 2/?0
i 2а2A-/?2)
- 2гг аг cos (dx - dSl) - 2r2 a2 cos (ft2 ^~ dsj
+ 2R0 rx a2 cos (#! + dS2 + #0) + 2#0 r2 ax c
rx>0, r2>0, |^!<я, |^2|<я, A0.55)
где ai=
Заметим, что выражение A0.55) записано в форме произве-
произведения двух экспонент, причем параметры детерминированной час-
части процесса содержатся только во второй экспоненте, которая
обращается в единицу, если s(^)=0, т. е. если гауссовский про-
процесс — стационарный.
Из A0.55) двукратным интегрированием по Oi, O2 находим
двумерную плотность вероятности огибающей, а двукратным ин-
интегрированием по ги г2 — двумерную плотность фазы.
10.2. ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ
ОГИБАЮЩЕЙ ГАУССОВСКОГО ПРОЦЕССА
10.2.1. Одномерная плотность вероятности и моменты. Срав-
Сравнивая A0.48) с C.49), приходим к выводу, что задача нахожде-
нахождения плотности вероятности огибающей узкополосного гауссовско-
го случайного процесса [см. A0.36)] полностью совпадает с ре-
решенной в п. 3.2.3 задачей нахождения плотности вероятности
265
длины вектора, компоненты которого независимы и распределе-
распределены нормально с параметрами u(t), о2 и v(t), о2, где о2 — дис-
дисперсия стационарной составляющей процесса A0.36). Используя
C.50), определим одномерную плотность вероятности огиба-
огибающей
Wx(r, /) = —
Таким образом, распределение вероятностей огибающей узко-
узкополосного гауссовскрго процесса в общем случае совпадает с
обобщенным законом распределения Рэлея. Функция A0.56) при
различных фиксированных значениях а/о изображена на рис. 3.6.
По мере увеличения отношения а/о закон распределения огиба-
огибающей приближается к нормальному [см. C.52)]. Соответствую-
Соответствующая A0.56) функция распределения в элементарных функциях
не выражается, но может быть представлена в виде ряда
х 2 НгГ 1.ИН '>0- (Ю.56а)
п=\ L a(t) J La2 J
Когда детерминированное слагаемое отсутствует (а = 0),
A0.56) соответствует обычному рэлеевскому закону распределе-
распределения (на рис. 3.6 кривая 1), т. е.
-йг} г>0> (la57)
г>0. A0.57а)
В соответствии с C.54) моменты огибающей
mk = ml{Eb(t)}=Bo*)WT(l+k/2)lFl[-k/21 I, -a2(t)/Bo2)],
A0.58)
где \F\ (xy у, г) —гипергеометрическая функция.
Если детерминированное слагаемое отсутствует, то
mh=BG2)U2r(l+k/2). A0.59)
Явные выражения первых трех моментов даются формулами
C.54а—в).
Заметим [см. A0.56)], что распределение огибающей суммы
детерминированного и узкополосного гауссовского стационарно-
стационарного случайного процессов не зависит от фазы *&8. Отсюда следу-
следует, что это распределение относится также и к огибающей сум-
суммы указанного случайного процесса и квазидетерминированного,
отличающегося от рассмотренного случайной фазой ф0. Действи-
Действительно,
—Л
266
так как условная плотность вероятности НМг|фо), как это сле-
следует из A0.56), равна Wx(r).
10.2.2. Двумерная плотность вероятности огибающей стацио-
стационарного гауссовского процесса. Переходя к определению дву-
двумерной функции распределения огибающей узкополосного гаус-
гауссовского случайного процесса, ограничимся подробными вычис-
вычислениями для случая, когда детерминированное слагаемое отсут-
отсутствует, т. е. когда гауссовский процесс стационарный. Тогда из
A0.55) при ai=a2 = '6is1 = '&S2=0 находим
Wt(rlt rt, x)- iu exp
B^1A^) F
f
oo
Интеграл по
Г Я0ггг2 cos и 1 Г R r r
—7 5Г da = 2я L —;° 1 2
не зависит от Оь Интегрирование по fh дает постоянную, равную
2я.
Таким образом, получаем двумерную плотность вероятности
огибающей стационарного узкополосного гауссовского случайно-
случайного процесса
, г2, т) = ^ ехр —' ' * х
Г!>0, г2>0. A0.60)
Если т-^оо, то R<r+0, и из A0.60) следует
2а2
т. е. при т-^оо, как и следовало ожидать, двумерная плотность
равна произведению одномерных плотностей вероятности огиба-
огибающей стационарного гауссовского процесса.
Соответствующая A0.60) двумерная функция распределения
через элементарные функции не выражается, однако ее можно
представить в виде ряда, если использовать разложение в сте-
степенной ряд функций Бесселя. Тогда
12м
X
267
Заменяя переменные интегрирования u=r2/[2a2(l—Ro2)] и
учитывая, что получающиеся при этом интегралы представляют
неполную гамма-функцию [см. A.31)], получаем1
г(д
i^WrL+l,
—о 1 2а*[1-Я20(т)](
xrjrt + 1, '-$- }/г(л+1), rx>0, r2>0.
A0.61)
10.2.3. Двумерная плотность вероятности огибающей суммы де-
детерминированного и гауссовского процессов. Случай, когда при-
присутствует детерминированный процесс, исследуется аналогично,
хотя вычисления более громоздки. Приведем лишь окончательное
выражение двумерной плотности вероятности огибающей:
lt rt, х,
[-
v
гх>0, г2>0, A0.62)
) J
где 8о=1, 8m=2, m^l.
Если детерминированный процесс представляет гармоническое
колебание частоты соо и амплитуды иОу то ai = a2 = tfo, и из A0.62)
следует
„2
U° У I
"
' ri>0' '•>-a A0M)
Когда т-^оо, то jRo-^O и из A0.62) находим
1 В [33] функция Fz{ru Тг, х) выражена через табулированную функцию рас-
распределения Рэлея — Раиса (см. [4]).
268
т. е. двумерная плотность вероятности при т-^оо, как и следовало
ожидать, равна произведению одномерных плотностей A0.56).
Огибающую узкополосного гауссовского случайного процесса
можно назвать рэлеевским случайным процессом, а функции
A0.60) и A0.62)—двумерными рэлеевскими плотностями веро-
вероятностей стационарного и нестационарного рэлеевских случайных
процессов.
10.2.4. Корреляционная функция огибающей. Зная двумерную
плотность вероятности огибающей, можно найти ее корреляци-
корреляционную функцию, так как последняя — второй смешанный момент
распределения. Связанное с этим вычисление двойного интеграла
целесообразно проводить, используя изложенный в п. 2.5.5. метод
разложения двумерной плотности вероятности в ряд по соответст-
соответствующим ортогональным полиномам.
Рассмотрим подробно последовательность вычисления корре-
корреляционной функции огибающей стационарного гауссовского слу-
случайного процесса. Двумерная плотность вероятности огибающей
при этом определяется формулой A0.60), а соответствующая ей
одномерная — формулой A0.57). Если на интервале @, оо) функ-
функцию (л/аJехр[—г2/Bа2)] принять за весовую, то ей соответст-
соответствует совокупность ортогональных полиномов Лаггера [см. B.90)]
Qn(r)=Ln<°)(r2/2a2),/z=0, 1,2,...
Разложим двумерную рэлеевскую плотность вероятности A0.60)
в ряд по этим полиномам:
ехр [ 11 ( \
Используя A0.64), представим корреляционную функцию оги-
огибающей рядом
и так как переменные в двойном интеграле разделяются, то
Яя(т) = о*2 dRf{T), A0.65)
л=0
где
C-fr-e^exp -¦?-*. A0.66)
В интеграле A0.66) заменим переменную интегрирования у=
212. Тогда получаем [см. B.90)]
269
= (-l)n J/±-1 у у -*- (yn e-y) dy. A0.67)
rt о dy"
Интегрируя A0.67) по частям п раз, находим при л ^2
_ V2"Bn-3)ll r/ 3 \
Cn~ 2»nl . 12 У
и так как Г C/2) = "|/я/2, то
L. A0.68)
л
2я л!
Для гг=О и п=1 из A0.67) непосредственно следует
co = V^j2, A0.68а)
4 A0.686)
Подставляя A0.68) — A0.686) в A0.65), получаем выражение кор-
корреляционной функции огибающей узкополосного стационарного
гауссовского случайного процесса
4 п=2 22"(п!J
(т)] + [1 - Щ (т)] К [Ro (т)]}, A0.69)
которое совпадает (с точностью до постоянного множителя 1/я2)
с (9.29). Первый член яа2/2 ряда A0.69) равен квадрату средне-
среднего значения огибающей [квадрату среднего значения для рэлеев-
ского распределения A0.57)]. Из A0.69) при т-^0 находим [ср.
A0.26)] ВЕ@)= 2а2. Дисперсия огибающей ix2{E{t)} = B—я/2)ог2,
где с2 — дисперсия исходного узкополосного стационарного гаус-
гауссовского процесса.
Из A0.69) следует, что нормированная корреляционная функ-
функция огибающей стационарного гауссовского процесса
^|>о()+ S ^2
A0.70)
Сумма в правой части A0.70) содержит только четные степени
i?o и поэтому неотрицательна, т. е. Яе(ч)^0. Она может обратить-
обратиться в нуль, если только i?o(rr) = 0. Так как R0(%)=0 является не-
необходимым и достаточным условием статистической независимо-
независимости двух значений огибающей {см. A0.60) ], то из некоррелирован-
некоррелированности двух значений огибающей стационарного узкополосного га-
гауссовского случайного процесса следует их статистическая неза-
независимость.
270
Когда присутствует гармонический сигнал с амплитудой и0,
корреляционная функция огибающей
° ' ~ Bm)![Bm + l)!!]2
X 2 ° (T) "О 1 - /?о (Т) х
л=о Bт-пI (п!J [ 2а2 1 + Ro (т) J
ИА] A0.71,
10.3. НЕЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ
ОГИБАЮЩЕЙ ГАУССОВСКОГО ПРОЦЕССА
10.3.1. Распределения вероятностей квадрата огибающей. Оп-
Определим двумерную плотность вероятности квадрата огибающей
узкополосного гауссовского случайного процесса после квадратич-
квадратичного детектирования. Для этого в A0.62) необходимо перейти от
переменных г\ и г2 к переменным
Р1=П2. р2 = Г22. A0.72)
Так как п>0, г2>0, то каждой точке в плоскости (рь ,р2) бу-
будет соответствовать только_одна точка в плоскости (п, г2), хотя
обратная функция г=±]/гр двузначна. Якобиан преобразования
A0.72)
1г г2)
2гх 0
0 2г,
= 4г1
Учитывая, что д{г\, r2)/5(pi, p2) = Drir2)~', находим двумер-
двумерную плотность вероятности квадрата огибающей
1^2 (Pi. P2. т. 0 = ; ^— X
Pi + Р2
хехр
KplJ
аг-Roa, у ~Л
X 1_
Если детерминированная часть процесса отсутствует, то а\ = а2 =
=0 и
х
2о« A-^) J
(Ю.74)
271
При т->оо, т. е. i?o(t)-^O, из A0.73) находим одномерную плот-
плотность вероятности квадрата огибающей [ср. с C.50) ]
. Р>0.
A0.75,
При a(t)=O распределение квадрата огибающей — экспоненци-
экспоненциальное
A0.75а)
а при а/а>1 [см C.52а)] (рис. ЮЛ)
1
BMP.
¦exp
\JV'lf)J\ e>°-
A0.756)
Из A0.60) и (8ЛЗ) нетрудно определить корреляционную функ-
функцию квадрата огибающей стационарного узкополосного гауссов-
ского процесса
где
A0.76)
A0.77)
Из A0.77) находим со=—сх = 2 и, интегрируя по частям, доказы-
доказывает, что при п^2 коэффициенты с сп=0. Таким образом, кор-
корреляционная функция квадрата огибающей стационарного гаус-
совского процесса
(т)]. A0.78)
Щ
Нормированная корреляционная функция квадрата огибающей
#Я1(т)=./?о2(т). A0.79)
Из сравнения A0.78) с (9.48) видно, что (как и следовало ожи-
ожидать) после квадратичного детектирования стационарного узкопо-
узкополосного гауссовского процесса
низкочастотная часть его спект-
спектра совпадает со спектром квад-
квадрата огибающей.
10.3.2. Идеальное ограничение
огибающей. Определим кор-
корреляционную функцию после
идеального (предельного) огра-
ограничения огибающей узкопо-
узкополосного стационарного гауссов-
> В 5 W у р/&2 совского процесса. Нелиней-
Рис. 10.1. Плотность вероятности ное преобразование в идеаль-
квадрата огибающей гауссовского ном ограничителе задается функ-
процесса цией (9.64).
272
3
а—
Используя A0.60) и разложение (8.13), получаем следующее
выражение корреляционной функции предельно ограниченной оги-
баюЩей
В(ч)= 5 с2пЯТ(% A0.80)
где
сп = а0 J LUy)exp{-y)dy, A0.81)
*2/Bа*)
Хо — уровень ограничения.
Для п—0 из A0.81) непосредственно следует
со=аоехр[—*о7Bа2)]. A0.82)
При
и, вводя полином Лаггера LA)n-i(#), получаем окончательно
A0.83)
айх20
Для вычисления LA)n_i(jc02/2a2) можно использовать разло-
разложение
A0.83а)
10.3.3. Логарифмический детектор. Рассмотрим логарифмичес-
логарифмическое преобразование огибающей стационарного гауссовского про-
процесса
Ex{t)=\n[E{t)la]. A0.84)
Среднее значение и второй момент логарифма огибающей ста-
стационарного центрированного гауссовского процесса с дисперсией
а2 равны
(f) A0.85)
-^ ехр ( - ^ dr =
A0-86>
4
где С=0,5772 — постоянная Эйлера.
273
Из A0.85) и A0.86) следует, что дисперсия огибающей равна
Ц2{?1(^}=я2/24. A0.87)
Из A0.60) и (8.13) определяем корреляционную функцию ло-
логарифма огибающей стационарного гауссовского процесса
BEA^=ic2nRln(x), A0.88)
/1=0
где
±](^)^(^)( jL\r. (Ю.89)
Для вычисления интеграла A0.89) перейдем к новой перемен-
переменной u = r2fBo2). Тогда, используя разложение
()ir. П0.90)
получаем
4 ( I )^]
= — 2 ( Л V (~1)fe ]Г/(А?+1)+1п2Г(Л?+1)], A0.91)
При я=0 из A0.91) находим co = [r/(l)+ln2]/2=mi{?i}.
Так как при n^l сумма 2 ( — 1L ] = 0, то остальные коэффи-
циенты
с* = \ 2
2
^5
т=\ т 2п
Подставляя A0.92) в A0.88) и учитывая A0.85), получаем
A0.93)
При t=0 правая часть A0.93) совпадает с A0.87), так как
10.4. ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ
ФАЗЫ ГАУССОВСКОГО ПРОЦЕССА
10.4.1. Одномерная плотность и моменты. Сравнивая A0.48) с
C.49), приходим к выводу, что задача нахождения плотности ве-
вероятности фазы узкополосного гауссовского случайного процесса
совпадает с решенной в п. 3.2.5 задачей определения плотности ве-
вероятности фазы вектора с независимыми гауссовскими компонен-
274
таки, средние значения которых отличны от нуля. Используя C.57),
запкшем одномерную плотность вероятности фазы случайного про-
процесса A0.35)
a cos (О-*.) р Г^
оу2п I- a
A0.94)
где a = a{t) = [u*(t)+v2(t)]l/2 и fle=ft.CO=ag[@@]
Заметим, что функция A0.94) зависит как от огибающей a(t)y
так и от фазы Ф8(/) детерминированного слагаемого процесса, в
то время как плотность вероятности огибающей содержит в каче-
качестве параметра только огибающую a(t), но не фазу ^(О- Если
детерминированное слагаемое (сигнал) представляет гармоничес-
гармоническое колебание частоты о>о и амплитуды ио, то из A0.94) следует
A0.95)
где через s = uo/g обозначено отношение амплитуды колебания к
среднеквадратическому значению стационарного гауссовского про-
процесса (шума).
Очевидно, чтов фиксированный момент времени функция A0.94)
имеет такой же вид, что и A0.95), если только начало координат
перенести в точку Ф—Os и обозначить s = a/o. Семейство кривых
Wi (Ф) для нескольких фиксированных значений s показано на
рис. 3.7.
Сопоставляя произведение функций A0.56) и A0.94) с совме-
совместной плотностью вероятности огибающей и фазы в совпадающие
моменты времени, убеждаемся, что огибающая и фаза зависимы.
Они не зависимы только при отсутствии детерминированной части
. процесса *.
Когда сигнал отсутствует (s=0), W\ (Ф) = 1/Bя), l^l^n, что
соответствует равномерному распределению фазы узкополосного
стационарного гауссовского процесса.
1 Заметим также, что узкополосный стационарный гауссовский процесс %{t)
с нулевым средним и его огибающая E(t) в совпадающие моменты времени не-
коррелированы. Совместная плотность вероятности E(t), %(t) и сопряженного
i\(t) Ws(y, Xiy X2) =w(xi, Х2)$[~1/х21-\-х22—у], откуда в силу симметрии двумер-
двумерной плотности вероятности ^2(^1,^2) процессов |(/) и r\(t) следует /wi{?"(/)!(/)}=
ОО се ОО оо ОО
J J J yXiW3(y, xu X2)dxidx2dy= J j
0 —CX) —00 —OO — OO
275
При s-Cl, т. е. при амплитуде сигнала, много меньшей сред-
неквадратического значения шума (слабый сигнал), в соответст-
соответствии с C.58)
ii^^ A0-96)
Из A0.96) следует, что при слабом сигнале плотность вероят-
вероятности фазы представляет косинусоиду, смещенную вдоль оси ор-
ординат на 1/Bп), с амплитудой 5/B У 2я).
Если scos'&>3, т. е. амплитуда сигнала много большей средне-
квадратического значения шума (сильный сигнал), в соответствии
с C.59)
При Ф>я/2, s>3 можно считать, что W^i (#) = 0, а для неболь-
небольших значений Ф
^^) [A0.98)
т. е. фаза в этом случае подчиняется нормальному закону распре-
распределения с дисперсией l/s2 = a2(/^2o, равной отношению шум-сигнал.
Центральные моменты фазы нечетного порядка равны нулю, а
четного порядка определяются по формуле C.64).
Дисперсия фазы а2ф совпадает со вторым центральным момен-
моментом [см. C.65)]
" °{-^ + 4*i(-l)*-gs (Ю.99)
где ah определяются согласно C.63).
При слабом сигнале можно ограничиться первым членом ряда
A0.99) и тогда [см. C.63)]
, 2, — s2/2)
или
а2ф^я2/3—sV2n, s<l. A0.99a)
Для сильного сигнала дисперсия фазы убывает с ростом ам-
амплитуды сигнала, причем
02<p~1/s2, 5>1. A0.996)
10.4.2. Двумерная плотность вероятности фазы стационарного
гауссовского процесса. При а=$8 = 0 из A0.55) следует
Xехр { — ~' [if + т\-2R0тхr2cos(*2-Ъ,-%)]J drx drz,
. |*аГ<«- A0.100)
276
Вычисление интеграла A0.100) приводит к выражению (см.
например, [1])
где
. y=i/(*i, «a, t)=/?0(t)cos[O2—*i—Оо(т)], A0.102)
|4r. A0.102а)
Сопоставляя произведение функций A0.60) и A0.101) с сов-
совместной плотностью A0.55) (при а=#8=0) огибающей и фазы
узкополосного стационарного гауссовского случайного процесса,
убеждаемся, что огибающая и фаза зависимы.
При г-^оо величины jRo-И), у-+0 и из A0.101) следует W2($i9
#2, x)^Wx (<h) W2 @2) = 1/Dя2).
Из A0.100) видно, что двумерная плотность вероятности фа-
фазы— периодическая функция переменной 02—<h. Поэтому ее мож-
можно представить рядом Фурье по этой переменной. Для этого вос-
воспользуемся известной формулой
ехрДгcosф] = ¦- 2 In (z) exP(inФ) (Ю-103)
и тогда из (8.69) после элементарной замены переменной интегри-
интегрирования получим
где
2f т)= 2
О
A0.104)
=—ОО
4л2 м=0
Так как АГ=А-Г, то A0.104) можно переписать в виде
^2(#i> «2. т) = Л + 22Лгсо5г(^2~^), A0.1046)
г=0
причем Л0=1/Dя2).
На рис. 10.2 построены функции Ar(R0) для г=1; 7.
277
4nzAr(R0)
0,8
0,6
0,2
А
/
/
/
/
/
у
А
/
7
§
2
д
¦Г
д
7
10.4.3. Двумерная плот-
плотность вероятности фазы
суммы детерминированного
и стационарного гауссовско-
го процессов. В общем слу-
случае [s(t)^O] двумерную
плотность вероятности фазы
можно также представить
кратным рядом Фурье по
переменным ®\ и *&2. Для
этого в интеграле A0.55)
перейдем к переменным
zi=fi/(y, z2 = r2/e и восполь-
воспольО 0,2 0,4 0,6 0,8 1,0 Rq
Рис. 10.2. Функция Ar(Ro)
зуемся формулой A0.103). Ограничимся сигналом вида s(t) =
= и (t) cos coot и предположим, что спектр гауссовского шума сим-
симметричен относительно частоты соо, вследствие чего Rs(i)=0 и
/?с(т)=;/?о(т). Тогда из A0.55), полагая $s = '&o=0, a[ = Ui = u(tI
получаем
ехР { " . ¦„ .
X
00 °°
x f f
0J0J
г\ +
Ir
0) J
L 0 U ~ J
I Р2
1—-^п
X
X 2
Меняя порядок суммирования и интегрирования и обозначая
коэффициенты разложения
U2 — ^х\
- ехр{ i-r-2^ ~м>^1 | х
1
4Я«A-Я») I 2a» A-7^)
.,
X 1таГ u*-R°Ul z2 lexp *1 + *2 ч \йгг dz2, A0.105)
I a(l—/?g) J L 2(!-^o) J
находим искомое разложение двумерной плотности вероятности
фазы в кратный ряд Фурье
i, %, х, 0= 2 2 2 Arnm(x,t)x
A0.106)
278
Если сигнал отсутствует, то АГпт=0 при всех значениях п и
, кроме п = т=Оу и тогда из A0.106) получаем A0.104), причем
А
Агго
10.4.4. Корреляционная функция фазы. Из A0.106) находим
корреляционную функцию фазы узкополосного гауссовского про-
процесса
B*(t, x)= i 5 2 Arnm{x, t)x
—оо П=—оо т=—оо
—Я —Я
Переменные в двойном интеграле разделяются и вычислить
каждый интеграл несложно. В результате
оо т~—оо
Если сигнала нет, то
-8д2 ? ^т^". A0.108)
При т-^оо из A0.108) следует 5ф(гг)->0, а при т-^0 ряд схо-
сходится к я2/3 — дисперсии фазы.
Явное выражение 5ф(т) в виде степенного ряда по R0(i:) полу-
получается путем подстановки A0.104а) в A0.108)
= у ^о W + -р$ W + -^ /?2 (т) + ... A0.109)
10.4.5. Распределение разности фаз и его моменты. Одномерную
плотность вероятности разности фаз Лф(/, т)=ф(?+т)—ф(/) га-
гауссовского стационарного случайного процесса нетрудно получить
непосредственно из A0.101), так как W2 (Oi, Ог, г) в этом случае
зависит только от разности фаз. Поэтому
^дФ (О, т) = jV2 (*lf О + О1Э т) d Ох =
(юлю)
2я
где у=у(, H()[0()]
Если т-^оо, то #о-Н), у-И) и И7дф('б')=1/2я, |^|<я. На рис.
10.3 построены зависимости WA4,($) для нескольких значений i?o-
Можно доказать, что /П1{Дф(^, т)}=€'о(т) и mi{\A(p{t, т)~
#()]} arccos/?()
279
Рис. 10.3. Плотность вероятности
разности фаз гауссовского про-
процесса
Используя A0.106), нетрудно
определить плотность вероятности
разности фаз гауссовского процесса,
когда s(t)=u(t)cos®ot, i?s(x)=0,
)#()
= 2я[ 2 An.-n.nfr, 0 + 2 2 2
Моменты распределения разности фаз
4Я24-23 оо
A0.111)
^я 2j j" cos «v axr 2j ^k-\-n,n,-
/j=l —Я /1=—oo
"*2g+l VT, fj ::=::U, ^ U, 1, Z, ...
Дисперсия разности фаз равна
A0.112)
A0.112а)
С Ди*,п.-^.(т, t). A0.113)
fe==l ^4 П=—оо
При s(/)=0 получаем выражение, аналогичное A0.99):
IS ()Г АЛт), A0.114)
в котором аг заменено на 4яЛг(т).
10.5. ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ
КОСИНУСА ФАЗЫ ГАУССОВСКОГО ПРОЦЕССА
10.5.1. Одномерная плотность вероятности и моменты. В неко-
некоторых случаях необходимо иметь вероятностные характеристики
не фазы ф@» з cosq>@. Используя результаты, приведенные в
§ 10.4, нетрудно определить плотность вероятности cos<p(/): до-
достаточно воспользоваться соотношениями для распределения
функции от случайной величины (см. п. 3.1.4).
280
Из A0.95), заменяя переменную 2=cos'fr, находим одномер-
одномерную плотность вероятности cosq>(/) (при (Ф^я функция O(z) =
= arccos2 двузначна), когда детерминированное слагаемое гаус»
совского процесса s(t)==u0cos(oot:
A0.115)
При s=0 плотность вероятности косинуса фазы стационарного
гауссовского процесса [ср. с (Па) в задаче 3.8]
^(г) = -^==-, |г|<1. 1A0.116)
Воспользовавшись разложением функции A0.115) в ряд Фурье
на интервале |z|^l и имея в виду, что cos (k arccos z) = Tk (z),
где Tk(z) —полином Чебышева первого рода k-то порядка, полу-
получаем
-+22 ahTh(z)\, |z|<l, A0.117)
Я J
У1_22
где коэффициенты ak определены формулой C.63).
Первые два момента распределения cos ф
(ШЛ18а)
= ^-+^1^1, 3, -^у A0.1186)
Используя A0.111), нетрудно записать для одномерной плот-
плотности вероятности косинуса разности фаз ф(Н-т)@
(г, т, t) = m 2 Ап, _„, „ (t,J t) +
Vl-г» Li—~
+ 22 2 Th{z)Ak+n,n.-n{x, t)\ |г|<1, A0.119)
которое для стационарного гауссовского процесса переходит в
Г-1 +16я S Л
L
, т) _1_
Vi-22 L J
A0.120)
Коэффициенты Amm и Ah определены согласно A0.105) и A0.104а).
Первые два момента соэДф для стационарного процесса:
т,=4яМ,. A0.121а)
т2=1/2+4яМ2. A0.1216)
281
10.5.2. Двумерная плотность вероятности и корреляционная
функция. Для определения двумерной плотности вероятности ко-
косинуса фазы стационарного гауссовского процесса воспользуемся
формулой A0.104). Заменяя переменные zi = cos-&b 22 = cosd2, на-
находим
X
Г 1 °°
Ь 2 2 Аг
[BяJ г=1
Г 1 °°
X Ь 2 2 Аг (т) cos (г arccos гг) X
[BяJ
X cos (r arccosz2) , \гг\ sg; 1, |z2| < 1
и, вводя полиномы Чебышева Tr {z) = cos (r arccos z), получаем
W2 (zly гг, т) = ^ g2, ' 2 X
X [l+8tt2i^TO\(zj7\(z2)l I^Kl, |г2|<1, A0.122)
J
где Лг(т) определяются по формуле A0.104а).
Заметим, что ряд A0.122) представляет разложение двумер-
двумерной плотности вероятности распределения косинуса фазы стацио-
стационарного гауссовского процесса по ортогональным полиномам Чебы-
Чебышева, что находится в полном соответствии с общим методом раз-
разложения, указанным в п. 2.5.4, так как одномерная функция рас-
распределения coscp, равная l/[jtV^l—^2] на интервале |2|^!1, сов-
совпадает с весовой функцией полиномов Tr{z) (с точностью до мно-
множителя 1/я).
Используя формулу A0.122), находим корреляционную функ-
функцию косинуса фазы стационарного гауссовского процесса
где
J, yi-2* 10, r>l
Таким образом [см. A0.104а)],
хехр l-J-l \dz1dz2 A0.123a)
1 2[\-r\(t)}
282
или
1R2{) (к+ 3/2)
#cos ф (т) 2j Но (т) -
2 о Л' (Л + *)'
(Ю.1236)
+ .
64
Выражение для корреляционной функции косинуса фазы мож-
можно представить и в другой форме. Для этого следует двойной ин-
интеграл A0.123а) выразить через гипергеометрические функции,
которые в рассматриваемом случае приводятся к полным эллип-
эллиптическим интегралам. Опуская здесь изложение указанных пре-
преобразований, приведем лишь конечный результат
]K[/?e(t)]}-r]rVr' (Ю.124)
где К и Е — полные эллиптические интегралы соответственно
первого и второго рода,
10.6. ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ
ПРОИЗВОДНЫХ ОТ ОГИБАЮЩЕЙ И ФАЗЫ
ГАУССОВСКОГО ИРОЦЕССА
10.6.1. Совместное распределение огибающей, фазы и их про-
производных. Определим совместное распределение (в совпадающие
моменты времени) огибающей, фазы и их первых производных
узкополосного, дифференцируемого в среднеквадратическом, гаус-
совского случайного процесса. Исходным для решения поставлен-
поставленной задачи является совместное четырехмерное нормальное рас-
распределение квадратурных составляющих A{t)9 C(t) стационарно-
стационарного слагаемого гауссовского процесса и их производных в совпа-
совпадающие моменты времени [см. A0.35)]. В соответствии с резуль-
результатами п. 10.1.3 корреляционная матрица этого нормального рас-
распределения
1 0 0
0 1 - Rs @)
0 -Л.'@) -R"c@)
kRs@) 0 0
Здесь согласно A0.31) и A0.29) [см. также A0.50), A0.51)]
~i?s'@)= J((o-coo)S(co)do) /Js((o)d(o = (ocp-co0 = (o*, A0.125a)
- R"c @) = J (со- cooJS (со)d(dj Js(со)dco =
0 ( 0
= GJ — 2@cp (Oo + 0J = 0J, A0.1256)
283
где 5 (to) — спектральная плотность мощности стационарной части
узкополосного гауссовского случайного процесса.
Детерминант указанной корреляционной матрицы
D= (о2!—оЛрJ = (ю2*-н(о*2J. A0.126)
Теперь можно записать совместную четырехмерную плотность
вероятности квадратурных составляющих и их производных в
совпадающие моменты времени
—-
4л2 ( со? - о)*2) о!
X
+ хГ*+у'*-2а!*(ху'-у*))\. A0.127)
Заменой переменных в A0.127)
х + « = rcosft, y + y = rsinft, x'—r' cos ft—rft'sinft—и',
y'^'sinft+rft'cosft—t/, A0.128)
u=u(t), v = v(t)9 a@ = [
с учетом того, что якобиан преобразования (8.128) равен г2, по-
получаем искомую четырехмерную плотность огибающей, фазы и их
производных в фиксированный момент времени
Wt(r, г', [О, О', 0= -^ х
|!(^*2)
xexpf —
1 2а*(со2-
г'2 + г2 ft'2 - 2г' а' cos (ft - fl?) +
+ 2rft' a' sin (ft - ft;) - 2co* a (r' sin (ft - fts) + r ft' cos4(ft - ft,)) +
+ 2co* (uvf - vu' + та' sin (ft - ft;)) ] 1,
где а/=(м/2 + у/2I/2, ft's=arctg(i>'AO. A0.129)
10.6.2. Совместное распределение огибающей и ее производной.
Для определения совместной плотности вероятности огибающей и
ее производной в совпадающие моменты времени необходимо про-
проинтегрировать A0.129) по ft и ftr. Это интегрирование выполня-
выполняется просто тогда, когда нет фазовой модуляции детерминирован-
детерминированного колебания {v(t)=O), а спектр S(©) симметричный, причем
несущая озо совпадает со средней частотой соСр. При этом со* = 0 и
из A0.129) следует
284
- 2r' и' cos О + 2H>' u' sin Ф) - -^_ cos О
»» + ("'2+V'2) llx
m2 JJ
2яо* coi
XI. j >>
l °*т, )
A0.130)
Если ы'(^)=0 (гармоническое колебание постоянной амплиту-
амплитуды), то функция Бесселя под знаком интеграла не зависит от
переменной интегрирования и тогда
-оо<г'<оо. A0.131)
Сравнивая A0.131) с A0.56), находим
г
'2
оо)ж У 2л |_ 2а2 со^
Г>0; -ооО'<оо, A0.132)
т. е. совместная плотность вероятности огибающей и ее производ-
производной равна произведению плотности вероятности огибающей (обоб-
(обобщенная функция Рэлея) и плотности вероятности производной,
которая оказывается нормальной с нулевым средним и диспер-
дисперсией сг2со2*. Из A0.132) следует, что огибающая узкополосного
нормального процесса и ее производная в совпадающие моменты
времени независимы [ср. D.150)].
10.6.3. Распределение мгновенной частоты. Определим теперь
совместную плотность вероятности фазы и ее производной. Сохра-
Сохраняя предположение о симметрии спектра S(co), а также полагая
©о = (Оср и гг'=О, проинтегрируем A0.129) по г и г', в результате
чего получаем
^2 (*, «')- 1тг- ехР ( - ^ X
285
Интегрируя A0.133) по О, находим плотность вероятности мгно-
мгновенной частоты производной от фазы суммы гармонического ко-
колебания постоянной амплитуды и стационарного гауссовского про-
процесса
B
П оо
i 1
—я о
* J KexP hi
X
X
а3 о* У 2я
exp -
+ -^ cos
x
X
р
или, обозначив s=«/a, о
A0.134)
где iFi (^, //, 2) — гипергеометрическая функция.
Величина s равна отношению амплитуды сигнала к средне-
квадратическому значению шума, а величина со* пропорциональ-
пропорциональна ширине полосы спектра шума. Функция W\(W) четная (рис.
ЮА).
•
и
-i
о
L
1
^1
-Z,d -1,5 -1,0 -0,5
0,5 1,0
1,5
Рис. 10.4. Плотность вероятности мгновенной частоты гауссовского процесса
286
Если м<(Т, то, разлагая в A0.134) гипергеометрическую функ-
функцию в ряд Тейлора и ограничиваясь двумя членами разложения,
получаем
Х f f I )] A0.134а)
2 со* У3'2 ! 2 \ 2 у
При u^>Gt используя асимптотическое разложение гипергео-
гипергеометрической функции, находим
_ ехр Г - SH1L1 e (Ю. 1346)
со* Ф У 2л
При W^>o, <К<;>©*, и«1 распределение мгновенной частоты —
нормальное с дисперсией oJ*/s2. Оно стремится к дельта-функции
при неограниченном возрастании s.
Для стационарного гауссовского процесса E = 0) плотность ве-
вероятности мгновенной частоты [см. A0.134а)]
Wi(&) = г>~3/2/Bсо*) = A+Ф'2/(й2*)~3/2/Bсо*). A0.135)
Сравнивая A0.135) с A0.133) при и = 0, убеждаемся, что сов-
совместная плотность вероятности фазы и ее производной стационар-
стационарного гауссовского процесса равна произведению одномерных функ-
функций распределения фазы и ее производной, откуда следует их не-
независимость в совпадающие моменты времени в согласии с об-
общим результатом D.150).
Функция распределения мгновенной частоты (производной от
фазы) стационарного гауссовского процесса при /&/>0
F (fl')=_L + — г «*.
A0.136)
Fl(—®>) = \—Fl(®'). A0.136a)
10.6.1. Среднее значение модуля мгновенной частоты. Среднее
значение производной фазы ввиду симметрии W\ (¦&') равно нулю.
При попытке вычислить дисперсию производной от фазы мы на-
оо
талкиваемся на расходимость интеграла j -ft'2W\ (fl1') dft'. Дейст-
— оо
вительно, из A0.134) следует, что Wi(ft') убывает при |0'|->ооэ
как l^'l, и, следовательно, подынтегральная функция в указан-
указанном интеграле убывает как (Ф'!, т.е. недостаточно быстро для
того, чтобы обеспечить сходимость несобственного интеграла. Та-
Таким образом, дисперсия производной от фазы неограничена К
Функция A0.134) представляет пример распределения случайной
величины, дисперсия которой неограничена.
1 Этот результат не противоречит физике явлений, так как фаза не является
энергетической характеристикой процесса. Применяемые в дальнейшем термины
«спектр фазы» и «спектр производной от фазы» указывают лишь на то, что соот-
соответствующие им функции частоты являются преобразованиями Фурье от корре-
корреляционных функций фазы и ее производной.
287
За числовую характеристику распределения мгновенной час-
частоты производной от фазы можно принять среднее ее абсолютных
значений, т. е.
j 2] VWiWdV . A0.137)
-.00 0
Подставляя A0.134) в A0.137) и меняя порядок интегрирова-
интегрирования, получаем
или, выражая гипергеометрическую функцию через функцию Бес-
Бесселя,
т1{\<р'\}=и*1о[и*/{4о2)]ехр[—иЩ4о2)]. A0.138)
Если детерминированная часть процесса отсутствует (и = 0), то
т1{|Ф/|}=©.. A0.139)
10.6.5. Корреляционная функция и спектр мгновенной частоты.
Рассмотрим стационарный узкополосный гауссовский процесс с
симметричным относительно центральной частоты со0 спектром. В
соответствии с A0.15) производная Q(t) от фазы (мгновенная
частота) этого случайного процесса
Q@- ± arctgS» e A(t)C>(t)-C(t)A>(tL
dt A if) Л2 (t) + С2 @ v
Корреляционная функция случайного процесса Q(t)
C(t + %)A(t + x)-A(t + %)C(t + i;) 1 A0 141)
Л2(/ + т)+С2(^ + т?) / '
Для определения 50(т), как видно из A0.141), необходимо
знать совместную нормальную плотность вероятности восьмого
порядка гауссовских случайных величин A(t), A'[t)t
A(t+%), A'{i+%)9 С(/), C'{t)9 C{t+%)9 C'lt+%).
В силу сделанного предположения о симметрии спектра исходно-
исходного гауссовского процесса случайные функции A(t) и C(t) незави-
независимы.
Достаточно громоздкие вычисления (см. [1]) приводят к сле-
следующему выражению корреляционной функции мгновенной часто-
частоты стационарного гауссовского процесса:
288
_ «?м«;м*м ln[1_^(T)]> (ЮЛ42)
где 7?о(т) — нормированная корреляционная функция квадратур-
квадратурных составляющих A(t), C(t), определяемая спектром гауссовско-
го процесса по формуле A0.50).
Из A0.142) следует, что lim BQ L(t)=oo. Это соответствует
указанной неограниченности дисперсии производной от фазы ста-
стационарного гауссовского процесса. Поэтому требуется известная
осторожность при исследовании вероятностных характеристик про-
производной от фазы. Например, если воспользоваться равенством
Bq(t)=—В"ф(т), справедливым лишь при условии ограничен-
ограниченности J3"<p @), то придем к ошибочному результату.
Пусть корреляционная функция гауссовского процесса [см.
17.72)]
Bt (т) = о|>хр ( - р2 т2/4) cos co0 т.
Тогда
Я'о (т) =- (р2т/2) ехр (-р2т2/4),
Я"о (т) =- (р2/2) A-р2т2/2) ехр (-pV/4)
и из A0.142) получаем
BQ(x) =-(p2/4)ln[l-exp;(-p2T/2)]. A0.143)
Параметр р=А/ 1/"я, где Д — ширина полосы спектра Ss(©) гаус-
гауссовского процесса.
Спектр мгновенной частоты находим по теореме Хинчина-Ви-
нера
SQ И = - Р2 J In (l - ехр (-11—Е-2)) coscoxdx. A0.144)
Разлагая логарифм в ряд и интегрируя почленно, получаем
Sa N = ft j/f ? «~3/2 ехр (^) . A0.145)
При о) = 0 спектральная плотность мощности
SQ @) - Р У^ ? я-з/. в р 1^/11 с ^А^ # AОЛ46)
где ?(*) — римановская дзета-функция. Имея в виду, что ? (—)==
= 2,612, находим
5Q @) = 1,86р /я= 1,86А. A0.146а)
При (o>ip
SQ fa)) ^яр2/й)=Д2/о). ,A0.147)
10-87 ' 289
10.7. ЗАДАЧИ
10.1. Пусть ^(t, x)=E2\(t)+E2(t+x) —сумма квадратов двух значений оги-
огибающей узкополосного стационарного нормального случайного процесса. Ис-
Используя A0,60) и заменяя переменные rt= ~\/usm$, r2= "l/iTcos 0, показать,
что одномерная плотность вероятности r\ (t, т)
х
При т->оо, Ro-+Q распределение A) переходит в
т. е. %2 — распределение с четырьмя степенями свободы, как и должно быть
для суммы двух независимых экспоненциальных случайных величин.
10.2. Пусть |i(/) и ?g(/) —стационарные и стационарно связанные узкопо-
узкополосные гауссовские процессы, которые можно представить в виде
li (t)=Ai @c°s toot+Ci (t) sin (xHt = Ei(t) cos[co0^—Ф1 (t)], C)
? I2(t) =A2(t)cos (dot+C2it)sm (dot = E2(t)cos[(uot—qJ(t)]. D)
Показать, что совместная плотность вероятности и взаимная корреляционная
функция огибающих этих процессов
1 Г^1 \. г1>0
E)
BEi Ei (x) = at o2 {2E [Ro (%)] - [1 - R20 (т)] К [Ro (т)]}. F)
где cr2i, 022 — дисперсии процессов ti(/) и |2@ (предполагается, что средние
значения этих процессов равны нулю),
G)
(8)
R.{x)=m1{Al(t)C2(t+x)}f(ala2)=mi{A2(t)Ci(t+t)}Haia2). (9)
При |1«)=|г@ формулы E) и F) переходят в A0.60) и A0.69).
Рис. 10.5. Схема устройств перемно-
перемножитель-фильтр
290
10.3. На вход устройства, схема которого изображена на рис. 10.5, пода-
подаются процессы li(t) и 5г@» указанные в задаче 10.2. Спектры процессов огра-
ограничены полосой А, а полоса Аф идеального низкочастотного фильтра НЧФ
удовлетворяет неравенству Д<Дф<С<о0. Замечая что процесс на выходе фильтра
получаем следующее выражение характеристической функции процесса e(t):
Ое (y)=det)[I—2k/QK]/2, A1)
где I — единичная матрица, и матрицы Q и К имеют вид
0 1/4 0 0 \
1/4 0 0 0 \ Поч
0 0 0 1/4 A2)
0 0 1/4 0 /
а? а^ЯЛО) 0
к . «^.«.(О) °l -o^RAO - A3)
0 — ог а2 Rs @) of
V <?2 Rs @) 0 d а2 i?c @)
10.4. Доказать, что среднее число и средняя длительность выбросов над
уровнем г0 огибающей эргодического узкополосного центрированного гауссовс-
гауссовского процесса
г0), г0>0,
где а2 — дисперсия гауссовского процесса и со. определяется согласно
A0.1256).
10.5. Доказать, что среднее число и средняя длительность выбросов над
уровнем Фо фазы эргодического узкополосного центрированного гауссовского
процесса
А,! = <о./Dя), A6)
(т. е. не зависит от уровня Фо)
где о* определяется согласно A0.1256).
10.6. Доказать, что среднее число и средняя длительность выбросов над
уровнем vo мгновенной частоты производной от фазы эргодического узкополос-
узкополосного центрированного гауссовского процесса
1 / 1
где
со4**=^оD)@)— со4*, B0)
причем величина со* определяется согласно A0.1256), а ЯоМ — согласно
A0.52).
10* 291
Глава 11
ПРЕОБРАЗОВАНИЯ ГАУССОВСКОГО ПРОЦЕССА
В НЕЛИНЕЙНЫХ ИНЕРЦИОННЫХ СИСТЕМАХ
11.1. ПОСТАНОВКА ЗАДАЧ
Задача определения вероятностных характеристик слу-
случайного процесса на выходе нелинейной инерционной системы в
общем виде практически неразрешима. При этом возникают труд-
трудности двоякого рода. Во-первых, достаточно сложно записать
функционал, представляющий характеристику «вход-выход» сис-
системы в замкнутом виде [см. F.5)] или в форме усеченного ряда
Вольтерра [см. F.9)]. Во-вторых, если на вход системы действует
негауссовский случайный процесс, то не удается получить точного
решения задачи об определении распределения на выходе даже
линейной инерционной системы (см. п. 7.3.1). Поэтому приходится
рассматривать задачи о преобразованиях случайных процессов в
нелинейных системах при дополнительных ограничениях.
Как отмечалось в п. 6.4.1, характерным для многих этапов ра-
работы радиотехнических устройств является преобразование сигна-
сигналов, представляющих, вообще говоря, случайные процессы в ти-
типовом звене, состоящем из трех последовательных элементов:
входной линейной системы, нелинейного неинерционного элемента
и выходной линейной системы (фильтра).
Если на входе типового звена действует гауссовский случайный
процесс, то определение спектральной плотности мощности про-
процесса на его выходе не встречает принципиальных затруднений.
После входной линейной системы распределение процесса остает-
остается нормальным, а спектр деформируется в соответствии с формой
частотной характеристики этой линейной системы. В результате
нелинейного преобразования функции распределения процесса пе-
перестают быть нормальными, но спектр преобразованного процес-
процесса все же можно определить, пользуясь одним из методов, под-
подробно изложенных в гл. 8. После этого достаточно учесть селек-
селективное действие выходной линейной системы (см. п. 7.2.1). Одна-
Однако во многих случаях знание спектральной плотности мощности
процесса на выходе типового звена оказывается недостаточным,
необходимы более детальные характеристики случайных процес-
процессов, какими являются функции распределения. Определение рас-
распределения процесса на выходе типового звена даже при гаус-
совском входном процессе связано с указанными трудностями: оп-
определением плотности вероятности на выходе линейного фильтра
при негауссовском входном процессе. В тех случаях, когда про-
процесс на входе типового звена негауссовский, эти затруднения по-
появляются уже на первом этапе исследования. Они могут помешать
решению задачи не только определения распределения, но даже и
нахождения корреляционной функции и спектральной плотности
292
мощности процесса после нелинейного элемента, так как для этого
должна быть задана двумерная плотность вероятности случайного
процесса на выходе предшествующей линейной системы.
Известно лишь небольшое число точных решений задачи об
определении распределения процесса на выходе типового звена,
полученных при специальных предположениях о характеристиках
элементов типового звена и о виде случайного процесса на входе.
Рассмотрим методы решения следующих трех типов таких задач:
1. Случайный процесс на входе представляет собой сумму де-
детерминированного сигнала и стационарного гауссовского процесса
с равномерным спектром («белый шум»), а характеристика нели-
нелинейного элемента квадратичная. В этом случае рассматриваемая
задача допускает следующую радиотехническую интерпретацию.
На входе усилителя промежуточной частоты (УПЧ) действуют
детерминированный сигнал и аддитивный флуктуационный шум.
Сигнал с шумом подвергается квадратичному детектированию и
последующей фильтрации. Для большей определенности в изло-
изложении сохраняется терминология, связанная с этой специальной
задачей. Рассматриваются два УПЧ: широкополосный и узкопо-
узкополосный (ширина полосы частотной характеристики много меньше
центральной частоты). В первом случае процесс после нелиней-
нелинейного преобразования принимается равным квадрату случайного
процесса на выходе УПЧ, а во втором — квадрату огибающей
случайного процесса на выходе УПЧ (отбрасывается высокочас-
высокочастотная составляющая процесса).
2. На вход фильтра действует произведение двух коррелиро-
коррелированных стационарных гауссовских процессов. Необходимо опреде-
определить функцию распределения процесса на выходе фильтра. К ре-
решению этой задачи сводится исследование распределения процес-
процесса на выходе коррелятора при конечном времени интегрирования,
т. е. величины
CrW-4" 7 EiftE,('-T)dTf (ИЛ)
1 —Т/2
если li(t) и g2@ — стационарные гауссовские процессы.
3. Средняя мощность эргодического гауссовского процесса %(t)
за конечное время усреднения Т
= 4г 7 •(')<«. (П.2)
1 -т/2
Необходимо определить функцию распределения случайной вели-
величины цт.
11.2. УСИЛИТЕЛЬ — КВАДРАТИЧНЫЙ ДЕТЕКТОР —
ФИЛЬТР
11.2.1. Прямое описание случайного процесса на выходе
фильтра. Пусть линейные системы рассматриваемого типового
звена характеризуются импульсными функциями: УПЧ-функцией
2ЙЗ
/*i(t) и фильтр-функцией Лг(т). Обозначим через s(t) детермини-
детерминированный сигнал и %(t)—аддитивный гауссовский белый шум*
действующие на входе УПЧ. Используя F.58), процесс на выхо-
выходе фильтра можно представить в виде суммы (сходящейся в
среднеквадратическом)
Т/2 Т/2
С@= { { K(u9v)[s{t-u) + l(t-u)][s(t-v) +
— Т/2 -Т/2
+ Ht-v)]dudv~i ^-ЦЖШ. . (П.3>
где
*(/)= ] s(<-*)q>,(*)d*. A1.4)
—оо
41 @- 1 &(*-*)<Pi(*)d*. (П.5)
—>оо
<Pi{x) и %i — собственные функции и собственные числа однород-
однородного интегрального уравнения [см. F.57), F.55)]
Ф(*)=Я 1 К{х, y)y(y)dy9 A1.6)
/С(ы, о)= ?Ai(«—t)h2(x)hl(v—x)dx. A1.7)
— 00
Заметим, что интегральное уравнение A1.6) может быть при-
приведено к другому уравнению, ядро которого есть произведение
корреляционной функции шума на выходе УПЧ и импульсной
функции фильтра. Для этого подставим A1.7) в A1.6) и изменим
порядок интегрирования
<р(*) = А, J h2(x)h1(x-x) У h1(y-%L{tj)dyd%.
— с» —00
Умножая обе части последнего равенства на h\(x—z) и ин-
интегрируя по х, получаем
оо
где f(z)=$q>(x)hi(x—z)dx. Согласно G.55) корреляционная
— оо
функция процесса на выходе УПЧ
оо
B(x)=N0 jhl{u)h1(u—x)du,
— оо
где No *— спектральная плотность белого шума на входе.
294
Следовательно, f(z) удовлетворяет интегральному уравнению
Дг)=А у В(т-г)А,(т)/(т)Л. (Н.8)
11.2.2. Анализ слагаемых процесса на выходе фильтра. Из
{11.3) следует, что задача анализа вероятностных характеристик
«случайного процесса ?(?) на выходе рассматриваемого типового
звена сводится к определению плотности вероятности суммы
квадратов случайных процессов Si(t) +гц(г), где Si(t) детерми-
детерминированы, а случайные процессы г]г(О> как интегралы от гаус-
совского белого шума, представляют гауссовские процессы. По-
Покажем, что случайные величины v)h(t) и v)j(t) при кф\ некорре-
лированы, а следовательно, в силу нормального распределения —
независимы.
Рассмотрим среднее значение произведения
Щ {r\k (t) r\} (t)} = m1 IT I (t - x) cpft (a:) dx x
x j 1(^-«/)фЛ{/)^{/} = I I Фь(*)фИу)х
—oo J — oo —oo
xm1{t(t-x)l{t-y)}dxdy.
Имея в виду, что корреляционная функция белого шума со спект-
спектральной плотностью No равна N08(x) и учитывая фильтрующее
свойство дельта-функции (см. Приложение 1), находим
оо оо
т1 Ы (О ГЦ @} = No j | q)ft (X) ф/ (у) Х
—ОО ОО
оо
ХЬ(х — у) dxdy = 7V0 j фЛ (л:) ф^ (л:) d*.
00
Но собственные функции q>i(x) линейного однородного инте-
интегрального уравнения A1.6) ортонормированы, поэтому
т. е. гауссовские случайные величины щ и r\j при кФ\ незави-
независимы, причем любая из этих величин центрирована и дисперсия
при любом k
^ A1.9a)
Из A1.9) следует, что случайные величины (Sk+t\kJlkk и (Sj +
+ r\jJ/%j !при кФ\ также независимы.
Процесс ?(/) на выходе фильтра непрерывный в среднеквад-
ратическом и поэтому ji2{?(tf)}<oo> т. е. дисперсия бесконечной
суммы в A1.3) ограничена. Отсюда следует, что отношение дис-
дисперсии любого слагаемого суммы A1.3) к дисперсии всей суммы
отлично от нуля, т. е. условие C.109), при котором может при-
применяться центральная предельная теорема для суммы независи-
295
мых случайных величин, в рассматриваемом случае не выполня-
выполняется. Следовательно, распределение суммы A1.3) отличается от
нормального, т. е. процесс на выходе фильтра негауссовский.
11.2.3. Распределение процесса на выходе фильтра. Опреде-
Определим сначала характеристическую функцию суммы A1.3) при ко-
конечном числе слагаемых
х ехр {Ц- ti-2styj+!Jb- i|J dyj, A1.10)
так как в силу независимости совместная плотность вероятности
случайных величин г\\,..., т)п
( it
¦Wtoi, -,Уп)= П
Дополняя показатель экспоненты под знаком интеграла A1.10)
до полного /квадрата и интегрируя, после несложных алгебраиче-
алгебраических преобразований имеем
М*. О- П (I- ^^
Переходя к пределу при п-^-оо, находим одномерную характе-
характеристическую функцию процесса на выходе фильтра
«М,,, О- П (Г- 21^-1/2ехР [ ^ 1 . A1.12)
Если сигнал отсутствует, то Sj=O и из A1.12) следует
;=1
Одномерная плотность вероятности случайного процесса ;()
на выходе фильтра получается из A1.13) обратным преобразова-
преобразованием Фурье. Вычислить обратное преобразование Фурье от бес-
бесконечного произведения очень трудно. Приближение, быстро при-
приводящее к требуемому результату, состоит в ограничении числа
сомножителей в указанном произведении, т. е. в аппроксимации
процесса на выходе типового звена конечным числом членов ряда
A1.3). При этом (если все характеристические числа различны)
интегрирование при преобразовании от характеристической
функции к плотности вероятности выполняется достаточно просто
методами теории вычетов. Однако достижение приемлемой точ-
точности потребует все же учета большого числа членов ряда A1.3).
11.2.4. Распределение процесса на выходе квадратичного де-
детектора. Заметим также, что в формуле A1.12) содержатся яв-
явно характеристические числа Kj и неявно (в величинах Sj) соб-
296
ственные функции q>j(x), для определения которых необходимо
еще решить интегральное уравнение A1.6). Решение этого ин-
интегрального уравнения получается чрезвычайно простым, если
частотная характеристика фильтра равномерная на всех часто-
частотах. В этом случае /12(т) =6(т) и из A1.7), учитывая фильтрую-
фильтрующее свойство дельта-функции, находим
К {и, v)=hl(u)hl(v). A1.14)
Ядро A1.14) вырожденное: ему соответствует лишь одно соб-
собственное значение X и одна собственная функция ср(^) =
=з V^/ii(w), причем X находится из условия, что cp(w)—норми-
cp(w)—нормированная функция, т. е.
Отношение
представляет дисперсию шумов на выходе УПЧ [см. G.55а)]. Из
A1.12) находим в рассматриваемом случае характеристическую
функцию
f "**@ \ A1.16)
1 — 2i v o\
где Sj(t) — сигнал на выходе УПЧ.
Так как выходной фильтр имеет неограниченную полосу, то
формула A1.15)—характеристическая функция процесса на вы-
выходе квадратичного детектора (квадрата гауссовского процесса с
дисперсией g2i). Обратное преобразование Фурье от характерис-
характеристической функции A1.15) совпадает с (9.86) (конечно, при соот-
соответствующей замене а на в\).
11.2.5. Узкополосный усилитель. В этом случае после детекто-
детектора отфильтровывается высокочастотная часть процесса и на
фильтр подается квадрат огибающей
Представим узкшюлосный гауссовский случайный процесс на
выходе УПЧ в виде суммы [см. A0.35)]
A1.16)
где u\(t) и v\(t)—квадратурные составляющие сигнала S\(i)f а
A\(t) и C\(t)—независимые (в совпадающие моменты времени),
нормально распределенные квадратурные составляющие гаус-
гауссовского шума l\(t). В этом случае процесс на выходе фильтра
можно представить в виде суммы двух независимых в совпадаю-
совпадающие моменты времени слагаемых
=&(')+?.('), (П.17)
297
где
Ы') = ? [ul(t-x)+Al(i-x)]2h2(x)dx, (Ы.18>
^оо
?.(*) = ? [vi(i-x)+Ci{t-x)]2h2(x)dx. A1.19)
—оо
Так жак составляющие A\(t) и C\(t) распределены нормаль-
нормально, их корреляционные функции одинаковы и равны огибающей
корреляционной функции процесса Si (Of T0 соответствующее
рассматриваемому случаю ядро интегрального уравнения A1.6)
запишется в виде
К(и, v)=]hlQ(u-x)h2(%)hl(v-x)dx, A1.20)
— оо
где h\o(t)—огибающая импульсной переходной функции узко-
узкополосного УПЧ [см. F.35а)]. Интегральному уравнению A1.8)
в рассматриваемом случае соответствует
f(z)=X/e* ]BAl(z-x)h2(x)f(x)dx. A1.21)
—оо
Представляя каждое из слагаемых A1.17) суммой вида A1.3)
и обозначая
оо
М0= U{t—x)<Vi(x)dx, A1.22а)
00
ОО
0<(О= $v(t-x)<pi(x)dx, A1.226)
— оо
[где u(t) и i/@—квадратурные составляющие сигнала s(t)] по
аналогии с A1.10) (при замене в этой формуле один раз Si на
щ, а другой раз на Vi) получаем следующее выражение для ха-
характеристической функции отфильтрованного квадрата огибаю-
огибающей:
^ - 2i vN0 J
си.«»
Обратным .преобразованием Фурье из A1.23) находим одно-
одномерную функцию распределения процесса на выходе фильтра.
Если сигнал отсутствует, то Uj = Vj=O и из A1.23) следует
Так же, как и в предыдущем случае, для получения плотности
вероятности необходимо решить интегральное уравнение A1.21)
для того, чтобы определить в A1.23) величины Xj и <pj(x). Толь-
Только тогда, когда частотная характеристика фильтра равномерна
298
на всех частотах, произведение в правой части A1.23) содержит
только один сомножитель
I, A1.25)
— 2\vaf J
где a(t) = [u2(t) +v2(t)y>2 — огибающая сигнала. Формула A1.25)
определяет характеристическую функцию квадрата огибающей
гауссовского процесса. Обратное преобразование Фурье функции
A1.25) совпадает с A0.75).
11.2.6. Приближенный метод определения плотности вероятно-
вероятности процесса на выходе фильтра. Решение интегрального уравне-
уравнения A1.6) и преобразование Фурье от бесконечных произведений
в общем случае связаны с большими математическими трудностя-
трудностями, которые преодолеваются путем некоторых приближений. По-
Поэтому заслуживает внимания приближенный метод непосредствен-
непосредственного определения плотности вероятности процесса на выходе
фильтра, минуя этапы решения интегрального уравнения A1.6) и
обращения характеристической функции. Этот метод основан на
вычислении кумулянтов случайного процесса на выходе фильтра и
аппроксимации искомой плотности вероятности при помощи этих
кумулянтов (см. § 7.3).
Из A1.12) находим
(^U2 'vfl , (п.26)
откуда последовательным дифференцированием определяем куму-
кумулянтную функцию п-то порядка случайного процесса на выходе
фильтра [см. D.13а)]
^ 5 1 (П.27)
Аналогично можно найти кумулянтную функцию квадрата оги-
огибающей, прошедшей через фильтр [см. A1.23)]:
Д "?'У" ]¦
Если сигнал отсутствует Sj = iij=Vj=O, то
«п = ^ = BЛд"-' No (п - 1)! S Чп- A1 29)
2 /=i
Входящие в A1.27) и A1.28) ряды можно выразить через итера-
итерации К^(и, v) ядра К(и, v) [см. D.61), D.62)]:
К(п)(ц, v)= J...
(п)(ц, v)=
—оо —оо
-Ь v)dx1...dxn_u n>2, A1.30)
«, v)=K(u, v).
299
Подставляя в интеграл A1.30) вместо ядра К(х^ Xi+\) era
разложение и учитывая, что совокупность функций (pj(xk) ортого-
ортогональна и нормирована, получаем
]к{п)(и, u)du=% %Jn. A1.31)
—оо
Аналогично
\ {s(t-u)s(t~v)K{n)(u,v)dudv--=-Z-^-. A1.32)
—ОО —ОО /=1 Л у
Подставляя A1.31) и A1.32) в A1.27), находим
+ ] ]s(t-u)s(t-v)Kin)(u, v)dudv]. A1.33)
—оо —оо J
По формуле A1.33) можно определить кумулянты произволь-
произвольного (порядка случайного процесса на выходе фильтра без реше-
решения интегрального уравнения A1.6).
Нетрудно записать выражение, аналогичное A1.33), и для ку-
кумулянтов профильтрованного квадрата огибающей
*по @ = W1"' п\ \^ 1К{П) (и, и) du +
[ п L
-L
+ 2 If ]a{t-x)K{n)(x, y)a(t-y)dxdy]. A1.34)
— оо —оо J
Если сигнал отсутствует, то двойные интегралы в A1.33) и
A1.34) исчезают. В этом случае относительно просто вычисляют-
вычисляются в общем виде кумулянты первых двух порядков: среднее и дис-
дисперсия. Например, из A1.33) находим
o\ j/i2(T)dt, [A1.35)
—оо
(u, u)du =
l
jf ]кЧи, x)dudx=2Nl
— ОО —CO —ОО —ОО
—оо —оо
xdxdudxdt = 2 J Js|, (t - x) h, (x) h2 (t) dx dt. A1.36)
—oo —oo
300
Конечно, формулы A1.35) и A1.36) получаются и непосредствен-
непосредственно, если воспользоваться выражениями корреляционных функций
квадрата гауссовского процесса или квадрата огибающей гауссов-
ского процесса [см. (9.85) и A0.78)] и правилом преобразова-
преобразований корреляционной функции в линейной системе.
11.3. ПЕРЕМНОЖИТЕЛЬ-ФИЛЬТР
10.3.1. Характеристическая функция процесса на выходе фильт-
фильтра. Рассмотрим два стационарных и стационарно связанных цент-
центрированных гауссовоких случайных процесса ^\(t) и ?г@» корре-
корреляционные и взаимные корреляционные функции которых равны
соответственно Bi(t), В2{т), Bi2(t), B2\ (т). Произведение этих
процессов Ii(t)l2(t) проходит через линейную систему — фильтр с
импульсной функцией h(t).
Случайный процесс ?(/) на выходе фильтра можно представить
в виде интеграла (в среднеквадратическом)
W)=lh(t—u)l2(t—ti)h(u)du. A1.37)
—.00
Введем полусумму и полуразность перемножаемых процессов:
(Н38а)
A1.386)
Случайные процессы pi(/) и рг(О также распределены нор-
нормально с нулевыми средними, а их корреляционные и взаимные
корреляционные функции
Яр, (т) = [Si (т) + В12 (т) + В21 (т) + В, (т)]/4, A1.39а)
BPlP2 (т) = [В, (т) - В12(т) + Ва (т) - В2(т)]/4, A1.396)
Яр2Р, W = 1^1 (т) + В12 (т) - S2L (т) - В2 (т)]/4, A1.39в)
5Р2(х) = [Вг (т) - В12 (т) - В21 (т) + 52 (т)]/4. A1.39г)
Выражая в A1.37) lx(t) и |2@ через pi(t) и рг(О. получаем
?@= ]\fi(t-u)-pl(t-u)]h(u)du. A1.40)
Характеристическая функция процесса ^(t) на выходе фильт-
фильтра имеет такой же вид, что и A1.13):
/8. A1.41)
Отличие состоит лишь в том, что собственные числа %$ находятся
301
из системы двух линейных неоднородных интегральных уравне-
уравнений
Мг) = J ]яр>(г-и)А(и)Ми)Л/-
- ]BPtQt(z-u)h(u)f2(u)du], A1.41а)
/, B) = Я [ JBPiPl% (г - ы) Л (и) /х (u) du -
L—оо
- ] BP2(z-u)h(u)f2(u)du\. A1.416)
—оо J
Если li(t)=l2(t),TO pi(t)=li(t), р2@=0, уравнение A1.416)
исчезает, а A1.41а) совпадает с A1.8), как и должно быть, так
как при указанном условии рассматриваемая задача совпадает
с определением распределения квадрата стационарного гауосов-
ского случайного процесса, прошедшего через фильтр.
11.3.2. Распределение произведения гауссовских процессов.
Решение системы интегральных уравнений A1.41а, 6) связано, в
общем, со значительными трудностями. В одном частном случае
решение можно достаточно просто получить в замкнутом виде.
Как и в § 11.2, это будет тогда, когда частотная характеристика
фильтра равномерная на всех частотах и, следовательно, им-
импульсная функция фильтра h(u) =д(и). Тогда уравнения
A1.41 а,б) переходят в систему алгебраических уравнений
h (г)/к = BPl (г) fx @) - SPlP, (Z) /2 @), A1.42а)
f2 (г)/Я = 5РгР1 B) h @) - 5Р2 B) /2 @). A1.426)
Так как эти уравнения должны удовлетворяться при любом
z, то, полагая z=0, получаем
откуда
Яр.р, @), ВРф1 @) = [ВР1 @) - 1Д] [Яр. @) - 1А]. A1.43)
Обозначим
о! = Вг @), о\ = Вг @), of2 = В1г @), <т|, = Вп @) = а?2.
Тогда из A1.39а—г) следует
Яр. @) = (°? + °1 + 2о12)/4> (!} -44а)
Вр,@) = (о? + о|-2о?2)/4, A1.446)
5Plp2 @) = Bp2Pl @) = (o»-o|)/4. A1.44b)
302
Подставляя A1.44а—в) в A1.43), получаем квадратное урав-
уравнение относительно величины 1/Х
корни которого
lAi=(a212 + aia2)/2, 1Д2= (a2,2-aia2)/2. A1.45)
Первый корень положительный, а второй отрицательный, так
как e2i2^O\o2 [см. D.73)].
Подставляя A1.45) в A1.41), находим характеристическую
функцию произведения двух зависимых стационарных гауссов-
ских случайных процессов:
6E(t;) = {[l-it;(a2i2 + a1a2)][l-it;(a2i2-a1a2)]}-1/2. A1.46)
Обратным преобразованием Фурье функции A1.46) получаем
одномерную плотность вероятности этого произведения [ср. A)
в задаче 3.1]
\ Ко/ а^у] \exp
A1.47)
где Ко'(z) — функция Бесселя 2-го рода нулевого порядка от
мнимого аргумента.
11.4. СРЕДНЯЯ МОЩНОСТЬ
ПРИ КОНЕЧНОМ ВРЕМЕНИ УСРЕДНЕНИЯ
11.4.1. Широкополосный гауссовский процесс. Рассмотрим эр-
годический центрированный гауссовский процесс ?(/) с корреля-
корреляционной функцией Въ(т). Средняя мощность этого процесса, вы-
вычисленная как средний квадрат за интервал времени Г,
1 -Т/2
(Н.48)
где интеграл понимается в среднеквадратическом смысле. Харак-
Характеристическую функцию случайной величины цт можно опреде-
определить по формуле A1.13). Характеристические числа kj, содержа-
содержащиеся в этой формуле, следует находить из уравнения A1.8),
причем
(.9)
0, |т|>772,
а корреляционная функция в указанном уравнении совпадает с
Bt(%). Таким образом, в рассматриваемом случае характеристи-
характеристические числа, определяющие распределения средней мощности за
время усреднения Г, можно получить из интегрального уравнения
Т{2Вг(г-т)[(т)с1х. A1.50)
-Т/2
303
Заметим, что A1.49) представляет импульсную функцию иде-
идеального интегратора, ширина полосы частот которого пропорцио-
пропорциональна 1/7\
Найдем распределение средней мощности для случая, когда
a|T|), a>0. A1.51)
Интегральное уравнение A1.50) нетрудно привести к линей-
линейному дифференциальному уравнению второго порядка. Пред-
Представляя A1.50) с учетом A1.51) в виде
a? -7/2 г
A1.52)
и дифференцируя обе части этого равенства дважды по г, нахо-
находим
_-772
ИЛИ
!rW/() . A1.53)
Общее решение уравнения A1.53), как известно, имеет вид
f(z) =Ciexp(ibaz) +c2exp(—ibaz), A1.54)
где
b2 = 2oh/(kaT) — 1. A1.55)
Подставляя A1.54) в A1.50) убеждаемся, что это решение
является собственной функцией интегрального уравнения только
в тех случаях, когда ?>2>0 и, кроме того, величина Ь удовлетво-
удовлетворяет одному из трансцендентных уравнений
btg(a7b) = l, fectg(aH?)=—1. A1.56)
Таким образом, характеристические числа интегрального
уравнения A1.50) для случайного процесса с экспоненциальной
корреляционной функцией A1.51) г
Xk = 2eh/[aT(\ + b\)]y A1.57)
где bk — корни уравнений A1.56).
Используя A1.29) и A1.57) и заменяя Nq/Kj на 1/Я^, находим
кумулянты средней мощности г|Г> ПРИ помощи которых ino ука-
указанной в § 7.3 методике можно получить приближенное распре-
распределение случайной величины цт-
На рис. 11.1 построены кривые аппроксимации плотностей ве-
вероятности средней мощности для нескольких значений параметра
1 Так как ядро уравнения A1.50) положительно-определенное, то все его
собственные числа положительны.
304
?7 с погрешностями, не превышаю-
превышающими одного процента [34]. При |3 = 0
(т. е. при Г=0) Т1т = ?2(*) и Wi(y) пред-
представляет одномерное распределение квад-
квадрата стационарного гауссовского случай-
случайного процесса [см. C.12а)]. При увели-
увеличении jj (увеличении времени Т усред-
усреднения) выявляется минимум плотности
вероятности при r//a2i=l, т. е. в районе
среднего значения средней мощности
mi{ir]T}=a2?. Заметим, что дисперсия
средней мощности
^ М = о| [4р - 1 + ехр (-
Щ(у)
2,0
0,8
А
\J
ir
JO
[
\
A1.58)
О 0,5 1,0 1,5 j_
Рис. 11.1. Плотность веро-
вероятности средней мощности
гауссовского процесса
стремится к нулю при неограниченном возрастании времени ус-
усреднения
^2 Ш - о|/Р = 2оу<аТ). A1.59)
Распределение средней мощности при этом асимптотически нор-
нормальное
1/2
-тЫ) ехр
2о|
A1.60)
11.4.2. Средняя мощность огибающей гауссовского процесса.
Пусть l(t)—гауссовский узкополосный эргодический случайный
процесс с нулевым средним и симметричным относительно цент-
центральной частоты coo энергетическим спектром Sg(co). Корреля-
Корреляционную функцию такого процесса можно представить в виде
В I (T) =«o(t)coscoot, где ао(т)—корреляционная функция любой
из двух квадратурных составляющих процесса A(t) или C(t)
(см. п. 10.3.1). Средняя мощность огибающей E(t) процесса ^(t)
«а интервале времени Т
t. A1.61)
1 -7/2 l -Г/2
Характеристическую функцию случайной величины ?т можно
определить по общей формуле A1.24). Характеристические чис-
числа, содержащиеся в этой формуле, следует находить из инте-
интегрального уравнения A1.21), которое в рассматриваемом случае
«можно представить в виде
Г/2
} ao{z-r)f{T)dT = XTf(z). A1.62)
-Г/2
Если
=G2i exP(—a|r|), a>0,
A1.63)
305
то характеристические числа уравнения A1.62) находятся из ре-
решения трансцендентных уравнений A1.56). Конечно, распределе-
распределение средней мощности огибающей узкополосного гауосовского
процесса отличается от распределения средней мощности широ-
широкополосного гауссовского процесса, рассмотренного в п. 11.4.1,
так как одни и те же характеристические числа подставляются в
различные формулы: A1.24) для огибающей и A1.13) для широ-
широкополосного процесса.
Среднее значение случайной величины ?т равно 2а2§ , а ее
дисперсия совпадает с дисперсией случайной величины цт [см.
A1.58)]. Распределение средней мощности огибающей эргоди-
ческого гауссовского процесса асимптотически нормальное с па-
параметрами Bа2!, 2aVp), р = аГ/2.
1L5. ЗАДАЧИ
11.1. Используя формулу A1.3), доказать, что среднее значение и корре-
корреляционная функция процесса ?(?) на выходе системы УПЧ — квадратичный
детектор — фильтр, когда на его вход действует сумма детерминированного
сигнала и гауссовского белого шума со спектральной плотностью No
оо оо оо
N0 j K(u,u)du+ j j s(t — u)K(u, v)s(t-v)dudvt A)
—oo —oo
2Nl ] I K*(x.y)dxdy
—oo —oo
— oo —OO
+ 4 ^o ? 1 1 s (*! - u) К («- *) * (xt v) s (t2 - v) dxdudv + m\ {Щ)}. B)
— oo —»oo —.00
11.2. Пусть в системе УПЧ — квадратичный детектор — фильтр частотные
характеристики УПЧ и фильтра описываются гаусеовскими кривыми
CM©) =exp[-(<o-(OoJ/BP2i)], C)
C2((o)=exp[-^co2/BiP22)]. D)
Соответствующие импульсные функции имеют вид
hx (i) = Pi/ Т/2д exp (—р2^2/2) cos co0^, E)
Ла(О =Ря/У 2я exp(-pV2/2). F)
Параметры Pi и Рг просто выражаются через полосы А! УПЧ и А2 фильтра
(см. п. 7.2.8):
G)
Обозначим отношение этих параметров
v = P2/Pi=2A2/A1. (8)
Доказать, что кумулянты процесса на выходе рассматриваемой системы, ког-
306
дана вход действует сумма гармонического сигнала s (t) = а0 cos ю0* и гаус-
совского белого шума со спектральной плотностью No
fog?)" (я-1I
71 "~ (~]/ 2 )n (y*+~ )n
{.+«.[-
v)n + (У v2 + 2 - v)n
,2.3 (9)
где a2i=A^oAi, c2 = a20(/2a2i), Ai«o0, Д2<оH.
11.3. Доказать, что коэффициенты асимметрии и эксцесса процесса на вы-
выходе системы высокодобротный колебательный контур — квадратичный детек-
детектор — .RC-фильтр, когда на вход действует гауссовский белый шум, определя-
определяется по формулам
к=4/2"УТ+]Г/B+|х), Ye12F+5|i)/[B+|i)C+|i)]f A0)
где |A=Ai/A2 — отношение полос пропускания колебательного контура и филь-
фильтра.
11.4. Доказать, что коэффициенты асимметрии и эксцесса процесса на вы-
выходе системы перемножитель — 7?С-фильтр, когда на вход перемножителя
действуют гауссовский белый шум со спектральной плотностью No и стацио-
стационарный гауссовский процесс с корреляционной функцией В(х) = (aN0/2)X
Хехр(—a|t|), определяется по формулам
?_<8 l/"S" //2a , A 6A0a/P+l)
8 У Т/\Т+ J'T~ (a/P+l)Ba/p+
где p l/(/?C)
11.5. Типовое звено состоит из высокодобротного контура типа RLC, квад-
квадратичного детектора, выделяющего квадрат огибающей, и iRC-интегратора, при-
причем отношение полос цепей до и после детектора jx=3/2. Показать, что плот-
плотность вероятности процесса на выходе указанного типового звена, когда на
входе действует гауссовский белый шум
^^] A2)
где а2 — мощность шума на единицу полосы частот.
11.6. В условиях предыдущей задачи при произвольном отношении полос
|х и конечном времени Т последетекторного интегрирования показать, что рас-
распределение процесса на выходе типового звена определяется из общей формулы
'{11.13) подстановкой собственных значений ^j=Dji^2j)-1, где qj — положитель-
положительные корни уравнения
( - а Т/2) qj) N^ (qj) = /ц_, (qj) N^ (exp ( ^ a T/2) qj), A3
где Jn и Nm — функции Бесселя первого и второго рода, a=l/(RC).
11.7. Процесс ?(?) представляет результат прохождения гауссовского бело-
белого шума через колебательный контур, образованный последовательным соедине-
307
нием резистора \R, катушки индуктивности L и конденсатора С (см. п. 7.2.7>
величина Q по-прежнему обозначает добротность контура, а соо= 1/ "VLC —
резонансную частоту). Доказать, что среднее значение и дисперсия средней
мощности т]г этого процесса за время усреднения Т:
=^Г [2р-1+ехр(-2р) +
где p = o)o71/BQ). Доказать, что при р->-оо (т .е. при неограниченном увеличе-
увеличении времени усреднения Т) распределение случайной величины т]г асимптоти-
асимптотически нормальное с параметрами (а2|, о^/р)-
11.8. В условии задачи 11.7 процесс %(t) — узкополосный (добротность
Q>1). Вывести следующее выражение плотности вероятности средней мощ-
мощности процесса ?(/) за конечное время усреднения
A5)
°2 Ij L * W a2 ^J
где
A6>
Доказать, что формула A5) представляет плотность вероятности суммы квадра-
квадратов двух независимых центрированных гауссовских случайных величин с дис-
дисперсиями СТ21 И <J22.
Часть вторая
СИНТЕЗ
Глава 12
ФОРМУЛИРОВКА ЗАДАЧ СТАТИСТИЧЕСКОГО
СИНТЕЗА
12.1. ОБЩИЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ
СТАТИСТИКИ
12.1.1. Проблема априорной неопределенности. Основой изла-
излагаемой в этой книге теории и ее приложений являются матема-
математические модели реальных явлений—распределения вероятностей
случайных событий, случайных величин и случайных процессов.
Полнота модели определяется априорными данными, накоплен-
накопленными предыдущим опытом и дополненные интуицией ученых и
инженеров.
Рассмотренные ранее задачи решались методами теории веро-
вероятностей и теории случайных процессов в предположении, что
математическая вероятностная модель исследуемых процессов
полностью определена, т. е. известны точно все необходимые по
условию задачи распределения вероятностей. Это были типовые
задачи вероятностного анализа процесса на выходе системы, ког-
когда на входе действует случайный процесс при условии, что за-
заданы как характеристики системы, так и требуемые вероятност-
вероятностные характеристики входного процесса.
Однако более сложной и чаще возникающей ситуацией, с ко-
которой встречается исследователь физических явлений или разра-
разработчик технической системы, является априорная неопределен-
неопределенность, когда вероятностная математическая модель изучаемого
явления или процессов, протекающих в системе, неизвестна или
определена не полностью. Преодоление априорной неопределен-
неопределенности — существо многих задач, решаемых в естествознании и
технике. Прием сигналов на фоне случайных помех представляет
типичный пример задач подобного рода в системах связи, радио-
радиолокации, управления. При постановке задач, решаемых в таких
системах, ситуация неопределенности характеризуется отсут-
отсутствием сведений о сообщении, которое закодировано в передан-
переданном сигнале.
Методы преодоления априорной неопределенности — предмет
математической статистики. «Сырьем» для формирования статис-
309*
тических выводов о неизвестных характеристиках вероятностной
математической модели всегда служат результаты эксперимента,
наблюдений, испытаний. Задача статистического синтеза — по-
построение алгоритмов обработки наблюдаемых эксперименталь-
экспериментальных данных для получения указанных статистических выводов.
Таким образам, решение задачи анализа обусловлено пол-
полностью определенной (априори) вероятностной моделью иссле-
исследуемого случайного процесса, а решение задачи статистического
синтеза — наличием хотя бы одной реализации этого процесса,
которая дополняет, эту модель, когда не все ее характеристики
известны.
12.1.2. Основные виды задач математической статистики. Ис-
Исследуется физическое явление или технический объект, математи-
математическую модель которых представляет случайный процесс X{t) с
неполностью известными характеристиками. Относительно неиз-
неизвестных характеристик модели выдвигаются взаимно несовмести-
несовместимые гипотезы Но, Яь... ,ЯШ. Задача проверки статистических
гипотез состоит в принятии одной из них по результатам наблю-
наблюдения реализации x(t)t O^.t^.T случайного процесса X(t). Дру-
Другим видом задач математической статистики является оценивание
неизвестных параметров распределения вероятностей случайного
процесса X(t) с помощью реализации x(t) этого процесса, на-
наблюдаемой на конечном интервале времени (О, Т).
На практике указанные два вида задач математической ста-
статистики — проверка гипотез и оценивание — рассматриваются
раздельно. В общей теории статистических решений в таком раз-
разделении нет необходимости. Но на практике иногда необходимо
учитывать взаимосвязь обоих видов задач и формулировать эту
взаимосвязь как совместную проверку гипотез и оценивание па-
параметров.
Приведенные определения задач математической статистики
нельзя считать их полной постановкой, хотя они и используют не-
некоторые априорные сведения и включают простейшие элементы
понимания смысла задач. Для такой постановки и формулировки
необходимых ограничений требуется подробно рассмотреть апри-
априорные данные.
12.2. АПРИОРНЫЕ ДАННЫЕ
12.2.1. Пространство наблюдений. Совокупность всех мысли-
мыслимых реализаций x{t) наблюдаемого случайного /процесса X(t)
образует пространство наблюдений.
При аналоговой форме регистрации (отображения) наблюде-
наблюдений множество Т моментов времени наблюдения (область опре-
определения случайного процесса X(t)) —континуальное. Пространст-
Пространство наблюдений в этом случае — функциональное пространство
непрерывных (или кусочно-непрерывных) функций.
При дискретной форме регистрации непрерывная реализация
x(t) подвергается временной дискретизации и тогда множество
310
T — конечное или счетное. В этом случае при ограниченных дли-
длительности наблюдения и интервале дискретизации наблюдение
представляется конечно-мерным вектором
x=xni=(xi,... ,хп), Xi = x(U)9 xgX^, tit=T, 1=17л, A2.1)*
где Хп — подмножество /г-мерного евклидового пространства. Век-
Вектор х называют выборкой размером я, а подмножество Хп — вы-
выборочным пространством.
Если элементы дискретной выборки — выборочные значения
Хи ••• >Хп — представляют совокупность независимых случайных
величин, то выборку х называют независимой (или случайной), а
если выборочные значения зависимы, то выборку х называют за-
зависимой. Если все элементы независимой выборки подчиняются
одному и тому же распределению F(x), то выборка х называется
однородной. В этом случае часто говорят, что выборка х получена
из распределения F(x) или что она принадлежит распределению
F(x).
Элементы дискретной выборки могут подвергаться квантова-
квантованию по уровням (см. п. 8.3.1). В этом случае из наблюдаемой
выборки х= (х\,..., Хп) получаем выборку k= (ku ..., kn) того же
размера, элементы k\ которой могут принимать значение из ко-
конечного множества уровней квантования. Множество К квантован-
квантованных выборок представляет решетчатое пространство наблюдений.
12.2.2. Вероятностная мера на пространстве наблюдений. При
дискретной форме регистрации наблюдений вероятностная мера
на пространстве наблюдений представляет совместное конечно-
конечномерное распределение выборочных значений случайного процес-
процесса. Плотность этого распределения называют функцией правдо-
правдоподобия выборки1.
Различают два класса функций правдоподобия: параметри-
параметрический и непараметрический. Функция правдоподобия параметри-
параметрического класса Щх^), хеХп, Фев при каждом фиксирован-
фиксированном векторе параметров Ф представляет известную функцию ар-
аргумента х. Априорная неопределенность в этом случае состоит в
том, что положение вектора Ф в пространстве параметров в (об-
(область параметрической неопределенности) заранее неизвестно.
Для непараметричеокого класса вид функции правдоподобия не
задан. Этот класс включает любые неотрицательные нормирован-
нормированные функции W(x) выборочных значений х, х^Хп.
При аналоговой форме регистрации на пространстве наблю-
наблюдений задается плотность вероятности меры, абсолютно непре-
непрерывной по отношению к другой мере (производная Радона —
Никодима) [35].
1 Заметим, что в отличие от первой части, где случайные величины и аргу-
аргументы соответствующих им функций распределения обозначались разными сим-
символами греческими и латинскими, здесь элементы выборки и аргументы соответ-
соответствующей функции правдоподобия обозначаются одинаковыми символами, что,,
однако, не должно служить поводом для отождествления этих величин.
311
12.2.3. Априорное распределение неизвестных параметров. В
условиях параметрической неопределенности возникает вопрос:
какова природа параметра Ф, определяющего семейство функций
правдоподобия, является ли этот параметр неизвестной векторной
константой или векторной случайной величиной с известной плот-
плотностью вероятности до(Ф), определенной на пространстве пара-
параметров в. Ответ на этот вопрос также относится к априорным
данным и любое из двух предположений о полной неопределен-
неопределенности значения параметра в данном параметрическом простран-
пространстве или о вероятностном распределении параметра на этом про-
пространстве можно принять за основу лри построении теории ста-
статистических решений.
В задачах проверки гипотез можно за неизвестный параметр
принять номер гипотезы. Задавая априорные вероятности гипотез
/-0, m, 2ft->. О2-2)
/=o
введем случайный параметр Ф, принимающий целочисленные зна-
значения от нуля до т, с распределением вероятностей A2.2) и плот-
плотностью распределения
Ш(О)== 2 Pj6 (*-/), A2.2а)
где 5(х) —дельта-функция.
12.2А. Пространство решений и правило выбора решения.
Каждое решение представляет статистический вывод на основе
наблюдений. Множество возможных решений образует простран-
пространство решений Г. В задачах проверки гипотез множество Г — ко-
конечное, состоящее из элементов
7г^Г, t = 67m, A2.3а)
где ^г—решение принять гипотезу Hi. В задачах оценивания па-
параметров пространство решений Г совпадает с пространством па-
параметров 0, а элементами множества Г являются оценки неиз-
неизвестного параметра
7==^^е=г. A2.36)
Как функция у(х) выборки или как функционал y[#@1 от на"
блюдаемой реализации решение y является случайной величиной,
которую называют статистикой.
Каждое правило выбора решения б (алгоритм обработки на-
наблюдаемой реализации с принятием решения) отображает про-
пространство наблюдений X на пространстве решений Г:
Х-^Г, A2.4)
В задачах проверки гипотез Hj, / = 0, т по выборке х разме-
размером п каждое оравило выбора решения б предписывает разделе-
312
ние выборочного пространства Хп на т+1 непересекающихся об-
областей:
Х.еХ", / = 0, т, U Х,- = Xя. A2.5а)
Если наблюдаемая выборка попала в область Xj, то принимается
решение Vj
6 : х-ну,-, хеХ,-, Vi^r, 6e=D. A2.56)
Совокупность D правил выбора решения представляет всех воз-
возможные способы разделения выборочного пространства Хп на
т+1 непересекающихся областей.
В задачах оценивания по выборке х размером п каждое пра-
правило выбора решения устанавливает соответствие между элемен-
элементами выборочного пространства и пространства решений изо-
изоморфному пространству параметров
8: х-**, хеХпДЕв, 8<е=Д A2.6)
В дальнейшем правило выбора решения, т. е. алгоритм обра-
обработки наблюдений с принятием решения, будем кратко называть
алгоритмом принятия решения. Аналоговому и дискретному пред-
представлениям наблюдений соответствуют аналоговые и дискретные
алгоритмы обработки. Последние разделяются на два вида: дис-
дискретно-аналоговые при дискретизации только по времени и циф-
цифровые при дискретизации и по времени, и по уровню наблюдаемой
реализации случайного процесса.
Алгоритм принятия решения может быть одношаговым, когда
решение выдается один раз в результате обработки входных дан-
данных за весь фиксированный интервал наблюдений. Он может
быть и многошаговым или последовательным, когда длительность
интервала наблюдения заранее не фиксируется. Решение может
приниматься на любом этапе наблюдения или не выноситься
впредь до получения дополнительных данных при продолжении
наблюдения.
12.2.5. Плата за принятие решения. Принятие решения по лю-
любому правилу на основе одной реализации наблюдаемого случай-
случайного процесса не может быть всегда безошибочным. Так, при про-
проверке гипотез наблюдаемая случайная выборка может попасть в
область Хь и будет принято решение yk (см. A2.56)), хотя в дей-
действительности имеет место гипотеза #г-, 1Фк. При формировании
оценки Ь неизвестного параметра Ф по случайной выборке неиз-
неизбежны случайные ошибки b—#=И=0.
Таким образом, принятие решений связано не только с опреде-
определенными затратами на обработку наблюдений для получения пра-
правильных решений, но и с определенными потерями, если решения
оказываются ошибочными. Эти затраты и потери можно учесть,
вводя априори так называемую функцию потерь, которая каждой
паре утверждений истина — принятое решение ставит в соответ-
31 а:
«ствие неотрицательную величину — плату за принятие решения.
Так, в задачах проверки гипотез Hjf /=0, /п, вводится матрица по-
потерь размером (т-\-1) X (т+1), элемент П^^О которой является
платой за решение уи, когда истинной была гипотеза #;, /, &=0, m.
!В задачах оценивания параметров вводится неотрицательная функ-
пия потерь П(Ь9 Ф), зависящая от двух переменных: случайной
оценки Ф и оцениваемого параметра Ф.
12.3. КРИТЕРИИ КАЧЕСТВА
12.3.1. Предварительные замечания. Статистическому синтезу
алгоритма принятия решения всегда предшествует выбор крите-
критерия качества алгоритма. Без формулировки критерия качества за-
задача синтеза становится бессодержательной. Синтез оптимального
алгоритма всегда связан с нахождением экстремума определенного
критерия качества. Алгоритм, оптимальный по данному критерию
качества, может оказаться неоптимальным по другому критерию.
Критерий качества используется и для сравнения двух любых ал-
алгоритмов, даже неоптимальных, а также оптимального с квазиоп-
квазиоптимальным, полученным эвристически или путем упрощения струк-
структуры оптимального алгоритма.
Использование того или иного критерия качества алгоритма
принятия решения зависит от полноты располагаемых априорных
данных. Критерий качества может быть векторным, когда к алго-
алгоритму предъявляется несколько требований. Будем рассматривать
только скалярные критерии качества. Ограничимся сначала клас-
классом дискретно-аналоговых одношаговых алгоритмов принятия ре-
решений и проанализируем несколько критериев качества, каждый
из которых соответствует определенному набору располагаемых
априорных данных.
12.3.2. Критерии качества алгоритма проверки гипотез. Сред-
Средний риск. При наличии полного комплекта априорных данных,
указанных в § 12.2, используется критерий среднего риска — сред-
среднее значение платы за принятие решения при проверке статисти-
статистических гипотез. Если выдвигаются т+1 гипотез #j, /=0, m, то
плата за решение представляет дискретную случайную величину П
с (т+1J возможными значениями П^, /, &=0, т, задаваемыми
матрицей потерь. Так как
Р{П = П;,}=^ЬПЯЛ, A2.7)
то по определению среднего значения дискретной случайной вели-
величины находим выражение среднего риска
m m
Я =2 2П^Р{7ьПЯЛ. A2.8)
Но согласно правилу умножения (см. п. 1.2.2)
РЬЛЯ;}=Р{Я,}РЫЯ;}. A2.9)
.314
Используя A2.2) и A2.56), получаем из A2.9)
Р {7*П#;} =PjP {xeX, | Я,-}, A2.10)
причем
Р{хе=Хк\Н,} = J W(x\HjT<b, A2.11)
Xh
где W(x\Hj)—функция правдоподобия выборки х при условии,
что верна гипотеза Hj.
Из A2.8) — A2.11) следует
. Я- 2 2 HjhPj I W(x\Hj)dx. A2.12)
Апостериорная вероятность гипотезы. Если мат-
матрица потерь априори не задана, то критерием качества алгоритма
Принятия решения может служить апостериорная вероятность ги-
гипотезы P{Hj\x} при условии, что наблюдается выборка х. По^
формуле Байеса получаем
/ш
2PjW(x\Hu)9 / = 0, т. A2.13)
*=о
Вероятность правильного решения. Другим кри-
критерием в условиях априорной неопределенности матрицы потерь
является вероятность правильного решения
{m \ m
U(Y*n//ft) =2M ^W#ft)dx. П2.14)
Вероятность ошибочного решения
Рош=1— Рпр. A2.14а)
Нетрудно убедиться в том, что вероятность ошибки рОш совпа-
совпадает с частным значением среднего риска R, когда платы удовле-
творяют условию П^ = 1—6jft, где 6jk — символ Кронекера,
/, & = 0, т.
Численные значения приведенных критериев качества зависят
от принятого правила разбиения выборочного пространства X на
области Xj, / = 0, m, т. е. от правила выбора решения 6 (алгорит-
(алгоритма проверки гипотез).
12.3.3. Критерии качества алгоритма оценивания параметров.
Средний риск. Аналогично п. 12.3.2 при наличии полного ком-
комплекта априорных данных в задачах оценивания параметров ис-
используется критерий среднего риска — среднего значения функ-
функции потерь. Если предположить, что оцениваемый параметр пред-
представляет векторную случайную величину с известной плотностью
вероятности w^), заданной на пространстве параметров В, то
совместная плотность вероятности оцениваемого параметра Ф и
выборки х, которая используется для оценки *(х), Wft, x) =
315*
= w(Q)W(x\Q), #евт, xGXn. Тогда среднее значение потерь
Щ-О^х), Ф] как функции от совокупности случайных величин
<д, Ь(х)
^ *)}= J jn[*(x)f *]^(*)^(x|*)d*dx. A2.15)
Апостериорная плотность вероятности. Если
функция потерь не задана, то критерием качества может служить
какая-либо числовая характеристика, (мода, среднее) апостери-
апостериорной плотности вероятности W(ft\x) параметра # при условии,
что наблюдается выборка х. По формуле Байеса получаем
W{Q\x)=w(Q)W{x\Q)\l J w(ft)W(x\ft)d®. A2.16)
9m
Средний квадрат ошибки. Часто используется как
критерий качества алгоритма оценивания средний квадрат ошиб-
ошибки е = Ф—О
-fl]2}. A2.17)
Ясно, что значение среднего квадрата ошибки совпадает с част-
частным значением среднего риска R при квадратичной функции
потерь
П(?, 0) = F—ОJ = е2. A2.17а)
12.4. СТАТИСТИЧЕСКИЙ СИНТЕЗ
ОПТИМАЛЬНЫХ АЛГОРИТМОВ
12.4.1. Предварительные замечания. В отличие от эвристиче-
эвристического решения, которое может отражать субъективное отношение
человека к наблюдению, оптимальный алгоритм принятия реше-
решения (оптимальное правило выбора решения) устанавливается до
наблюдения по заданному критерию качества. Такой алгоритм
может использоваться человеком-оператором, а также автоматом
или ЭВМ по заранее определенной программе. Как было показа-
показано в § 12.3, задание критерия качества обусловлено априорными
данными. Отсутствие необходимых априорных данных вынуждает
отказаться от одних критериев оптимальности и принимать
Другие.
Здесь будут приведены лишь формулировки задач статистичес-
статистического синтеза оптимальных алгоритмов принятия решений по задан-
заданным критериям качества, решение которых составит содержание
последующих глав. Хотя далее в этой главе рассматривается
только класс дискретно-аналоговых, одношаговых алгоритмов, в
последующих главах теория статистического синтеза будет ох-
охватывать и аналоговые, и цифровые алгоритмы.
316
12.4.2. Байесовские алгоритмы. Оптимальный алгоритм
принятия решения 6б называется байесовским, если при его ис-
использовании достигается минимальное значение (нижняя грани-
граница) среднего риска
A2.18)
или
A2.18a)
Поэтому байесовский алгоритм называют оптимальным по кри-
критерию минимума среднего риска. Решение 7б(х)> принимаемое со-
согласно этому алгоритму при наблюдении выборки х, называют
байесовским.
Задача статистического синтеза байесовского алгоритма про-
проверки гипотез состоит в определении такого разделения выбороч-
выборочного пространства Хп на непересекающиеся области Xj, / = 0, /п,
которое удовлетворяет условию B.18) [см, также A2.56) и
(А2.12)].
Задача статистического синтеза байесовского алгоритма оце-
оценивания параметра Ф^б состоит в определении оценки ()
которая удовлетворяет условию A2.18) [см. также A2.6) и
02.15)].
Заметим, что из A2.15) и A2.16) следует
) J П [*(*), *]\F(<>|x)d*dx, A2.19)
где
W(x)= J w(H)W(x\*)d1*. A2.19а)
Функционал
f x}= jn[*(x)f #]№(fl|x)d# A2.20)
QtJl
называется апостериорным риском, так как представляет усред-
усредненную по апостериорной плотности Щ-О^х) плату за ошибки
при оценивании параметра в1.
Ввиду того, что ЩхJ^0, для выпуклой положительной функ-
функции потерь оценка, минимизирующая апостериорный риск, мини-
минимизирует и средний риск R, т. е. является байесовской.
12.4.3. Минимаксные алгоритмы. Предположим, что в задаче
проверки гипотез априорное распределение ро, Рь ..., рт неизвест-
неизвестно. В этом случае можно определить т+\ условных рисков
Лр,, / = 0,т. A2.21)
*=о k
317
В этих условиях априорной неопределенности можно использовать
критерий минимакса, согласно которому алгоритм принятия ре-
решения (правило разделения выборочного пространства на непе-
непересекающиеся области) является оптимальным, если при его ис-
использовании минимизируется максимальный из условных рисков.
Доказано (см., например, [26]), что минимаксный алгоритм сов-
совпадает с байесовским для наименее благоприятного априорного
распределения гипотез
min max r7-== max mini?. A2.22)
Для аналогичной ситуации в задаче оценивания параметра О,
когда априорная плотность вероятности неизвестна, можно опре-
определить функцию условного риска
r^(*)= jn[*(x)f O]lP(x|O)dxf fl€Eem. A2.23)
X"
В этом случае оптимальность может основываться на минимакс-
минимаксном критерии, согласно которому наилучшей является минимак-
минимаксная оценка Фмм, для которой верхняя граница значений функции
г(Ф) не превосходит верхних значений этой функции при любых
других оценках:
max r. («)<max г Л*), #€Евт . A2.24)
Как и в задаче проверки гипотез, минимаксный алгоритм оцени-
оценивания совпадает с байесовским для наименее благоприятного ап-
априорного распределения оцениваемого параметра,
12.4.4. Алгоритмы максимальной апостериорной вероятности и
максимальной апостериорной плотности вероятности. Предполо-
Предположим, что в задаче проверки гипотез матрица потерь неизвестна.
В этом случае по формуле A2.13) можно определить апостериор-
апостериорные вероятности гипотез Р{#;|х}, / = 0, т. Алгоритм 8Мап провер-
проверки гипотез называется оптимальным по критерию максимальной
апостериорной вероятности, если при его использовании принимает-
принимается решение уи, когда
P{Hk\x}= max P{#7.|x}, xgeX^. A2.25)
В аналогичной ситуации в задаче оценивания параметра Ф,
когда неизвестна функция потерь, можно по формуле A2.16) оп-
определить апостериорную плотность вероятности параметра
W('Oi|x). Оценка #Мап называется оценкой максимальной апосте-
апостериорной плотности вероятности оцениваемого параметра, если
, хееХп. A2.26)
12.4.5. Алгоритм максимального правдоподобия. Если в зада-
задаче проверки гипотез неизвестны и априорное распределение гипо-
318
тез, и матрица потерь, то синтез оптимального алгоритма может
основываться лишь на функции правдоподобия. Оптимальный ал-
алгоритм проверки гипотез 6МП называется алгоритмом максималь-
максимального правдоподобия, если при его использовании
W(x\Hk)=maxW(x\Hj)9 хееХ^. A2.27)
В аналогичной ситуации в задаче оценивания параметра Ф,
когда неизвестны априорная плотность w (О) и функция потерь,
оптимальная оценка Фмп называется оценкой максимального прав-
правдоподобия, есл'И
*Mn = arg max 1Р(х|О), xgX". A2.28)
12.4.6. Алгоритм различения гипотез, оптимальный по крите-
критерию Неймана—Пирсона. Рассмотрим задачу проверки гипоте-
гипотезы Но против альтернативы Hi в ситуации априорной неопреде-
неопределенности, когда априорные вероятности гипотез, а также матри-
матрицы потерь неизвестны. Для указанной бинарной (одноальтерна-
тивной) задачи проверки гипотез при использовании любого пра-
правила выбора решения возможны два ошибочных решения yi\Ho,
уо\Н1 и два правильных у\\Ни уо\Но. Условные вероятности
A2.29)
A2.30)
называют вероятностями ошибок первого и второго рода соответ-
соответственно.
Ясно, что вероятности правильных решений
P{Yil#iHl-P, Р{Уо\Но}=1-а. A2.31)
Алгоритм 6н-п называется оптимальным по критерию Нейма-
Неймана — Пирсона, если при его использовании достигается мини-
минимальное значение ошибки второго рода
A2.32)
при заданном ограничении вероятности ошибки первого рода
12.5. ВЕРОЯТНОСТНЫЙ АНАЛИЗ АЛГОРИТМОВ
ПРИНЯТИЯ РЕШЕНИЯ
12.5.1. Предварительные замечания. На этапе синтеза алгорит-
алгоритма принятия решения (оптимального, квазиоптимального, эврис-
эвристического) формируются статистики — функции выборочных зна-
значений, которые используются для принятия одной из гипотез или
для оценивания неизвестных параметров. Процесс формирования
этих статистик представляет прямое описание алгоритма, необхо-
319
димое для реализации алгоритма техническими средствами. Од-
Однако на этапе прямого описания алгоритма принятия решения
исследование физического явления или проектирование техниче-
технического объекта не заканчивается. Требуются рабочие характерис-
характеристики (количественные показатели) алгоритма. Для их расчета не-
необходимо определять распределение вероятности или моменты
распределения статистик, используемых в алгоритмах. Этот за-
завершающий этап исследования или проектирования назовем ве-
вероятностным анализом (косвенным описанием) алгоритма приня-
принятия решения, который проводится методами теории вероятностей
и теории случайных процессов, изложенными в части I книги.
12.5.2. Характеристики алгоритмов проверки гипотез. Рабочую
характеристику алгоритма проверки гипотез представляет значе-
значение принятого критерия качества алгоритма, например среднего
риска, апостериорной вероятности гипотезы, вероятности правиль-
правильного решения. Для байесовского алгоритма различения гипотез
рабочей характеристикой служит минимальный (байесовский)
средний риск. Для алгоритма максимальной апостериорной веро-
вероятности— эта вероятность гипотезы. Для алгоритма, оптималь-
оптимального по критерию Неймана — Пирсона, — минимальная ошибка
второго рода при фиксированной ошибке первого рода.
Для) сравнения двух алгоритмов проверки гипотезы Яо про-
против альтернативы Н\ иногда используют непараметрический кри-
критерий качества — коэффициент относительной эффективности
(КОЭ). Пусть 8^ и 8^} —два одношаговых алгоритма приня-
принятия решения по выборкам размерами щ ип2 соответственно. Потре-
Потребуем равенства ошибок первого и второго рода при использова-
использовании и того, и другого алгоритмов [см. A2.29) и A2.30) ]
<12-зз>
Отношение размеров выборок
p(/ii, n2)=n2/n] A2.34).
называют коэффициентом относительной эффективности алгорит-
алгоритма 6A) по отношению к алгоритму 8B). Если р>1, то алгоритм
б*1) лучше (эффективнее) алгоритма 6B).
Если не удается вычислить КОЭ, то для сравнения двух алго-
алгоритмов используют предельное значение этой величины
> л2), A2.34а)
которое называют коэффициентом асимптотической относительной
эффективности (КАОЭ).
12.5.3. Характеристики оценивания. Рабочую характеристику
алгоритма оценивания параметра представляет принятый крите-
критерий качества оценки, например средний риск, а для байесовской
оценки — минимальный (байесовский) риск.
Широко используемыми характеристиками оценок параметров
являются их моменты первого и второго порядка — средние зна-
320
чения и дисперсии. Если среднее значение оценки Оп(х) совпада-
совпадает при любом п со средним значением оцениваемого параметра О,
т. е.
mi{On(x)}-O, A2.35)
то ее называют несмещенной оценкой. В классе несмещенных эф-
эффективной называют оценку с наименьшей дисперсией (средним
квадратом ошибки). Если
О_(х)) = О, A2.35а)
то оценку Оп называют асимптотически несмещенной оценкой па-
параметра О.
Для сравнения двух оценок ОпA) и ОпB) скалярного параметра
О по выборке размером п используют относительную эффектиа-
ность i
Щ/т, {(*П) - Щ A2.36а)
для оценок с заданным смещением mi{bn}—•&=bn(ft) и
e» = \b{fyV\b{fy} A2.366)
для несмещенных оценок. Если вп>1, то оценка ОпA) лучше (эф-
(эффективнее) оценки ОпB). Если ОпA)= (Оп)эф — эффективная оцен-
оценка, то еп>\ при любых оценках dnB).
Иногда для сравнения качества двух оценок используют асим-
асимптотическую относительную эффективность (АОЭ)
На основе введенных в этой главе понятий и определений
выявляется следующая последовательность этапов (структурная
схема) решения задач статистического синтеза:
формулировка задачи (цели исследования),
укомплектование априорных данных,
принятие критерия качества,
синтез оптимального алгоритма принятия решения,
анализ рабочих характеристик оптимального алгоритма.
После указанных этапов выполняют анализ сложности реали-
реализации оптимального алгоритма, возможные его упрощения на ос-
основе квазиоптимального или эвристического алгоритма и сравне-
сравнения рабочих характеристик последних с рабочей характеристикой
оптимального алгоритма.
П-87 321
Когда имеется полный комплект априорных данных, возможен
синтез оптимального байесовского алгоритма принятия решения.
Таким образом, байесовский алгоритм синтезируется в условиях
полной априорной информации.
Неполнота априорных данных—априорная неопределен-
неопределенность— преодолевается различными путями. Один из них — син-
синтез алгоритма по критерию качества, согласованного с имеющи-
имеющимися априорными данными, как было указано в п. п. 12.4.3—
12.4.6. При этом, однако, всегда предполагается знание функции
правдоподобия выборки, которое представляет наиболее значи-
значимую априорную информацию. В этой связи будем относить апри-
априорную неопределенность (в узком смысле) к незнанию функции
правдоподобия выборки. Имея в виду два класса функций прав-
правдоподобия — параметрический и непараметрический — выделим
два основных типа задач синтеза алгоритмов принятия решения
в условиях априорной неопределенности: в условиях параметри-
параметрической и непараметрической априорной неопределенности.
Глава 13
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
13.1. ОДНОШАГОВЫЕ АЛГОРИТМЫ ПРОВЕРКИ ПРОСТОЙ
ГИПОТЕЗЫ ПРОТИВ ПРОСТОЙ АЛЬТЕРНАТИВЫ
13.1.1. Постановка задачи и априорные данные. Наблю-
Наблюдается реализация исследуемого случайного процесса. Результат
наблюдения представляется в виде выборки х= (xi, ..., хп) фикси-
фиксированного размера п. Выдвигается простая гипотеза Но о том, что
функция правдоподобия выборки равна Щх|#0), против простой
альтернативы, что эта функция равна W(x\Hi). Гипотеза (и аль-
альтернатива) называется простой, если она полностью определяет
функцию правдоподобия, и сложной, если она представляет конеч-
конечное, счетное или континуальное множество гипотез. Примером
сложной гипотезы является предположение о том, что выборка х
характеризуется параметрическим семейством Щх|Ф) функций
правдоподобия, причем Феб ив — конечное, счетное или конти-
континуальное множество.
Задача состоит в том, чтобы по результату наблюдения — вы-
выборке х — принять или отвергнуть гипотезу Но. Рассмотрим пол-
полный комплект априорных данных для этой задачи.
При фиксированном размере выборки пространством наблюде-
наблюдений (выборочным пространством) является /г-мерное евклидово
пространство Хп, на котором заданы две функции правдоподобия
Щх|#0) и W(x\Hi), xgX71. Известны, кроме того, априорные ве-
322
роятности гипотезы Яо и альтернативы Яь которые образуют
полную группу событий
Ро = Р{#о} = 1—Р{#,} = 1—pi. A3.1)
Пространство решений Г состоит из двух элементов: у0 — реше-
решения принять гипотезу Яо, yi — решения принять альтернативу Hi
(отклонить гипотезу Яо).
Рассматривается класс D дискретно-аналоговых, одношаговых
алгоритмов принятия решения. Каждый алгоритм (правило выбо-
выбора решения) 8eD предписывает в этом случае разделение выбо-
выборочного пространства Хп на две непересекающиеся области
Хо и Хь XoljXi = X>. Если наблюдаемая выборка попала в область
Хо, то принимается решение ^о» а если в область Xi, то реше-
решение Vi-
В математической статистике область Хо принятия гипотезы
Яо называют допустимой, а область Xi отклонения этой гипоте-
гипотезы — критической.
Матрица потерь
п /П00П01\ По1>Поо>О) п10>Пг1>0 A3.2)
состоит из четырех элементов: по главной диагонали расположе-
расположены платы за правильные решения, а по побочной — платы П01 и
Пю за ошибки первого рода yi[)H0 и второго рода уо(]Нх соответ-
соответственно.
Так как при проверке простой гипотезы Но против простой
альтернативы Hi функции правдоподобия Щх|Я0), W(x\H\) пол-
полностью известны, то согласно предложенной в п. 12.6 терминоло-
терминологии синтез алгоритма принятия решения по любому критерию
в рассматриваемом случае является синтезом в условиях полной
априорной информации.
13.1.2. Условные вероятности ошибок и априорные вероятности
ти решений. Запишем выражения для условных вероятностей оши-
ошибок. Вероятность а ошибки первого рода [см. A2.29)]:
а = Р{71!Я0} = Р{хеХ1|Я0}= {W(x\H0)dx. A3.3)
Xt
Вероятность правильного решения, состоящего в принятии верной
гипотезы Яо, дополняет указанную вероятность до единицы, т. е.
= 1- JH7(x|#0)dx=l-a. A3.3а)
х»
Вероятность |3 ошибки второго рода
Р = РЫЯ1} = Р{хеХ0!#1}= ^(xltfjdx. A3.4)
Хо
Вероятность правильного решения, состоящего в отклонении
ложной гипотезы Яо, дополняют р до единицы, так как
И* 323
-1- ГЯ7(х|Я1)с1х=1-р- A3.4a)
Xo
Вероятность а ошибки первого рода (т. е. вероятность отверг-
отвергнуть правильную гипотезу Яо) в математической статистике на-
называют уровнем значимости, а вероятность 1—р отвергнуть лож-
ложную гипотезу — мощностью правила выбора решений1.
Априорные вероятности решений ^о и у\
+piP, A3.5а)
l—P) A3.56)
определяют частоты появления отдельных решений в длинной по-
последовательности принятия решений. В A3.5а и б) pip, poa—ап-
poa—априорные вероятности ошибок, а роA—a), pi(l—Р)—априорные
вероятности правильных решений.
Для заданного размера выборки вероятности ошибок и перво-
первого и второго рода невозможно одновременно сделать сколь угод-
угодно малыми. Например, чтобы ошибки первого рода появлялись
1редко, можно уменьшить до очень малого размера критическую
Область Хь Но при этом допустимая область будет охватывать
почти все выборочное пространство, что приведет к недопустимо-
недопустимому увеличению вероятности ошибок второго рода. Поэтому для
того, чтобы сформулировать то или иное правило выбора реше-
решений, необходимо выработать какие-то разумные подходы. Путь к
таким подходам указывают критерии качества, рассмотренные в
§ 12.3.
13.1.3. Байесовский алгоритм. Используя указанный весь ком-
комплект априорных данных, запишем выражение среднего риска
[см. A2.12) при т = 1]
R = poro + piru A3.6)
где
1—a)-i-nOia, A3.7)
A—р) A3.8)
1 Решающая функция Ф(х) для нерандомизированного правила выбора ре-
решения Ф(х) = j q *^х* ' Т' е> является своеобразным счетчиком попадания вы-
выборки х =•(*!, ..., хп) в критическую область. Формулы A3.3) и A3.4а) при по-
помощи решающей функции Ф(х) можно записать в виде условных средних
Для рандомизированного правила Ф(х) представляет некоторую функцию
распределения.
324
<— условные риски, соответствующие гипотезе Яо и альтернати-
альтернативе Hi.
Подставляя A3.7) и A3.8) в A3.6), после простых преобразо-
преобразований получаем
# = роПоо + р1Пю+Ро(По1—ПОо)а—
—Р1-(Пю—Пц)A—,р). A3.9)
За критерий оптимальности алгоритма принятия решения при-
примем минимальное значение среднего риска (байесовский крите-
критерий). Тот или иной алгоритм определяется выбором области Хь
Область Хо является дополнением к области Xi в выборочно;^'
пространстве. Зависимость среднего риска от выбора Xi прояв-
проявляется через величины а и 1—|3. Подставляя A3.3) и A3.4а) в
A3.9), находим указанную зависимость среднего риска R от вы-
выбора области Xi в выборочном пространстве:
Я « Ро ПОо + Pi П10 - J [Pi (П10 - Пп) W (х\Нг) -
- р0 (П01 - Поо) W (х| Но)] dx; A3.10)
где /?о = РоПоо -f Р1П10 — неотрицательная известная константа и
Обозначим
f(x)=pl(U1o—nn)W(x\Hl)-po(Uoi-noo)W(x\Ho). A3.11)
Так как для любого подмножества А множества Х2 при
/(х)^0 имеет место неравенство j /(x)dx^ J f(x)dx, то интег-
Xt A
рал в правой части A3.10) достигает максимума тогда и только
тогда, когда в область интегрирования Xi включаются все точки
выборочного пространства, для которых подынтегральная функция
A3.11) неотрицательна. Отсюда следует, что минимальное значение
среднего риска достигается при условии, что в область Xi принятия
альтернативы Hi включаются все выборки, для которых функция
A3.11) неотрицательная, а в область Хо принятия гипотезы Яо —
все выборки, для которых функция A3.11) отрицательна.
Таким образом, получаем байесовский алгоритм 8б проверки
простой гипотезы Яо против простой альтернативы Н\, который
можно записать в виде1
6б : Pl (П10 - Пи) W (х | Нх) - р0 (П01 - Поо) W (х|Яо) % 0 A3.12)
Yo
ИЛИ
ПО1-Поо Ж ПЗ 13)
W х\Н0) ^ П1О~ПИ Pl
1 Хотя при выводе указанного оптимального правила предполагалось зара-
заранее, что рассматриваются только детерминированные правила, полученный ре-
результат остается справедливым и тогда, когда средний риск минимизируется в
более широком классе правил, включающем и рандомизированные (см., напри-
например, [37], §2.3).
325
13.1.4. Достаточная статистика отношения правдоподобия.
Функция
xvr I -. I тт \
I [X) — 1\Х19 ... , Хп) -
называемая отношением правдоподобия, представляет неотрица-
неотрицательную случайную величину, получаемую функциональным пре-
преобразованием z = l(xu ..., Хп), которое отображает точки п-мерно-
го пространства выборок на действительную полуось.
Байесовский алгоритм A3.13) проверки простой гипотезы про-
против простой альтернативы состоит в сравнении отношения прав-
правдоподобия /(х) с порогом
с _ noi—поо Ро A3 15>
причем принимается решение у\ (отклоняется гипотеза #0), если
/(х)^Сб, и принимается решение yo (принимается гипотеза Но),
если /(х)<Сб. Таким образом, для вынесения решения достаточ-
достаточно использовать значение одной случайной величины — статисти-
статистики отношения правдоподобия 1{хи ..., #п), а не значения каждого
элемента выборки хи ..., хп в отдельности. Иными словами, отно-
отношение правдоподобия несет всю статистическую информацию о
проверяемых гипотезах, которая содержится в выборке заданного
размера. Подобная статистика называется достаточной.
Использование достаточной статистики отношения правдопо-
правдоподобия приводит к редукции наблюдаемых данных: отображению
выборочного n-мерного пространства Хп на действительную поло-
положительную полуось. Поверхность в /г-мерном выборочном прост-
пространстве, разделяющая согласно
байесовскому правилу пространство
Хп на подпространства Хо и Хь ото-
отображается в точку Сб на оси /^(L
Байесовское правило 8б теперь со-
состоит в отображении интервала
0</<Сб в точку 7о^Г и интервала
1^св в точку Yi^r (рис. 13.1).
Любое монотонное преобразова-
преобразование я|>[/(#1, ..., #п)] достаточной ста-
статистики отношения правдоподобие
также представляет достаточную
статистику. В качестве такого пре-
преобразования иногда целесообразно принять яр (/) =1п /. Тогда байе-
байесовский алгоритм A3.13) проверки простой гипотезы против прос-
простой альтернативы запишется в виде
1п/(х)« ^ \пс6, A3Л6>
О i сб 1(х)
Рис. 13.1. Редукция данных при
использовании достаточной стати-
статистики
где порог сб определяется согласно A3.15)-
326
Замена отношения правдоподобия его логарифмом всегда це-
целесообразна при факторизации функций правдоподобия. Напри-
Например, если элементы выборки независимы, то
1п/(х)= 2 Ш(хк)= 2 l
k=l Ы
В этом случае достаточная статистика представляет сумму неза-
независимых случайных величин, которая при выполнении условий
центральной предельной теоремы асимптотически нормальна.
Заметим, что на основании A3.17) можно вычислять статис-
статистику 1п/(х) последовательно в процессе наблюдения согласно ре-
рекуррентному соотношению
In 1(хи ..., xh) =1п 1(хи ..., xk-i) +
+lnl(xk), k = 2, n. A3.17a)
13.1.5. Байесовский риск. Минимальный средний риск (байе-
(байесовский) определяется по формуле A3.9), в которой условные ве-
вероятности ошибок аир вычисляются согласно A3.3) и A3.4)
при использовании байесовского алгоритма принятия решения.
Редукция данных, т. е. отображение выборочного пространства
на действительную полуось отношений правдоподобия, позволяет
обойти непреодолимые трудности, связанные с вычислением п-
кратных интегралов A3.3) и A3.4). Так как при использовании
байесовского алгоритма событие xeXi эквивалентно событию
/(х)^Сб, а событие xgX0 — событию /(х)<сб, то в этом случае
вероятности ошибок представляются однократными интегралами
<хб = Р {/(х) > сб|Я0} = ] Wt (г\Н0) dz=l-Ft (сб|Я0), A3.18)
? A3.19)
О
где Wi(z\H0), Fi(z\H0), Wi(z\HY)y Fi(z\Hx)— плотности вероятно-
вероятности и функции распределения статистики отношения правдоподо-
правдоподобия при гипотезе Но и альтернативе Hi соответственно.
Если используется байесовский алгоритм в виде A3.16), то
аб=1— Fini(lnc6\Ho)9 A3.20)
Рб = /71п/Aпсб|Я1)> A3.21)
где F\ni(z\Ho), F\ni{z\Hx)—функция распределения логарифма
отношения правдоподобия при гипотезе Но и альтернативе #i со-
соответственно.
Байесовский риск [см. A3.9)]
1—Поо)аб—
A3.22)
327
где ссб, Рб определяются согласна
A3.18), A3.19) [или A3.20) и
A3.21)]; po + Pi=l.
13.1.6. Минимаксный алгоритм.
Предположим теперь, что апри-
априорные гипотезы #о и альтерна-
альтернативы Hi неизвестны, и определим
оптимальное минимаксное прави-
правило выбора решения, которое, как
указывалось в п. 12.4.3, представ-
представляет специальный случай байе-
байесовского правила для наименее
ом благоприятного априорного рас-
Рис 13.2. Зависимость байесовского пределения гипотез. Так как в
риска от вероятности гипотезы рассматриваемом случае провер-
проверки простой гипотезы Яо против»
простой альтернативы Нх события Но и Н{ составляют полную
группу, то достаточно определить наименее благоприятное значе-
значение вероятности ро=Р{#о} или ром, которому соответствует мак-
максимум байесовского риска — минимаксный риск
м (Ром) =
0<ро<1
(Ро)-
A3.23)
На рис. 13.2 изображена типичная зависимость байесовского рис-
риска от вероятности ро гипотезы Яо. Запишем уравнение прямой,,
касательной к этой зависимости в точке р0:
0—r*i)9 A3.24)
где r*o, r*i — условные риски, определяемые согласно A3.7) п
A3.8) при использовании байесовского правила, причем при:
р=ро (точка касания) у(ро)=Яб{Ро).
В точке ро = ром максимума функции Re(po) касательная к
кривой байесовского риска параллельна оси абсцисс (см.
рис. 13.2) и, следовательно, y(p)=const, т. е. не зависит от пере-
переменной р. Согласно A3.24) это условие максимума функции
Re(po) выполняется, если значение рОм удовлетворяет уравнению*
r*o(po)=r*i(po). A3.25)
Минимаксный риск [см. A3.24), A3.25)]
Rm (Ром) =/**! (ром) =Г*о (ром) . A3.26)
Из A3.26) с учетом A3.7), A3.8), A3.13), A3.18) и A3.19)
следует, что минимаксный алгоритм проверки простой гипотезы
против простой альтернативы предписывает сравнение отношения
правдоподобия /(х) с порогом см, который определяется из транс-
трансцендентного уравнения относительно неизвестной сь:
Поо+ (По1—Поо) [ 1— Fx(сб\Н0)] =
A3.27)
328
При Поо = Пц = О уравнение A3.27) несколько упрощается
Uoi[l—Fi(c6\Ho)] =П,о^(сб|Я,). A3.27а)
13.1.7. Алгоритм максимальной апостериорной вероятности.
Предположим, что матрица потерь A3.2) неизвестна. Тогда мож-
можно синтезировать оптимальный алгоритм проверки простой гипо-
гипотезы Но против простой альтернативы Н\ по критерию макси-
максимальной апостериорной вероятности (см. п. 12.4.4). По формуле
Байеса находим апостериорные вероятности гипотезы Но и альтер-
альтернативы Ни если в результате наблюдения получена выборка х:
Р{Я0[х} = PoW(x\Ho) A3.28а)
1 ' p0W(x\H0) + PlW(x\H1) '
Р{Нх\х)шш PiWWHJ A328б
p0W(x\H0) + PlW(x\H1)
откуда
Р±.
A3.29)
Установим следующее правило выбора решения: принимается
альтернатива Ни если P{#i|x}^P{#0|x} (решение vO» и отвер-
отвергается эта гипотеза, если Р{Яо|х}>Р{Я1|х} (решение *уо).
Условие Р{Я0|х}+Р{Я1|х} = 1 равносильно принятию той ги-
гипотезы, для которой апостериорная вероятность больше 1/2 (а
при равенстве 1/2 принимается альтернатива Н\).
Используя A3.29), запишем оптимальный алгоритм по крите-
критерию максимума апостериорной вероятности в виде
l(x) ? ^ A3.30)
Yo Pi
тля
In / (x) i1 In ( *l) . A3.30a)
yo v pi ;
Таким образом, в этом случае оптимальный алгоритм провер-
проверки простой гипотезы Яо сводится к вычислению отношения прав-
правдоподобия и сравнению его с величиной ро/рь Нетрудно заметить,
сравнивая A3.30) с A3.15), что рассматриваемый алгоритм совпа-
совпадает с байесовским, когда Поо = Пц = О, По1 = Пю=1. При этом
средний риск [см. A3.22)]
# 6, A3.306)
т. е. равен априорной вероятности ошибочного решения (любого
рода). Следовательно, алгоритм максимальной апостериорной ве-
вероятности минимизирует априорную вероятность ошибок. Иначе
говоря, этот алгоритм на протяжении длинной последовательнос-
последовательности принятия решений обеспечивает максимальную частоту пра-
правильных решений.
329
13.1.8. Алгоритм максимального правдоподобия. Если неиз-
неизвестны и матрица потерь A3.2), и априорные вероятности гипо-
гипотезы Но и альтернативы Hi, то можно применить критерий мак-
максимального правдоподобия, согласно которому при наблюдении
выборки x=(a:i, ..., хп) принимается та из гипотез, которой соот-
соответствует большее значение функции правдоподобия выборки.
Принимается гипотеза Яо, если W(x\Ho)>W(x\Hi) (решение vo),
и отвергается эта гипотеза, если W(x\Hi)^W(x\H0) (решение
Таким образом, .оптимальный алгоритм максимального прав-
правдоподобия записывается в виде
/(х) J 1 A3.31J
Yo
ИЛИ
Ы(х) I1 0. A3.31а)
Yo
Этот алгоритм предписывает вычисление отношения правдоподо-
правдоподобия и сравнение его с единицей (или определение знака логариф-
логарифма отношения правдоподобия).
Алгоритм максимального правдоподобия совпадает с опти-
оптимальным алгоритмом по критерию максимума апостериорной ве-
вероятности, когда гипотеза и альтернатива равновероятны, т. е.
когда pi = po = 1/2.
13.1.9. Алгоритм, оптимальный по критерию Неймана—Пир-
Неймана—Пирсона. Другой подход к оптимизации алгоритма принятия решения
при отсутствии априорной информации о потерях и вероятностях
гипотез указывает критерий Неймана — Пирсона. Согласно это-
этому критерию оптимальный алгоритм обеспечивает минимально
возможную вероятность |3 ошибок второго рода при условии, что
вероятность ошибки первого рода не больше заданного значения
а (см. п. 12.4.6).
Задача синтеза оптимального алгоритма принятия решения по
указанному критерию состоит в определении минимума функцио-
функционала
Ф = Р+са, A3.32)
в котором вероятность р зависит от правила выбора решения, ве-
вероятность а фиксирована и с—неопределенный множитель Лаг-
ранжа. Сравнивая A3.32) с A3.9), замечаем, что функционал Ф
совпадает со средним риском при pi=po=l/2, ПОо = Пп = О, Пю = 2,
По1 = 2с (плата за ошибку первого рода в с раз больше, чем за
ошибку второго рода). Следовательно, минимум функционала Ф
достигается при использовании байесовского алгоритма для ука-
указанных плат и априорных вероятностей гипотез. Тогда из A3.13)
находим следующий оптимальный по критерию Неймана — Пир-
330
сона алгоритм проверки простой гипотезы Яо против простой аль-
альтернативы Hi:
Цх)% с. A3.33)
Ye"
Порог с находим из граничного условия (заданного значения ве-
вероятности ошибки первого рода)
Р{/(х)^с|#0} = а A3.34)
или [ср. A3.18)]
1— Fi{c\H0)=a. A3.34a)
Конечно, и в рассматриваемом случае вместо статистики от-
отношения правдоподобия можно использовать ее логарифм
У*.
lnZ(x)
A3.35)
Yo
P{lnl(x)^\nc\H0}=a
или [ср. A3.20)]
1— Fmi(lnc\H0)=a.
Минимальная по критерию Неймана — Пирсона
ошибки второго рода [ср. A3.19) и A3.21)]
или
A3.36)
A3.36а)
вероятность
A3.37)
A3.37а)
и A3.36) соответст-
где с и In с определяется согласно A3.34)
венно.
13.1.10. Универсальность достаточной статистики отношения
правдоподобия. При проверке простой гипотезы против простой
альтернативы все рассмотренные критерии качества приводят к
единообразной процедуре
Принятия решения: по Таблица 13.1
наблюденной выборке
х= (xi, ..., хп) фиксиро-
фиксированного размера п вычис-
вычисляется отношение правдо-
правдоподобия 1(х) и принима-
принимается или отвергается ги-
гипотеза Но в зависимости
от того, где находится это
отношение ниже или вы-
выше некоторого фиксиро-
фиксированного порога, устанав-
устанавливаемого заранее в со-
331
Критерий
Байесовский
Максимум апостериорной
вероятности
Максимум правдоподо-
правдоподобия
Неймана — Пирсона
Минимаксный
Порог
Сб, формула
A3.15)
PofPi
1
Уравнение
A3.34),
Уравнение
A3.27)
ответствии с принятым критерием. Пороги, с которым сравнивает-
сравнивается отношение правдоподобия для различных критериев, приведе-
приведены в табл. 13.1.
13.2. ПОСЛЕДОВАТЕЛЬНЫЕ МНОГОШАГОВЫЕ
АЛГОРИТМЫ ПРОВЕРКИ ПРОСТОЙ ГИПОТЕЗЫ
ПРОТИВ ПРОСТОЙ АЛЬТЕРНАТИВЫ
13.2.1. Описание последовательного алгоритма. Отличительная
особенность рассмотренных алгоритмов принятия решения состо-
состоит в том, что проверка гипотезы производится за один шаг. При
этом до начала наблюдений задается размер выборки п. Сущест-
Существует другой подход, при котором отказываются от постоянного
размера выборки, а ограничивают это значение в процессе экспе-
эксперимента в зависимости от результата уже выполненных наблюде-
наблюдений. В этом случае алгоритм проверки гипотезы становится мно-
многошаговым.
При многошаговом (последовательном) алгоритме следует оп-
определить два правила: остановки наблюдений и выбора решения
после остановки наблюдений. Вначале наблюдают одно значение
Х\ (извлекают выборку размером я=1) и на основании этого зна-
значения по заранее установленному правилу либо останавливают
наблюдение и принимают одно из двух решений G0 или 71) > либо
продолжают наблюдения (т. е. отказываются на первом шаге от
принятия решения). Если правило предписывает отказ от реше-
решения, то извлекают следующую выборку, а описанная процедура
повторяется: на основании выборки (х\у #2) размером п = 2 либо
останавливается наблюдение и принимается решение, либо на-
наблюдают следующее значение Хз и указанная процедура повторя-
повторяется относительно выборки (хи х2, Хз). Испытание заканчивается
на той выборке, на основании которой наблюдение в соответст-
соответствии с правилом остановки прекращается и принимается одно из-
двух решений 70 или 7ь
При использовании последовательного алгоритма момент ос-
остановки процесса наблюдения является случайным и зависит от
предшествующих ему результатов наблюдений. Размер выборки
я, при которой выносится окончательное решение, заранее не на-
назначается, а является случайной величиной. На каждом шаге
пространство выборок соответствующего числа измерений долж-
должно делиться не на две, а на три области: критическую Xi, допус-
допустимую Хо и промежуточную Хпр. Разделение пространства выбо-
выборок на три области и содержит указание на то, должно ли быть
принято одно из решений 70 или 71 или наблюдение должно быть
продолжено. Если выборочное значение попадает в критическую
область Xi, то гипотеза Яо отвергается; если в допустимую об-
область Хо, то она принимается, а если выборочное значение попа-
попало в промежуточную область Хпр, то это служит указанием на
необходимость продолжить наблюдения 1.
1 Вероятность того, что число шагов в последовательной процедуре проверки
гипотезы не ограничено, равно нулю (см. [35], с. 166).
332
Как и при непоследовательных алгоритмах, число способов раз-
разбиения пространства выборок на три области не ограничено.
Следовательно, возможны разнообразные последовательные пра-
правила выбора решения и, очевидно, необходим критерий качест-
качества, при помощи которого можно сравнивать различные последо-
последовательные правила и выбирать наилучшее.
13.2.2. Последовательный алгоритм Вальда. Для синтеза опти-
оптимального последовательного алгоритма проверки простой гипоте-
гипотезы Но против простой альтернативы #i А. Вальд предложил ис-
использовать в качестве критерия минимум среднего значения раз-
размера выборки (длительности процесса наблюдения до момента
его остановки) при условии, что вероятность ошибки первого ро-
рода (уровень значимости) не превышает а, а вероятность правиль-
правильного отклонения гипотезы Но (мощность) не менее 1—р. Заметим
при этом, что средние значения размера п выборки mi{n\H0}>
m\{n\Hi} при справедливости гипотез Но и Н\ соответственно, во-
вообще говоря, не равны, и требуется минимизировать обе вели-
величины.
Вальд показал [38], что при независимых наблюдениях среди
всех алгоритмов принятия решения — последовательных и непос-
непоследовательных, для которых условные вероятности ошибок не пре-
превосходят величин а и |3, последовательное правило выбора реше-
решения, состоящее в сравнении отношения правдоподобия с двумя
порогами Со и си приводит к наименьшим значениям mi{n\H0},
Оптимальное разбиение пространства выборок определяется
следующими неравенствами:
для допустимой области Хо:
ь ..., xk)<cu k=l, я—1,
для критической области Xi
i, ..., xk)<cu k=l9 л—1,
для- промежуточной области
и ..., хк)<си k=l, п. A3.38в)
Если отношение правдоподобия заменить его логарифмом, то в
силу независимости элементов выборки оптимальное последова-
последовательное правило можно сформулировать следующим образом:
при п-м наблюдении принимается решение 70, если
2 ln/(^)<lnq, ?=1,л—1, A3.39а)
In/(*,)< In с0; A3.396)
333
принимается решение уи если наряду с A3.39а)
2 ln/(^)>c1. A3.39b)
Точное определение порогов с0 и си значения которых к тому
же зависят от номера шага ft, сопряжено со значительными ма-
математическими трудностями. Однако было доказано [38], что
Cl<max(-i— , ^ , A3.40а)
A3.406)
—а а
В практически интересных случаях, когда условные вероятности
ошибок не превышают 0,5, имеем A—Р)/а»р/A—а).
Тогда неравенства A3.40а,б) можно переписать в виде
*<A—Р)/а, Со>р/A—а). A3.41)
Если отдельные слагаемые 1п/(хг) в среднем малы по сравнению
с ln(ci/co), то число шагов до остановки оказывается достаточно
большим и тогда с небольшой погрешностью неравенства
A3.41) можно заменить равенствами (подробнее см. [35],
с. 142—143):
Cl= (I—p)/a, со = р/.A—а). A3.42)
Подчеркнем, что при указанных допущениях последователь-
последовательный алгоритм предписывает сравнение отношения правдоподобия
с порогами, которые определяются только заданными вероятнос-
вероятностями ошибок первого и второго рода.
k
Заметим также, что случайные величины Zk= 2 In/(**),
i=\
k=l, 2, ..., образуют случайную последовательность с независи-
независимыми приращениями. Поэтому точное определение порогов сво-
сводится к задаче о достижении границ некоторым марковским слу-
случайным процессом (см. , например, [39]).
13.2.3. Минимальные средние размеры выборок. Определим
средние значения т\{п\Н0} и m\{n\Hi} размеров выборок при
использовании оптимального по Вальду последовательного алго-
алгоритма принятия решения. Если выборка однородная, то логарифм
отношения правдоподобия представляет сумму случайного числа
одинаково распределенных случайных величин. Поэтому1
т1 {In I (х19 ... , xn)\Hj] = m1\i In /(*,) [ Я Л =
w=i J
= m1{n\Hj}m1 {In Hx)\Hj}fj=--0; 1,
1 См. формулу B2а) в задаче 3.15, для использования которой следует пред-
предположить независимость случайных величин п и \nl(Xi), l</</2. Строгое дока-
доказательство (без предположения о независимости), приводящее к тому же ре-
результату, дано в [28], с. 80.
334
откуда
<13-436»
Предположим, что при принятии решения G0 или 71) на п-м
шаге отношение правдоподобия точно совпадает с одним из поро-
порогов Со или с\ (т. е. будем пренебрегать пересечением порога на
заключительном этапе проверки гипотезы). Тогда ln/(*i, ..., хп)
представляет дискретную случайную величину, принимающую
два значения In с0 и In С\ с вероятностями 1—а, а, если верна
гипотеза Яо, и с вероятностью |3, 1—р, если верна гипотеза Яь
Отсюда следует
1 — а
1
^P f A3.44a)
а
+(рIп=1 . A3.446)
1 —а а
Подставляя A3.44а) в A3.43а) и A3.446) в A3.436), получаем
тх{п\Н0}= f(l-a)ln-2— +oln L=P]/m10, A3.45a)
L I а a J/
— а
m
«i W#i} = [Pin г-5— + A - P) In t^l
|_ 1 —а а J/
где [см. A3.18) и A3.19)]
m10 = та {In Z (x)\H0) =] Wt (z\H0) In / (z) dz,
б
"*ii = m1{lnl(x)\H1}= ] Wl(z\H1)\nl(z)dzi
о
llt
A3.456)
A3.46a)
A3.466)
причем /72ю<0, тц>0, что непосредственно следует из формулы
A4) задачи 13.6.
13.2.4. Усеченный последовательный алгоритм. Средние значения объема
выборки, определяемые по формулам A3.45а и б), являются минимально воз-
возможными, если рассматривать любые другие правила выбора решений (в том
числе и непоследовательные), гарантирующие ограничения вероятностей оши-
ошибок заданными значениями. Однако оговорка, что эта экономия длительности
эксперимента достигается в среднем, весьма существенна. Так как размер вы-
выборки п — величина случайная и ее возможные значения могут быть значи-
значительно больше среднего значения, то в конкретном эксперименте может ока-
оказаться, что оптимальный последовательный алгоритм принятия решения при-
приведет к чрезмерно большому размеру выборки и окажется более длительным,
чем непоследовательный. Естественно, приходит мысль о способе устранения
этого недостатка, который заключается в том, что заранее устанавливается мак-
максимальный размер выборки пт&Х) при достижении которого последовательная
335
процедура заканчивается и принимается одно из решений 7о или 71 в соответ-
соответствии с одношаговым алгоритмом. Таким образом, можно обезопасить себя от
случаев, когда л>/гтах.
Указанный алгоритм проверки гипотез называется усеченным последова-
последовательным. Для всех я<Яшах устанавливаются (как и для неусеченного алго-
алгоритма) два порога, с которым сравнивается отношение правдоподобия. Если
размер выборки #=лтах, то отношение правдоподобия сравнивается только с
одним порогом согласно одношаговому алгоритму. Чем меньше /imax, т. е. чем
сильнее усечение, тем меньшим будет выигрыш в среднем времени, получаемом
от последовательной процедуры.
Усеченный последовательный алгоритм принятия решения формулируется
следующим образом: если при размерах выборки ж/Zmax алгоритм A3.39а—в)
не приводит к выбору одного из решений G0 или 71), то гипотеза Яо откло-
отклоняется (принимается решение 7i)> если
"max
2 In/fo)> In с, A3.47а)
и принимается гипотеза Яо (решение 7о). если
A3.476)
A3.47b)
При использовании этого правила вероятности ошибок аус, рус первого и
второго рода могут оказаться большими заданных а, р, так как принимаемые
при этом ошибочные решения, возможно, не появились бы при продолжении
испытаний (n>/2max). Так как р/A—^а)<1, A—Р)/а>1, то из A3.47в) сле-
следует, что порог с= 1 при использовании усеченного последовательного алго-
алгоритма всегда приемлем.
13.2.5. Байесовский последовательный алгоритм. Рассмотрим критерий ка-
качества последовательного алгоритма, учитывающий на каждом шаге стоимость
эксперимента, пропорциональную средней его длительности, и потери, связан-
связанные с принятием ошибочных решений. Тогда условные риски при ПОо=Пц=О
[см. A3.7) и A3.8)]
г о = Пси а+СвШ^п \ Яо},
"max
P
1 — a
ln/(*,)
- <c <
<
1
\nc,
-p
a
где Св. — стоимость каждого наблюдения. Если известны априорные вероятнос-
вероятности р0 и р^ гипотезы и альтернативы, то можно записать величину среднего рис-
риска [см. A3.6)] Я=роГо+р1Г{ или
Я1}. A3.48)
Первые два члена в A3.48) представляют средний риск без учета стоимости
эксперимента, а последний член учитывает затраты, связанные с наблюдениями.
Оптимальными в смысле байесовского последовательного критерия качест-
качества будут правила остановки наблюдения и выбора решения после остановки,
которые минимизируют полный средний риск A3.48).
336
Доказано (см. [36], § 4.2), что приведенное вальдовское последовательное
правило остановки наблюдения и выбора решения, состоящее в сравнении от-
отношения правдоподобия с двумя фиксированными порогами, является опти-
оптимальным и для байесовского последовательного критерия.
Для полного описания байесовского последовательного алгоритма необхо-
необходимо определить неизвестные пороги с0 и с\ [см. A3.39а) — A3.39в)]. Можно
показать, что эти пороги
co=Pi(l—а)/(роа), A3.49st
cl=pl(l-b)l(pdb)i A3.496)
где константы а и Ъ находятся из системы трансцендентных уравнений
Яб(а)=аП10, 1*б(Ь)=Ь\Пои A3.49в)
где Re (с) — байесовский риск при р\ = с.
Примеры байесовских последовательных алгоритмов приведены в [39].
13.3. МНОГОАЛЬТЕРНАТИВНАЯ ЗАДАЧА
ПРОВЕРКИ ГИПОТЕЗ
13.3.1. Постановка задачи и априорные данные. Выдвигаются
т+1 гипотез Яо, #i, ..., Нт об исследуемом процессе. Задача со-
состоит в том, чтобы по результату наблюдения реализации этого
процесса, представленному в форме выборки х=-- (хи ..., хп) фик-
фиксированного-размера п принять одну из гипотез и отклонить ос-
остальные.
На выборочном пространстве, которое представляет я-мерное
евклидовое пространство Хп, заданы функции правдоподобия
W(x\Hk), k = Q, т. Известны, кроме того, априорные вероятности
гипотез pk = P{Hk}i k = 0, т> 2 /?ь=1. Пространство решений
k=o
Г состоит из т+1 элементов уь, k = 0, т, где уи — решение при-
принять гипотезу Ни. Рассматривается класс D дискретно-аналоговых
одношаговых алгоритмов принятия решения. Каждый алгоритм
8eD предписывает разделение пространства Хпт на т+1 непере-
т
секающихся областей Х&, k = 0, т, [] Х& = ХП. Если наблюдае-
мая выборка попала в область Х^, то принимается решение yh.
Элемент П^^О матрицы потерь размером (т-\-1)Х(т+1) пред-
представляет плату за решение yk, когда истинной была гипотеза #,-.
Вероятность
Р{П = ПЛ} =^Р {хе Xh\Hj) =p, J W(x\H}) dx.
Ч
13.3.2. Байесовский алгоритм. Используя указанный комплект
априорных данных, запишем выражение среднего риска [см.
A2.12)]
Я= 2 2 RjkPj I W(x\Hj)dx. A3.50)
/=0 k=0 xk
337
Обобщая подход, использованный при выводе неравенств
A3.12), можно доказать, что минимальное значение среднего рис-
риска A3.50) достигается в том случае, если к области Xk принятия
решения ун, k=l, m, относят точки х выборочного пространства
Хп, удовлетворяющие системе неравенств (байесовский алго-
алгоритм)
2 (Щ-и1к)
A3.51)
Область Хо принятия решения у0 определяется из условия
Х0 = Х"- U Хл.
Введем вектор отношений правдоподобия l(x) = [/i(x), ...
..., /m(x)], где
= W(x\Hk)/W(x\H0), k = YT^ A3.52)
Тогда систему неравенств A3.51) можно переписать в виде
2 №,,*)
A3.53)
Таким образом, для реализации байесовского алгоритма про-
проверки /п+1 гипотез достаточно вычислить компоненты /л-мерного
вектора отношений правдоподобия. Иными словами, вектор отно-
отношений правдоподобия несет всю информацию о проверяемых ги-
гипотезах, которая содержится в выборке заданного размера и яв-
является в этом случае достаточной статистикой.
13.3.3. Проверка трех простых гипотез. Проиллюстрируем бай-
байесовский алгоритм A3.53) принятия решений на примере провер-
проверки трех простых гипотез Яо, Ни Я2. Обозначая Уг= (Pi/Po)U(x)>
запишем оптимальное байесовское правило выбора решения сле-
следующим образом:
1) принимается решение 71 ° том, что верна гипотеза Яь если
(Пю—Пц)у1+ (П20—П21)У2^ПО1—Поо,
(П12-П11)г/1-:-(П22-П21)г/2^По1-По2; A3.54а)
2) принимается решение 72 о том, что верна гипотеза Яг>
если
(Пю—П12)г/1+(П2о—П22)
(Пи—П12)#1+ (П21—П22)г/2^П02—Пог, A3.546)
3) принимается решение 7о о том, что верна гипотеза Яо, если
i2)yi+ (П20—П21)
у2<о1оо
;(Пю—П12)У1+,(П2о—П22)У2<По2—Поо, A3.54в)
338
Переменные
представляют функциональное преоб-
преобразование я-мерного случайного век-
вектора х с компонентами (хи ..., хп) в
случайный вектор с неотрицательными
компонентами (уи #2). В зависимости
от того, в какую из трех непересекаю-
непересекающихся областей первой четверти плос-
плоскости, определяемых приведенными
системами двух неравенств, попадает Рис. 13.3. Области принятия ре-
указанный вектор, принимается одно шения
из трех возможных решений.
На рис. 13.3 показаны области принятия трех решений для
частного случая, когда платы за правильные решения равны ну-
нулю, а платы за ошибочные решения равны между собой.
13.3.4. Алгоритм максимальной апостериорной вероятности.
Предположим, что матрица потерь неизвестна. Тогда можно син-
синтезировать оптимальный алгоритм проверки /л-Н гипотез Яо,
Ни .-., Нт по критерию максимальной апостериорной вероятности
{см. п. 12.4.4). По формуле Байеса находим апостериорные веро-
вероятности гипотез, если в результате наблюдения получена выбор-
выборка х размером п:
A3.55)
Из A2.25) и A3.55) получаем следующий оптимальный алгоритм
по критерию максимальной апостериорной вероятности: принима-
принимается решение уи, если
pk W (x\Hk) = max PjW (x\Hj). A3.56)
Вводя статистики отношения правдоподобия [см. A3.52)], за-
запишем это правило выбора решения так: принимается решение
Yfc, k= I, rn, если
Pk к (х) = jnax р7 lj (x), (pjlp0) lj (x) > 1, / = \~m, A3.57)
и решение 70, если
(/?j//?o)/j(x)<l, /=1, т. A3.57а)
Алгоритм максимального правдоподобия является частным
случаем алгоритма максимальной апостериорной вероятности при
равновероятных гипотезах Яо, Яь ..., Нт.
Многоальтернативная задача проверки гипотез при других
критериях качества (минимаксном, Неймана — Пирсона) рассмат-
рассматривалась в [35, 40].
339
13.4. ПРОВЕРКА ГИПОТЕЗ В УСЛОВИЯХ
ПАРАМЕТРИЧЕСКОЙ АПРИОРНОЙ НЕОПРЕДЕЛЕННОСТИ
13.4.1. Проверка простой гипотезы против сложной альтерна-
альтернативы. По принятой в § 12.6 терминологии априорная неопределен-
неопределенность относится только к неполному знанию функций правдопо-
правдоподобия выборки. Предположим, что функции правдоподобия пред-
представляют однопараметрическое семейство функций W(x\$),,
-Оевн- при гипотезе Я и W(x\&), $ = ®к при альтернативе К.
Если интервалы &н и вк вырождаются в точку, т. е. вн=<&о и
®к = '&и то приходим к рассмотренному случаю проверки простой
гипотезы Но: <&='&о против простой альтернативы #ь <О='вч (слу-
(случай полной априорной информации). В этом случае алгоритм,
предписывающий сравнение с порогом достаточной статистики от-
отношения правдоподобия l(x) = W(x\&i)/W(x\#o), является опти-
оптимальным по критерию Неймана — Пирсона: при заданной вероят-
вероятности а ошибки первого рода (уровня значимости) минимизиру-
минимизируется вероятность р ошибки второго рода (достигается в терхминах
статистики максимальная мощность).
Когда гипотеза Н простая <& = (&о, а альтернатива К сложная
#g6k, to р = р(О), #g0k и можно попытаться найти такое пра-
правило выбора решения (т. е. разбиение пространства выборок на
две области Хо и Xi), которое при заданной верхней границе ве-
вероятности а ошибок первого рода минимизирует вероятность
ошибки второго рода Р(Ф) [или максимизирует мощность
1—Р('&)] для всех простых гипотез, содержащихся в сложной
альтернативе К- Такое правило называют равномерно наиболее
мощным (РИМ). Если существует равномерно наиболее мощное
правило выбора решения при проверке простой гипотезы против
сложной альтернативы, то оно, по существу, не отличается от та-
такого же правила, соответствующего простой альтернативе, так
как при этом неоднозначность, возникающая из-за того, что вк
представляет множество значений параметра О, не имеет значе-
значения, так как критическая область Xi одна и та же для всех зна-
значений #е6к.
Существование равномерно наиболее мощного правила выбо-
выбора решения при проверке простой гипотезы против сложной аль-
альтернативы является скорее исключением, нежели правилом. Мож-
Можно попытаться сузить класс правил и искать в этом меньшем клас-
классе правил равномерно наиболее мощное. К одному из таких
суженных классов принадлежат так называемые несмещенные
правила. Эти правила должны удовлетворять следующему усло-
условию: вероятность отвергнуть ложную гипотезу не меньше вероят-
вероятности отвергнуть правильную. Иначе говоря, вероятность а ошиб-
ошибки первого рода является нижней границей значений функций
мощности 1—Р(О) для всех значений ¦&, т. е.
P{x€=Xi|06=ex} = l—p@)^a = P{xeX1|0=Oo}. A3.58)
340
Если р^)—непрерывная функция, то минимальное значение
1—РСв1) достигается при /&=/в>о и в точности равно а, так как
1—p{Oo)=P{xeXi|0=^}=a. A3.58а)
Равномерно наиболее мощное правило всегда является несме-
несмещенным. Если же такого правила нет, то все же может сущест-
существовать несмещенное равномерно наиболее мощное правило.
Заметим, что оптимальное по критерию Неймана — Пирсона
правило выбора решения при проверке простой гипотезы против
сложной альтернативы не имеет, вообще говоря, структуры бай-
байесовского правила, как это имело место при простой альтернативе.
13.4.2. Проверка сложной гипотезы против сложной альтерна-
альтернативы. Когда и гипотеза Н сложная, то вероятность ошибки пер-
первого рода зависит от параметра Ф, принадлежащего некоторому
множеству @н (области неопределенности). Можно попытаться
найти так называемый класс подобных правил выбора решения,
удовлетворяющий условию
Je//)dx = a. A3.59)
Если критическая область Xi удовлетворяет условию A3.59), та
ее называют подобной пространству выборок, так как интеграл
по всему выборочному пространству
х"
т. е. также не зависит от неизвестного параметра Ф. Теперь зада-
задача состоит в том, чтобы в классе подобных правил найти такое,,
которое является равномерно наиболее мощным для всех значе-
значений Февк. Конечно, как и в рассмотренной в п. 13.4.1 более про-
простой ситуации, решение указанной задачи может и не существо-
существовать. Тогда следует попытаться найти его в более узком классе
правил, вводя дополнительные предположения. Одним из таких
предположений является несмещенность, которая ограничивает
класс функций мощностей, равных для любого Ь вероятности по-
попадания выборки в критическую область
f(fl)=P{x€=XilO}. A3.60)
Ясно, что при таком определении функции мощности она равна
вероятности правильного принятия альтернативы К, когда Февк*
и вероятности ошибки первого рода, когда Фебн- Условие не-
несмещенности правила выбора решения при проверке сложной ги-
гипотезы Н против сложной альтернативы К формулируется следу-
следующим образом: при заданном значении a
ра^еб/с, A3.61а)
П ' 1<а, Фе9я. A3.616)
Отметим, что иногда при синтезе правила выбора решения в рас-
рассматриваемом случае класс правил ограничивают дополнитель-
дополнительным условием инвариантности правила относительно некоторой
группы преобразования координат выборочного пространства.
34*
13.4.3. Алгоритм максимального правдоподобия. При проверке
сложной гипотезы Н о том, что параметр йебн, против сложной
альтернативы К о том, что Февк, можно использовать алгоритм
максимального правдоподобия. В этом случае принимается ре-
решение 7i (отвергается гипотеза Я), если для наблюдаемой выбор-
выборки х выполняется неравенство
max W(x\$)l max ИР(х|Ф)>с, A3.62)
и решение 70 (принимается гипотеза Н) в противном случае. За-
Заметим, что структура правила максимального правдоподобия не
совпадает с байесовской при некоторых частных значениях поро-
порога, как это было при проверке простой гипотезы против простой
альтернативы.
13.4.4. Проверка гипотез о векторном параметре функции
правдоподобия. Понятие равномерно наиболее мощного правила
и несмещенного РИМ правила непосредственно обобщаются на
случай неизвестного векторного параметра функций правдоподо-
правдоподобия. Однако отыскание таких правил представляет, в общем, до-
достаточно трудную задачу (см. [35]). Достаточно просто в этом
случае обобщается принцип максимального правдоподобия. Ал-
Алгоритм максимального правдоподобия при проверке гипотезы Я:
Февн против альтернативы К: $^®к совпадает с A3.62), если
скалярные величины заменить векторными.
Иногда по условию задачи неизвестные компоненты векторного
параметра функции правдоподобия классифицируют как инфор-
информационные и мешающие параметры. Предположим, что при ги-
гипотезе Н информационный параметр задан #=#о, а мешающий
Ф^вн, и при альтернативе К информационный параметр также
задан #=#1, а мешающий йе0к. Если мешающие параметры
случайны и известны их совместные плотности вероятности Wh(^)
и wK{ft), то их можно исключить усреднением функций правдо-
правдоподобия Щх1*, *о), #^вн и №(х|*, *i), Оев*:
= J wH(<t)W(x\u, #0)d#, A3.63a)
вн
= J wK(*)W(x\*9 OJd*. A3.636)
в/с
Тогда задача сводится к проверке простой гипотезы против про-
простой альтернативы об информационном параметре. Оптимальное
по любому критерию правило выбора решения предписывает
сравнение с порогом достаточной статистики отношения усред-
усредненных функций правдоподобия
Z(x)=oi(x|*i)/ai(x|*o). A3-64)
Если гипотеза и/или альтернатива об информационном пара-
параметре сложная, то после усреднения функций правдоподобия по
мешающим параметрам приходим к задачам, рассмотренным в
п.п.13.4.1 и 13.4.2.
.342
13.5. ПРОВЕРКА ГИПОТЕЗ О СРЕДНЕМ ЗНАЧЕНИИ
ГАУССОВСКОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
13.5.1. Постановка задачи и априорные данные. Выдвигается
гипотеза Яо, что среднее значение гауссовской случайной вели-
величины | равно яо, против альтернативы Яь что этот параметр рас-
распределения | равен аь Имеется случайная выборка х= (х\..., хп)
заданного размера п, представляющая возможные значения g.
Задача состоит в том, чтобы, используя эту выборку, принять или
отклонить гипотезу Яо. Так как элементы выборки независимы и
подчиняются нормальному закону распределения, то на выбороч-
выборочном пространстве Хп функции правдоподобия [см. B.66)]
^ (х|Я0) = ПBяа2)-1/2 ехр
- Bяа2)-«/2 ехр Г - -L 2 (xh - aQf I, A3.65a)
L 2o k=\ J
W (х\Нг) - ft Bяа2)-1/2 ехр
[
Г - -±- д (Ч ~ ^iJ], A3.656)
где а2 — дисперсия гауссовской случайной величины.
Возможными решениями являются
Hi} = a1. A3.66)
Если дисперсия а2 известна, то сформулированная задача
представляет проверку простой гипотезы Яо против простой аль-
альтернативы Яь Но если проверяются гипотезы о среднем гаус-
гауссовской величины в условиях параметрической априорной неоп-
неопределенности и/или если дисперсия представляет неизвестный
мешающий параметр, то приходим к более трудным задачам про-
проверки сложных гипотез.
13.5.2. Достаточная статистика. Как было отмечено в п. 3.1.4,
достаточной статистикой для проверки простой гипотезы против
простой альтернативы является любое монотонное преобразова-
преобразование отношения правдоподобия. Для рассматриваемой задачи про-
проверки простой гипотезы Н0:а=а0 против простой альтернативы
Hi:a=ai>a0 из A3.17) и A3.65а), A3.656) получим
тп7/у\- а1~ао у у п (а*" fl<>) A3.67)
a2 k=\ 2o2
Так как линейное преобразование — монотонное, то достаточной
статистикой будет также
уп(х) = —? xhf A3.68)-
п k==l
т. е. среднее арифметическое выборочных значений.
343-
1*1
^Puc. 13.4. Плотность вероятности исходной случайной величины (а) и достаточ-
достаточной статистики (б)
Статистика уп(х) как линейная функция гауссовских случай-
случайных величин подчиняется нормальному закону распределения. Па-
Параметры этого распределения при гипотезе #о и альтернативе Hi
m1{yn(x)\Ho}=aOi ml{yn(x)\Hi} = a1 A3.69)
и из условия независимости выборочных значений
МУп(х)\Н0}=\12{уп(х) [Я!}=а2М. A3.70)
Рис. 13.4 иллюстрирует все возрастающую эффективность исполь-
использования достаточной статистики для различения между гипотезой
и альтернативой при увеличении размера выборки. Априорные
плотности вероятности случайной величины § при гипотезе и аль-
альтернативе существенно перекрываются (рис. 13.4,а). Плотности
вероятности среднего арифметического выборочных значений за-
заметно различаются, концентрируясь при увеличении размера вы-
выборки вблизи средних значений, соответствующих гипотезе и аль-
альтернативе (рис. 13.4,6).
13.5.3. Оптимальные алгоритмы. Из результатов, приведенных
в § 13.1, следует, что оптимальные дискретно-аналоговые одно-
шаговые алгоритмы принятия решения при проверке простой ги-
гипотезы Н0:а=а0 против простой альтернативы Hi:a=al>a0
состоит в сравнении с порогом достаточной статистики A3.68)
уЛJЛ
п k=\ Yo
где порог К определяется выбранным критерием качества. Для
344
байесовского алгоритма, а также для алгоритмов максимальной5
апостериорной вероятности и максимального правдоподобия
к _ ор + а, + (fine ^ A3 72>
2 я (ах — а0)
где константа с для указанных критериев приведена в табл. 1.1.
При использовании оптимальных по указанным трем критери-
критериям алгоритмов вероятности ошибок первого и второго рода
A3.73)
Р = Р {Уп (х) < К\Нг) = Р(^Ь- V" ), A3.74)
где F(z) —интеграл Лапласа (функция распределения стандарт-
стандартной гауссовской случайной величины). Подставляя A3.72) в
A3.73) и A3.74), получаем
а= 1— F{dn/2+ln фп), A3.75)
f>=F(-dnf2+\nc/dn), A3.76)
где
dn= fll"-fl° Vn. A3.77)
а
Формулы A3.75) и A3.76) можно записать иначе, если ввести
процентные точки стандартного нормального распределения ве-
вероятностей [см. B.34а)]:
A3.78)
A3.79)
откуда следует простое соотношение между вероятностями оши-
ошибок первого и второго рода
*а-*1-Э = <*п> A3.80)
которое определяется только величиной dn, не зависящей от по-
порога.
Нетрудно проверить, используя A3.67), что среднее и диспер-
дисперсия логарифма отношения правдоподобия связаны с величиной
йп простыми соотношениями
m1{lnl{x)\Hi}=— m1{\nl{x)\H0} = d2n/2, A3.81a)
^2{ln/(x)|^} = ^{ln/(x)^o}=d2n. A3.816)
Заметим, что
d
и2{1п/(х)|Я0, Hi) n'
Подставляя A3.75), A3.76) в A3.22), получаем величину ми-
минимального среднего (байесовского) риска (при ПОо=Пи=О)
Яб=ПО1Ро [ 1— F (dn/2+ln c6fdn) ] +;
{13.83)
Если По1 = Пю, то формула A3.83) определяет вероятность
ошибки любого рода. Для алгоритма максимального правдопо-
правдоподобия (с=1) из A3.75) и A3.76) следует
а = р=1_ F(dnf2) A3.84)
и согласно A3.72)
/С=(ао+а1)/2. A3.85)
Рис. 13.5 иллюстрирует равенство A3.84) и положение поро-
порога при использовании алгоритма максимального правдоподобия.
В заключение* отметим, что согласно A3.75) — A3.77) при
л-^оо, т. е. при dn-+oot вероятности ошибок а->0, fH-О. Алгорит-
Алгоритмы, обладающие таким асимптотическим свойством, назовем со-
состоятельными. В этом случае плотности вероятности достаточной
статистики A3.68) приближаются к дельта-функциям в точках
z=a0 и z=au а порог K->(ao-\-cii)J2 [см. A3.72)].
13.5.4. Алгоритм, оптимальный по критерию Неймана—Пир-
Неймана—Пирсона. Для критерия Неймана — Пирсона алгоритм принятия ре-
решения определяется согласно неравенствам A3.71), но порог К
при заданной вероятности а ошибки первого рода определяется
из уравнения [см. A3.73)]
(^) af A3.86)
которое можно переписать в виде
K = a0 + oxjV^ A3.87)
где ха—a-процентная точка нормального распределения, опреде-
определяемая заданной величиной а.
Минимальная величина ошибки второго рода
или
A3.88)
A3.88а)
Из A3.88а) следует, что и для рассматриваемого критерия имеет
место соотношение A3.80) между вероятностями ошибок первого
1=1
Рис. 13.5. Вероятности ошибок (заштрихованные области)
346
и второго рода. Из A3.88) следует также, что при
Р-И).
Заметим, что порог /С, устанавливаемый в соответствии с A3.87) 7
не зависит от аь Кроме того, при dn>0 #a>*i-0> т. е. а<1—р
(вероятность ошибки первого рода меньше вероятности отверг-
отвергнуть ложную гипотезу или уровень значимости меньше мощности
правила выбора решения).
Формула A3.88) допускает и другую интерпретацию: при за-
заданных вероятностях ошибок аир определяется минимально воз-
возможная величина dn=(^^tyrn. Это означает, что при заданном.
a
(ai—по)/о существует минимальный размер выборки
Пт1п = '[of (их—по) ] 2 (ха— *1-р) 2,
при котором возможна проверка гипотез с заданными вероятно-
вероятностями ошибок аир.
Если ai<ao, то решение 71 по критерию Неймана — Пирсона
принимается при условии
У»(х) = — 2 **< а0-оха/У7Г. A3,886)
n k=i
13.5.5. Минимаксный алгоритм. Полагая ПОо=Пц=О, П01 =
=KUi0, из A3.27а) для рассматриваемой задачи проверки про-
простых гипотез о среднем значении гауссовской величины находим
следующее уравнение, определяющее наименее благоприятную-
априорную вероятность р0 гипотезы Яо: а = ао [см. также A3.83)]
dn 1 — Ро ;J \ 2 " dn
A3.89>
При К=1 A3.89) следует, что рОм=1/2. При заданном А, на-
наименее благоприятная величина ром соответствует максимальному*
значению Ды—Яб(ром). Как
видно из рис. 13.6, если Х =
= 1, потери уменьшаются не
очень значительно при р0Ф
?= Ром, однако при %=№ ми-
минимаксное правило может
показаться чересчур осто-
осторожным. Но оно гаранти-
гарантирует, что потери никогда не
превысят значения RM. Дей-
Действительно, если при А,= 10
немного отклониться от наи-
наименее благоприятного зна-
значения ром = О,3 и принять
байесовское решение при
Ро
р/о=О,2, то средние потери
будут уменьшены всего на
Рис. 13.6. Зависимость байесовского риска
от вероятности гипотезы при dn=2
347
20%. Если же в действительности рофр'о, а применяется байесов-
байесовское решение для ро»=Ро, то средний риск будет изменяться в за-
зависимости от ро по линейному закону R (р0) =рог(р/0) +
+ A—po)ri(p'o) (касательная в точке ро=р'о к кривой Re(po) при
1=10 на рис. 13.6) и при некоторых значениях р0 может значитель-
значительно превышать RM, соответствующее минимаксному правилу (см.
заштрихованную часть на рис. 13.6).
13.5.6. Оптимальный последовательный алгоритм Вальда. Рас-
Рассмотрим оптимальный многошаговый дискретно-аналоговый ал-
алгоритм проверки простых гипотез о среднем значении гауссовской
случайной величины по критерию минимума средних размеров
выборки до принятия решения. Из A3.39а—в) следует, что ука-
указанный алгоритм предписывает сравнение достаточной статисти-
статистики логарифма отношения правдоподобия A3.67) с двумя поро-
порогами (при а<0,5, р<0,5)
? bJL A3.90)
со 1п , r^ln.
1 — а а
Этот же алгоритм можно записать, используя статистику A3.68):
«а я-м шаге принимается решение у0, если
+ _?a_ A3.9,a)
шли решение 7ь если
«ли продолжаются наблюдения, если не выполняется ни одно из
неравенств A3.91а,б).
Определим средние значения (минимально возможные) раз-
размеров выборки до принятия решения. Так как в рассматриваемом
случае
где х — гауссовская случайная величина с известной дисперсией
<у2 и средними значениями а0 при гипотезе, а{ — при альтернати-
альтернативе, то по формулам A3.46а—б) находим
"ч° (\r°J --"»• A3-92>
Подставляя A3.92) в A3.45а,б) получаем
•WJl^[r?7 f] A394)
348
¦1-рЩ
13.5.7. Проверка простой
гипотезы о среднем значении
против сложной альтернативы.
Предположим, что о неизвест-
неизвестном среднем значении гауссов-
ской случайной величины выд-
выдвигается простая гипотеза Я:
a = a,Q против сложной альтер-
альтернативы /(: афпъ. Дисперсия о2
при этом предполагается из-
известной. Как отмечалось в
п. 13.5.4, оптимальный алго- Рис' 137' ФУНК*ИЯ мощности
ритм A3.71), A3.87) при условии а{>а0 несмещенный и не зависит
от альтернативы. Потому алгоритм, определяемый неравенствами
г/п(х) = —
A3.95)
является несмещенным равномерно наиболее мощным алгоритмом
относительно сложной альтернативы К: а>а0.
Однако, если проверяется гипотеза а=а0 против сложной аль-
альтернативы аФа09 причем а может принимать любые действитель-
действительные значения, то равномерно наиболее мощного правила не су-
существует. Функция мощности для правила A3.95) имеет вид1
A3.96)
где F(z) —интеграл Лапласа.
При а>а0, 1—р(а)>а функция мощности монотонно возра-
возрастает при увеличении а и 1—C(ао)=а. Но если а<а0, то
1—||3(а)<а, причем функция мощности убывает при уменьшении
а (рис. 13.7). Таким образом, если не ограничивать значения па-
параметра а, то правило A3.95) смещенное.
Если а<Са0, равномерно несмещенный наиболее мощный ал-
алгоритм принятия решения при сложной альтернативе определя-
определяется неравенствами
ах
i=l
Yo
A3.97)
^Можно показать [6], что для альтернативы, включающей все
действительные значения параметра а, несмещенный равномерно
наиболее мощный алгоритм определяется следующим образом:
принимается решение 71 (отклоняется гипотеза Яо), если
— 2*1
п i=\
-а0
A3.98)
1 Заметим,_что при а^а^ формула A3.96) не отличается от A3.88а), так как
dn= (ai—ао)уп1в. В рассматриваемом случае альтернатива включает все дей-
действительные значения параметра а и поэтому функция мощности совпадает с
функцией вероятности правильного принятия альтернативы.
349
В отличие от алгоритмов A3.95) и A3.97) алгоритм A3.98)
двусторонний, так надкритическая область определяется двумя
порогами ao±GXa/2/Vn .(при этом критическая область двусвяз-
ная).
Функция мощности, соответствующая правилу A3.98) (штри-
(штриховая линия на рис. 13.7), имеет вид
A3.99)
и достигает минимума при а=а0
1—РМ=2[1—-F(*a/2)]=a.
При всех a>ao функция A3.96) превышает A3.99), так как для
произвольного с>0 F{xa/2—c)—F(xC(t—c)>F{—Xa/2—c). При
а=а0 обе функции совпадают, но при a<a0 мощность правила
A3.95) меньше мощности правила A3.98).
Теперь в рассматриваемой задаче используем критерий мак-
максимального правдоподобия A3.62) и покажем, что статистика
максимального правдоподобия [левая часть A3.62)] представ-
представляет монотонную функцию статистики, определяющей алгоритм
A3.98). Так как
max W(x\a) = Bяо2)-"/2 ехр -
2 (** - а? 1,
1 "
где а= —2 хи то в соответствии с A3.62)
п i=i
maxW(x\a)
или
A3.100)
Из A3.98) и A3.100) следует, что алгоритм максимального прав-
правдоподобия, определяемый неравенствами
^' (Ш01)
является несмещенным РНМ алгоритмом при проверке простой
гипотезы а=а0 против сложной альтернативы афа0.
13.5.8. Несмещенный РНМ алгоритм проверки простой гипо-
гипотезы о среднем против сложной альтернативы при неизвестной
дисперсии. Необходимо проверить гипотезу Н о том, что выборка
350
Xu..., Xn принадлежит нормальному распределению со средним
по и неизвестной дисперсией а2, против сложной альтернативы К>
что эта выборка принадлежит нормальному распределению со
средним афа0 и неизвестной дисперсией а2. В этой задаче неиз-
неизвестная дисперсия является мешающим параметром. Рассмотрим
статистику
р2 (*|*о)[Ц2 (%я)Г , л>1. A3.102)
У а |л1 J
Для гипотезы Я, т. е. при независимых нормально распределен-
распределенных выборочных значениях Х{ с параметрами (а0, о2), эта стати-
статистика распределена по закону Стьюдента с п—1 степенью свобо-
свободы. Плотность вероятности для распределения Стьюдента
Г (я/2) !1+Л\-1\ n>L A3.103)
1)/2]УA) ^ п-\) ^ К '
Обозначения / и Sn-\ {t) приняты в статистике для случайной
величины A3.102) и ее плотности вероятности.
Можно показать (см., например, [41]; гл. 3), что при а>а0
несмещенным равномерно наиболее мощным является такое пра-
правило, при котором критическая область определяется неравен-
неравенством
t>ta, A3.104)
где ta—а-процентная точка распределения Стьюдента, т. е. откло-
отклоняется гипотеза Н о том, что среднее равно по при неизвестной
дисперсии, если
in Г 1 п л 11/2 t
— s*i-*o> -Ч^^-^J -*=- A3-105)
Сравнивая правило A3.105) с аналогичным правилом A3.95)
для проверки простой гипотезы о среднем против сложной альтер-
альтернативы, когда дисперсия известна, замечаем: в A3.105) неизве-
неизвестная дисперсия представлена выражением в квадратных скоб-
скобках, а процентная точка ха нормального распределения заменена
процентной точкой ta распределения Стьюдента.
Если выборочные значения xu t=l, n, независимы, распреде-
распределены нормально, но афа0, то статистика t(x\a0) подчиняется не-
нецентральному распределению Стьюдента
х
п
х]уТ~ ехр - — [y + [t ]/^=гг-вп) )d0' A3.106)
где
6n=(a-a0)Vn/o A3.107)
351
— параметр нецентральности, при а=аи совпадающий с пара-
параметром rfn, определенным согласно A3.77).
Используя A3.106), запишем выражение вероятности ошибки
второго рода при использовании правила A3.105):
р(бп)- j Sn_i(f, 8n)dt. A3.108)
—оо
Если а<#о, то равномерно наиболее мощное правило провер-
проверки сложной гипотезы о том, что среднее равно а0 при неизвестной
дисперсии, определяет критическую область неравенством [ср. с
A3.97)]
11/2 *" A3.109)
В этом случае, когда альтернатива содержит все действитель-
действительные значения а, равномерно наиболее мощного правила не суще-
существует. Но аналогично A3.98) правило, согласно которому гипо-
гипотеза Н отвергается, если
hf^ A3.110)
является наиболее мощным несмещенным правилом с заданной
вероятностью а ошибки первого рода. При этом вероятность ошиб-
ошибки второго рода
'а/2
Р(б„)= Г Sn-x(t, bn)dt. A3.111)
-'а/2
13.5.9. Алгоритм максимального правдоподобия проверки ги-
гипотез о среднем значении при неизвестной дисперсии. Рассмот-
Рассмотрим ту же задачу, что и в п. 13.5.8, но используем критерий мак-
максимального правдоподобия. Покажем, что в рассматриваемом слу-
случае статистика максимального правдоподобия [см. левую часть
A3.62)] представляет монотонную функцию статистики Стьюден-
та A3.102). Максимум функции
W(x\a,
— 2 (xt-df] A3.112)
2°2 f-i J
по двум переменным а и а2 достигается при значениях этих пара-
параметров, удовлетворяющих системе уравнений
откуда находим экстремальные значения параметров а и а2:
а = — 2 хк9 A3.113)
о2 = — 2 (Ч~аJ. A3Л14)
352
Подставляя A3.113), A3.114) в A3.112), находим
maxW(x\ay а2) = Bяа2)-"/2ехр(-п/2). A3.115)
а, о*
Аналогично
maxW(x\aOi o2)= Bло2)-"/2ехр(-п/2), A3.116)
о*
где
%-oo)'- К13Л17)
п
Тогда в соответствии с A3.62)
maxlF(x|a, a2)
f
2 \/
— | • A3.118)
Но из A3.102), следует, что
К**—
2 (хл-а)» S(*ft—вJ
т.е. Л(х)-^Г1 + -Ц^(х|«о)Т/2- A3.119)
L п 1 J
Из A3.110) и A3.119) следует, что алгоритм максимального
правдоподобия, определяемый неравенством
2, A3.120)
является несмещенным РНМ алгоритмом проверки простой гипо-
гипотезы а=а0 против сложной альтернативы афа0 при неизвестной
дисперсии а2.
13.6. ПРОВЕРКА ПРОСТОЙ ГИПОТЕЗЫ О ВЕКТОРЕ
СРЕДНИХ МНОГОМЕРНОГО НОРМАЛЬНОГО
РАСПРЕДЕЛЕНИЯ ПРОТИВ ПРОСТОЙ АЛЬТЕРНАТИВЫ
13.6.1. Постановка задачи и априорные данные. Имеется неод-
неоднородная зависимая выборка х= (хи ..., хп) заданного размера п.
Выдвигается простая гипотеза Яо о том, что эта выборка подчи-
подчиняется я-мерному нормальному распределению с вектором средних
{|} ( ) aoi = mi{xi\Ho}, i=l9 ny
A3.121а)
12—«7 353
против простой альтернативы Нх о том, что
=ai = (an,..., aln)9 ali=mi{xi\Hi}9 i=~n.
(
A3.1216)
При этом предполагается, что ковариационная матрица
UH A3.121b)
известна и одинакова как при гипотезе, так и при альтернативе.
Функции правдоподобия выборки х на выборочном пространстве
X" [см. B.64)} •
= ^ ^.«,lti ^ , ехп Г L (х - а,У К" (х - а
A3 122а)
ехр Г - — (х - а^' К (х - ajl.
№ (x|#!) =-тг—? Г75
V ' V Bя)"/2 (det KI/2
A3.1226)
Задача состоит в установлении оптимального (по заданному кри-
критерию) правила выбора одного из двух решений
Vo:^i{x}=ao, vi:miW=ai. A3.123)
13.6.2. Достаточная статистика. Как и для независимой одно-
однородной выборки (см. п. 13.5.2), достаточной статистикой в рас-
рассматриваемой задаче является логарифм отношения правдоподо-
правдоподобия. Из A3.122а) и A3.1226) находим
In ЦХ) = In Г(х|//1) = (аг - а0)' К^1 х -
-Y(ai + a°)/K^(ai-ao)- A3Л24)
Так как в правой части A3.124) второй член — известная кон-
константа, то достаточной статистикой будет также
^(x) = u'x=--2^xft, A3.125)
fe=i
где
u'= (uu ..., ип) = (ai-ao)^. A3.125а)
Статистика уп(х) как линейная комбинация зависимых гаус-
совских величин подчиняется нормальному закону распределения
(см. п. 3.3.3), Параметры этого распределения при гипотезе #о
и альтернативе #i
т^уп^) \Но}=ъ'&ъ=Bц—Ъъ)'?гхЪъ, A3.126а)
тх{уп (х)|Я1}=и/а1=(а1-а0)/К-1а1, A3.1266)
МУп(*)\Н*} = \*,2{уп(х)\Н1}=(Рп, A3.126в)
где
d\= (El—ao)/K-l(ai—а0). A3.127)
354
Заметим, что параметр dn определяет «расстояние» между
статистиками */п(х) при гипотезе и альтернативе [ср. с A3.82)]
[тг{уп(х) \Нг}—т±{уп(х) |//о}]/[МУ»00 |#о, Hl}]^ = dn.
: « A3.128)
При п-^оо «расстояние» между статистиками увеличивается, так
как при этом dn-^oo.
Отметим, что параметр dn определяет также среднее и дис-
дисперсию статистики логарифма отношения правдоподобия A3.124),
которая, как и статистика A3.125), распределена по нормально-
нормальному закону. Из A3.124) следует
mi{\nl{x)\Hi}=—ml{\nl(x)\Ho}==d2n/2i A3.129а)
l(x)\Ho} = d2n. A3.1296)
13.6.3. Оптимальные алгоритмы. Из результатов, приведенных
в § 13.1, следует, что оптимальные дискретно-аналоговые алго-
алгоритмы принятия решения при проверке простой гипотезы #о: а=
= ао против простой альтернативы #i:a=ai (при известной ко-
ковариационной матрице К) состоят в сравнении с порогом доста-
достаточной статистики A3.125)
A3.130)
Yo
где порог К определяется выбранным критерием качества. Для
байесовского алгоритма, а также для алгоритмов максимальной
апостериорной вероятности и максимального правдоподобия
7(=у(а1 + а0)/К(а1-а0) + 1пс, A3.131)
где константа с для указанных критериев приведена в табл. 1.1.
При использовании оптимальных по указанным трем критери-
критериям алгоритмов вероятности ошибок первого и второго рода
, A3.132)
A3.133)
где F(z) —интеграл Лапласа. Подставляя A3.131) в A3.132),
A3.133), получаем
, A3.134)
A3.135)
Формулы A3.134) и A3.135) имеют тот же вид, что и A3.75),
A3.76), и отличаются значением параметра dn. Поэтому в рассма-
рассматриваемом случае можно использовать формулы A3.80), A3.83),
A3.84), если только подставлять в них значения параметра dn
согласно A3.127).
Алгоритм принятия решения, определяемый неравенствами
A3.130), оптимален также и по критерию Неймана — Пирсона,
12* 355
если при заданной вероятности а ошибки первого рода согласно
A3.132) [ср. A3.87)] порог
К= (ai—aoKK-^ao+dnJa- A3.136)
Минимальная вероятность ошибки второго рода определяется по
формулам A3.133) и A3.136), в которые подставляется значе-
значение параметра dn из A3.127).
Если результаты наблюдений представлены не одним я-мер-
ным вектором х, а N независимыми векторами xh, k=ly N9 т. е.
матрицей размером NXn9 то решение задачи проверки простых
гипотез о векторе средних гг-мерного нормального распределения
сводится к рассмотренному, если выборку х заменить средним
1 N
арифметическим— 2 хл> а матрицу К—матрицей K/N. Величину
N k=\
d2n в A3.127) при этом следует заменить на Nd2n.
13.6.4. Другая форма достаточной статистики. Выражение
1A3.124) логарифма отношения правдоподобия можно упростить
путем декорреляции случайных величин хи •••, хп (см. п. 3.1.10).
Пусть С — ортогональная матрица, векторами-строками которой
являются собственные (ортонормированные) векторы ср;, 1=1, п
ковариационной матрицы К указанной совокупности зависимых
выборочных значений [ом. C.20)]. Тогда компоненты вектора
у=Сх A3.137)
некоррелированы и, следовательно, независимы, так как выборка
принадлежит нормальному распределению. Матрица
CKC/ = D A3.138)
диагональная, ее элементы к\,..., Кп — собственные значения (по-
(положительные) ковариационной матрицы К.
Из уравнения A3.137) находим
m1{y\Hj}=bj = Cmi{x\Hj} = C^ /=0; 1. A3.139)
Используя A3.137) и учитывая A3.139), получаем из A3.124)
In I (х) = (Ъг - Ъ0У СК С у - y (Ьг + Ьо)' СК С (Ъ± - Ьо) -
= (bi-borDy-y(b1 + borD(b1-bo). A3.140)
Так как второе слагаемое в A3.140) —известная компонента, то
достаточной статистикой будет также
gn(x) = (bl-b0YDy^ ЪК(Ьи-Ьог)уи A3.141)
где biz, bOi — компоненты векторов bi и Ьо.
В отличие от статистики уп{*) статистика gn{x) представляет
линейную комбинацию независимых гауссовских случайных вели-
величин уit i=l, п.
356
13.7. ПРОВЕРКА ГИПОТЕЗ В УСЛОВИЯХ
НЕПАРАМЕТРИЧЕСКОЙ АПРИОРНОЙ НЕОПРЕДЕЛЕННОСТИ
13.7.1. Типы задач. Ранее рассматривались задачи проверки
гипотез относительно параметров функций правдоподобия (пара-
(параметрических гипотез). Теперь рассмотрим некоторые типы задач
проверки гипотез в условиях непараметрической априорной не-
неопределенности (непараметрических гипотез), когда функции
правдоподобия принадлежат непараметрическому классу (см.
п. 12.2.2).
Ограничимся независимыми однородными выборками. Тогда
непараметрический класс функций правдоподобия
A3.142)
k=\
где w(x)—произвольная одномерная плотность вероятности.
Один тип задач проверки непараметрических гипотез — зада-
задачи сдвига. Гипотезе Н о том, что w(x) =w(х\Н)у противопостав-
противопоставляется альтернатива К
w{x\K)=w(x—®\H)t ЪФО. A3.143)
В некоторых случаях априори известно, что при гипотезе Н рас-
рассматриваемому непараметрическому классу принадлежат распре-
распределения, симметричные относительно медианы хо=хо,5. Тогда
альтернативой в задаче сдвига является Хо?=#о,5.
Другой тип задач проверки непараметрических гипотез — за-
задачи масштаба. Гипотезе Н о том, что w (х) = w (x\ H) противопо-
противопоставляется альтернатива
w(x\K)=w(bx\H), ЬФ\. A3.144)
Представляет интерес также задача проверки гипотезы Н о
том, что выборка однородная, независимая [см. A3.142)], про-
против альтернативы /С, что элементы выборки зависимы, т. е.
A3.145)
k=l
Эту задачу иногда называют задачей проверки случайности.
13.7.2. Непараметрические алгоритмы проверки гипотез. Рас-
Рассмотрим дискретно-аналоговые одношаговые алгоритмы проверки
непараметрической гипотезы Н против непараметрической аль-
альтернативы К. Каждый алгоритм основывается на разбиении вы-
выборочного пространства Хп на две непересекающиеся области Хн
и Хк, Хн{]Хк = Хп. Если выборка хеХн, то принимается решение
Ун о том, что справедлива гипотеза Н, а если xgX^, to прини-
принимается решение ук в пользу альтернативы К. Обозначим через
wH и wK непараметрические семейства функций правдоподобия,
357
соответствующие гипотезе Н и альтернативе К. Вероятности оши-
ошибок первого и второго рода запишутся в виде
a{Wn} = P{x<=XK\H}t Wn<=wH, A3.146)
${Wn}=P{x<=XH\K}t Wn(=wK. A3.147)
Обычно к непараметрическим относят алгоритмы принятия ре-
решения, для которых вероятность ошибки сохраняет постоянное
значение по отношению к одной из непараметрических гипотез (Н
или /(). «Истинно» непараметрический алгоритм должен обладать
указанным свойством по отношению к обеим непараметрическим
гипотезам.
13.7.3. Критерий качества непараметрических алгоритмов про-
проверки гипотез. Ограничимся непараметрическими состоятельными
алгоритмами принятия решения, для которых вероятность а ошиб-
ошибки первого рода
а=Р{хе=Х*|Я} A3.148)
постоянна для всех Wn(x)^wH. Зададимся некоторой величи-
величиной |3 вероятности ошибки второго рода. Для фиксированной аль-
альтернативы К рассмотрим две последовательности алгоритмов 8П
и 6*п*, где {п}, {п*}—последовательности размеров выборок.
Так как алгоритмы состоятельные, то всегда найдутся такие на-
наименьшие размеры выборок nk, n*h, для которых
Р- A3Л49)
Непараметрический алгоритм 8*п* более эффективен, чем алго-
алгоритм бп, если при заданных аир размер выборки n*k^nh. Из
двух непараметрических алгоритмов, поддерживающих постоян-
постоянное значение ошибки первого рода, более эффективен тот, для ко-
которого заданное требование к вероятности ошибки второго рода
удовлетворяется при меньшем размере выборки. Мерой эффек-
эффективности алгоритма является отношение указанных размеров вы-
выборок, которое называют коэффициентом относительной эффек-
эффективности 8*п* по отношению к алгоритму 6П [см. A2.34)):
ра,3 («п, f?n*) = nklnk. A3.150)
Алгоритм 8*п* более эффективен, чем 8П, если ра,з^1.
Предположим, что алгоритм 80n — оптимальный по критерию
Неймана — Пирсона при полностью известных распределениях вы-
выборки как для гипотезы, так и для альтернативы. Ясно, что ко-
коэффициент относительной эффективности непараметрического ал-
алгоритма 8*п* по отношению к 8°п будет меньше или, по крайней
мере, не больше единицы. Однако, если распределение выборки
при гипотезе Н изменилось, то непараметрический алгоритм 8*п%
сохраняющий то же самое значение вероятности ошибки первого
рода, становится более эффективным, чем алгоритм 8°п, который
уже утратил свойство оптимальности в изменившейся ситуации.
358
Как уже отмечалось в п. 12.5.2, иногда не удается вычислить
коэффициент относительной эффективности по формуле A3.150),
и тогда для характеристики качества алгоритма принятия реше-
решения используют коэффициент асимптотической относительной эф-
эффективности [см. A2.34а)].
13.7.4. Синтез непараметрических алгоритмов. Непараметриче-
Непараметрический (по отношению к гипотезе Н) алгоритм 6*п* — оптимальный
по критерию относительной эффективности (т. е. наиболее эффек-
эффективный), если при заданных значениях вероятностей ошибок а и
Р для любых других напараметрических алгоритмов бп выполня-
выполняется неравенство ра,р (бп, 6*п*)~^1. Алгоритм 8*п* будет равно-
равномерно наиболее эффективным, если указанное неравенство при
фиксированном значении а выполняется %л* любого значения fl
В отличие от синтеза оптимальных алгоритмов проверки про-
простых гипотез и гипотез в условиях парамехричеслии неииределей-
ности регулярных общих методов синтеза наиболее эффективных
непараметрических алгоритмов пока не существует. Поэтому не-
непараметрические алгоритмы проверки гипотез синтезируются на
эвристической основе. При фиксированном условии A3.148) ус-
устанавливается соответствие между критической областью Xfe вы-
выборочного пространства Хп и некоторой статистикой (функцией
выборочных значений) уп(х), которое может быть следующим:
A3.151)
или #п(х)^Сн. A3.152)
Неравенство A3.154) определяет односторонний алгоритм, а не-
неравенства A3.152)—двусторонний.
Конечно, из условия A3.148) статистика #п(х) не определяется
однозначно. Задача синтеза на эвристической основе состоит в
подборе статистики #п(х), которая определяет непараметрический
алгоритм бп (например, односторонний), удовлетворяющий ус-
условию
Р{уп(х)^с\Н} = а. A3.153)
При этом нет гарантии того, что может быть найдена другая ста-
статистика gn(x), удовлетворяющая такому же условию A3.153), ко-
которая определяет непараметрический алгоритм б*п более эффек-
эффективный, чем 6П-
13.7.5. Коэффициент асимптотической относительной эффектив-
эффективности алгоритма, использующего асимптотически нормальную ста-
статистику. Рассмотрим два состоятельных односторонних алгорит-
алгоритма проверки гипотезы Я против альтернативы К, удовлетворяю-
удовлетворяющих условию A3.153). Решение у\ (отклоняется гипотеза Н) при-
принимается, если
(алгоритм 6^>П1), A3.154)
2 (алгоритм 6<2>па). A3.155)
359
Предположим, что распределения статистик ут П1 (х) и
У{2)п 2 (х) асимптотически нормальные К Обозначим
щ {ум (хЩ - «<;V A3.156а)
; = [ o«;V]2, » = 1; 2. A3.1566)
Предположим также, что
=1- A3.156b)
Предельные при я^оо рабочие характеристики алгоритмов
бA)П1 и бB)п2, связывающие предельное значение вероятности р
ошибки второго рода с заданной вероятностью а ошибки первого
рода, имеют следующий вид [ср. с A3.88а)]:
*!_р = *„-<*„ A3.157а)
где
Если (как это часта бывает) дисперсия статистики y{i)Ui (к)
растет пропорционально размеру выборки пг-, то для того, чтобы
величина di была конечной и отличной от_нуля, необходимо, что-
чтобы разность а>п\ — а^^н возрастала как Yni-
Предположим далее, что при п{-+оо альтернатива К и гипо-
гипотеза Н сближаются. При этом а\}}jc*a\t}н- Введем малый параметр
* и обозначим а\}}к = аЦ} (О) a\f?H = a$ @). Тогда
где
Полагая 7i=^ ^«i, получаем из A3.1576) и A3.158)
di^ym, A3.159)
где _
е,= lim [а^Щ'1[оЦ}нУщ\, i=l;2. A3.160)
1 Во многих случаях асимптотическая нормальность статистики уп\х) сле-
следует из центральной предельной теоремы. Как известно, центральная предельная
теорема формулируется относительно нормированных статистик [#п(х)—miX
X{#n(x)}]/[fi2[#n(x)}]1/2. Мы будем часто использовать термин «асимптотически
нормальная статистика» для ненормированных статистик, имея при этом в виду,
что распределение суммы случайных величин при большом числе слагаемых при
определенных ограничениях аппроксимируется нормальным распределением со
средним и дисперсией, зависящими от числа слагаемых.
360
Величину 8г, определенную согласно A3.160), называют эффек-
эффективностью алгоритма 6(^п.
Из A3.157а) и A3.159) получаем линейное уравнение относи-
относительно yiy которое имеет единственное решение:
Ъ = (*а-*1-э)/е*, i=l; 2. A3.161)
При фиксированных значениях а и р из A3.161) находим следу-
следующее выражение коэффициента асимптотической относительной
эффективности (КАОЭ) алгоритма 6A)п по отношению к алго-
алгоритму бB)п:
''-/_^!_\2 A3.162)
где si и ег определяются согласно A3.160).
Если первые г производных а^п^Ь) по О при Ф = 0 обраща-
обращаются в нуль, то в A3.160) вместо первой производной следует под-
подставить (г+1)-ю производную a<f)nj (О) при О = 0.
Заметим, что из определения КАОЭ следует, что при фикси-
фиксированных вероятностях а и § для трех алгоритмов 6A)п, 8B)п,
б(?)п имеет место следующее соотношение:
р(бО>, 6<3>)=р(в<4>, 6<2>)рF<2>, б<3)). A3.162а)
13.8. СТАТИСТИКИ, ИСПОЛЬЗУЕМЫЕ
В НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМАХ ПРОВЕРКИ
ГИПОТЕЗ
13.8.1. Предварительные замечания. Если имеется независимая
однородная выборка, то, используя некоторые статистики от нее,
можно на эвристической основе получить непараметрические ал-
алгоритмы проверки гипотез, для которых вероятность ошибки пер-
первого рода остается постоянной при произвольных размерах вы-
выборки для любых распределений, характеризуемых плотностью
w(x)^wH. Вероятность ошибки второго рода при использовании
таких алгоритмов будет, в общем больше минимально возмож-
возможной для данного распределения при альтернативе.
Рассмотрим следующие статистики, на основе которых могут
быть получены непараметрические алгоритмы: знаковые, поряд-
порядковые, ранговые и знаково-ранговые.
13.8.2. Знаковые статистики. Пусть х= (#i, ..., хп) — наблюда-
наблюдаемая выборка. Введем знаковую функцию
sign* = —^— =/ [• х>0* A3.163)
У\х\ 1-1, *<0.
Знаковым вектором выборки х назовем вектор sgnx с компонен-
компонентами sgnxb..., sgnxn. Пространство всех знаковых векторов вы-
выборки размером п содержит 2п точек. Произвольную функцию
компонент знакового вектора назовем знаковой статистикой, а
361
алгоритм, использующий знаковую статистику — знаковым алго-
алгоритмом.
Пусть рассматривается задача сдвига (см. п. 13.7.1) и априори
известно, что при гипотезе Н наблюдения характеризуются плот-
плотностью w(x), которая принадлежит непараметрическому классу
wH распределений, симметричных относительно нуля лго==л:о,5 = О.
Если выборка х независимая, однородная, то число положитель-
положительных и отрицательных знаков в выборке равновероятно для всех
ш(х)е%, т. е. Р{х^0\Н} = 1/2. При альтернативе К: л:о=#о,5>
>0 вероятность появления положительных знаков больше веро-
вероятности появления отрицательных для всех w(x—О), /&>0, т. е.
Р{#г>0|/(}=р>1/2. Это позволяет использовать знаковую ста-
статистику для принятия или отклонения гипотезы Н о симметрии
относительно нуля плотности распределения, которому принадле-
принадлежит наблюдаемая выборка.
Для рассматриваемого симметричного распределения наблю-
наблюдений, для которого плотность w(x) =w{—х)у нетрудно записать
распределение знакового вектора выборки х размером п:
P{sgnx=(sgnx),|tf} = (l/2)*, t=l,..., 2", A3.164а)
A3.1646)
где sgnxfe — вектор, содержащий k единиц, р>1/2.
Заметим, что гипотеза Н о симметрии плотности w(x) относи-
относительно нуля влечет утверждение, что медиана распределения рав-
равна (нулю: лго,5 = О (как уже отмечалось). Однако обратное утверж-
утверждение, вообще говоря, неверно, т. е. из Хо,5 = О не следует обяза-
обязательно симметрия распределения.
Иногда вместо знаковой функции A3.163) используют функ-
функцию единичного скачка [см. B.7)], которая однозначно связана
со знаковой функцией, так как
2u(x)=sgnx+L A3.165)
Вектор и(х)=![и(*1), ..., и(хп)] назовем положительным знако-
знаковым вектором выборки х.
13.8.3. Порядковые статистики. Перегруппируем элементы вы-
выборки х= (х\у ..., хп), расставляя их в возрастающем порядке так,
что xW^Zx(i\ если k<Cj. Тогда получим упорядоченную выборку
*A\ ..., #(п), которую называют также вариационным рядом. Век-
Вектор #(•>, компонентами которого являются элементы упорядочен-
упорядоченной выборки, называют вектором порядковых статистик, а ком-
компоненты этого вектора — порядковыми статистиками. Для выбо-
выборок из распределения, имеющего непрерывную плотность, вероят-
вероятность совпадения двух и более выборочных значений (а следова-
следовательно, и порядковых статистик) равна нулю.
Для однородной независимой выборки размером п из распре-
распределения Fi(x) нетрудно найти функцию распределения F^(x)
порядковой статистики х^\ Так как вероятность того, что в не-
362
зависимой выборке хи ..., хп имеется ровно k элементов, не пре-
превосходящих заданного порога ху равна
то
k=i
:)]"-*, » = ГЛГ х(п+1) = оо. A3.166)
Из A3.166) дифференцированием по х правой части получим
выражение для плотности вероятности порядковой статистики х(г):
- (л - fe) [F, (*)]* [1 - /?! (л:)]"-6-1} =
= пш1(^)'"/
- S (
"~11)[F,W]'-41- iWr'a-iW. A3.167a)
Совместная плотность вероятности г порядковых CTaTHCTHK
= x{si\ I<s1<...<sr<n, [42]
Щ(У1,-, Уr) = n\[(s1 -l)!(s2-sx-l)!...
... (n - sjir1 Ft1"' (yx) [Fx (У2) - -ri (yi)]Ss~Sl"' -
A3.1676)
Из A3.167а и б) следует, что совокупность порядковых ста-
статистик л;*1), ..., х{п) представляет простую марковскую последова-
последовательность, так как
w \Уг+1\Уг> •" у ifi) =
Уи ...
= n-r)wl (yr+1) ' '
^^; , )в A3.167в)
13.8.4. Ранговые статистики. Рангом Ri элемента xi выборки
называется порядковый номер этого элемента в вариационном ря-
363
ду или, другими словами, число элементов выборки х меньших
или равных Х\. Следовательно, выборочному значению х\ соответ-
ствует порядковая статистика х * вариационного ряда.
Ранговым (вектором R (х) = (i?b ..., kn) выборки х называется
перестановка чисел 1, 2, ..., которая получается при замене эле-
элементов выборки их рангами. Ранговой статистикой называется
произвольная функция от рангового вектора. Ранговый алгоритм
предписывает сравнение некоторой ранговой статистики с поро-
порогом.
Исходную выборку х можно восстановить, если известен век-
вектор х(') порядковых статистик и ранговый вектор R. Отдельно
любой из этих двух векторов представляет необратимое нелиней-
нелинейное преобразование исходной выборки. Для однородной незави-
независимой выборки х случайные векторы х<*) и R независимы.
Ранг Ri элемента Хг выборки размером п при помощи функ-
функции единичного скачка и(х) или знаковой функции можно пред-
представить следующим образом:
Ri= 2 u(Xi-xh), i = T7n, A3.168a)
/г=1
Д*=-"Г2 sgn(xi-xk)+-^ , i'=T77i. A3.1686)
Из A3.168а и б) следует, что ранги являются знаковыми ста-
статистиками от разностей выборочных значений.
Для однородной независимой выборки функция правдоподо-
правдоподобия инвариантна к группе перестановок аргументов. Отсюда сле-
следует, что для указанной выборки все ранговые векторы равно-
равновероятны, каково бы ни было распределение, которому принад-
принадлежит выборка. Общее число возможных ранговых векторов, со-
соответствующих выборке размером п, равно числу перестановок п
чисел, т. е. п\ Следовательно, выборочное пространство ранговых
векторов состоит из п\ дискретных точек ^-мерного эвклидового
пространства. Вероятность попадания рангового вектора R на-
наблюдаемой выборки в любую точку п, *=1, 2,..., п\ этого дис-
дискретного множества равна 1/az!, т. е. для любого распределения
однородной независимой выборки
f=l, 2,..., п\ A3.169)
Таким образом, ранговый алгоритм — непараметрический по
отношению ;к гипотезе Н о том, что выборка из произвольного
распределения однородная и независимая. Для альтернативы К
о том, что независимая выборка неоднородная, ранги перестают
быть равновероятными. Для определения функции распределения
рангового вектора при альтернативе К необходимо вычислить ин-
интеграл
P{R = rf|/C}= Ja;(x|/C)dx, /=1,2, ... , п\
At
364
где область Аг^Хп включает те точки выборочного пространства,
которым при упорядочивании соответствует заданный вектор
U= (Г1<*>,..., rn(i)). Этот интеграл [42]
) ,К°)|Я| )
|fli''=1'2'-''lfll A3Л7О)
Практическое использование формулы A3.170), за исключением
специальных случаев, сопряжено с трудно выполнимыми вычис-
вычислениями. Из-за сложности распределения A3.170) синтез опти-
оптимального по критерию Неймана — Пирсона рангового алгоритма
проверки гипотез при конечном размере выборки практически не-
нереализуем. Это также одна из причин того, что указанный синтез
осуществляют на эвристической основе (см. п. 13.7.4).
Отметим, что ранговый вектор однородной независимой вы-
выборки инвариантен к безынерционному преобразованию выборки
R(x) =R(fx), f,=![/(*i) /(*«)], A3.171)
так как такое преобразование ие изменяет относительного распо-
расположения элементов выборки х. Из A3.171) следует, что ранговый
алгоритм сохраняет непараметрическое свойство и после указан-
указанного нелинейного преобразования.
13.5.8. Знаково-ранговые статистики. Дополним гипотезу Н
об однородности >и независимости выборки предположением, что
плотность распределения выборочного значения симметрична
w(x)=w(—х). Если альтернатива К состоит в нарушении сим-
симметрии функции 'плотности, то при такой альтернативе будет со-
сохраняться инвариантность функции правдоподобия выборки к пе-
перестановкам аргументов и, следовательно, использование ранго-
ранговой статистики не позволит проверить гипотезу Н против альтер-
альтернативы К. Но нарушение симметрии плотности приводит к тому,
что выборочные значения определенного знака становятся более
вероятными, чем выборочные значения (противоположного знака.
Поэтому при ранжировании следует сохранить информацию о
знаке. Для этого используют вектор абсолютных величин наблю-
наблюдений
|x| = (|*i|,..., |*я|) A3.172)
и вектор положительных рангов
R+= (/?+!, ..., Я+п), A3.173)
компоненты которого представляют порядковые номера элементов
вариационного ряда |х|A), ..., |х|(п) выборки абсолютных величин
наблюдений. Ясно, что
xt = |*| ( **") sgn xu i = Т7л . A3.173а)
365
Элементы вектора положитель-
положительных рангов A3.172) можно пред-
представить в виде [ср. с A3.168а)]
Рис. 13.8. Задача сдвига
[A3.174)
Функция вектора положитель-
положительных рангов R+ и вектора знаков
и(х) называется знаково-ранговой статистикой. Алгоритм, исполь-
использующий знаково-ранговую статистику, называется знаково-ранго-
вым.
Если выборка однородная, независимая и выполняется условие
симметрии плотности вероятности выборочных значений, то сово-
совокупность случайных векторов sgnx, R+ и |х|<'> независимая и
A3.174а)
A3.1746)
где г — вектор перестановок чисел от 1 до л, a v — вектор, ком-
компоненты которого равны ±1.
13.8.6. Односторонний знаковый алгоритм. Рассмотрим задачу
проверки гипотезы Н о том, что независимая однородная выборка
x=(a:i, ..., хп) принадлежит симметричному относительно нуля рас-
распределению с плотностью w(x) против альтернативы /С, что эта
выборка принадлежит тому же симметричному распределению, но
с плотностью w(x—О), сдвинутому на ФХ) (т. е. симметричному
относительно х = $). По классификации, приведенной в п. 13.7.1,
сформулированная задача проверки непараметрических гипотез яв-
является задачей сдвига (рис. 13.8).
Как отмечалось в п. 13.8.2, любую знаковую статистику можно
использовать для построения непараметрического алгоритма при-
принятия или отклонения гипотезы Н о симметрии распределения
относительно нуля. Часто в качестве такого алгоритма (на эврис-
эвристической основе) выбирают простейший односторонний линейный
знаковый алгоритм, предписывающий сравнению суммы знаков с
порогом:
sgn xk
с1У
A3.175)
где Yi ~ решение отклонить, а 7о — решение принять гипоте-
гипотезу Н.
Учитывая связь функций sgnx и ^(л:)[см. A3.165)], можно
линейный знаковый алгоритм A3.175) записать в виде
и (xk)
с.
A3.176)
366
Обозначим вероятность
Для гипотезы Н величина р=1/2, а для альтернативы К при
>0р>1/2.
Сумма в левой части A3.176), равная числу положительных
значений в независимой однородной выборке размером п, подчи-
подчиняется биномиальному закону распределения вероятностей с па-
параметрами (пу 1/2), если справедлива гипотеза Я, и с параметра-
параметрами (я, /?), если справедлива альтернатива К (см. п. 1.3.1, а также
A3.164а и б)). При заданной вероятности а ошибки первого ро-
рода всегда существует такое а*^а, для которого
a* = P \i u(Xi)>[c]+l\H\ =
= 2 ( I) (±)П -l-h/2{n-lc],[c)+l), A3.177)
k=[c]+l \* / \М
где 1д(а, Ь) — отношение неполной бета-функции к полной [см.
A.23а)], [с] — целая часть величины с. Уравнение A3.177) опре-
определяет постоянный порог для любых симметричных распределе-
распределений пр<и фиксированном значении вероятности ошибки первого
рода. Заметим, что оно определяет и величину [с], причем мо-
может оказаться, что для этого целого числа правая часть A3.177)
не равна в точности заданному значению вероятности а ошибки
первого рода.
Вероятность ошибки второго рода
= 2 ( " )р*A-р)я"*=11-р(л-М,М + 1). A3.178)
Из A3.177) и A3.178) следует, что при р>1/2 алгоритм
A3.176) — несмещенный, так как при q=l—р<1\/2 из неравен-
неравенства [см. A.236)]
1/2
В\/2{п-т, m+l)= J zn-m-1 (\-z)mdz>
о
получаем h/2(n—[c]t [c]+l)>Iq(n—[c]t [c]+l) и, следователь-
следовательно, 1—р>а*.
При больших размерах выборки биномиальное распределение
аппроксимируется нормальным (см. п. 1.3.2) со средним пр и
дисперсией прA—р), что соответствует центральной предельной
теореме, из которой следует асимптотическая нормальность
367
линейной знаковой статистики. Тогда формулы для вероят-
вероятности ошибок первого и второго рода при п^> 1 можно перепи-
переписать в виде
a=l—F<\\(c—nl2)/(nl4y'*]9 A3.179а)
,Р=^[ (с-пр)/Упр(Л-рI A3.1796)
где F(z) — интеграл Лапласа.
При заданной вероятности ошибки первого рода а порог с
определяется из A3.179а)
c={xaV^ + n)\li A3.180)
где ха — процентная точка стандартного нормального распре-
распределения. Подставляя A3.180) в A3.1796), получаем при \
(Ш81)
Из A3.181) следует, что для несмещенного правила (р>1/2)
при п-+оо вероятность ошибки второго рода |3->0.
Если О<0 ,и, следовательно, /?<1/2, то несмещенным будет
алгоритм
2 u(xk) % с. A3.182)
fc=l Yi
Тогда
а* = Р {_2 u(xt)<[cl\H\ =Ii/2(n-Mt M+1), A3.183)
l-Ii-P(n-M,M+l) A3.184)
и при р<1/2 из A3.183) и A3.184) следует 1—р>а*.
13.8.7. Относительная эффективность одностороннего знаково-
знакового алгоритма. Сравним по критерию асимптотической относи-
относительной эффективности односторонний линейный знаковый алго-
алгоритм A3.176) с линейным алгоритмом, оптимальным (РИМ) по
критерию Неймана — Пирсона, который используется для про-
проверки простой гипотезы о нулевом среднем гауссовекой случай-
случайной величины (а = 0) против сложной альтернативы, что среднее
значение положительное (а>0). В обоих случаях решение выно-
выносится по однородной независимой выборке х заданного размера
п (см. п. 13.5.7).
Предположим, что односторонний линейный алгоритм
2 Ч S с0, A3.185)
ft=»l Yo
оптимальный в указанном смысле для нормального распределе-
распределения выборок (которое, очевидно, принадлежит классу симмет-
368
ричных распределений), используется для проверки гипотезы о
сдвиге произвольного симметричного распределения w(x) с из-
вегтной дисперсией а2<оо. Ясно, что алгоритм A3.185) не яв-
является непараметрическим.
Согласно центральной предельной теореме линейная статисти-
статистика [см. левую часть A3.185)] асимптотически нормальна при
произвольном распределении элементов независимой однородной
выборки х и при условии g2<°°, причем при любом п
=па, [i2 {s хЛ =по\ A3.185а)
Тогда вероятности ошибок первого и второго рода при
равны
A3.186а)
A3.1866)
где F(z) — интеграл Лапласа.
При заданном значении а из A3.186а) находим
co = xaaVn A3.187)
и, подставляя A3.187) в A3.1866), получаем [ср. с A3.96)]
ха-х1НЗ=]/ня/о, A3.188)
где ха и xi-p — процентные точки нормального распределения.
Определим, используя соотношения, приведенные в п. 13.7.5,
КАОЭ линейного знакового алгоритма A3.176) по отношению к
линейному A3.185), имея в виду, что статистики, на которых ос-
основаны указанные алгоритмы, асимптотически нормальные. Как
указывалось в п. 13.7.5, ори неограниченном увеличении разме-
размера выборки п следует предположить, что гипотеза Н и альтер-
альтернатива К сближаются. В рассматриваемом случае близость Н и
К означает малость параметра а. Тогда для симметричной отно-
относительно среднего значения а плотности вероятности w(x) имеем
р==Р{х>О|а> 0}- J w (x—a)dx= — +
о 2
+ f w (х + a) dx = — + aw @) + 0 (а), A3.189а)
о 2
4рA— р) = 1—0 (а). A3.1896)
Подставляя A3.189а и б) в A3.181), получаем для линейно-
линейного знакового алгоритма следующую асимптотическую характе-
характеристику:
xa—xi-fl=2aw@) Vn. A3.189b)
369
Из A3.162), A3.188) 1И A3.189b) находим КАОЭ линейного зна-
знакового алгоритма A3.176) по отношению к линейному A3.185):
р = 4а2ш2@). A3.190)
Если w(x) — плотность нормального распределения, то w@) =
= Bжт2)~1/2 и :из A3.190) следует, что р = 2/я^0,64, т. е. при ука-
указанном условии эффективность знакового алгоритма почти в два
раза меньше эффективности линейного, который оптимален при
проверке гипотез о среднем значении нормального распределе-
распределения. Однако при симметричном распределении, которое отлича-
отличается от нормального, положение меняется. Так, при распределе-
распределении Лапласа с плотностью w(x) = (V2)exp(—А,|х|), Х>0, имеем
w@)=hJ2, o2 = 2/X2 и из A3.190) следует, что р = 2, т. е. знаковый
алгоритм асимптотически вдвое эффективнее линейного.
Из A3.190) для равномерного распределения ш(х) = 1/2, \х\^
^1, а2==1/3 следует, что р=1^3, а для синусоиды со случайной
равномерно распределенной фазой
р = 2/я2^0,2. В этих двух случаях линейный алгоритм сущест-
существенно эффективнее линейного знакового.
Заметим, что для симметричного распределения, у которого
до@)=0, КАОЭ знакового алгоритма A3.176) по отношению к
линейному A3.185) равен нулю. Примером указанного распреде-
распределения является бимодальное распределение с плотностью w(x) =
A/2)\\М
Отметим также, что формула A3.190) представляет КАОЭ
знакового алгоритма A3.176) по отношению к равномерно наи-
наиболее мощному алгоритму A3.104) для проверки гипотезы о
среднем нормального распределения при неизвестной дисперсии.
Это происходит потому, что статистика Стьюдента асимптотичес-
асимптотически нормальная, статистика в левой части A3.105) при п^$>1 и
ао = О близка к линейной в A3.185), а порог A3.105) близок к Со
[см. A3.187)].
13.8.8. Двусторонний знаковый алгоритм. Если проверяется
гипотеза Н о том, что независимая однородная выборка х= (лгь ...
...., хп) принадлежит симметричному относительно нуля распре-
распределению с плотностью w(x) против альтернативы /С, что эта вы-
выборка принадлежит тому же симметричному распределению, но с
плотностью w(x—О), причем сдвиг $Ф0 и может быть любого
знака, то следует использовать двусторонний знаковый алгоритм.
Решение 7i принимается, если [см. A3.152)]
2 u(xk)^c или 2 u(xh)<n — c. A3.191
k= i k= i
370
Вероятность ошибки первого рода [ср. с A3.177) ]
а* = Р ( 2 и хк) ^ [с + 1 Я 1 +
+ Р (J и(х)<п-[с]\н) = 2 [1 — Ii/2 (л— [с], [с] + 1)],
A3.1916)
а вероятность ошибки второго рода [ср. с A3.178)]
P = P(S и(хк)<[с]+ЦК] +
+ Р f ? a(*ft)>/i-[c]|/cl =Ii-P(/i-
- M, [c] + 1) + I^p ([с] + 1, /i - [c]). A3.191b)
Нетрудно доказать несмещенность алгоритма A3.191а).
При д>1 аналогично A3.179а и б) находим
Из A3.191г) при д»1 следует, что в алгоритме A3.191а)
c = (xa/zVn + n)l2. A
Подставляя A3.194е) в A3.194д), находим
2Vp(l-p)
Сравним теперь двусторонний знаковый алгоритм A3.191а)
с алгоритмом A3.98) при ао = О, оптимальным для проверки ги-
гипотезы Н о том, что среднее значение а гауссовской случайной
величины равно нулю, против сложной альтернативы /С, что афО.
Для независимой выборки jci, ..., хп при заданной вероятности
а ошибок первого рода алгоритм A3.98) в этом случае представ-
представляется в виде
Yl /л, A3.191з)
Yo
где а2 — 'известная дисперсия гауссовской случайной величины.
Предположим, что двусторонний алгоритм A3.191з) исполь-
используется для проверки гипотезы Н против альтернативы К при про-
произвольном симметричном распределении w{x). Так как сумма
371
1 л
— 2 я* при альтернативе /С асимптотически нормальна с па-
паст Ул i=i _
раметрами (а/<у)Уп, то из A3Л91з) следует, что при п^> 1 веро-
вероятность ошибки второго рода
Из сравнения A3.191ж, и) с аналогичными формулами
A3.188), A3.189в.) непосредственно следует, что КАОЭ двусто-
двустороннего знакового алгоритма A3.191а) по отношению к двусто-
двустороннему линейному алгоритму A3.191з) равен аналогичному ко-
коэффициенту для односторонних алгоритмов, т. е. определяется по
формуле A3.190).
Из A3.110) следует, что при неизвестной дисперсии оптималь-
оптимальный (несмещенный РНМ) по критерию Неймана — Пирсона ал-
алгоритм проверки рассматриваемых гипотез о среднем значении
гауссовской случайной величины при заданной вероятности a
ошибок первого рода представляется в виде
1 л \ 2 -j — i/2 Yi
- —2 *r * '«/'• <13-19lK>
где ta/2 — процентная точка распределения Стьюдента. Квадрат
знаменателя в левой части A3.191к) — несмещенная оценка дис-
дисперсии а2. Поэтому при п-^оо для однородной независимой вы-
выборки из произвольного распределения алгоритмы A3.191к и з)
совпадают. Следовательно, формула A3.190) остается также
справедливой и для КАОЭ двустороннего знакового алгоритма по
отношению к алгоритму A3.191к).
13.8.9. Линейный знаково-ранговый алгоритм. Более эффек-
эффективным, чем рассмотренный линейный знаковый алгоритм, в за-
задаче проверки гипотезы о том, что независимая однородная вы-
выборка принадлежит симметричному относительно нуля распреде-
распределению против альтернативы сдвига, является, как правило, зна-
знаково-ранговый непараметрический алгоритм. Рассмотрим (на эв-
эвристической основе) линейный знаково-ранговый алгоритм, ис-
использующий статистику
Sn(x)= 2 *t= 2 Rfu(Xih A3.192>
которая представляет сумму тех компонент вектора положитель-
положительных рангов, которые соответствуют положительным выборочным
значениям хг->0. Учитывая A3.165), можно статистику A3.192)
переписать в виде
5„(х)= 4" S Rt^nxt+ 4" 2 Л+, A3.192а)
372
причем второе слагаемое в A3.192а) — постоянная величина,
так как
J^7 T- • A3.1926)
Линейный знаково-ранговый алгоритм проверки гипотезы Н о
симметрии плотности относительно нуля против альтернативы К
сдвига предписывает сравнение статистики Sn(x) с порогом1
S* (х) =~ 2 Rf s§n *t + n(ntl) * c> A3Л93)
2 i=l 4 Yo
где yi — решение отклонить гипотезу Я, а 70 — решение принять
ее. Заметим, что для любой однородной независимой выборки,
принадлежащей симметричному относительно нуля распределе-
распределению, векторы R+ и sgnx независимы [42].
13.8.10. Среднее и дисперсия линейной знаково-ранговой ста-
статистики. Из A3.192а и б) с учетом независимости векторов R+ и
sgnx при гипотезе Н
X m1{sgnxi\H}+ (J1±^L = ^±il». , A3.194)
4 4
так как mi{sngXi\H}=0, i==\, n.
Дисперсия статистики Sn(x) при гипотезе Н
i /=1
X sgnj^sgn^ltf) = -I" 2 ^1
J 4 1=1
Так как P{R+i=k\H} = l/n, i, й=17л, то
/г=1
*-i 6
и, следовательно, при гипотезе Я
= п{п+\) Bл+1)/24. A3.195)
1 Алгоритм A3.193) называют одновыборочным ранговым алгоритмом Вил-
коксона [42]. Его можно записать более компактно:
5п(х)= 2 S m(^ + jc,)Sc A3.193а)
373
Пр<ия>1 из A3.194) и A3.195) получим
rt3/12. A3.196)
Для определения среднего значения статистики Sn(x) при
альтернативе К обратимся к формуле A3.193а). Двойная сумма
содержит п членов при i = j и п (п—1)/2 членов при 1ф\. Статис-
Статистика 5п(х) равна числу тех случаев, когда Xi+Xj^O. Следова-
Следовательно, при альтернативе К
+ п(п-\) p{
Так как при альтернативе К сдвига w(x\K) =w(x—а), а>0, то
Р{хг>0\К}= ] w(z-a)dz
о
и для независимой однородной выборки
где F\ (у) — функция распределения выборочных значений.
Из приведенных соотношений следует, что при альтернати-
альтернативе К
Щ {Sn (x)\K) =--n]w{z-a)dz+
о
- "("-'> J F^-z-^wiz-a^dz. A3.197)
2 —оо
Так как w(x) симметрична относительно нуля, то при сбли-
сближении альтернативы с гипотезой, т. е. при малом а, имеем [см.
A3.189)]
J w (z - a) dz - — + aw @) + 0 (а).
о 2
Далее заменяя у = а—z и разлагая функцию Fx(y—2a) в ряд Тей-
Тейлора по степеням малого параметра а, получаем
J Fx (- z - a) w (z - a) dz = J Fi(y-2a)w (у) dy =
= ±-2а
374
Подставляя получешые выражения в A3.197), находим при
и ayrn = const для альтернативы К
roi{SnM|tf}~ — +п2а j w2(y)dy. A3.198a)
^ 00
Можно показать, что при тех же условиях для альтернативы К
|i2{Sn(x)|tf}~tt3./12, A3.1986)
т. е. для дисперсии статистики Sn(x) асимптотические соотноше-
соотношения для гипотезы и для альтернативы совпадают [см. A3.196)].
13.8.11. Асимптотическая характеристика линейного знаково-
рангового алгоритма. При конечных размерах выборки опреде-
определить распределение статистики Sn(x) трудно (см. [42]). Но эта
статистика удовлетворяет условиям применимости центральной
предельной теоремы и, следовательно, она асимптотически нор-
нормальная и пр.и гипотезе Я, и при альтернативе /С. Параметры
асимптотически нормального распределения определяются ло фор-
формулам A3.196), A3.198а, б).
Таким образом, для алгоритма A3.193) получим следующие
асимптотические формулы вероятностей ошибок первого и вто-
второго рода:
ct= \-F[(c- п2/4)/]/пз7Т2"]. A3.199а)
A3Л99б)
где F(z) — интеграл Лапласа.
При заданной вероятности а ошибки первого рода из A3.199а)
находим в алгоритме A3.193) порог
A3-20°)
где ха — процентная точка стандартного нормального распреде-
распределения.
Подставляя A3.200) в A2.1996), вычисляем асимптотическую
характеристику линейного знакаво-рангового алгоритма A3.193)
а2п J w*(y)dy. A3.201)
—оо
13.8.12. Относительная эффективность линейного знаково-ран-
гового алгоритма. Из A3.201) и A3.188) определяем КАОЭ ли-
линейного знаково-рангового алгоритма A3.193) по отношению к
линейному A3.185)
рх = 12о2 ( J w2 (у) dy\2 , A3.202)
где w(x)=w(—х) — произвольная симметричная плотность ве-
вероятности и а2 — дисперсия, которая предполагается известной.
375
Если w(x) — плотность нормального распределения, то
оо
I w2(y)dy=Dno2)-l/2 .и :из A3.202) следует, что pi = 3/л^0,955,
— 00
т. е. при указанном условии эффективность линейного знаково-
рангового алгоритма близка к эффективности оптимального ли-
линейного алгоритма. Такое существенное повышение эффективности
по сравнению со знаковым алгоритмом [см. A3.190)] в этом слу-
случае достигается, конечно, за счет усложнения алгоритма. В то
время, как число операций для знакового алгоритма A3.176) рас-
растет линейно в зависимости от размера выборки, число операций
в знаково-ранговом алгоритме пропорционально квадрату раз-
размера выборки.
JB табл. 13.2 указаны значения коэффициента pi асимптотиче-
асимптотической относительной эффективности знаково-рангового алгоритма
по отношению к линейному для тех же распределений, ко-
которые были приведены в п. 13.8.7. В последней строке приведено
наименее благоприятное распределение, для которого коэффици-
коэффициент pi достигает наименьшего значения1. При всех других рас-
распределениях pi^ 0,864.
В табл. 13.1 приведены также значения КАОЭ знаково-ран-
гового алгоритма A3.193) по отношению к знаковому A3.176).
При этом использовано соотношение p2 = pi/p ![см. A3.162а),
A3.190) и A3.202)]. Только при лапласовском распределении эф-
эффективность знаково-рангового алгоритма меньше эффективности
знакового.
Используя рассуждения, приведенные в конце п. 13.8.7, при-
приходим к выводу, что формула A3.202) остается справедливой и
для КАОЭ рассматриваемого знаково-рангового алгоритма по от-
Таблица 13.2
Распределение
Нормальное
Лапласовское
Равномерное
Синусоиды со случайной фазой
*" W ~~ 4 а/5 V 5 а* / '
|*Kg1/5
Pi
0,995
1,5
1
оо
0,864
Р2
1,5
0,75
3
оо
1,94
1 Легко видеть, что минимум функционала j w'2(y)dy при заданном а2 и ус-
условиях неотрицательности и нормировки w(x) достигается для w(y)=b—ay2,
\у\<~[/b/a, b>0, a>0. Константы а и b определяются из условий
Vbja Ybja
2 j y2w(y)dy = o2, 2 j w(y)dy=\.
о о
376
ношению к равномерно наиболее мощному алгоритму A3.104)
для проверки гипотезы о среднем нормального распределения.
Для некоторых классов распределений вероятностей можно по-
повысить эффективность алгоритма проверки гипотез о симметрии,
если использовать более сложные знаково-ранговые статистики.
Таким алгоритмом является, например, знаково-ранговый алго-
алгоритм Ван-дер-Вардена
где F~l(z) — функция, обратная интегралу Лапласа.
13.9. АНАЛОГОВЫЕ АЛГОРИТМЫ ПРОВЕРКИ ГИПОТЕЗ
13.9.1. Постановка задачи. Ранее предполагалось, что исход-
исходной для статистических выводов является дискретная выборка —
результат временной дискретизации наблюдаемой реализации слу-
случайного процесса. Однако при такой дискретизации часть полез-
полезной информации неизбежно теряется. Поэтому представляют ин-
интерес аналоговые алгоритмы проверки гипотез, использующие не-
непрерывно наблюдаемые реализации. Задача проверки гипотез в
этом случае формулируется следующим образом.
Рассматриваются два случайных процесса X0(t) и X\{t). На
интервале длительностью Т наблюдается реализация x(t), относи-
относительно которой выдвигается гипотеза Яо, что x(t)^X0(t), против
альтернативы Яь что x(t)^X\(tf). Пространством наблюдений яв-
является функциональное пространство непрерывных функций. За-
Задача состоит в принятии одного из двух решений: ^о — верна ги-
гипотеза Но или Yi — верна альтернатива Ни Аналоговый алго-
алгоритм принятия решения предписывает сравнение с порогом функ-
функционала y[x(t)] от наблюдаемой реализации. Оптимальный алго-
алгоритм обусловлен заданным критерием качества.
В приведенной постановке задачи отсутствует один из важ-
важнейших элементов комплекта априорных данных — вероятност-
вероятностная мера на пространстве наблюдений, без которой, как показы-
показывают приведенные результаты, невозможен синтез алгоритма про-
проверки гипотез. Строгое в математическом отношении введение
понятия вероятностной меры на функциональном пространстве на-
наблюдений выходит за рамки настоящей книги (см., например,
[10], [46]). Приведем лишь результаты, необходимые для реше-
решения поставленной задачи.
Заметим прежде всего, что невозможно указать содержатель-
содержательный смысл используемого некоторыми авторами формального пе-
перехода к пределу при п-+оо в функции правдоподобия Wn(x\, ••-
..., хп) дискретной выборки для введения понятия так называемо-
называемого функционала правдоподобия ИР'[*(О]- Такого предела просто
не существует. Предельный переход возможен лишь для статис-
статистики отношения правдоподобия.
377
13.9.2. Функционал отношения правдоподобия. Пусть последо-
последовательности конечномерных непрерывных плотностей вероятности
Wn(xu ..., Хпу tu ..., tn\H0) ,и Wn{xi9 ..., Хп, tu ..., tn\Hi) удовлет-
удовлетворяют условиям D.5а и б), необходимым и достаточным для су-
существования случайных процессов X0(t) и Xi(t). Для проверки
гипотезы Но против альтернативы #i можно вместо дискретной
выборки х=(хи ..., хп), Xi^x{ti), ti^@, T) использовать непре-
непрерывно наблюдаемую реализацию x\t). Эта возможность базиру-
базируется на фундаментальной теореме, согласно которой при опреде-
определенных условиях существует предел по вероятности при /г->оо
отношения правдЪподобия
W о©
wl* ^/ *\И) A3.204)
ц
Wn(Xl Xn,tl9uu. ,tn\H0)
Предел A3.204) называется функционалом отношения правдо-
правдоподобия наблюдаемой реализации x(t). Следуя Гренадеру [47],
случай, для которого функционал отношения правдоподобия 0<
<'[*@]<°°> называют регулярным. При других условиях фун-
функционал отношения правдоподобия с вероятностью единица не-
неограниченно возрастает или обращается в нуль, что соответству-
соответствует вырожденному (или сингулярному) случаю К
Как и для дискретной выборки, в дальнейшем будет рассмат-
рассматриваться логарифм функционала отношения правдоподобия
[nl[x(t)]. Тогда в сингулярном случае |1п?[л:(?)}| неограничен.
Если Um\i2{lnl(xu...,xn, tu ..., tn) |#o, #i}<oo, то \nl(xnu tni)
сходится к In /[x(/)] в среднеквадратическом и имеет место регу-
регулярный случай.
Для независимой однородной выборки при я->оо
^)} = Л|ха {In / (л:, t)}-+oo.
t=i
т. е. этот случай сингулярный и рассматривался в § 13.5 при про-
проверке простых гипотез о среднем нормального распределения. Яс-
Ясно, однако, что применительно к выборке из реализации случай-
случайного процесса неограниченное увеличение числа независимых на-
наблюдений означает неограниченное время наблюдения.
13.9.3. Оптимальные аналоговые алгоритмы проверки гипотез.
Оптимальный по любому из критериев, указанных в § 13.1, одно-
шаговый аналоговый алгоритм проверки гипотезы Яо против аль-
1 В математической литературе часто используется следующая терминоло-
терминология. Регулярному случаю соответствует эквивалентность двух вероятностных мер
(относительно гипотезы и альтернативы), а сингулярному случаю — ортогональ-
ортогональность этих мер [46].
378
тернативы Нх предписывает сравнение с порогом достаточной ста-
статистики функционала отношения правдоподобия
/[*(*)] S с, A3.205)
Yo
где с — порог, определяемый из табл. 13.1.
Можно показать, что в регулярном случае при любом конеч-
конечном вреАмени наблюдения Т алгоритм A3.205), использующий
функционал отношения правдоподобия, неизбежно приводит к от-
отличным от нуля вероятностям ошибочных решений. Напротив, в
сингулярном случае достоверные безошибочные решения оказы-
оказываются возможными при любом конечном Г>0.
Байесовский риск при использовании алгоритма A3.205) вы-
вычисляется согласно A3.9), где вероятности ошибок
a = P{l[x{t)]^c\H0}, A3.206)
$ = P{l[x(t)]<c\H1}. A3.207)
Эти же соотношения верны и для вероятностей ошибок при ис-
использовании алгоритмов, оптимальных по критерию максималь-
максимальной апостериорной вероятности или максимального правдоподо-
правдоподобия (с соответствующим значением порога с).
Для алгоритма, оптимального по критерию Неймана — Пирсо-
Пирсона, формула A3.206) используется для определения порога с в
алгоритме A3.205), а формула A3.207) — для определения ми-
минимальной вероятности ошибки второго рода.
Нетрудно получить оптимальные аналоговые алгоритмы при-
принятия решений и в многоальтернативной задаче проверки гипотез.
Для этого достаточно в формулах A3.53) и A3.57) заменить от-
отношения правдоподобия h(x) их предельными статистиками —
функционалами отношения правдоподобия li[x(t)], i=\y m.
13.10. ЗАДАЧИ
13.1. Проверяется простая гипотеза Яо о том, что дисперсия центрирован-
центрированной гауссовской случайной величины равна о2 = о20, против простой альтерна-
альтернативы Ни что G2 = a2i>G2o. Имеется независимая случайная выборка дсь ..., хп,
принадлежащая этой гауссовской величине. Доказать, что оптимальный (по
любому из критериев, рассмотренных в § 13.1) одношаговый дискретно-анало-
дискретно-аналоговый алгоритм принятия решения определяется неравенствами
п Yi
2 *\ ^ К. A)
*=1 Yo
Получить следующие формулы для вероятностей ошибок первого и второго
рода:
К/Bа2о))/Г(л/2), B)
= Г(я/2, К/Bа20)/Г(/г/2), C)
379
где Т(и, v) — неполная гамма-функция, а также следующее соотношение
между величинами а и |3:
где %2а> x2i— з — процентные точки %2 распределения с п степенями свобо-
свободы (см. задачу 3.9).
13.2. Пусть хи ..., хп представляют независимые выборочные значения,
принадлежащие экспоненциальному распределению (см. задачу 2.1). Проверя-
Проверяется простая гипотеза Яо о том, что параметр этого распределения к=К0, против
простой альтернативы, что X=Xi>>X0. Доказать, что оптимальный (по любому
из критериев, рассмотренных в § 13.1) одношаговый дискретно-аналоговый ал-
алгоритм принятия решения определяется неравенствами
п Yi
2 xk ^ К. E)
k=l Yo
Получить следующие формулы для вероятностей ошибок первого и второго
рода:
<х=Г(л, а,оК)/Г(л), F)
Р=1-Г(л, hK)/T(n), G)
а также соотношение между величинами а и f:
где %2р, X2i-a — процентные точки %2 распределения с 2/г степенями свободы
(см. задачу 3.9).
13.3. Проверяется простая гипотеза Я, что дисперсия центрированной га-
уссовской случайной величины равна а20, против сложной альтернативы, что
дисперсия aV=cr2o- Доказать, что при независимой выборке алгоритм, согласно
которому отвергается гипотеза Н, если
где х2 a — процентная точка ^-распределения с п степенями свободы, является
равномерно наиболее мощным относительно сложной альтернативы, если. а2>
>а20.
13.4. Проверяется простая гипотеза Я, что параметр X экспоненциального
распределения (см. задачу 2.1) равен Ко против сложной альтернативы, что
Хф%о. Доказать, что при независимой выборке алгоритм, согласно которому
отвергается гипотеза Я, если
где %2i— — процентная точка %2"Распределения с 2п степенями свободы, яв-
является равномерно наиболее мощным относительно сложной альтернативы, ес-
если А,>А,0.
13.5. Выдвигается простая гипотеза Но, что выборка х принадлежит нор-
нормальному распределению с вектором средних а и корреляционной матрицей Ко,
против простой альтернативы Яь что это значение принадлежит нормальному
380
распределению с тем же самым вектором средних и корреляционной матрицей
Ki- Показать, что оптимальное правило выбора решения формулируется сле-
следующим образом: принимается решение Yi (корреляционная матрица равна
Ki), если для наблюдаемого вектора х
00
ц решение Vo (корреляционная матрица равна Ко), если выполняется неравен-
неравенство, обратное A1).
13.6. Доказать, что условный максимум функционала
оо
Ф[ф(*)]= j w(x)\a<f(x)dx A2)
—-ОО
яри условии ф(х)>0, j y(x)dx=l достигается при
— оо
Ф(*)езв,(*), A3)
т. е. что
оо оо
J w(x)\nw(x)dx^ j w(x)\ny(x)dx. A4)
Глава 14
ОЦЕНИВАНИЕ НЕИЗВЕСТНЫХ ХАРАКТЕРИСТИК
14.1. OHFHHBAHHE В УСЛОВИЯХ
НЕПАРАМЕТРИЧЕСКОЙ АПРИОРНОЙ НЕОПРЕДЕЛЕННОСТИ
14.1.1. Постановка задач. Наблюдается реализация ис-
исследуемого случайного процесса. Результат наблюдения пред-
представляется в виде однородной независимой выборки х= (хь ..., хп)
фиксированного размера п. Плотность вероятности Wt(x) каждого
выборочного значения принадлежит непараметрическому семей-
семейству Ж. Один вид задач состоит в оценивании неизвестных чис-
числовых характеристик распределения вероятностей, другой — в
оценивании неизвестных функции распределения Fi(x) и плот-
плотности W\(x). Решение указанных задач представляется статисти-
статистиками — функциями выборочных значений, формируемыми в ус-
условиях непараметрической априорной неопределенности на эврис-
эвристической основе (ср. с. п. 13.7.4).
Критериями качества непараметрических оценок (алгоритмов
оценивания) являются несмещенность [см. A2.35)], асимптоти-
асимптотическая несмещенность [см. A2.35а)], относительная эффективность
[см. A2.36а, б)]. Как правило, оценки, используемые на практи-
практике, должны быть состоятельными. Оценка #n=g(x) неизвестной
381
числовой характеристики О распределения называется состоятель-
состоятельной, если
lim P {|фп - Щ>&) = 0, e>0, A4.1)
т. е. если она сходится ло вероятности к оцениваемой величине
при неограниченном увеличении размера выборки [см. C.93)].
Ясно, что требование состоятельности оправдывает затраты, свя-
связанные с накоплением данных (увеличением размера выборки).
По критерию состоятельности оценка величины # не определяется
единственным образом.
14.1.2. Непараметрические алгоритмы оценивания моментов
распределения. Пусть х= (хи ..., хп) — однородная независимая
выборка, принадлежащая распределению с плотностью W\(x). Вы-
Выборочным моментом k-ro порядка называют среднее арифмети-
арифметическое k-x степеней выборочных значений
тГ= — 2 ** А=1,2,... A4.2)
п i=i
Из закона больших чисел (см. п. 3.4.3) следует, что выборочный
момент m*k сходится по вероятности к моменту mh распределе-
распределения [см. B.20)]. Достаточным условием применимости закона
больших чисел в рассматриваемом случае является существова-
существование конечного момента распределения порядка 2k.
Следует подчеркнуть, что выборочные моменты являются слу-
случайными величинами (статистиками), в то время как моменты
распределения — постоянными числами. Так как
ml™mk= °[ xkw1(x)dx, A4.3)
то выборочный момент &-го порядка является состоятельной оцен-
оценкой fe-ro момента распределения:
Ttlk = tTlji (х) # 1.4
Наряду со статистикой A4.2) рассматривают центральный вы-
выборочный момент k-то порядка
1 "
|^= — 2 [xi-rn\)k, k = 2, 3, ... , A 5)
^ i=i
который представляет состоятельную оценку центрального момен-
момента k-то порядка распределения
Iii-Mx), A4.6)
так как при условии |i2fe<°°
рк X* рк = J {x-mlYw1 (х) dx. A4.7)
382
При соответствующих ограничениях, формулируемых в цент-
центральной предельной теореме (см. п. 3.4.4), выборочные моменты
A4.2) и A4.5), как суммы независимых случайных величин,
асимптотически нормальны при я->оо.
14.1.3. Выборочное среднее. В соответствии с A4.2) при k=\
выборочный момент первого порядка (или выборочное среднее)
равен среднему арифметическому выборочных значений, т. е.
m;=— S Ъ. A4.8)
п ;=i
• Выборочное среднее характеризует расположение однородной
независимой выборки на действительной оси. Среднее значение
выборочного среднего
mi{m;}=— 2 "Ч {*,}=— 2 * = а. О4-9)
т. е. совпадает при любом я с априорным средним
оо
= пг1 {х} = j (л:) djc.
—оо
Таким образом, выборочное среднее является несмещенной, со-
состоятельной оценкой среднего значения распределения, представ-
представляет собой статистический аналог априорного среднего а и может
использоваться в качестве оценки последнего m*i = d(x).
Дисперсия выборочного среднего при \i2{xi} =g2<oo
и.1 № = ¦? (i с <*> = i ?| °2 = т • A4ло)
так как дисперсия суммы независимых случайных величин равна
сумме дисперсий слагаемых.
14.1.4. Выборочная дисперсия. В соответствии с A4.5) при
k=2 центральный выборочный момент второго порядка (или вы-
выборочная дисперсия)
Й=— 2 {xt-КУ <14.11)
п t=i
Выборочная дисперсия характеризует рассеяние выборочных зна-
значений относительно выборочного среднего, является статистичес-
статистическим аналогом априорной дисперсии а2 и может использоваться в
качестве оценки последней |д,*2 = а2.
В соответствии с п. 14.1.2 выборочная дисперсия представляет
собой состоятельную оценку дисперсии а2 распределения. Однако
состоятельности оценки необязательно сопутствует ее несмещен-
383
нофть. Выборочная дисперсия — смещенная оценка дисперсии, так
как
П t = l
п i=i
-2(xi-a)(m]-a)}= ±- | (W-^ -
Поскольку смещение Ьп(с2) =—а2/я, причем Ьп-Я) при я->оо, то
выборочная дисперсия — асимптотически несмещенная оценка
дисперсии.
Нетрудно устранить несмещенность при любом конечном раз-
размере выборки, выбирая в качестве оценки дисперсии статистику
tl — 1 tl —
2 (xt-m\)\ A4.13)
Статистику s2(x) иногда называют исправленной выборочной
дисперсией.
14.1.5. Вычислительный метод Монте-Карло. Если хи ..., хп —
однородная независимая выборка из распределения с плотностью
wi(x)9 то согласно закону больших чисел
— 2 / (**)—- Ъ W Щ W dx9 A4.14)
П
где f(x) — заданная функция, mi{f2(xi)}\<.oot i=\, n.
Соотношение A4.14) используется для приближенного вычис-
вычисления интегралов (метод Монте-Карло или метод статистическо-
статистического эксперимента). 'Пусть, например, необходимо вычислить интег-
интеграл j f(x)dxy который не выражается через элементарные функ-
функции. Если имеется таблица случайных чисел, распределенных
равномерно на интервале @, 1), то, извлекая из этой таблицы вы-
выборку Xi, ..., хПу можно приближенно оценить интеграл по фор-
формуле
J/(x)dx« —?/(**). A415а)
о п i=\
Так как такая оценка состоятельная, то для произвольных е>0
и 0<а<1 всегда найдется такое число N(e, а), что при размере
выборки n>N(e, a)
PJlj/W^-yS/^) <el = l-a. A4.156)
384
14.1.6. Оценка вектора средних и ковариационной ,у.л1рищ*»
Пусть хи ..., х> —- независимые выборочные векторы «<> Л/-мАрного
распределения, принадлежащего непараметрическому се& йству.
Статистики
т? =
n
J_
n
A4.16)
A4.17)
называют выборочным вектором средних и выборочной ковариа-
ковариационной матрицей соответственно.
Выборочный вектор средних m*i представляет несмещенную
состоятельную оценку априорного вектора средних а, Выборочная
ковариационная матрица К* — состоятельная оценка априорной
ковариационной матрицы К, но эта оценка — смешанная, при-
причем
A4.17а)
К является ста-
стаm,{K*} = (l—1M)K.
Несмещенной оценкой ковариационной матриц
тистика [nl(n—1)]К*.
14Л.7. Эмпирическая функция распре .ения, Рассмотрим.
вновь однородней независимую вч^арку x=(jci, •.., хп) из распре-
распределения F\{x)f принадлежащего непараметрическому семейству.
Пусть x(-)='(jt(^f ..., *<п)) — ее вариационный ряд (см. п. 13.8.3).
Обозначим через т(х, х<#>) — число выборочных значений (по-
(порядковых статистик), не превосходящих заданного порога х. Ста-
Статистику
F\(x, х(>))=* т '*' х — =¦ — - 2 и(х — х^)у A4.18>
п п ks_i
где и (г) — функция единичного скачка, называют эмпирической
функцией распределения. Она представляет статистический ана-
аналог функции распределения F\(x), но для каждого фиксирован-
фиксированного значения х является случайной величиной. На рис. 14.1 изоб-
изображена одна из возможных реализаций статистики A4.18).
Эмпирическую функцию распределения F*\(xf x<#)) можно
принять за непараметрическую оценку Р\ (х, х()) функции рас-
Рис. 14.1. Эмпирическая функ-
функция распределения
13—87
38S
пределевия Fi(x)f из которой извлечена выборка х. Максималь-
Максимальная ошибка оценивания
Дп = тах|/ч(*, х<>)-/ч(*)|. A4.19)
X
Случайная величина Ап сходится при п-+оо по вероятности к ну-
нулю в каждой точке непрерывности функции распределения F\(x).
В этом смысле статистика Pt(x9 x('))=F*i(x, x(#)) является со-
состоятельной оценкой функции распределения F\(x).
14.1.8. Непараметричекие оценки плотности вероятности. Диф-
Дифференцируя формально обе части формулы A4.18) по х, получаем
оценку плотности вероятности
щ(х, х<>) = — 2 6(x~x{k)). A4.20)
п *=i
Функция A4.20) обращается в бесконечность при x=xw и равна
нулю при остальных значениях аргумента х. Из A4.20) заменой
дельта-функции «сглаженными» функциями получаем оценку
плотности в виде
где К{z) — произвольная весовая функция, которая должна удов-
удовлетворять следующим ограничениям:
0<К(г)<оо, f/C(z)dz=l. A4.22а)
Если, кроме того,
lim 2/((z)-0, A4.226)
Шп*(л)«0, A4.22b)
то оценка A4.21) сходится к W\(x) в среднеквадратическом, если
функция w\ (x) непрерывна в точке х.
Указанным условиям удовлетворяет, например, функция
A4-23)
Оценка A4.21) обобщается на многомерный случай. Пусть
Xi, ..., хп — независимая векторная выборка, принадлежащая
многомерному распределению с плотностью wN(x). Для оценки
этой плотности можно использовать следующую статистику:
A4.24)
где Xil _ /.ft элемент выборочного вектора x*, /=1, /z, принадле-
386
жащего распределению wN(x). Если функция К(z) удовлетворяет
условиям A4.22а—в) и, кроме того,
lim ПМ^Н0* A4.25а)
N
limn \{кг{п)=-ооу A4.256)
n—oo ^__j
TO
Iimm1{|^iv(x, х1э..., xn)-~i#jv(x)!2} = 0, A4.26)
если функция wN (x) непрерывная в точке х.
14.2. ОЦЕНИВАНИЕ В УСЛОВИЯХ
ПАРАМЕТРИЧЕСКОЙ АПРИОРНОЙ НЕОПРЕДЕЛЕННОСТИ
14.2.1. Постановка задачи и априорные данные. Рассмотрим
сначала задачу оценивания скалярного параметра. Имеется од-
однородная независимая выборка х— (хи ..., xn)t принадлежащая
распределению с плотностью ш(я|#), деЭ, где в — интервал на
действительной оси (в дальнейшем без потери общности полага-
полагаем, что параметр О может принимать любые действительные зна-
значения). Если параметр О случайный^ то необходимо задать его
плотность вероятности w($), Оев, а также функцию потерь
, )^
В зависимости от полноты априорных данных используется
один из критериев качества, указанных в § 12.3, для синтеза оп-
оптимального одношагового дискретно-аналогового алгоритма оце-
оценивания y = le(x), y^T, неизвестного параметра # распределения»
где Г — множество допустимых оценок. В качестве условий, ог-
ограничивающих множество Г, могут быть выдвинуты такие есте-
естественные требования, как состоятельность и несмещенность оценок
[см. A2.35) и A4.1)]. Желаемым свойством оценки является
также эффективность (см. п. 12.5.3), но регулярных методов син-
синтеза эффективных оценок не существует. В некоторых случаях
можно лишь проверить, является ли эффективной синтезирован-
синтезированная по заданному критерию оптимальная оценка параметра Ф
(см. далее п. 14.2.3).
14.2.2. Достаточная оценка. Оценка Ъп(х) называется доста-
достаточной оценкой параметра #, если условная плотность Wn(x\, ...
..., Хп\Ь) не зависит от #. Из этого определения следует, что дос-
достаточная оценка содержит всю информацию о неизвестном пара»
метре О, которую можно получить при наблюдениях хи ..., хп-
Иными словами, для оценки параметра д необходимо знать не
каждый элемент наблюдаемой выборки х отдельно, а лишь одну
функцию выборочных значений — достаточную оценку (достаточ-
(достаточную статистику).
13* 38?
Приведенное определение не дает, однако, простого признака
достаточной оценки, так как вычисление условной платности
Wn(x\#n) может оказаться весьма трудоемким. Очень простым и
удобным для практического использования является признак
факторизации функции правдоподобия выборки. Он состоит в воз-
возможности представления функции правдоподобия в виде произве-
произведения двух неотрицательных сомножителей
^, A4.27)
первый из которых зависит от достаточной статистики и оценивае-
оцениваемого параметра Ф, а второй — не зависит от О. Возможность
представления A4.27) является необходимым и достаточным ус-
условием того, что Оп(х) — достаточная оценка параметра О (до-
(доказательство см., например, в [43], § 12.2).
Пусть §о — какое-нибудь фиксированное значение д. Тогда
отношение правдоподобия
l(x\®)=Wn(x\$)IWn(x\$o) A4.28)
шредставляет достаточную статистику, так как №п(х|0) = /(х|О) X
Х^п(х|0о), что соответствует признаку факторизации A4.27).
Заметим также, что если Ьп — достаточная оценка параметра
i&, то достаточной оценкой ф(Ф) будет q>(On).
Если Ьп — достаточная оценка случайного параметра О, то
апостериорное распределение Щ0|х) зависит не от самих выбо-
выборочных значений, а только от Фп(х). Действительно, подставляя
выражение для функции правдоподобия из A4.27) в формулу
Байеса A2.16), получаем
!". В.
W(Q\x)=W[Q\bn{x)]. A4.29)
14.2.3. Неравенство Рао — Крамера. Существует неравенство,
с помощью которого можно определить нижнюю границу средне-
жвадратических ошибок при использовании любых оценок пара-
параметра. Предположим, что границы области действительной оси,
-где плотность распределения ш(дс|д) отлична от нуля, не зависят
ют О. Это условие выполняется, например, если w(x\'&) фО на
всей действительной оси или для х^О. Примером распределения,
-которое не удовлетворяет этому условию, является равномерное
(см. задачу 14,1). Предположим, кроме того, что функция ш(х|0)
дифференцируема по параметру О.
388
Введем новое обозначение.
Lx (*)=И7(х|О) = И7п(*ь ..., *я|0), A4.30)
чтобы подчеркнуть зависимость функции правдоподобия от неиз-
неизвестного параметра Ф. Для независимой выборки
In !«(*) = 2lnL^@), A4.31)
где
Пусть hn = g® (х) — некоторая оценка параметра О. Среднее
значение этой оценки
n(«). О4-32)
Предположим, что интеграл в A4.32) можно дифференциро-
дифференцировать по параметру д. Тогда, используя предположение о незави-
независимости пределов интегрирования от д, получаем
1 х) Lx (Ь) -A. in Lx (d) dx - «! {^n ^- In Lx @)}. A4.33)
X
Кроме того, из очевидного равенства j ^х('в')dx= 1 дифференци-
рованием по О находим
J A- Lx (Ф) dx = J -^ [In Lx («)] Lx (О) dx = щ {-^ in Lx (*)} = 0.
X X
A4.34)
Умножая A4.34) на mi{&n} и вычитая из A4.33), получаем
1 + ь; (О) = щ {[Ьп - тх {Оп}] -A. inLx WJ. A4.35)
Правая часть A4.35) представляет ковариацию двух случайных
величин, имеющих нулевые средние. Как известно (см. п. 2.3.3),
квадрат ковариации не может превосходить произведения дис-
дисперсий сомножителей, т. е.
^) (H.36)
Неотрицательная величина
{[^]2} (H.37)
называется информацией по Фишеру о параметре О, содержащей-
содержащейся в выборке х.
389
Если функция правдоподобия дифференцируема дважды по па-
параметру О, то нетрудно доказать, что
Для однородной независимой выборки
In(O)=/iIi(G), A4.39)
где
^Wj ][\*(x\u)dx. A4.39a)
Для дискретного распределения
М*) = 2 [^lnp(^|#)J2/7(^l*). (H.396)
Из A4.36) находим искомую нижнюю границу дисперсии оце-
оценок (неравенство Рао — Крамера)
;г1п(Ч A4.40)
Заметим, что правая часть неравенства A4.40) является так-
также нижней границей среднеквадратических отклонений оценок от
оцениваемого параметра. Так как минимум величины mi {(On—
—ОJ} достигается при mi{0n}=0, то
Щ {Фп ~ Щ >Н {К} >И + Ь'п (Щ]2/1п (*). A4.40а)
Для несмещенных оценок
В этом случае нижней границей дисперсии оценок является ве-
величина, обратная информации по Фишеру.
Величину [mi{(On—ОJ}]1/2 принимают иногда за меру точ-
точности оценки. Правая часть неравенства A4.40) определяет по-
потенциальную точность.
Обратим внимание на то, что для смещенной оценки ее точ-
точность определяется не дисперсией, а среднеквадратическим от-
отклонением от оцениваемого параметра. Приведем тривиальный
пример смещенной оценки с нулевой дисперсией. Пусть Оп =
= Со = const независимо от результатов наблюдений. Тогда
|i2{On}=0. Но если только значение оцениваемого параметра не
угадано ил»и не было заранее известно, смещение &п(О)=с0—О
будет велико. Нельзя, вообще говоря, сделать равными нулю и
дисперсию, и смещение оценки. Поэтому нулевая дисперсия, ко-
которой соответствует fc'n(O)=—1, исключается.
390
14.2.4. Эффективная оценка параметра. В классе оценок с за-
заданным смещением оценку On эф с наименьшей среднеквадратиче-
ской ошибкой называют эффективной. Для любой оценки Ьп ука-
указанного класса
Щ {(К ~ ОI} > Щ {(К эф - Щ. A4.42а)
В классе несмещенных оценок эффективной называют оценку с
наименьшей дисперсией, т. е. удовлетворяющую неравенству
\h$n}>\hiK*}- A4.426)
Часто эффективность определяют из условия достижения ниж-
нижней границы в неравенстве Рао — Крамера. Для оценок с задан-
заданным смещением эффективная оценка удовлетворяет равенству
тг {(К эФ - ОJ} = [1 + К @)]«/1п (*). A4.43а)
а для несмещенных оценок — равенству
M^».*}=l/U*)- A4.436)
В тех случаях, когда минимальная дисперсия оценок совпадает
с нижней границей Рао — Крамера, оба приведенных определе-
определения A4.42) и A4.43) эффективности совпадают. Однако для не-
некоторых распределений w(x\$) нижняя граница дисперсии оце-
оценок, указываемая неравенством Рао—Крамера, может оказаться
слишком грубой, тогда второе определение эффективности дает
не потенциальную реализуемую точность оценки, а меру качества
нижней границы в неравенстве A4.41). Если в данной задаче
минимальная достижимая дисперсия несмещенной оценки не рав-
равна [In(О)], то следовало бы отказаться от второго определе-
определения эффективности оценки и принять первое. Все же для опре-
определенности можно условиться называть эффективными оценки,
удовлетворяющие равенствам A4.43а или б), а в тех случаях,
когда эти оценки не существуют, рассматривать оценки Ь*п с ми-
минимально возможной дисперсией (или среднеквадратической оши-
ошибкой для смещенных оценок), удовлетворяющие равенствам
A4.42а или б).
Из A4.40) учитывая A4.38), находим для однородной неза-
независимой выборки /tjLi2 {On} ^ [l4-b'n(/&)]2/Ii('6t). Так как это нера-
неравенство имеет место для любых пу то для состоятельных (и, сле-
следовательно, асимптотически несмещенных) оценок справедливо
следующее предельное неравенство:
Hm[nMfl»}]>l/Ii(O)- A4.44)
Оценки, для которых имеет место равенство A4.44), называют
асимптотически эффективными.
391
14.2.5. Общая структура эффективных оценок. Из A4.35) и
A4.36) следует, что для эффективных оценок коэффициент корре-
корреляции случайных величин ®п—^{Фп} и inLx('fr) равен еди-
д #
нице, т. е.
К - Щ {Ьп} = к (#) -^ In Lx (О). A4.45)
Подставляя A4.45) в A4.35), находим
Таким образом, эффективная оценка имеет следующую структуру:
К )~1п^(Щ. A4.46)
Для несмещенных эффективных оценок
-^JnL, @)J / In (*). A4.47)
Заметим, что оценки вида A4.46) и A4.47) существуют не
всегда, так как правые части их должны быть функцией только
выборочных значений и не зависеть от д. Для этого функция
правдоподобия должна принадлежать экспоненциальному семей-
семейству вида [см. A4.45)]
U (Ь) =-- ехр [кг (&) ^ri -i- k, {Щ h (х). A4.48)
Из A4,48) следует, что эффективные оценки являются доста-
достаточными статистиками определенного вида. Но» конечно, не лю-
любые достаточные оценки параметра являются эффективными.
14.2.6. Интервальные оценки. Под интервальной оценкой па-
параметра Ф понимают интервал, границы которого @(н)г., #(в)п яв-
/Ч /Ч
ляются функциями выборочных значений (причем /6i(H)n<d(B)n) и
который содержит с заданной вероятностью оцениваемый пара-
параметр. Аналитически это можно записать в виде
Р |«оо < О < &<>>} ^ ?> A4.49)
Вероятность у называется коэффициентом доверия, а оценки
<ИН)П и Ь{в)п — соответственно нижним и верхним доверительны-
доверительными пределами. Интервал (<ИН)П, &ЪК) называется доверительным.
Длина доверительного интервала 0(в)л—Ф(н)п является случай-
случайной величиной. Однако иногда доверительный интервал целесооб-
целесообразно определить следующим образом:
где Ьп — точечная оценка параметра d; ei, г2 — положительные
числа. Тогда длина доверительного интервала постоянна и равна
392
(ei-f 62H. Для заданного у величины ei и е2 можно найти беско-
бесконечным числом способов. Если W^ (z) — плотность распределе-
распределения точечной оценки, то из
7 A4.50)
получаем два соотношения для определения ei и &2'.
*(If'V<f(z)dZ = Yo, A4.50a)
] Ws (z)dz=yly A4.506)
где Vi' Усг — любые положительные числа, меньшие единицы, при-
причем ух г 72=1—7-
При ei!=e2 = e формула A4.50) определяет связь между коэф-
коэффициентом доверия у, относительной длиной доверительного ин-
интервала 2е и размером выборки п
О(!+в)
J Ws (z)dz~y. A4.51)
«A-е) п
Если задана величина е, то для состоятельных оценок коэффи-
коэффициент доверия будет возрастать по мере увеличения размера вы-
выборки, приближаясь к единице. При заданном размере выборки
коэффициент доверия будет тем больше, чем больше е. Иными
словами, при заданном размере выборки невозможно повысить
коэффициент доверия, не увеличивая относительной длины дове-
доверительного интервала.
Возможны три вида задач, использующих интервальные оцен-
оценки параметра. Для выборки заданного размера п строится точеч-
точечная оценка Ъп, находится ее распределение W ^ (z) и для фикси-
фиксированного е из A4.51) определяется коэффициент доверия у. При
тех же условиях можно по заданному у найти относительную дли-
длину доверительного интервала 2г. Наконец, можно задать и коэф-
коэффициент доверия 7, и относительную длину доверительного интер-
интервала 2е. Тогда из A4.51) последовательными приближениями на-
находят размер выборки, для которой можно достигнуть одновремен-
одновременно заданных 7 и е.
14.2.7. Оценивание векторного параметра. Теория оценивания
обобщается на случай, когда плотность вероятности выборочных
значений зависит от неизвестного векторного параметра ф= (fh,...
..., От). По независимой выборке заданного размера х=(д:ь...
... 9хп) из распределения с плотностью w(x\'&) определяются т
статистик—функций выборочных значений (оценок).
О* = г^(х), 1=1, т. A4.52)
Векторная оценка /в1=(/&1, ..., Фт) состоятельная, если состоятель-
393
ны все ее компоненты, и несмещенная, если несмещены все ее
компоненты.
Оценки Ьи — i ®т — совместно достаточные, если функцию
правдоподобия выборки
можно представить в виде произведения двух сомножителей
I, <*) = /(*!*) Л D A4.54)
Пусть #г — несмещенные оценки параметров #*, i=l,m. Рас-
Рассмотрим при заданном п следующие средние по выборочному
пространству:
IU./) («) = щ { JL In Lx (*)Л- In U(*)\, U /=Т^г. A4.55)
Квадратная матрица 1Л размером тХт, элементы которой рав-
равны InB'j)(#), называется информационной матрицей Фишера. Как
следует из A4.55), информационная матрица Фишера является
корреляционной матрицей совокупности зависимых случайных
величин
причем средние значения этих величин равны нулю [см, A4.34)].
Элементы информационной матрицы можно выразить через ис-
исходную плотность вероятности w(x\'&)
= л1(/'/)(ф)| /, /«ITS. A4.56)
Эта формула аналогична A4.39) и совпадает с ней при /п=1.
Так как
пгг j In Lx
11 о ^
то
d2
OXJj
t, /= 1, m. A4.57)
При m=l A4.57) совпадает с A4.38).
Если детерминант информационной матрицы отличен от нуля,
то имеет место следующее обобщение неравенства Рао — Краме-
Крамера [ср. с A4.41)]. При любом и'= (ии ..., ип) и при условии не-
394
вырожденности информационной матрицы \п имеет место нера-
неравенство
2 2 К «*i - *f) (h - О,)} - Y|/' л] Щ uj > 0, A4.58)
где Yn(i>j) — элементы матрицы In'41, обратной информационной
матрице Фишера. В матричной форме формулу A4.58) можно за-
записать в виде
u'(M-I^)u>Of A4.59)
где М — корреляционная матрица ошибок.
Из этого условия следует система неравенств
fc{<*i}>l/lJM). г = ТГ^, (Н.60)
определяющих нижние границы дисперсий оценок О*.
Система оценок, для которой в A4.58) достигается равенст-
равенство, называется совместно эффективной. Если это равенство име-
имеет место лишь при п-*~оо, то оценки называют совместно асимп-
асимптотически эффективными.
Если CS — смещенные оценки параметров Фг-, 1=1, т, причем
ft), то» вводя матрицу размером пгХт,
можно получить обобщенное неравенство Рао — Крамера:
u^M-DI^DOuX). A4.61)
Структура эффективных оценок векторного параметра имеет
вид [ср. с A4.46) ]
йэФ^ + bW+DI-1 [vlnLx (#)]'. A4.62)
где [Vln Lx(t))]/ — вектор-строка с компонентами lnLx(u),
1=1, т, Ь('О') —вектор-столбец с компонентами bi(ft), i=l, rn.
Для несмещенных эффективных оценок [ср. с A4.47) ]
^эф-^ + 1^1 [V InIx(#)]'. A4.63)
14.3. ОПЕНКИ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ
14.3.1. Уравнения максимального правдоподобия. Рассмотрим
оценку Ьми векторного параметра й, оптимальную по критерию
максимального правдоподобия [см. A2.38)]. Так как логарифм—
монотонная функция, то экстремумы функций Lx [p) и lnL (й)
395
достигаются при одинаковых аргументах #. Поэтому критерий
максимального правдоподобия можно представить в виде
*мп = arg max In Lx (#). A4.64)
Заметим, что функцию правдоподобия в A4.64) можно за-
заменить статистикой отношения правдоподобия
Z(x|0) = Z.,(d)/Lx(Oo). A4.64a>
где #0 — фиксированный вектор.
Учитывая соотношение A4.53) для независимой выборки, за-
запишем необходимое условие для экстремумов функции т пере-
переменных (компонент di, t=l, /n, вектора Ф) в виде системы урав-
уравнений максимального правдоподобия1
т2^1пЧ(*) = 0' i==l>m- A4-65>
Максимумы будут лишь в тех точках экстремумов, для кото-
которых выполняется условие: матрица 9? с элементами
>Mn, i. /=ТЯ A4.65а>
отрицательно определенная.
Оценку #мп=(в1мп,...,втмп), удовлетворяющую системе урав-
уравнений A4.65) и условию A4.65а), называют оценкой максималь-
максимального правдоподобия векторного параметра Ф или совместной
оценкой максимального правдоподобия компонент этого вектор-
векторного параметра.
Оценки максимального правдоподобия состоятельные и асимп-
асимптотически совместно эффективные. При больших размерах вы-
выборки п оценка йМп асимптотически имеет m-мерное нормальное
распределение с вектором средних, равным й, и ковариационной
матрицей Ir1/^, где Ii — информационная матрица при размере
выборки я=1 [см. A4.56)]. Доказательства того, что оценки
максимального правдоподобия обладают указанными свойства-
свойствами, можно найти, например, в [43].
14.3.2. Приближенное решение системы уравнений мак-
максимального правдоподобия. Разложим функцию lnLx('6i) многих
переменных Ъи...,Ът в кратный ряд Тейлора около точки Фо^
= (Ою, ..., Ото) и ограничимся в этом разложении первыми тре-
тремя членами:
1 Предполагается, что производные по Фг функции In LX(O) существуют.
Если это условие не выполняется, то в качестве оценки максимального правдо-
правдоподобия параметра О выбирается статистика ОМп, для которой lnLx(iOiMn)s=*
¦= sup lnLx(O).
396
In Lx @) « ' Lx (d0) + 2 Г-|- In Lx (*)] @, - di
+ -f 2 s f -
ln
Подставляя A4.66) в A4.65), запишем систему уравнений
максимального правдоподобия:
Заменяя вторые производные логарифма функции правдоподо-
правдоподобия их средними значениями и вводя информационную матрицу
Фишера [см. A4.57)], запишем уравнение для первого прибли-
приближения оценки максимального правдоподобия в виде z(fto) —-
—In(*o)(#i—#о)=О, откуда Ui = #o+ in" (#o)z(#o), где z(O0) —
вектор частных производных логарифма функции правдоподобия:
в точке й = 'О1о. Следующее приближение получается заменой д^
на Ь\ и г*Ь на ^2. Если найдено k-e приближение, то
A4.67)
Если функция правдоподобия Lx (О) унимодальна и -первое
приближение выбрано вблизи максимума, то итерационная про-
процедура A4.67) обеспечивает быструю сходимость Ъь, к оценке мак-
максимального правдоподобия.
14.3.3. Оценивание скалярного параметра. Рассмотрим частный
случай приведенных в п.п. 14.3.1, 14.3.2 результатов для т=\ъ
т. е. когда независимая однородная выборка х принадлежит рас-
пределению с плотностью w{x\b), зависящему от скалярного па-
параметра.
Оценка ^мп максимального правдоподобия параметра Ф нахсъ-
дится из уравнения [см. A4.65)]
av
= 2 ^-l
при условии [см. A4.65а)]
A4.68>
A4.68а>
Заметим, что для дискретного распределения р(х\&) уравне-
уравнение максимального правдоподобия имеет вид
0. A4.68б>
39?
Уравнение максимального правдоподобия A4.68) является, в
общем, нелинейным алгебраическим или трансцендентным и мо-
может иметь несколько решений, соответствующих максимумам и
минимумам функции правдоподобия. Каждое решение О = ?ф(х),
соответствующее максимуму функции правдоподобия, представ-
представляем оценку максимального правдоподобия неизвестного пара-
параметра. Если решение уравнения максимального правдоподобия
не единственное, то задача состоит в нахождении того решения,
которое соответствует абсолютному максимуму (максимуму мак-
симоруму).
Если существует несмещенная эффективная оценка Ф3ф, то
уравнение максимального правдоподобия имеет единственное ре-
решение, которое совпадает с Фэф. Если O=g# (x) — достаточная
оценка, то из A4.27) и A4.68) следует
lnLx(O)
Таким образом, если существует достаточная оценка, то каждое
решение уравнения A4.68) является функцией этой достаточной
оценки.
Из A4.67) при т=1 получаем соотношение
[jL\Lm] A4.69)
которое определяет итерационную процедуру приближенного вы-
вычисления оценки максимального правдоподобия параметра О.
Структура этого соотношения аналогична A4.47).
14.4. ОЦЕНИВАНИЕ СЛУЧАЙНОГО ПАРАМЕТРА
14.4.1. Оптимальная оценка по критерию максимума апосте-
апостериорной плотности. Предположим теперь, что однородная неза-
независимая выборка х= (х\9..., хп) принадлежит распределению с
плотностью w(x\ib)y причем д — случайный параметр с извест-
известной плотностью вероятности w($). При таких априорных данных
оптимальный алгоритм оценивания параметра О синтезируется по
критерию максимума апостериорной плотности вероятности
IF(Ojx) оцениваемого параметра [см. A2.26)]. По формуле Бай-
еса находим [см. B.61)]
НР(#|х) = w@)L«(O)/U7(x), A4.70)
где
И7(х)- Jш («) Z-ж (О) d «. A4.70а)
—00
Так как логарифм — монотонная функция, то точки экстре-
экстремумов функции W(b\x) по Ф совпадают с точками экстремумов
по Ф функции
In Щ0|х)=1пш(д)+1п!ж(#)— 1пИ7(х). A4.71)
398
Если функция 1п№(Ф|х) дифференцируема по О, то ее максимум
определяет оптимальную оценку #Мап максимальной апостериор-
апостериорной плотности согласно уравнению
JL JLW-O A4.72)
при условии
— [In w (ft) + In Lx (ft)] L $ < 0. A4.72a)
Для независимой выборки из A4.72) следует
2 -^-ln^(xft!^) = 0. A4.73)
Оценка максимальной апостериорной плотности вероятности со-
состоятельная и асимптотическая эффективная. Распределение ее
при /г>1 асимптотически нормальное с параметрами т:{®}%,
{I(d)} I() ф Ф [ A4.39а)].
р рр
где Ii($) — информация по Фишеру [см. A4.
Если априорное распределение случайного параметра Ф рав-
равномерное на заданном интервале, то [см. A4.71)]
JL\nW($\x) = ^-lnLx($)
ди ди
и, следовательно, при этом оценка максимальной апостериорной
плотности совпадает с оценкой максимального правдоподобия.
14.4.2. Байесовские оценки. Предположим, что наряду с апри-
априорными данными, указанными в п. 14.4.1, задана также функция
потерь П(О, Ф) (см. п. 12.2.5). Тогда имеется полный комплект
априорных данных, необходимый для синтеза байесовского алго-
алгоритма оценивания случайного скалярного параметра О. Как по-
показано в п. 12.4.2, байесовской оценкой, минимизирующей сред-
средний риск, является оценка минимального апостериорного риска
[см. A2.20)]
4 A4.74)
Минимизация функционала A4.74) представляет задачу вариа-
вариационного исчисления, Функционал /(О) в правой части A4.74)
зависит от вида функции h = g®(x), и необходимое условие мини-
минимума можно записать в виде
dJldg = 0. A4.75)
Выбор функции потерь в известной мере субъективен и зави-
зависит от конкретной задачи оценивания параметра. Наиболее час-
часто используются функции потерь, которые представляют четные
функции ошибки О—О оценивания, монотонно возрастающие (не-
(неубывающие) при увеличении модуля ошибки. Далее рассматри-
399
ваются байесовские ошибки при функциях потерь указанного
вида.
14.4.3. Простая функция потерь. Рассмотрим функцию потерь,
которая равна постоянной с для всех значений ошибок и дает
^бесконечный «выигрыш» при точном оценивании
О)-е~-8($-Ф), с>0. A4.76)
Функция потерь A4.76) называется простой.
Подставляя A4.76) в A4.74), получаем
J {Ьб}« min [с - W (*|х)] - max W (Ъ\х). A4.77)
l
Из A4.77) следует, что байесовская оценка при простой функ-
функции потерь совпадает с оценкой максимальной апостериорной
плотности вероятности оцениваемого параметра.
14.4.4. Квадратичная функция потерь. При квадратичной функ-
функции потерь
П@, Ф)-(Ф-Ф)* A4.78)
апостериорный риск
A4.79)
Подставляя A4.79) в A4.75) и разрешая уравнение относитель-
относительно функции Ф=?о(х), получаем
Ь6= ]&W(#\x)d* A4.80)
—оо
или
A4.80a)
Функцию правдоподобия Lx (й) в A4.80а) можно заменить
статистикой отношения правдоподобия
/(x|0HLx(d)/Lx@0), A4.806)
где Оо — некоторое фиксированное значение параметра О [ср.
также с A4.64а)].
Из A4.80) следует, что байесовская оценка при квадратичной
функции потерь представляет условное среднее значение оцени-
оцениваемого параметра О при заданной выборке х. Нетрудно убе-
убедиться, что A4.80) соответствует минимуму апостериорного рис-
400
ка, так как d2J/(dgJ = 2>0. Условное среднее A4.80) является
несмещенной оценкой параметра
J« ^ (О) Lx()d«dx /?!!{#} A4.81)
xn "°°
и, следовательно, [см. A4.79)]
/(Об)=^{*|х}. A4.82)
В отличие от простой функции потерь, для которой байесов-
байесовская оценка определяется локальными свойствами апостериорной
плотности вероятности оцениваемого параметра Ф в окрестности
ее максимума, байесовская оценка при квадратичной функции
потерь зависит от изменения указанной апостериорной плотности
во всем диапазоне измерения параметра О. Заметим, однако, что
для унимодальной и симметричной относительно моды апостери-
апостериорной плотности распределения условное среднее совпадает с
модой и, следовательно, байесовская оценка при квадратичной
функции потерь совпадает с оценкой по критерию максимума
апостериорной плотности, т. е. с байесовской оценкой при про-
простой функции потерь.
14.4.5. Функция потерь, равная модулю ошибки. Для функ-
функции потерь
П@, О) = |«—Ф| A4.83)
апостериорный риск
У D)= ] |«
откуда согласно условию A4.75)
d-L = JV(#|x)d#- JH7(fl|
дЬ $
или
J W (Ь\х) d* = J W (d|x) db. A4.84)
— 00
Из A4.84) следует, что байесовская оценка при функции по-
потерь, равной модулю ошибки, совпадает с условной медианой
оцениваемого параметра Ф при заданной выборке х.
401
Если апостериорная плотность вероятности оцениваемого па-
параметра унимодальна и симметрична относительно моды, то ме-
медиана и среднее значение этого распределения совпадают и рав-
равны его моде. В этом случае байесовские оценки при функции по-
потерь, равной модулю ошибки, и при квадратичной функции по-
потерь одинаковы и совпадают с оценкой максимальной апостери-
апостериорной плотности вероятности.
14.4.6. Прямоугольная функция потерь. Для функции потерь
апостериорный риск
У{«}=1- } Г(Ф|х)Л>, A4.85)
откуда из A4.75) получаем следующее трансцендентное уравне-
уравнение для определения байесовской оценки при прямоугольной
функции потерь:
x). A4.86)
Если апостериорная плотность вероятности оцениваемого пара-
параметра унимодальна и симметрична относительно моды, то един-
единственным решением уравнения A4.86) является такая оценка
О-б, которая совпадает с модой указанной апостериорной плотно-
плотности вероятности. В этом случае байесовская оценка при прямо-
прямоугольной функции потерь совпадает с оценкой, соответствующей
максимальной апостериорной плотности вероятности, т. е. с байе-
байесовской оценкой при простой и квадратичной функциях потерь.
14.4.7. Симметричная функция потерь. Рассмотрим произволь-
произвольную функцию потерь, четную относительно ошибки и неубываю-
неубывающую при увеличении модуля ошибки
П (fl—fl) = П («—«). A4.87)
Все указанные в п.п. 14.4.3—14.4.6 функции потерь являются
функциями такого вида. Предположим, что апостериорная плот-
плотность вероятности параметра $ при заданной выборке х унимо-
унимодальна и симметрична относительно моды. Из этого предположе-
предположения следует, что условное среднее а(х)=т\{&\х} является модой
апостериорной плотности, т. е. W\p—а(х)|х]—четная функция
аргумента ф—а(х).
Запишем уравнение A4.75)
7=(f [П (*-?)] W [О-а (х)|х] Л>. A4.88)
og _До dg
Так как П (Ф—g) — четная функция, ее производная дП/dg— не-
нечетная функция аргумента О—go5(x). Поэтому величина dJ/dg
402
тождественно обращается в нуль, если #—g $(*)='$—а(х), т. е.
если оценка ft =
mi{OU}, A4.89)
потому что при выполнении равенства A4.89) подынтегральная
функция становится нечетной функцией относительно новой пере-
переменной интегрирования т = /&—а(х). Таким образом, оценка
A4.89) является решением уравнения A4.88) и, следовательно,
байесовской оценкой.
Сравнивая A4.89) с A4.80), приходим к выводу, что байесов-
байесовская оценка при квадратичной функции потерь является также
байесовской оценкой при симметричной функции потерь для це-
целого класса апостериорных плотностей оцениваемого параметра,
удовлетворяющих условиям унимодальности и симметричности
относительно моды1.
14.4.8. Байесовские оценки векторного параметра. Предполо-
Предположим, что однородная независимая выборка х= (хь ..., хп) при-
принадлежит распределению с плотностью w(x\i>)y причем Ф=({>1, ...
..., ft™) —случайный векторный параметр с известной плотностью
вероятности w($), #^0m. Задана также функция потерь Щф,
•&). Оптимальной байесовский оценкой Фб параметра $ является
оценка, минимизирующая апостериорный риск (см. п. 12.4.2):
J {Ьб} = min j П (#, 0) W (Ъ\х) d#. A4.90)
Апостериорный риск /{#б} представляет многомерный функ-
функционал, зависящий от т функций (статистик) fti = g$i (x), i =
= l,m. Система уравнений
_^_ =0, i=UWt A4.90а)
d8*t
определяет необходимое условие экстремума этого функционала.
Для простой функции потерь
П(Ь, Ъ)=с—6(Ь—Ъ) A4.91)
апостериорный риск
/ {<>б} = max W (Ь\х). A4.92)
При этом из A4.92) следует, что байесовская оценка векторного
параметра # является оценкой максимальной апостериорной
1 Можно доказать (см., например, [44]), что оценка A4.89) — байесовская
для четной выпуклой функции потерь и апостериорной плотности, симметричной
относительно условного среднего (необязательно унимодальной).
403
плотности -Оман, компоненты коюрой определяются системой
уравнений [ср. с A4.73)]
2 ?rtow(xh\4) = Q,i=\.m. A4.93)
Для квадратичной функции потерь
П (#, #) = (*- #)' Я, (# - #) =
m
2 M*i-*)(*i-O). detb>0, A4.94)
mm
байесовские оценки компонент векторного параметра # равны
апостериорному среднему
*= J O|U?(^|x)d#|f / = П^ A4.95)
0m —oo
14.5. ОЦЕНИВАНИЕ ПАРАМЕТРОВ
НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
14.5.1. Совместные оценки параметров одномерного нормаль-
нормального распределения. Предположим, что наблюдаемая однородная
независимая выборка х= (х\,..., хп) принадлежит нормальному
распределению с неизвестным средним значением а и дисперсией
а2. Функция правдоподобия выборки х
Lx (а, а2) = B ло*)~»/> ехр Г - ±^ 2 (*i - а? 1 =
= B яа2)-"/2 ехр ( — | 2 х\ - 2а 2 ^ + ^а2 11 . A4.96)
п
Сравнивая A4.96) с A4.54), приходим к выводу, что 2 х\ и
п
2 x2i представляют совместно достаточные статистики для сред-
него значения и дисперсии нормального распределения соответ-
соответственно. Из общих соотношений, справедливых для любых рас-
распределений (см. п.п. 14.1.3, 14.1.4), следует, что выборочное сред-
среднее
а-— 2 *i A4.97)
п
1=1
и исправленная выборочная дисперсия
s2- -Ц 2 {*i-a? A4.98)
представляют соответственно состоятельные и несмещенные оцен-
оценки среднего и дисперсии нормального распределения.
404
Случайная величина V~n(a—a)la распределена нормально с
нулевым средним и единичной дисперсией, а случайная величина
[п—\)s2/g2 — по закону %2 с (п—1) степенями свободы. Заметим
при этом, что выборочные среднее и дисперсия для нормального
распределения независимы (см. задачу 14.2, а также [45], с.
233).
Определим элементы информационной матрицы Фишера для
одномерного нормального распределения. В соответствии с
|14.55), учитывая A4.96), получаем
]
Из независимости выборочного среднего и выборочной дис-
дисперсии следует
m, f± In U (а, <т2) ±- In Lx (a, o«) =
l да до2
Далее, используя выражение для моментов %2"Распределения (см..
задачу 3.9), находим
1<2,2) {а, <,*) = щ {[A- In Lx (а, о») ]*} =
Таким образом, информационная матрица Фишера имеет вид
Детерминант этой матрицы равен п2/Bа6), а элементы матри-
матрицы, обратной информационной,
Дисперсии и ковариация оценок A4.97) и A4.98)
= mx \(a-
n — l [
Г П , о «1l
-fl) 2 (Xi-aJ-n(a-aJ \\ «0.
405
Подставляя полученные выражения в A4.58), находим
2оЧ[п(п— 1)]ы22>0,
т. е. оценки A4.97) и A4.98) не являются совместно эффектив-
эффективными.
14.5.2. Оценки максимального правдоподобия. Из A4.65) и
A4.96) получаем систему уравнений максимального правдоподо-
правдоподобия
— In Lx (а, а2) - — 2 (*л - а) = 0, A4.100а)
А_- In Lx (flf о') - J- ? {Хк - аJ- JL- - 0. A4.1006)
Из уравнения A4.100а) следует
^мп = — 2 **, (Н.101)
т. е. оценкой максимального правдоподобия среднего значения
для нормального распределения является выборочное среднее.
Заметим, что уравнение A4.100а) не зависит от параметра а2
нормального распределения. Сравнение ^{й} с 1ПAД) показывает,
что выборочное среднее является несмещенной эффективной
оценкой параметра а нормального распределения.
Из уравнения A4.1006), подставляя вместо а величину амп,
находим оценку максимального правдоподобия дисперсии
^п = — 2 (хь-ЪаГ. A4.102)
п *«1
Таким образом, оценкой максимального правдоподобия дисперсии
для нормального распределения является выборочная дисперсия.
Эта оценка состоятельная, смещенная, причем согласно A4.12)
смещение
Ьп(а2)=~а2//г. A4.103)
Дисперсия оценки A4.102)
A4.104)
Нижняя граница дисперсии оценок параметра а2 нормального
распределения в соответствии с неравенством Рао—Крамера рав-
равна Bа4/я)[1—1/п]2, т. е. отличается от A4.104) множителем
1 — 1/л.
При п-^оо имеем
lim n |i2 Йп} = 2 а4 = Y(,2'2) , A4.104a)
т. е. оценка A4.102) асимптотически эффективная в соответствии
с отмеченными общими свойствами оценок максимального прав-
правдоподобия.
406
Заметим, что при априори известном среднем значении а
оценка максимального правдоподобия дисперсии нормальной
случайной величины имеет вид
# ? ()а A
Оценка A4.105) — несмещенная, а дисперсия ее равна
Y^2). A4.105а)
Таким образом, при известном среднем оценка максимального
правдоподобия дисперсии нормальной случайной величины эф-
эффективная.
14.5.3. Интервальная оценка среднего значения (дисперсия из-
известна). Наряду с точечными оценками параметров нормального
распределения рассмотрим интервальные оценки этих парамет-
параметров. Предположим, что дисперсия а2 известна. Введем нормиро-
нормированную ошибку е оценивания среднего, принимая за точечную
оценку й выборочное среднее A4.97)
e=(a—й)/(а2МI/2. A4.106)
Вероятность того, что |е| не превосходит заданного значения е*
P{|8|<8Y} = Y. (Н.107)
Из A4.106) следует, что нормированная ошибка оценки сред-
среднего представляет гауссовскую случайную величину с нулевым
средним и единичной дисперсией. Поэтому A4.107) можно пере-
переписать в виде
2F(ey)-l=y A4.108а)
или
8v=:*A_v)/2, A4.1086)
где F(z)—интеграл Лапласа, а *а-у)/2 — процентная точка нор-
нормального распределения.
Последние два уравнения связывают относительную длину
доверительного интервала 2еу для нормированной ошибки и ко-
коэффициент доверия у. Первое из них используется для определе-
определения у, если задано еу, а второе — для определения eY, когда да-
дано у. Доверительный интервал для оцениваемого параметра а
можно представить неравенствами
а — *A-7)/2 V°2/n < a <a + a:(i_v)/2 Vd^Jn. A4.109)
Связь между ааа геометрически описывается двумя прямыми,
параллельными биссектрисе координатного угла и отсекающими
на оси й величины ±Хц-^)/2 V<52ln (рис. 14.2). Для определения
нижней и верхней границ доверительного интервала необходимо
спроектировать на ось абсцисс точки пересечения этих прямых с
прямой й=const.
407
15.4.4. Интервальная оценка
среднего значения (дисперсия неиз-
неизвестна). Рассмотрим интервальную
оценку среднего значения гауссов-
ской случайной величины, когда
дисперсия ее неизвестна. В качест-
ве точечных оценок среднего и дис-
персии используем несмещенные
оценки A4.97) и A4.98). Так же,
как и в п. 14.5.3, введем нормиро-
Рис. 14.2. Определение гранлц ванную ошибку оценки. Отличие
доверительного интервала будет в тОМ> что для НОрМИрОВки
используется оценка s2, так как значение дисперсии а2 неизвестно.
Таким образом, в качестве нормированной ошибки оценки сред-
среднего выбираем величину
t=(u—a)l(s*lny'29 A4.110)
которая представляет отношение двух независимых случайных
величин: гауссовской (й—а)/(о2/пI/2 с нулевым средним и еди-
единичной дисперсией и случайной величины (s2/a2I/2, распределен-
распределенной как [%2(п—1)]1/2. Это отношение имеет распределение Стью-
Стьюдента с (п—1) степенью свободы [см. A3.ЮЗ)]1
/2. (или)
•W Уя(я-1) Г[(п-1)/2Д n-l
Функция Sn-i (x) при п-^-оо стремится к плотности стандартного
нормального распределения
y A4.111а)
Для больших размеров выборки распределение статистики
{14.110) можно считать нормальным и при неизвестной диспер-
дисперсии, что и следовало ожидать, если иметь в виду состоятельность
оценки а2. Однако для небольших п распределение Стьюдента за-
заметно отличается от нормального.
Учитывая симметрию распределения Стьюдента, получаем
P{\t\^ty} = 2lySn-i(x)dx = y. A4.112)
о
Доверительный интервал для оцениваемого параметра а пред-
представляется теперь неравенствами [см. A4.110) и A4.112)]
7 A4.113
Более широкий доверительный интервал, который получается при
одинаковых размерах выборки и коэффициентах доверия по срав-
сравнению с предыдущим случаем известной дисперсии, является
платой за неполную информацию о величине дисперсии а2 при
оценке среднего.
408
1 При п = 2 распределение Стьюдента совпадает с распределением Коши.
14.5.5. Интервальная оценка дисперсии. Рассмотрим интерваль-
интервальную оценку неизвестной дисперсии а2 гауссовской случайной вели-
величины. В качестве точечной оценки дисперсии примем несмещен-
несмещенную оценку A4.98), а в качестве нижней и верхней доверитель-
доверительных границ — величины eis2 и в2$2. Вероятность того, что довери-
доверительный интервал с указанными границами содержит пара-
параметр а2,
•V. A4'114>
где х2 — случайная величина, распределенная по закону %2 с п—1
степенями свободы (см. п. 14.5.1)
Величины г\=(п—l)x2i, 82= (п—1)х22 выберем из условия
(рис. 14.3)
A4Л15)
что равносильно
X? = xf,_v))/2, xi = X?I+T)/r A4.115а)
Таким образом, доверительный интервал для дисперсии гаус-
гауссовской случайной величины, соответствующий коэффициенту до-
доверия у, определяется неравенствами
sa,
A4Л16)
где х2а — процентная точка стандартного х2-РаспРеДеления-
14.5.6. Байесовская оценка среднего значения. Предположим,
что дисперсия нормального распределения о
среднее представляет гауссовскую случайную
метрами (а0, а2о), т. е.
w (а) = —
2 известна точно, а
величину с пара-
а0
A4.117)
Wxz(y) I
о
Рис. 14.3. Интервальная оценка дисперсии
409
Найдем сначала оптимальную оценку ймап по критерию максиму-
максимума апостериорной плотности вероятности оцениваемого парамет-
параметра а. Используя A4.73), получаем уравнение для определения
оценки ймап:
откуда
а0о*
1 ( ' У
амап— , г г *//„2\т ( _ 2*fc +
, v2=-^-, A4.118)
где
«мп = — 2 *ь A4.118а)
— оценка максимального правдоподобия.
Оценка A4.118) представляет среднее взвешенное двух вели-
величин: оценки максимального правдоподобия ами и априорного
среднего значения по оцениваемого параметра, причем отноше-
отношение веса, приписываемого второй величине, к весу первой равно
отношению дисперсии оценки максимального правдоподобия к
априорной дисперсии. При /г-*-оо v2->~0 и ймап сходится к оценке
максимального правдоподобия.
Для заданной выборки х=(дгь... ,хп) апостериорная плот-
плотность вероятности параметра а
w'(a) Lx (a) da
—7 2:(**-ЯJ
н
При п-+оо апостериорная плотность вероятности A4.119)
стремится к дельта-функции 8 (а—ймп). При данном п и а0/а->оо
410
параметры нормальной плотности вероятности A4.119) прибли-
приближаются к (амп, Q2/n), а при g2/az>g20 A4.119) переходит в
A4.117).
Из A4.118) и A4.119) видно, что оценка амап максимальной
апостериорной плотности вероятности совпадает с условным
средним оцениваемого параметра т\{а\х). Отсюда следует, что
при квадратичной функции потерь оценка является байесовской.
Так как апостериорная плотность A4.119) симметрична относи-
относительно своей единственной моды а = амап, то в соответствии с об-
общим результатом, указанным в п. 14.4.7, при произвольной сим-
симметричной функции потерь оценка амап является байесовской.
Заметим, что из A4.118) следует
4«ап~<*мп=— 2**> A4.120)
когда априорная дисперсия g2o много больше дисперсии о2/п
оценки максимального правдоподобия амп, т. е. когда
о2о>о2/п. A4.121)
Условие A4.121) выполняется, если при фиксированном
(g/goJ неограниченно увеличивается размер выборки п или если
о2о*>о2 при данном п. Первое означает,что байесовская» оценка при
п-+-оо асимптотически переходит в оценку максимального правдо-
правдоподобия. Второе условие можно трактовать следующим образом:
распределение w(a) неизвестного параметра приблизительно рав-
равномерное при сопоставлении его с исходным распределением
w(x\a). По этой причине оценка A4.118) при g2o»g2 переходит
в оценку максимального правдоподобия. Когда априорная дис-
дисперсия g2o много меньше дисперсии оценки максимального прав-
правдоподобия о2In, байесовская оценка йб=амап~#о, т- е- выбороч-
выборочные значения не влияют на оценку, которая принимается равной
априорному среднему значению оцениваемого параметра.
Подставляя A4.118) и A4.119) в A4.74), получаем
A4.122)
т. е. апостериорный риск, совпадающий в рассматриваемом слу-
случае с условной дисперсией ц,2{я|х}, — постоянная величина и,
следовательно, средний риск
+L\1. A4.122а)
о* 2 J
Нетрудно убедиться, что оценка A4.118) несмещенная, так как
яо- (Н.123а)
411
Безусловная дисперсия оценки A4.118)
I _"*1{И'»{<*мдП}__
x"
A4Л236)
14.5.7. Байесовская оценка вектора средних. Рассмотрим
оценку вектора средних а многомерного нормального распреде-
распределения, предполагая, что этот вектор случайный, его априорное
распределение нормальное с известными параметрами ао и Ко и
что корреляционная матрица К исходного распределения также
известна. Если, кроме того, принята квадратичная функция по-
потерь, то байесовская оценка вектора средних многомерного нор-
нормального распределения запишется в виде [см. A4.95)]
a=Ja№(a|x)da. A4.124)
А
Апостериорная плотность
И?(а|х) = оу(а|ао, К0)Ма, К)х
X [{Иа|а0, К0)Ма, К) da]-* f A4.125)
где априорная плотность
w (а|а0, /Со) = Bя)-"/2 (det Ко)~1/2 X
Xехр [ - ^- (а - а0)' V (а - а0)] A4.125а)
и функция правдоподобия
U (а, К) = Bл)-""/2 (det К)-1/2 X
X ехр [ - -I" 2 (х* - а)' К (xft - аI . A4.1256)
Из A4.124), A4.125) следует [ср. с D.118), D.119)]
* /1 + ККр-* 4-М » Xk+ MO^\ A4Л26)
\ п I \ п k=\ п I
14.5.8. Рекуррентная форма байесовской оценки вектора сред-
средних. Формулу A4.126) можно переписать в форме рекуррентно-
рекуррентного соотношения
^n_1+^xn) A4.127)
Kn - К (Km_! + К)-1 Кп_! A4.127a)
412
и а& — байесовская оценка вектора средних на k-м шаге наблю-
наблюдения.
В скалярном случае К = а21, Ко = а2о1 и тогда рекуррентная
форма байесовской оценки случайного среднего значения для
одномерного нормального распределения записывается в виде
[ср. с A4.118)]
е-М-н^ _¦*_ A4128)
l + *
где ап — оценка на n-м шаге наблюдения.
При п->оо из A4.128) получаем рекуррентное соотношение
для оценки максимального правдоподобия среднего аначения
n-i + xn/n. A4.129)
14.6. АНАЛОГОВЫЕ АЛГОРИТМЫ
ОЦЕНИВАНИЯ ПАРАМЕТРОВ
14.6.1. Постановка задачи. Пусть на интервале (О, Т) наблю-
наблюдается реализация x(t) случайного процесса X(t), некоторые ха-
характеристики которого, например моментные функции, содержат
неизвестные параметры #1,..., ftm. Задача состоит в том, чтобы
найти оценки этих параметров в виде функционалов от непре-
непрерывно наблюдаемой реализации
*!=&>, 1х @М€= (О, Г), I = 1, т. A4.130)
Каждый функционал gQt[x(t)] представляет случайную величи-
величину, распределение которой связано с вероятностными характерис-
характеристиками случайного процесса X(t).
Как уже подчеркивалось в конце п. 13.9.1, предела функции
правдоподобия, когда размер выборки неограниченно возрастает,
не существует. Это, казалось бы, создает препятствия для фор-
формального обобщения изложенных результатов теории дискретных
алгоритмов оценивания на аналоговые алгоритмы, в которых ис-
используются функционалы от реализаций случайных процессов.
Чтобы преодолеть это препятствие, вместо несуществующего
функционала правдоподобия вводится функционал отношения
правдоподобия
I [х @|«] = lim W (xv ... , xn\*)/W (хъ ... , xn|O0)f A4.131)
тде Фо — некоторое фиксированное значение параметра О. В ре-
регулярном случае |ln l[x(t) I*] | <oo.
Для синтеза аналоговых алгоритмов оценивания, оптимальных
по рассмотренным критериям качества, следует учесть замеча-
замечания, приведенные в п.п. 14.3.1 и 14.4.4 [см. A4.64а) и A4.806)],
о замене функции правдоподобия статистикой отношения правдо-
413
подобия. Тогда оптимальные аналоговые алгоритмы получаются
предельным переходом [см. A4.131)] из дискретных алгоритмов
оценивания при неограниченном увеличении размера выборки.
14.6.2. Несмещенность и эффективность оценок. Оценка д=
= ?#[Л'@] параметра Ф называется несмещенной, если
mi{go[x{t)]} ^ft* где символ т\ означает усреднение по множест-
множеству реализаций. Величина
A4.132)
называется смещением.
Информация по Фишеру об оцениваемом параметре О, содер-
содержащаяся в реализации x(t) случайного процесса, определяется
по формуле
фру
I (О) - «1 {(? И* ЙМJ J . A4.133)
Нижнюю границу дисперсии оценки получаем из неравенства
? — Крамера [см. A4.40)]
A4.134)
Оценка, для которой в A4.134) достигается равенство, называет-
называется эффективной.
14.6.3. Оптимальные аналоговые алгоритмы оценивания. Если
параметр Ф — неизвестная константа, то, используя критерий
максимального правдоподобия
I I* @1 ^мп1 = шах 1[х @1*1, A4.135)
получаем уравнение максимального правдоподобия1
^{1п/И01<>]}-0, A4.136)
которое при условии
? {In l[x @1*]} л <0 A4.136а)
определяет оценку максимального правдоподобия ^Мп [см. A4.68),
A4.68а)].
Если параметр ф случайный и известна его априорная плот-
плотность вероятности до (О), то апостериорная плотность вероятности
параметра Ф по наблюдаемой реализации x(t) случайного про-
процесса
W'H')l<4 e A4137)
1 Если функционал In l[x(t) |ft] не дифференцируем по ft, то оценку макси-
максимального правдоподобия находим из условия l[x(t) \ЬМп] =sup l[x(t) |ft].
•б1
414
Оценка #Мап по критерию максимума апостериорной плотности
находится из уравнения [ом. A4.72)]
± 1гш(#)+ ?{Ы[*@|<>]}0 A4.138)
при условии
^ л <0 B4.138а)
Апостериорный риск J{ft\x(t)} получим усреднением функции
потерь по апостериорной плотности A4.137):
J{b\x(t)}= J U(b,b)Wl&\x(t)]db. A4.139)
Байесовская оценка Фб, определяемая из условия минимума апос-
апостериорного риска A4.139) для четных функций потерь и для уни-
унимодальных и симметричных относительно моды апостериорных
плотностей вероятности оцениваемого параметра, имеет вид Гсм.
A4.80) и A4.80а)]
Ьб= J $W[$\x(t)]d$ A4.140)
—00
ИЛИ
A4.140а)
Заметим, что знаменатель в правой части A4.140а) представ-
представляет усредненный по априорному распределению параметра
функционал отношения правдоподобия.
Естественным образом приведенные определения и соотноше-
соотношения обобщаются на совместные оценки компонент векторного па-
параметра.
14.7. ЗАДАЧИ
14.1. Показать, что для равномерного распределения о/(*|ft) = 1/0, 0<*<ft,
оценка
\)t A)
где *(п> и я*1) — наибольшая и наименьшая порядковые статистики
^несмещенная и имеет наименьшую дисперсию
B)
415
Убедиться, что дисперсия B) меньше нижней границы Ф2/я2, определяемой
неравенством Рао — Крамера, если его формально использовать для распре-
распределения, равномерного на интервале (О, Ф).
14.2. Доказать, что выборочные среднее и дисперсия для нормального рас-
распределения независимы. Обобщить этот результат на многомерное нормальное
распределение и доказать, что вектор выборочных средних значений не зави-
зависит от выборочной ковариационной матрицы (см. [45]).
14.3. Дисперсия центрированной гауссовской случайной величины распре-
распределена экспоненциально с плотностью
1 / о*
Маа)= -г еха - —
Доказать, что оценка максимальной апостериорной плотности вероятности па-
параметра о2
C)
Доказать также, чте при квадратичной функции потерь байесовская оиен-
ка
_ ± [¦
где а2мж — оценка максимального правдоподобия [см. A4.105) при а = 0],
Km (z) — функция Бесселя второго рода от мнимого аргумента.
Обратить внимание, что при этом байесовская оценка не совпадает с оцен-
оценкой по критерию максимальной апостериорной плотности и объяснить причину
такого различия.
14.4. Доказать, что оценка максимального правдоподобия параметра О1 экс-
экспоненциального распределения с плотностью
ю <*!*)= ¦?" ехр (- -М, х>0, О>0 E)
равна
1 п
^мц= — 2*1» F)
п <-1
Доказать, что эта оценка несмещенная и эффективная.
Показать, что доверительный интервал для оцениваемого параметра Ф име-
имеет следующий вид:
2п ^мп/Х( l-v)/2 < # < 2п ёмп/%( l+v)/2 . G)
где у — заданный коэффициент доверия и %2а — процентная точка стандарт-
стандартного х2-распределения.
14.5. Параметр О экспоненциального распределения [см. E)] — случайная
величина, распределенная также по экспоненциальному закону с известным па-
416
раметром Фо. Доказать, что оценка максимальной апостериорной плотности ве-
вероятности Ф
Доказать также, что при квадратичной функции потерь байесовская оценка
$ — - —
где Ома — оценка максимального правдоподобия [см. F)] и Km (z) — функ-
функция Бесселя второго рода от мнимого аргумента (применительно к рассматри-
рассматриваемой задаче см. также замечание к задаче 14.3).
Глава 15
ОБНАРУЖЕНИЕ СИГНАЛОВ НА ФОНЕ
АДДИТИВНЫХ ГАУССОВСКИХ ПОМЕХ
15.1. ОПТИМАЛЬНЫЕ ДИСКРЕТНО-АНАЛОГОВЫЕ
АЛГОРИТМЫ ОБНАРУЖЕНИЯ ДЕТЕРМИНИРОВАННЫХ
СИГНАЛОВ
15.1.L Постановка задачи и априорные данные. В ра-
радиолокации, в системах связи и во многих других областях есте-
естествознания и техники возникает следующая ситуация априорной
неопределенности. Исследователь наблюдает (или регистрирует
при помощи автоматического устройства) реализацию случайного
процесса, которая может представлять либо смесь сигнала, со-
содержащего полезную информацию, и мешающей помехи, либо
только помеху. Задача исследователя состоит в том, чтобы, ис-
используя заранее выработанное правило, вынести решение о на-
наличии или отсутствии полезного сигнала в наблюдаемой реали-
реализации. Эта задача обнаружения сигнала на фоне помех относит-
относится к классу задач проверки статистических гипотез (см. п. 12.1.2).
Обозначим через x(t) реализацию случайного процесса X(t)9
наблюдаемую на интервале 0^j^7\ Выдвигается гипотеза Н^
что X(t)=%(t), где l(t)—случайная помеха, против альтернат
тивы #i, что X(t)=s(t)®%(t), где s(t) —полезный сигнал и сим-
символ ® характеризует взаимодействие сигнала s(t) с помехой
%{t). Необходимо на основании определенного правила, оптималь-
оптимального по некоторому критерию или эвристического, принять реше-
решение 7i о наличии сигнала (принять альтернативу Н\) или реше-
решение 7о об отсутствии сигнала (принять гипотезу #о).
Как отмечалось в п. 12.1.2, указанная общая постановка зада*
чи проверки статистических гипотез не является исчерпывающей.
Ее необходимо дополнить укомплектованием априорных данных.
14—27 ' 417
В этой главе предполагается, что помеха ?(/)—аддитивная
и представляет центрированный гауссовский случайный процесс.
Аддитивность означает, что символ ® заменяется знаком сумми-
суммирования. Сигнал предполагается детерминированным, что соответ-
соответствует так называемой задаче когерентного обнаружения.
Рассмотрим одношаговые дискретно-аналоговые алгоритмы
обнаружения. В этом случае непрерывная реализация x(t) подвер-
подвергается временной дискретизации и наблюдение представляется
выборкой заданного размера
x=(xi,..., xn), Xi=Xi(ti), xgeX", *»€=@, 71), *=Т7/Г A5.1)
Элементы выборки — гауссовские случайные величины, средние
значения которых
m1{xi\Ho}=Of mi{Xi\Hi}=sit Si=s(ti), i=l7~n. A5.2)
Предполагается известной ковариационная матрица выборки х,
которая равна К и при гипотезе, и ври альтернативе.
Функции правдоподобия выборки х запишутся в виде [см.
B.64)]
W (х|Я0) - Bя)-"/2 (det К)-1/2 ехр ( - — х' К-1 х \ , A5.3)
W (х\Нг) =* Bя)-«/2 (det КГ1/2 ехр Г - -~ (х - s)' К" (х - s)l ,
A5.4)
где s=(sif..., sn) —вектор сигнальных значений в моменты дис-
дискретизации. За критерий качества алгоритма принятия решения
выбираем критерий Неймана—Пирсона, который чаще всего ис-
используется в теории обнаружения сигналов. Поэтому указанный
комплект априорных данных является полным для синтеза опти-
оптимального алгоритма обнаружения по принятому критерию (см. п.
12.4.6 и § 12.6).
Как и в общей теории проверки гипотезы Но против альтер-
альтернативы #i, в теории обнаружения сигналов на фоне помех рас-
рассматриваются ошибки двух видов: первого рода — ложная трево-
тревога, когда принимается решение о наличии сигнала, а в действи-
действительности его нет, и второго рода, — пропуск сигнала, когда при-
принимается решение о том, что сигнала нет, а в действительности
он присутствует. Вероятности а ложной тревоги р пропуска сиг-
сигнала
а=Р{71|#0}, p=P{7o|//i}. A5.5)
Вероятность правильного обнаружения сигнала
1-р=Р{Т1|Я,}. A5.5а)
Алгоритм обнаружения, оптимальный по критерию Неймана —
Пирсона, обеспечивает максимум вероятности правильного об-
обнаружения сигнала при заданной вероятности ложной тревоги.
418
15.1.2. Синтез оптимального алгоритма обнаружения по неза-
независимой выборке. Предположим сначала, что интервал дискре-
дискретизации тд>тк, где тк — интервал корреляции стационарной га-
уссовской помехи. Так как тк«1^Лс, где Ас — ширина полосы
спектра помехи, то указанное условие означает тдАс^>1. Время
наблюдения 71=лтд>лтк. При указанных условиях элементы вы-
выборки A5.1) можно полагать практически некоррелированными,
а так как распределение выборки нормальное, то с достаточным
приближением можно полагать наблюдаемую выборку х неза-
независимой. В этом случае корреляционная матрица диагональная
К=аЧ, A5.6)
где а2 — дисперсия помехи и I — единичная матрица. Очевидно,
что обратная матрица К~1 = 1/а2. Тогда согласно A5.3) и A5.4)
функции правдоподобия выборки при гипотезе Но и альтернати-
альтернативе Нх
W (х|#0) - B по*)-"* ехр (' - -±_ х' х) -
- Лг S *l\ . A5.7)
W (xl/Zi) = B яо1)-"/2 ехр Г l— (x - s)' (x -
= Bяо«)-»/2ехр I - -J- 2 {xk-sh)*} . A5.8)
Как следует из общей теории проверки статистических гипо-
гипотез (см. п. 13.1.9), оптимальный по критерию Неймана — Пирсона
алгоритм принятия решения предписывает сравнение с порогом
достаточной статистики логарифма отношения правдоподобия. В
рассматриваемом случае эта статистика равна
1п/(х)= - JL. l(x-s)'(x-s)-x'x]
или
Так как дисперсия помехи и детерминированный сигнал априори
известны, то достаточной статистикой является также сумма
yn(x) = s'x= 2 sk*h. A5.10)
Теперь можно сформулировать оптимальный по критерию Ней-
Неймана— Пирсона дискретно-аналоговый алгоритм обнаружения де-
детерминированного сигнала на фоне независимой гауссовской ад-
14* 419
дитивной помехи. Принимается решение ^i ° наличии сигнала,
если
уп(х)>с, A5.14)
и решение -у0 о том, что сигнала нет, в противном случае.
Порог с в (H5.ll) при заданной вероятности а ложной трево-
тревоги находим из уравнения
* Р /// ^y\ *-^./»1 J-f \ г* Н ^ 1 91
¦ * \Уп \"*у ^^^ I **Qj—(X. ^lO.lZJ
Чтобы определить вероятность в левой части равенства
A5.12), необходимо исследовать распределение статистики A5.10)
при гипотезе Яо, т. е. когда выборка х представляет последова-
последовательность п независимых центрированных гауссовских величин с
одинаковыми дисперсиями а2. Ясно, что сумма уЛ(х) также пред-
представляет центрированную гауссовскую величину с дисперсией
п
2
A5.13)
Тогда
00
х j exp
с
5с|Я0}«Bяо2|8|2)-1/2 X
2o4s|2 J [a|s| J
A5.14)
или
C=xmo\s\, A5.15)
где ха — процентная точка стандартного нормального распре-
распределения.
Из A5.10), A5.11), A5.15) окончательно сформулируем ал-
алгоритм обнаружения сигнала:
A5.16)
Ya
Этот алгоритм состоит в вычислении корреляционной суммы srx
и сравнении ее с порогом, который определяется известными ап-
априори вероятностью ложной тревоги а, дисперсией помехи а2 и
мощностью детерминированного сигнала |s|2. Этот алгоритм реа-
реализует дискретный коррелометр (рис. 15.1).
При байесовской трактовке критерия Неймана — Пирсона (см.
п. 13.1.9) порог с в алгоритме A5.11) представляет (при равно-
равновероятных гипотезе и альтернативе) отношение платы за ложную
Умножитель
Накопитель
Сумматар
Уп.
Генератор
сигнальных
значений
Рис. 15.1. Струк-гурная схема дис-
дискретного коррелометра
420
тревогу к плате за пропуск сигнала. При уменьшении требуемой
вероятности а ложных тревог повышается порог [см. A5.15)] и,
следовательно, увеличивается плата за ложную тревогу.
15.1.3. Анализ рабочей характеристики оптимального алгорит-
алгоритма обнаружения сигнала. Рабочей характеристикой оптимально-
оптимального алгоритма обнаружения сигнала на фоне помех назовем зави-
зависимость максимальной вероятности правильного обнаружения сиг-
сигнала от заданной вероятности ложной тревоги при фиксированных
априорных данных.
Для того чтобы определить максимальную по критерию Ней-
Неймана— Пирсона вероятность правильного обнаружения сигнала,
необходимо исследовать распределение статистики в левой части
A5.16), т. е, когда выборка х представляет аддитивную смесь
сигнала и независимой гауссовской помехи. Ясно, что линейная
комбинация гауссовских случайных величин также представляет
гауссовскую случайную величину, а ее среднее и дисперсия
H 2 sft/"i{*ft}=2 s* = |s|a, A5.17a)
= 2 «* ^2 Ы = °3 2 4 = °2 Is|a- A5.176)
k=\
Заметим, что при гипотезе и альтернативе «расстояние» между
статистиками z/n(x) [ср. с A3.82) ]
Вероятность правильного обнаружения сигнала
-(stao-wv1 j exp{- (Li:ir W
J
() A5.19)
или
xa-jf,_p=|s|/o = dn, A5.20)
где xa, xi-p — процентные точки стандартного нормального рас-
1 "
пределения вероятностей. Обозначая через Wns=—2 s2fe мощ-
ность сигнала s(t), перепишем характеристику A5.20):
xa-^_p = (nWn,/o2)'/2. A5.20а)
Соотношение A5.20) представляет рабочую характеристику
оптимального алгоритма обнаружения детерминированного сигна-
сигнала на фоне аддитивной независимой гауссовской помехи в виде
421
Рис. 15.2. Линейная зависимость Рис. 15.3. Семейство рабочих характери-
процентных точек стик обнаружения сигнала
линейной зависимости процентных точек ха и х\-$ (рис. 15.2).
Единственным параметром этой характеристики является вели-
величина dn> пропорциональная квадратному корню из отношения
мощности сигнала к дисперсии помехи. Таким образом, качест-
качество обнаружения не зависит от вида сигнала, а только от его мощ-
мощности. Ясно, что при увеличении размера выборки увеличивается
значение параметра dn, которое пропорционально У п.
На рис. 15.3 приведены в явном виде рабочие характеристики
обнаружения детерминированного сигнала на фоне аддитивной не-
независимой гауссовской помехи как семейство функций 1—Р = /(а)
при различных значениях отношения dn сигнал-помеха.
15.1.4. Реализация алгоритма при помощи цифрового фильтра.
Как было указано в п. 15.1.2, для реализации оптимального ал-
алгоритма обнаружения детерминированного сигнала s(t) на фоне
аддитивной независимой гауссовской помехи необходимо осущест-
осуществить корреляционную обработку наблюдаемой выборки. Такая об-
обработка в дискретном коррелометре (рис. 15.1) содержит нели-
нелинейный элемент — умножитель. Можно, однако, выполнить кор-
корреляционную обработку и линейным цифровым фильтром.
В »п. 6.2.1 лриведено соотношение «вход-выход» для физически
реализуемого цифрового фильтра с постоянными во времени па-
параметрами
Уп ==
A5.21)
где hn-h — импульсная характеристика линейного цифрового
фильтра, хн — текущее значение величин на входе фильтра, уп —
значение величины на выходе фильтра в момент наблюдения. Ее-
422
ли принять, что входные величины — выборочные значения, то
Хл = 0 при k^0f и формулу A5.21) следует переписать в виде
Уп-i hn-kXk. A5.22)
Сравнивая A5.22) с A5.10), замечаем, что обе формулы совпа-
совпадают, если задать импульсную характеристику цифрового фильт-
фильтра следующим образом:
An-fc = Sfc, fe = T7^ A5.23)
где Si, ..., sn — значения детерминированного сигнала в моменты
дискретизации.
Цифровой фильтр, импульсная характеристика которого свя-
связана со значениями сигнала соотношением A5.23), называется
согласованным.
Таким образом, оптимальный алгоритм обнаружения детерми-
детерминированного сигнала на фоне аддитивной независимой гауссовс-
кой помехи реализуется при помощи согласованного цифрового
фильтра (рис. 15.4).
15.1.5. Синтез оптимального алгоритма обнаружения по кор-
коррелированной выборке. Рассмотренный случай независимой вы-
выборки часто оказывается нереальным, так как для накопления
выборки достаточного размера потребуется недопустимо большое
время наблюдения. Поэтому рассмотрим задачу синтеза опти-
оптимального дискретно-аналогового алгоритма обнаружения детер-
детерминированного сигнала на фоне аддитивной гауссовской помехи
при произвольном интервале дискретизации. В этом случае функ-
функции правдоподобия коррелированной (зависимой) выборки при ги-
гипотезе и при альтернативе определяются формулами A5.3) и
A5.4). Теперь достаточная статистика логарифма отношения
правдоподобия
In/(х) = — — (х - s)' К" (х - s) - — х' К~
2, Z
ИЛИ
In / (х) = s'K^x - s'K^s.
A5.24)
Так как корреляционная матрица помехи и детерминированный
Рис. 15.4. Схема согласо-
согласованного цифрового филь-
фильтра:
х—регистр сдвига; а —
аттенюатор (или усили-
усилитель)
423
сигнал представляют априори известные данные, то достаточной
статистикой является также
yn(x)=s/K-1x. О5-25)
Вводя вектор-строку u^s'K'1, можно представить статистику
A5.25) в виде скалярного произведения (суммы):
A5.26)
т. е. линейной комбинации гауссовских случайных величин. Ког-
Когда сигнала нет, то
A5.27)
=s/K~1s = dV A5.28)
Используя A5.26) —A5.28), находим уравнение, определяющее
порог при заданной вероятности а ложной тревоги:
Р{у»(х)>с|Я0}«(^^
A5.29)
или
c=xadn, A5.30)
где хл — процентная точка нормального распределения, а
<Й = 8'К-!в-2 isiSjKiTl)> A5.31)
Kij(~l) — элементы матрицы К.
Заметим, что величина s'K^s, которую можно назвать обоб-
обобщенным отношением сигнал-помеха, всегда положительна, так
как корреляционная матрица К положительно определенная.
Теперь можно сформулировать оптимальный по критерию Ней-
Неймана— Пирсона дискретно-аналоговый алгоритм обнаружения
сигнала на фоне аддитивной коррелированной гауссовской поме-
помечи: принимается решение 71 о наличии сигнала, если
u'x=2ukxk>xadnf A5.32)
и решение *уо о том, что сигнала нет, в противном случае.
Как и при независимой выборке, оптимальный алгоритм обна-
обнаружения сигнала A5.32) состоит в вычислении корреляционной
суммы и сравнение ее с порогом. Отличие состоит в том, что ве-
совйе коэффициенты корреляционной суммы представляют ком-
компоненты вектора и', зависящего и от сигнала, и от корреляцион-
корреляционной матрицы помехи.
Устройство, реализующее алгоритм A5.32), также является
дискретным коррелометром, структурная схема которого отличает-
424
ся от схемы, изображенной на рис. 15.1, тем, что генератор сиг-
сигнальных значений заменяется генератором значений компонент
вектора u/ = s/K~1. Как и при независимой выборке, корреляцион-
корреляционную обработку можно выполнить при -помощи цифрового фильтра
с импульсной характеристикой
hn-h — Uh, k—lt n, A5.33)
где uh — компоненты вектора и [ср. с A5.23) и рис. 15.4].
15.1.6. Рабочая характеристика оптимального алгоритма. Най-
Найдем зависимость вероятности правильного обнаружения сигнала
от вероятности ложной тревоги для алгоритма A5.32). Так как
статистика A5.26) и при наличии сигнала представляет гауссов-
скую случайную величину, то для определения вероятности пра-
правильного обнаружения сигнала достаточно найти среднее и дис-
дисперсию этой случайной величины лри альтернативе Н\. Из A5.26)
следует
= u/s = s/Ks = d2n, A5.34)
ro} = s/K-1s = rfan. A5.35)
Используя A5.34), A5.35) и A5.30), находим вероятность пра-
правильного обнаружения сигнала
= l-F(*a-dn) A5.36)
или
P*a-*i-p = dn, A5.37)
где ха , xi-p— процентные точки нормального распределения ве-
вероятностей, а параметр dn определяется по формуле A5.31).
Рабочая характеристика A5.37) оптимального по критерию
Неймана — Пирсона дискретно-аналогового алгоритма обнаруже-
обнаружения детерминированного сигнала на фоне аддитивной коррелиро-
коррелированной помехи имеет формально тот же вид, что и характеристи-
характеристика A5.20) для независимой помехи. Однако в рассматриваемом
случае параметр dn характеристики обнаружения определяется
по формуле A5.31), т. е. зависит и от вида сигнала, и от корре-
корреляционных свойств помехи. Фрмальное совладение соотношений
A5.20) и A5.37) позволяет использовать графики рабочих ха-
характеристик обнаружения, изображенные на рис. 15.2 и 15.3, и
для коррелированной помехи, если при этом определять параметр
dn по формуле A5.31).
Заметим, что и в рассматриваемом случае «расстояние» меж-
между статистиками уп(х) при гипотезе и альтернативе равно пара-
параметру dn [ср. с A5.18)].
15.1.7. Два способа дискретизации наблюдений. При постанов-
постановке рассматриваемых в этом разделе задач синтеза и анализа
425
a)
5)
6)
1
1
xz
1
1
хз
1
1
XS
] ,
tz
Рис. 15.5. Мгновенная дискретизация:
a — наблюдаемая реализация, б — ключе-
ключевая схема, в — выборка
дискретно-аналоговых алгорит-
алгоритмов обнаружения сигналов
предполагалось, что временная
дискретизация наблюдаемой
реализации происходит мгно-
мгновенно в заданные моменты
времени [см. A5.1)]. Практи-
Практически такая дискретизация
осуществляется (прнближер-
но) при помощи ключевого
элемента (последовательности
импульсов), работа которого
иллюстрируется рис. 15.5.
Можно использовать и другой
способ дискретизации — фильт-
фильтровой. Наблюдаемая реализа-
реализация поступает на входы N ли-
линейных фильтров и значения сигналов на выходах фильтров в кон-
конце интервалов наблюдения образуют выборку размером N, причем
можно так согласовать импульсные характеристики фильтров с
корреляционной функцией помехи, чтобы получаемая фильтровым
способом выборка (координаты наблюдаемой реализации случай-
случайного процесса) была некоррелирована (такой способ дискретиза-
дискретизации рассматривался в пп. 4.5.6—4.5.9).
Пусть tph(t) и^ — собственные функции и собственные числа
интегрального уравнения
Ф (t) = % j В (t — у) ф (у) dy> 0 ^ / <! Ту A5.38)
где В(х) — корреляционная функция гауссовской помехи.
Рассмотрим N линейных фильтров с импульсными характе-
характеристиками
(Г-т), 0<т<7\ 6=177"
О, т<0, т>7\
Если на вход &-го фильтра действует реализация x(t)9 то на его
выходе в конце интервала наблюдения реализации выдается /со-
ордината процесса хъ.
т
x(t)yh(t)dt.
A5.40)
Как показано в п. 4.5.6, определенные таким образом координаты
представляют совокупность некоррелированных случайных вели-
величин. Но так как здесь рассматриваются реализации гауссовского
случайного процесса, то координаты Xk, k=l, N9 как линейные
426
функционалы гауссовского процесса, образуя совокупность неза-
независимых гауссовских случайных величин. Параметры этих вели-
величин (координат)
ml{xk\Ho}=Oy A5.41а)
тг {хк\Нг} = Vhj*(t) Ф* @ dt = ski A5.416)
где sk — координата детерминированного сигнала при указанном
фильтровом способе его дискретизации,
B(t-y)<ph(t)<ph(y)dydt =
A5.41в)
[{
Устройство, реализующее фильтровой способ дискретизации
наблюдаемой реализации, (рис. 15.6) используется и для форми-
формирования координат s^ k=l, N, детерминированного сигнала, ес-
если на входы фильтров подается детерминированный сигнал s(t).
15.1.8. Оптимальный алгоритм обнаружения по независимым
координатам. Рассмотрим задачу синтеза оптимального дискрет-
дискретно-аналогового алгоритма обнаружения детерминированного сиг-
сигнала на фоне аддитивной гауссовской помехи при фильтровом
способе дискретизации наблюдаемой реализации x(t) случайного
процесса. Достаточная статистика формируется на основе неза-
независимых координат xh, &=1, N, определяемых согласно A5.40) и
представляющих гауссовские случайные величины, средние и
дисперсии которых (при гипотезе и альтернативе) находят по
формулам A5.41а—в).
Функции правдоподобия выборки х= (хи ..., xN), составленной
из указанных независимых координат, запишутся в виде
2
A5.42)
= BяГ"/2ехр Г - -i- i(xh -s,J1 A5.43)
Теперь достаточная статистика логарифма отношения правдопо-
правдоподобия-
In /(х) = — (|х—s|2—|x|2)/2 = xrs—|s| 2/2 A5.44)
или
ЬI (х) = 2 [sk Ч - -j 2 si A5.44а)
427
«p,
i
x(t)
о
xz
ИУ
\
Рис. 15.6. Схема фильтровой
дискретизации:
Фк — линейный фильтр с импульс-
импульсной характеристикой A5.39); ИУ —
блок, в котором хранятся собствен-
ные функции и собственные числа
интегрального уравнения A5.38)
для заданной корреляционной функ-
функции помехи
Следует иметь в виду, что формула A5.44а) не отличается от
формулы A5.9) только потому, что для разных величин исполь-
использованы одинаковые обозначения. В A5.9) величина Хк получена
путем мгновенной дискретизации при условии, что интервал диск-
дискретизации достаточно большой, поэтому можно не учитывать
коррелированность значений помехи и полагать выборку незави-
независимой. В A5.44а) величина хи получена путем фильтровой диск-
дискретизации, которая зависит от корреляционной функции помехи,
хотя и позволяет сформировать независимую выборку. Аналогич-
Аналогичное замечание относится и к величине s*. В A5.9) sk — значение
сигнала s(t) в момент tk, а в A5.44а) — координата сигнала
s(t) в базисе собственных функций интегрального уравнения
A5.38) и, следовательно, определяется и сигналом, и корреля-
корреляционной функцией помехи [см. A5.416)]. Из последнего замеча-
замечания следует, что второе слагаемое в A5.44а) представляет априо-
априори известные данные о сигнале и помехе и поэтому достаточной
статистикой является также
N
которая представляет гауссовскую случайную величину.
При гипотезе Яо (сигнала нет)
N
Щ {Уы (х)\но) = 2 Ч Щ {хк\Н0} = О,
A5.45)
A5.46)
A5.47)
Из A5.45) — A5.47) находим значение порога при заданной ве-
вероятности а ложной тревоги [ср. с A5.14) и A5.29)]:
c=xadNt A5.48)
где ха — процентная точка нормального распределения вероят-
вероятности, а величина dN определяется по формуле A5.47).
Оптимальный по критерию Неймана — Пирсона алгоритм об-
обнаружения запишется в виде
N vi
V A5.49)
/5=1
Yo
428
Рабочая характеристика обнаружения
Ц-*,_Р = <!„ A5.50)
в рассматриваемом случае формально совпадает с A5.20) и
A5.87). Необходимо учитывать лишь, что параметр dN рабочей
характеристики отличается от соответствующих параметров dn
для рЬбочих характеристик алгоритмов, синтезированных по вы-
выборкам, которые получены путем мгновенной дискретизации. Од-
Однако и при этом можно попользовать графики рабочих характе-
характеристик, изображенных на рис. 15.2 и 15.3, если заменить параметр
dn параметром dN согласно формуле A5.47), которая учитывает
и вид сигнала, и корреляционную функцию помехи. Заметим, что
и в рассматриваемом случае параметр dN равен «расстоянию»
между статистиками z/jv(x) при гипотезе и альтернативе.
Статистика A5.45), как и A5.10), A5.26), представляет кор-
корреляционную сумму и, следовательно, структурные схемы диск-
дискретного коррелометра (рис. 15.1) и цифрового фильтра (рис. 15.4)
представляют устройства, реализующие алгоритм A5.49), если
только иметь в виду, что выборочные значения Хк и сигнальные
значения Sk на этих схемах заменены величинами на выходах
фильтров Фк (рис. 15.6), когда на их входы действуют наблюдае-
наблюдаемая реализация x(t) и детерминированный сигнал s(t) соответст-
соответственно.
15.1.9. Сопоставление рассмотренных дискретно-аналоговых
алгоритмов обнаружения. Сопоставим рассмотренные три типа
оптимальных дискретно-аналоговых алгоритмов обнаружения де-
детерминированного сигнала на фоне аддитивной гауссовской по-
помехи по трем признакам: сложность алгоритма; необходимое вре-
время наблюдения (размер выборки) для> получения требуемой ха-
характеристики обнаружения; характеристика обнаружения при
фиксированном времени наблюдения. Сравнение производится
для заданного детерминированного сигнала, заданных вероятно-
вероятностных характеристик гауссовской помехи и заданной вероятности
ложной тревоги.
Все три оптимальных алгоритма обнаружения A5.11), A5.32)
и A5.49), полученные при различных условиях формирования вы-
выборки заданного размера, основаны на вычислении корреляци-
корреляционной суммы и сравнении ее с дорогом. Эти операции реализуют-
реализуются дискретным коррелометром или соответствующим цифровым
фильтром. Поэтому сложность алгоритма и устройства, реализую-
реализующего алгоритм, зависит от метода получения выборочных значе-
значений Xk9 весовых коэффициентов s& и параметра характеристики
обнаружения.
Наиболее простым является алгоритм A5.11), когда xk = x(tk),
Sft = s(/fc), а параметр d2n равен произведению размера выборки на
отношение сигнал-помеха. Однако для получения выборки необхо-
необходимого размера следует располагать очень большим временем на-
429
блюдения, чтобы выполнить условие независимости выборки/ при
котором синтезирован указанный алгоритм. ;
Более сложным является алгоритм A5.32), так как длк вы-
вычисления весовых коэффициентов uk и параметра d2n необходимо
выполнить операцию обращения корреляционной матрицы/боль-
матрицы/большого размера. Но три этом коррелированную выборку размером
п можно получить при существенно меньшей длительности йаблю-
дения по сравнению с той, которая требуется для получения неза-
независимой выборки того же размера. Конечно, может оказаться, что
при одинаковых размерах выборки характеристика обнаружения
алгоритма A5.11) 'будет лучше, чем у алгоритма A5.32), и тогда
для достижения одинаковой эффективности обнаружения придет-
придется увеличить размер коррелированной выборки, не увеличивая
при этом длительности наблюдения. Однако в некоторых случаях
эффективность алгоритма A5.32) может оказаться выше, чем у
алгоритма A5.11) даже при одинаковом размере выборки. Для
иллюстрации последнего утверждения рассмотрим лростейший слу-
случай постоянного сигнала s(t)^a и п = 2. Тогда для независимой
выборки (параметр ^2(н)=—|К2 [см. A5.18)]. Для коррелирован-
о
ной выборки, как нетрудно подсчитать, параметр ^2(к) = — X
а
X 1/ ? , где R — коэффициент корреляции между выборочными
V I -J- /\
значениями [см. A5.31)]. Следовательно, d2(H)/^2(K) = V
||
)
|| и это отношение больше единицы, если /?>0, и меньше
единицы, если R<.0. При монотонном изменении корреляционной
функции помехи алгоритм с независимыми выборками более эф-
эффективен, чем с коррелированными, но при знакопеременной кор-
корреляционной функции эффективность алгоритма с коррелирован-
коррелированными выборками может оказаться выше, чем с независимыми.
Наиболее сложным, на первый взгляд, представляется алго-
алгоритм A5.49), так как для получения выборочных значений и ве-
весовых коэффициентов корреляционной суммы необходима систе-
система цифровых фильтров, импульсные характеристики которых яв-
являются решениями интегрального уравнения A5.38). Однако, как
показывает пример, приведенный в [48], при одинаковом времени
наблюдения и одинаковом размере выборки (N = n) характерис-
характеристика обнаружения алгоритма A5.38) лучше, чем у алгоритма
A5.32). При заданной вероятности правильного обнаружения и
фиксированной длительности наблюдения число N «декоррели-
рующих» фильтров может оказаться существенно меньшим, чем
размер п коррелированной выборки.
15.2. ФУНКЦИОНАЛ ОТНОШЕНИЯ ПРАВДОПОДОБИЯ
ГАУССОБСКОГО ПРОЦЕССА
15.2.1. Предварительное замечание. При использовании диск-
дискретно-аналоговых алгоритмов неизбежны потери части полезной
430
информации, содержащейся в наблюдаемой реализации случай-
ногоТпроцесса. Эти потери связаны с ограниченностью размера
выборки при мгновенной временной дискретизации непрерывной
реализации и с конечным числом независимых координат реали-
реализации при фильтровом способе ее дискретизации. Представляет
интерес синтез оптимальных аналоговых алгоритмов обнаружения
сигналов на фоне аддитивных гаусшвских помех, использующих
всю непрерывную наблюдаемую реализацию для решения о на-
наличии или отсутствии сигнала.
Как было 'показано в п. 13.9.3, оптимальный по любому из
рассмотренных критериев качества аналоговый алгоритм провер-
проверки гипотезы Но против альтернативы Н\ предписывает сравнение
с порогом логарифма функционала отношения правдоподобия. По-
Поэтому для синтеза оптимального аналогового алгоритма обнару-
обнаружения сигнала на фоне гауссовской помехи необходимо опреде-
определить логарифм функционала отношения правдоподобия гауссовс-
кого случайного процесса с указанием ограничений, при которых
этот функционал существует (см. in. 13.9.2).
Имея в виду, что в дальнейшем будут рассмотрены также оп-
оптимальные алгоритмы различения сигналов на фоне аддитивных
гауссовоких помех, далее приводится вывод выражения логариф-
логарифма функционала отношения правдоподобия для более общего
случая, когда гипотеза Яо состоит в том, что наблюдаемая реа-
реализация принадлежит гауссовскому прцессу с корреляционной
функцией B(i9 у) и средним значением So(t), а альтернатива
#i — в том, что реализация принадлежит гауссовскому процессу
с той же корреляционной функцией и средним значением S\(t).
Для рассматриваемой здесь задачи обнаружения so(O=O и
Sl(t)=s(t).
15.2.2. Предел логарифма отношения правдоподобия для кор-
коррелированной выборки. Запишем логарифм отношения правдопо-
правдоподобия для дискретной выборки х~ (хи ..., хп), полученной отбо-
отбором на интервале (О, Т) через равные промежутки времени из
реализации x(t) гауссовского случайного процесса [см. A3.124)]
In I (х) = х' К (s, - so) ~ -1- (Sl + So)' К (s, - s0) =
-^Sx-So), A5.51)
где x — вектор с компонентами Xu=x(th)\ sb s2 — векторы с ком-
компонентами sik = si(tk), soh = so{th), ^e=@, 7), k=l, n\ K=[B(tif
tj)] — корреляционная матрица (положительно определенная)
размером пХп.
Введем вектор
V=K-4si—so). A5.51a)
Тогда
si—so = KV. A5.516)
431
Записывая компоненты вектора V в виде У(ы;)Ди,-, представим
A5.516) интегральной суммой , I
h (t) - s0 @ = 2 В (t, uj) V (uj) A uj. (ksiB)
Переходя к пределу при /i->oo (или при max Awj->-0) на заданном
интервале наблюдения (О, Г), получаем неоднородное интеграль-
интегральное уравнение
\в (/, и) V (и) da = s± (t) -s0 (*), 0 < f < 7\ A5.52)
о
из которого можно определить функцию V(и). Представим те-
теперь A5.51) стохастической интегральной суммой
\]s A5.53)
Для любой гипотезы дисперсия этой интегральной суммы
№ {In I (x)} ^ (Sl - во)' К" (sx - во) - (в1 - ei) V -
= SK(^)-50(^)]K^)Af;. A5.54)
Если
Hm>2 {In / (x)} == IV (t) [$г (t) - s0 (/)] dt = d\ <oo, A5.55)
rt>oo 5
то имеет место регулярный случай (см. п. 13.9.2) и логарифм от-
отношения правдоподобия A5.53) сходится в среднеквадратическом
к логарифму функционала отношения правдоподобия
In/[*(*)] = ]v (t) [*(f)-Sl@+g6(f) ] dty A5.56)
где V(t) — решение интегрального уравнения A5.52).
Нетрудно найти также средние значения логарифма функцио-
функционала отношения правдоподобия при гипотезе и при альтернативе:
m1 {InI[x{t)\ Ho} = lim/Я!{InI (x)|#0) - - d\ /2, A5.57а)
Щ {In / [x (t)] HJ = lim tn^Xnl (x) | Hy) = d| /2, A5.576)
где параметр d2T определяется по формуле A5.55) [см. A5.56)].
15.2.3. Вывод выражения логафима функционала отношения
правдоподобия при помощи независимых координат. Используя
W независимых координат наблюдаемого гауссовского процесса,
получаем (см. п. 15.1.7)
Щ / (хг... t xN) - - 4" 2 l(xh - bhf - (xk - akf] -
432
-ak)q>k(t), A5.58)
о \' z J*=i
где
~ Т A5.59а)
A5.596)
A5.59b)
%k и q>k{t) — собственные числа и собственные функции однород-
однородного линейного интегрального уравнения A5.38).
Из A5.58) находим средние и дисперсию логарифма отноше-
отношения правдоподобия
i N
= — 2 (bk ~ а&J> A5.60а)
И{ S^-e*I- A6.606)
Обозначим
^ @ = S VTfc (ftfc - fl*) Фь @- [A5.61)
Умножая обе части A5.61) на B(t, и), интегрируя по / от 0 до Г
и используя A5.38), получаем
f B(t, u)VN{f)dt=. 2 ^-fl*l^W. A5.62)
Используя A5.61), можно переписать выражение A5.58) в
виде
[[@+@]. A5.63)
Если дисперсия A5.606) при JV->oo ограничена, т. е. если1
1 Условие A5.64) совпадает с условием регулярности A5.55). Действительно,
2 (&*—аЛJ= lim J [si(/)—so(/)] S
т т
При этом A5.60а, б) совпадают с A5.57а, б), A5.55), если N-+oo.
433
-«»)¦< oo, A5.64)
го существует конечный предел
limVN(t) = V(f)9 A5.65)
причем функция У(/) определяется из следующего неоднородно-
неоднородного линейного интегрального уравнения [см. A5.596), A5.59в),
A5.62)]
( В (/, и) V (и) du=i (bk - ak) Ф, (t)/Vh = h (t) - s0 (t), 0 < t <Г.
о k=\
Это уравнение не отличается от A5.52).
При выполнении условия A5.64) из A5.65) следует, что лога-
логарифм отношения шравдоподобия A5.63) сходится в среднеквад-
ратическом к функционалу
In I [х (t)] - [ V (t) [x (t) - So@ + Sl@] dt.
Последнее выражение совпадает с A5.56).
Когда ряд A5.64) расходящийся, логарифм отношения прав-
правдоподобия A5.63) стремится к оо, если верна гипотеза Яь и к
—оо, если верна гипотеза Яо.
15.2.4. Обобщение на комплексный гауссовский процесс. Рас-
Распространим результаты п. 15.2.3 на комплексный гауссовский слу-
случайный процесс ?(#) с известной корреляционной функцией
В^ С» У) ==mi{ECO?(i/)}> г^е черта указывает на комплексно-со-
комплексно-сопряженную величину.
Найдем логарифм отношения правдоподобия для дискретной
выборки (размером 2N) независимых координат
k=l N, A5.66)
наблюдаемой на интервале (О, Т) реализации
z(t)=x{t)+iy(t) A5.67)
центрированного гауссовского процесса
5@ =5@+Ы @ A5.68)
(гипотеза Яо), или гауссовского процесса
С@ +s(t) =6@ +a(t) +i[t|(rf) +b{t)] A5.69)
(гипотеза #i), где s(t) =a(t) +ibt — детерминированная комп-
комплексная функция.
Предполагается, что mi{§(a)?(i>)} =mi{r\(u)r\(v)}, mx{l(u)X
Xr)(v)}=—™>i{n{u>Yl{v)}t а также
ml{t(t)} = ml{r\(t)}=0, mi{6^)+tl2(/)}<oo. A5.70)
434
ПрА гипотезе #о
mi{Xxm}==mi{yhym}=0 для кфт, A5.71а)
mi{Aym}=0 Для всех к, т, A5.716)
m1{xk}=ml{yh} = H2. A5.71b)
Введем, кроме того, координаты детерминированного процесса
A5.72)
Учитывая, что распределение случайных величин дса, Цъ. нор-
нормальное и при гипотезе, и при альтернативе, получаем аналогич-
аналогично A5.58)
Ш / (х19..., ум) - 2
или в комплексной форме
N N
где
"~" Т A5.75а)
фГ(?) Л, A5.756)
а Я& и ф^@ — собственные числа и собственные функции интег-
интегрального уравнения х
<p(f) = blBt(t9y)<p(y)dy9 0<^<Г. A5.76)
о
Обозначим
VN{t)^iVKsh^k{t). A5.77)
Jfe=l
Из A5.77) аналогично A5.62)
/[Я6(<, a) VN@ ^= 2 ДЛФД!,Ц). A5.78)
О /г=1 | У ЯА
Из A5.74) находим средние и дисперсию логарифма отношения
правдоподобия
}= -/Mln/fzJItfoH-i- 2 \Ч\\ A5.79а)
Яо}= 2 |sft|2. A5.796)
1 Нетрудно убедиться, что для комплексного случайного процесса корреля-
корреляционная функция B^(t, у) симметрична и положительно определенна, а собствен-
собственные числа Xfe действительны и положительны.
435
Тогда A5.74) можно переписать следующим образом:
t A5.80)
Если дисперсия A5.796) при JV-мэо ограничена, т. е.
2Ы2<°о, A5.81)
то существует предел
[{) (\ A5.82)
N->00
Функция V(t) определяется» из неоднородного линейного интег-
интегрального уравнения, которое получается из A5.78) при N-+oo
f B6(f, u)V{u)du = s(t), 0<f<7\ A5.83)
Интегральное уравнение A5.83]г в комплексной форме экви-
эквивалентно системе двух интегральных уравнений относительно дей-
действительной Vn(t) и мнимой Vi(t) частей:
( ч(*. u)]VR(u)du +
-Brt(t, a)]Vi(tt)du-Res@, 0<*<7\ A5.84a)
чС u)]Vl{u)du +
. A5.846)
l
0
При выполнении условия A5.81) логарифм отношения прав-
правдоподобия (!15.80) сходится в среднеквадратическом к функцио-
функционалу
\V{t)\z (Q —-?i?L]dt. A5.85)
15.3. ОПТИМАЛЬНЫЕ АНАЛОГОВЫЕ АЛГОРИТМЫ
ОБНАРУЖЕНИЯ ДЕТЕРМИНИРОВАННЫХ СИГНАЛОВ
15.3.1. Синтез оптимального алгоритма и его рабочая характе-
характеристика. Рассмотрим задачу обнаружения детерминированного
сигнала на фоне аддитивной гауссовской помехи, постановка ко-
которой и необходимые априорные данные для ее решения приведе-
1 Условие A5.81) легко преобразуется к виду, аналогичному A5.55).
436
иы в п-\ 15.1.1. Будем, однако, предполагать, что наблюдаемая ре-
реализация x{t) не подвергается дискретизации и необходимо син-
тезироврь оптимальный по критерию Неймана — Пирсона анало-
аналоговый алгоритм обнаружения. Для этого используем выражение
A5.56) логарифма функционала отношения (Правдоподобия для
гауссовского случайного процесса, полагая si(t)=s(t) и so(t)=O.
Так как s{t) — детерминированный сигнал, а функция- V(t)
определяется априорными данными [см. A5.52) ], то достаточной
статистикой является случайная величина [линейный функционал
от реализации x(i)]
yT=lv(t)x{t)dU A5.86)
о
где функция V(t) представляет решение интегрального уравнения
I B(t-u)V(u)du = s(t), 0<*<7\ A5.87)
о
где В{х) — корреляционная функция» гауссовской помехи.
Оптимальный аналоговый алгоритм обнаружения предписыва-
предписывает сравнение функционала A5.86) (так называемого корреляци-
корреляционного интеграла) с порогом
Ут%с, A5.88)
Yo
который определяется заданной вероятностью а ложной тревоги.
Случайная величина ут как линейный функционал гауссовско-
гауссовского процесса распределена нормально с параметрами
Щ{Ут\Но}~09
т
^i{yH^i}«j^(/)s(/)d/,
т т
Ц2Ы#0, #i}=J I B(t-u)V(t)V(u)dtdu
0 0
или с учетом A5.87)
*Лут\Н0, H,} = lv(t)s(t)dt.
0
Обозначим
т
d>T = {V(f)s(t)dt.
A5.89а)
A5.896)
A5.89b)
A5.89)
A5.90)
Тогда из уравнения
находим
c=xadT. A5.91)
437
Таким образом, в соответствии с A5.88) принимается реше-
решение Yi о наличии сигнала, если
$V(t)x(t)dt>xa-dT, A5.92)
о
и решение 70 о том, что сигнала нет, в противном случае.
Вероятность правильного обнаружения
1—$ = P{yT>c\Hl} = l-F(xa— dT). A5.93)
Используя A5.93), запишем рабочую характеристику оптималь-
оптимального аналогового алгоритма обнаружения сигнала
*a-*,_3-dr, A5.94)
где ха1 xi-з — процентные точки нормального распределения ве-
вероятностей; dT — параметр обнаружения, определяемый из
A5.90).
Из A5.20), A5.37), A5.50) и A5.94) следует, что рабочие
характеристики всех рассмотренных оптимальных дискретно-ана-
дискретно-аналоговых алгоритмов обнаружения и оптимального аналогового
алгоритма одинаковы и отличаются лишь параметрами обнару-
обнаружения. Графики рабочих характеристик, изображенные на рис.
15.2 и 15.3, можно использовать и для оптимального аналогового
алгоритма обнаружения, если заменить параметр dn параметром
dT. Параметр dT зависит от вида сигнала и корреляционной функ-
функции помехи [см. A5.90) и A5.87)] и равен «расстоянию» между
статистиками ут при гипотезе Яо и альтернативе Н\.
15=3.2. Реализация оптимального аналогового алгоритма. Из
A5.92) следует, что для реализации оптимального аналогового
алгоритма обнаружения детерминированного сигнала на фоне ад-
аддитивной гауссовской помехи необходимо вычислить корреляци-
корреляционный интеграл A5.86), представляющий линейный функционал
от наблюдаемой реализации x(t) с ядром V(t), представляющим
решение интегрального уравнения A5.87). Вычислитель корре-
корреляционного интеграла ут — аналоговый коррелометр (рис. 15.7) —
содержит нелинейный элемент — умножитель, на вход которого
поступают наблюдаемая реализация x{t) и функция V(t), генери-
генерируемая в блоке ИУ путем решения интегрального уравнения
A5.87) для заданных сигнала и корреляционной функции помехи.
Можно, однако, вычислить корреляционный интеграл, исполь-
используя физически реализуемый линейный фильтр с постоянными во
времени параметрами (см. п. б.ЗЛ). Рассмотрим линейный фильтр
с импульсной характеристикой
A5.95)
0, т<0, т>7.
Если на вход такого фильтра действует процесс x{t), то процесс
y(t) на выходе фильтра [см. F.29)]:
y(t) = (v(u)x(t + u-T)du A5.96)
о
438
Рис. 45.7. Схема аналогового корре-
коррелометра
и, следовательно, в конце наблюдения три i = T из A5.96) полу-
получаем
yT = y(T)=fv(u)x(u)du, A5.96а)
о
т. е. корреляционный интеграл.
Фильтр с характеристикой A5.95), при помощи которого реа-
реализуется оптимальный алгоритм обнаружения, назовем оптималь-
оптимальным.
15.3.3. Помеха — белый шум. Предположим, что аддитивной
помехой является белый гауссовский шум со спектральной интен-
интенсивностью No (см. п.п. 4.4.2, 5.5.9). Так как корреляционная
функция белого шума равна В(т) =JVo6(t), то из A5.87), исполь-
используя фильтрующее свойство дельта-функции, получаем
V(t)=s(t)/N0. A5.97)
Из A5.90) следует
± -^, A5.98)
где Es — энергия сигнала на интервале наблюдения.
Таким образом, оптимальный аналоговый алгоритм обнаруже-
обнаружения детерминированного сигнала на фне аддитивной гауссовской
помехи представляется в виде [см. A5.92)]
-^ls{t)x{t)dt%xa(-^-\l\ A5.99)
No о Yo \ No )
Рабочая характеристика этого алгоритма [см. A5.94)]
*а-*Ы>==(Я.да/2 A5.100)
полностью определяется отношением энергии сигнала Es к спект-
спектральной плотности No белого шума и не зависит от вида сиг-
сигнала.
Заметим, что при белом шуме условие A5.55) для рассмат-
рассматриваемой задачи обнаружения
EJNQ<oo A5.101)
представляет требование ограниченности отношения энергии сиг-
сигнала к спектральной плотности шума, что практически всегда вы-
выполняется. Таким образом, при обнаружении сигнала на фоне ад-
аддитивного белого шума всегда будет иметь место регулярный слу-
439
чай, а сингулярность (которой соответствуют безошибочные реше-
решения при конечном времени наблюдения) исключается.
15.3.4. Согласованный фильтр. Из A5.99) следует, что опти-
оптимальный алгоритм обнаружения детерминированного сигнала на
фоне аддитивного белого гауссовского шума предписывает срав-
сравнение с порогом корреляционного интервала
ут=$ s(t)x(t)dt. B5.102)
о
В соответствии с результатами, приведенными в п. 15.3.3, корре-.
ляционный интеграл A5.102) вычисляется при помощи оптималь-
оптимального линейного фильтра с импульсной характеристикой
A5.103)
0, т<0, т>7.
Фильтр, импульсная характеристика которого определяется фор-
формулой A5.103), называют согласованным.
Как следует из A5.103), импульсная характеристика согласо-
согласованного фильтра представляет зеркальное отображение сигналь-
сигнальной функции s(t) относительно оси, проходящей через точку
t=T (см. рис. 15.8).
Передаточная функция согласованного фильтра [см. F.30а)]
т
k (i со) == J s (Т - т) ехр (- i со /) dt =
о
т
= exp(-i©7) J s(r)exp(-io)T)dT A5.104a)
6
или
ft=(i©)=i48((o; Г)ехр(—icoT), A5.1046)
где As((u; T) — спектр сигнала. Следовательно, передаточная
функция согласованного фильтра равна комплексно-сопряженно-
комплексно-сопряженному спектру сигнала на интервале наблюдения.
15.3.5. Отношение сигнал-помеха на выходе оптимального
фильтра. Оптимальность использования фильтра с характеристи-
характеристикой A5.95) для обнаружения детерминированного сигнала s(t)
на фоне аддитивной гауссовской помехи можно объяснить и с
другой точки зрения. Для этого рассмотрим отношение квадрата
сигнала на выходе произвольного линейного фильтра в конце на-
наблюдения
S2(Г) = Г f h(T-u)s(u)duY A5.105a)
U J
к дисперсии помехи на выходе фильтра
а2= [ jh(T-u)h(T-v)B(v-u)dudv, A5.1056)
о о
440
в)
О f~tg T Г+Tfl t
Рис. 15.9. Реакция согласо-
согласованного фильтра на входной
импульс
Рис. 15.8. Сигнальная функ-
функция (а) и импульсная харак-
—=»- теристика (б) согласованн)-
и i-z0 i V го фильтра
где h(u) — импульсная характеристика фильтра, В(т) — корре-
корреляционная функция помехи.
Величину V2 = s2iG')/a2n называют отношением сигнал-помеха.
Так как для любого фильтра s2i(T)fo2n^:V2m2ix, то
V2ma*G2n
2n—S
ИЛИ
т т
h(T-u)h(T-v)B(v-u)dudv-
A5.105b)
причем знак равенства соответствует максимальному отношению
сигнал-помеха. Нетрудно проверить, что левая часть A5.105в)
обращается в нуль для функции Л(т), удовлетворяющей интег-
интегральному уравнению
A5.106)
A5.107)
i
причем
h(T-u)s(u)du.
Уравнение A5.106) при h(T—т) = У(т), О^т^Г, не сличается
от A5.87) и, следовательно, определяет импульсную характерис-
характеристику оптимального фильтра, а параметр d2T рабочей характерис-
характеристики оптимального алгоритма обнаружения совпадает при этом с
441
максимальным отношением сигнал-помеха [ср. A5.107) с A5.90)].
Для белого шума с интенсивностью No из A5.107) следует
*2«—М*Ю<«—!г> <15-107а)
т. е. максимальное отношение сигнал-помеха на выходе согласо-
согласованного фильтра равно отношению энергии сигнала Es на интер-
интервале @, Т) к спектральной плотности No шума.
Заметим, что >в конце интервала наблюдения t = T реакция
Si(t) согласованного фильтра на входной сигнал s(t) максималь-
максимальна [см. A5.105а) и рис. 15.9].
Обозначая мощность сигнала WS = ES/T и мощность шума Wm =
= NoF в полосе F, запишем A5.107а) в виде
v2m*x=FTWslWm. A5.108)
Величину FT называют базой сигнала.
Формулу A5.107) можно выразить через спектральные харак-
характеристики сигнала и помехи:
-' <15109>
где 5 (со) —спектральная плотность мощности помехи. Для бело-
белого шума из A5.109) следует
15.4. ОПТИМАЛЬНЫЕ АЛГОРИТМЫ ОБНАРУЖЕНИЯ
КВАЗИДЕТЕРМИНИРОВАННЫХ СИГНАЛОВ
15.4.1. Постановка задачи. Рассмотрим теперь задачу синтеза
оптимального алгоритма обнаружения квазидетерминированного
сигнала, представляющего узкополосный процесс с заданными
законами амплитудной a(t) и фазовой г|эв(*) модуляции и со слу-
случайной начальной фазой <p0:
A5.111)
на фоне аддитивной узкополосной гауссовской помехи. Задача со-
состоит в проверке простой гипотезы Яо, что наблюдаемый про-
процесс — реализация стационарного гауссовского процесса с нуле-
нулевым средним, против сложной альтернативы Ни что этот процесс
также реализиция гауссовского, но со средним значением s(f),
которое представляет одно из континуума реализаций, соответ
ствующих изменению случайной фазы фо в интервале @, 2я).
Синтез оптимальных алгоритмов обнаружения в рассматрива-
рассматриваемом случае основан на усредненных по случайной фазе отноше-
отношения правдоподобия для дискретно-аналогового алгоритма и функ-
функционала отношения правдоподобия для аналогового алгоритма
442
(см. п. 13.4.4). Такие алгоритмы, использующие усредненные по
неизвестной фазе сигнала (мешающему параметру) достаточные
статистики, называют некогерентными в отличие от рассмотрен-
рассмотренных когерентных алгоритмов обнаружения детерминированных
сигналов.
15.4.2. Комплексная огибающая узкополосного процесса. Вос-
Воспользуемся комплексным представлением реализаций помехи как
узкополосного стационарного случайного процесса (см. п.10.1.2):
x(t)=Rez(t)exp(mot), A5.112)
где z(t) —комплексная огибающая помехи, связанная с ее огиба-
огибающей г@ и фазой 0@ соотношением
A5.112а)
причем
z(f)=A(t)+\C(t), A2.1126)
где A({t) и С(t)—квадратурные составляющие помехи. Для га-
уссовской помехи эти составляющие распределены нормально.
Комплексная огибающая квазидетерминированного сигнала
A5.111)
A5л13)
A5.113а)
При гипотезе Яо (сигнала нет) наблюдаемая реализация по-
помехи связана с ее комплексной огибающей соотношением
A5.112), а при альтернативе #i (сигнал присутствует) наблюда-
наблюдаемая реализация
oO. A5.1136)
Из A5.112) и A5.1136) следует, что при гипотезе, и при аль-
альтернативе для каждого фиксированного значения фазы ф0 сиг-
сигнала вероятностные характеристики наблюдаемой реализации
x(t) высокочастотного процесса полностью определяются веро-
вероятностными характеристиками комплексной огибающей z(t) по-
помехи (или ее квадратурными составляющими, медленно изменя-
изменяющимися по сравнению с высокочастотным колебанием coscooO-
Поэтому для синтеза оптимального дискретно-аналогового алго-
алгоритма обнаружения детерминированного узкополосного сигнала
на фоне стационарной узкополосной помехи с центральной часто-
частотой coo спектра, совпадающей с несущей частотой сигнала, можно
использовать выборки комплексной огибающей помехи
(или выборки ее квадратурных составляющих). Такой алгоритм
обнаружения, который можно назвать оптимальным амплитудно-
фазовым (см. [16], п. 6.3.6), будет так же эффективен, как и оп-
оптимальный дискретно-аналоговый алгоритм обнаружения, синте-
синтезированный на основе выборки наблюдаемого высокочастотного
процесса.
443
15.4.3. Независимые координаты комплексной огибающей га-
уссовского случайного процесса. Рассмотрим фильтровой способ
дискретизации комплексной огибающей (см. пп. 15.1.7 и 15.2.4).
В результате такой дискретизации получаем совокупность некор-
некоррелированных координат комплексной огибающей 1
{ A5.114)
о
Здесь Xk и ф^(/) —собственные числа и собственные функции'
интегрального уравнения
A5.115)
где
Дг (т) == т1 {^@ Z(^ + T)} A5.116)
— корреляционная функция комплексной огибающей помехи, дей-
действительная и мнимая части которой совпадают с корреляцион-
корреляционной и взаимной корреляционной функциями квадратурных состав-
составляющих A(t) и C(t) помехи;
ЯеВ2(т)=ВА(т)=Вс(т), A5.116а)
1тВг(т)=ВАс(т)=-ВСА(т). A5.1166)
Заметим, что для симметричного относительно частоты спект-
спектра помехи Бас(т)=0, Sz(t)=Ba(t) и решения интегрального
уравнения A5.115) —действительные функции.
Из A5.114) и A5.115) имеем
ml{zkzm}=26km. A5.117)
Нетрудно показать, что
mi{zkzm}=0 A5.117а)
для всех k и т.
Если Хи и уи — действительная и мнимая части координаты
zk (т. е. координаты квадратурных составляющих), то из
A5.117), A5.117а) следует (см. п. 15.2.4)
mi{xkym}=0 для любых к, т; A5.118а)
mi{xhxm} = ml{yhym} =0 для кфт\ A5.1186)
ml{x2k}=m1{y2k} = 1. A5.118в)
Кроме того, для помехи (гипотеза Но) m\{z{t)} =0, и, следова-
следовательно,
mi {zh | Но} = тх {xk | Но} = тх {yk \ Но} = 0, A5.118г)
1 В качестве упражнения рекомендуется рассмотреть мгновенную дискрети-
дискретизацию комплексной огибающей (см. также задачу 15.9).
444
а для смеси помехи с сигналом (гипотеза #1) m\{z(t)} =
*=zs(t)exp(iq)o) и поэтому
ml{zk\Hi}=skexp Офо), A5.119а)
mi {xh | Hi} = ak cos ф0—bfe sin <p0> A5.1196)
mi{yk\Hi} =aksin<po+bkcos(po, A5.1 19b)
где
Так как компоненты координат комплексной огибающей гаус-
еовского узкополосного процесса распределены нормально, то
случайные величины xi, yu ..., jcjv, f/я представляют совокупность
независимых случайных величин.
15.4.4. Оптимальные дискретно-аналоговые алгоритмы обна-
обнаружения квазидетерминированных сигналов. Условный (при фик-
фиксированной фазе фо) логарифм отношения прадоподобия при ис-
использовании 2JV независимых координат х,и Уи *=1, N, наблюда-
наблюдаемого процесса можно записать в виде [ср. A5.44)]
\nl(xl9 у19..*, xN,
1 N
2 k~\
- (Ун - <*h sin фо - bk cos ф0J], A5.120a)
или в комплексной форме i[cm. A5.80)]
1п/(г1,..., ^|фо)= 2 fRe Bл sft ехР (~~ 1фо)) ~" lsftl2/2]. A5.1206)
Из A5.1206) следует, что при фиксированной фазе ф0 опти-
оптимальный амплитудно-фазовый дискретно-аналоговый алгоритм
обнаружения детерминированного узкополосного сигнала на фоне
аддитивной узкополосной гауссовскои помехи имеет вид
2 Re f2ft sft exp (- i ф0)] = 2 IK cos ф0 - bh sin фо) xk +
+ (ak sin фо + bk cos фо) yh]*c A5.1 20b)
y°
Статистика в левой части неравенств A5.120в) представляет ли-
линейную функцию от независимых координат л;*, уъ. квадратурных
составляющих наблюдаемой реализации узкополосного случай-
случайного процесса.
445
Если мешающий параметр <p0 — случайный и распределен рав-
равномерно на интервале @, 2я), то усредненное по этому парамет-
параметру отношение правдоподобия [см. A5.1206)]
j 2я
Л (г19..., zN) = — j I (*i,..., zN\q>0) d ф0 =
Г 1 N 1 1 2я
= ехр 2 lsftl2 j exP lrNcos(ф0 — фл/)] dф0, A5.121)
где
~ A5.121а)
N __ N
(l %zkh/Re %zhh). A5.1216)
\
Используя известное интегральное представление функции Бес-
Бесселя от мнимого аргумента (см., например, п.3.2.3), получаем
окончательно
[4 l A5.122)
Экспоненциальный сомножитель в A5.122) зависит только от
априорных данных, а функция Io{rN) монотонно возрастает при
гм^О. Так как случайная величина rN^0 [см. A5.121а)], то из
A5.122) следует, что усредненное отношение правдоподобия яв-
является монотонной функцией статистики rN-=rN(zu ..., zN). Поэто-
Поэтому оптимальный (по любому из рассмотренных в гл. 12 крите-
критериев) дискретно-аналоговый алгоритм обнаружения квазидетер-
минированного сигнала на фоне аддитивной узкополосной гаус-
совской помехи предписывает сравнение с порогом статистики
A5.121а):
rN %c. A5.122а)
Yo
При использовании критерия Неймана — Пирсона порог с опре-
определяется заданной вероятностью а ложной тревоги.
Для определения порога с в A5.122а) по заданному значению
а и для вычисления вероятности правильного обнаружения не-
необходимо знать распределение случайной величины rN при гипо-
гипотезе Но и при альтернативе Ни Нетрудно найти это распределе-
распределение. Действительно, случайные величины ги представляют незави-
независимые комплексные нормальные случайные величины с нулевыми
средними, когда верна гипотеза Яо, и со средними, равными
Skexp(icpo), когда верна гипотеза Нх. Для обеих указанных гипо-
гипотез дисперсии этих величин.
446
Отсюда следует, что случайная величина rN представляет модуль
комплексной гауссовской случайной величины (или случайного
вектора с независимыми компонентами), дисперсия которой рав-
равна 2 2 Isfcl2, а среднее значение равно нулю, когда верна гипо-
N
теза #о, и равна exp(icpo) 2 |s&|2, когда верна гипотеза #ь
Распределение модуля такого вектора было подробно рассмо-
рассмотрено в п. 3.2.3, из которого следует, что случайная величина rN
подчиняется рэлеевскому распределению
VrNi*)~exp\ 7-^7-1 *>0> A5.123)
dN L \2dN) J
если справедлива гипотеза Яо, и обобщенному рэлеевскому рас-
распределению
wrN (z)« -JL«p [ - (z2 + d%)lBd%)] Io (г), z>09 A5.124)
dN
если верна гипотеза Н\.
В формулах A5.123) и A5.124) [ср. € A5.47)]
d%-2\sk\*. A5.125)
Из A5.123) следует
a = P{rN^c\H0}=exp [—c2/Bd2N)], A5.126)
откуда в алгоритме A5.122)
c = dN[2ln(Ua)]1'2. A5.127)
Вероятность правильного обнаружения
1 _ р = 1 _ ехр I -I г. J Jxexpf -J—U0(xdN)dx. A5.128)
Интеграл в A5.128) табулирован (см., например, [4]).
Формула A5.128) представляет зависимость вероятности пра-
правильного обнаружения от вероятности ложной тревоги — рабочую
характеристику обнаружения. Параметром этой характеристики
является величина dN, определяемая из A5.125).
15.4.5. Оптимальные аналоговые алгоритмы обнаружения ква-
зидетерминированных сигналов. Рассмотрим задачу синтеза оп-
оптимального алгоритма обнаружения квазидетерминированного
сигнала при условии, что используется вся наблюдаемая на ин-
интервале @, Т) реализация x(t), а не конечный набор ее коорди-
координат, как в 15.4.4.
Из A5.85), подставляя вместо s(t) величину 2s(/)exp (icpo),
находим выражение для функционала отношения правдоподобия,
соответствующее комплексной огибающей z(t) процесса x(t) при
заданной фазе <р0:
447
I [z@!Ф0] = exp ГRe / V (t; %) z(t) dt\ x
xexpj"--±-Re/Vtf; <ро)^аГехр(-1Фо) dt\ A5.129)
где ]/(/) фо) определяется из неоднородного линейного интеграль-
интегрального уравнения [см. A5.83)]
SBt(t-u)V(u;>%)du-zs(t)exp(i<p0), 0<*<7\ A5.130)
о
Вводя функцию
U{t) = V(t; q>o)exp(-icpo) A5.131)
и подставляя A5.131) в A5.130), получаем комплексное инте-
интегральное уравнение
U(d A5.132)
из которого видно, что функция U(t) не зависит от фо. Заметим,
что комплексное интегральное уравнение A5.132) эквивалентно
системе двух действительных интегральных уравнений относитель-
относительно действительной u(t) и мнимой v(t) частей функции U(t) [см.
A5.116а), A5.1166)]:
/ [В a (t-y)u (у) - ВАС (t-y)v (у)] dy = a (t) cos г|>8 (/), A5.132а)
о
d
A5.1326
Если спектральная плотность мощности симметрична относи-
относительно центральной частоты со0, то ВАС(т)=0 (см. п. 10.1.3) и
вместо системы уравнений имеем два отдельных уравнения отно-
относительно неизвестных функций и (t) и v (t):
BA(t-y)u(y)dyr=a(t)costy8(t), 0<*<7\ A5.132в)
A5.132г)
Выражение A5.129) функционала отношения правдоподобия
с учетом A5.131) можно переписать в виде
1
= exp {I ]u(t)W)dt со8(Фо-г|)Г)| х
A5.133)
448
где
tpr=arctg \lmf U(QzffidtlRe]U{t)zjt)dt\ A5.133a)
L о о J
Знак Re при втором сомножителе в A5.133) опущен, так как ин-
интеграл действительный и положительный:
0 0
aJ0. A5.1336)
Из A5.133) следует, что при фиксированной фазе ф0 опти-
оптимальный амплитудно-фазовый аналоговый алгоритм обнаруже-
обнаружения детерминированного узкополосного сигнала на фоне аддитив-
аддитивной узкополосной гауссовской помехи можно представить в виде
Re exp (i90)f I/@z@ Л =
о
= J [и (t) cos ф0 - v (t) sin фJ xc (t) At +
+ Г H0sin90 + i;@cos9jxJ/)d*Vi<?, A5.133в)
0 Yo
где xc(t) и xs(t)—квадратурные составляющие наблюдаемой ре-
реализации узкополосного случайного процесса. Статистика в ле-
левой части неравенства A5.133в)—линейный функционал от ука-
указанных квадратурных составляющих.
Если мешающий параметр фо — случайный и распределен рав-
равномерно на интервале @, 2я), то усредненный по этому парамет-
параметру функционал отношения правдоподобия A5.133) [ср. с. A5.122)]
A[z(/)]=Io(rr)exp(—d2r/2), A5.134)
где [ср. с A5.121а) и A5.125)]
т
$U(t)z(t)dt
о
г
A5.135)
<PT=$U(t)z9(f)dt. A5.136)
о
Повторяя рассуждения, приведенные в п. 15.4.3 после форму-
формулы A5.122), приходим к выводу, что оптимальный аналоговый ал-
алгоритм обнаружения квазидетерминированного сигнала на фоне
аддитивной узкополосной гауссовской помехи предписывает срав-
сравнение с порогом статистики A5.135)
rT*zc, A5.137)
Yo
15—87 449
где порог с при использовании критерия Неймана — Пирсона оп-
определяется заданной вероятностью а ложной тревоги.
Случайная величина гт — модуль комплексной гауссовской
т
случайной величины JU (t)z(t)df, среднее значение которой
равно нулю, когда справедлива гипотеза Яо, и d2rexp(icpo), ког-
когда справедлива гипотеза Яь Дисперсия этой величины
Поэтому случайная величина гт подчиняется рэлеевскому распре-
распределению при гипотезе Яо и обобщенному рэлеевскому распреде-
распределению при гипотезе Яь Плотности этих распределений определя-
определяются по формулам A5.123), A5.124), если параметр d2N заме-
заменить параметром d2r. Отсюда следует также, что порог с в ал-
алгоритме A5.137) и рабочая характеристика этого алгоритма вы-
вычисляются по формулам A5.127), A5.128) с заменой величины
d2N величиной d2r-
Из A5.137) следует также, что оптимальный по критерию
Неймана — Пирсона аналоговый алгоритм обнаружения квази-
детерминированного сигнала на фоне аддитивной узкополосной
гауссовской помехи
/a), A5.138)
Yo
где
Re rT = J [u (t) A(t)+v (t) С (t)] dt, A5.138a)
о
lmrT=f[v(t)A(t)~u(t)C(t)]dt, A5.1386)
о
причем функции и(/), v(t) представляют решения системы инте-
интегральных уравнений A5.132а), A5.1326).
15.4.6. Структурная схема устройства, реализующего оптималь-
оптимальный аналоговый алгоритм обнаружения. Рассмотрим два линей-
линейных фильтра с импульсными характеристиками
A5.139а)
A5.1396)
О, т<0, т>7\
где u(t), v(t)—решения системы интегральных уравнений
A5.132а,б). Тогда из A5.138) следует, что для оптимального (не-
(нелинейного) аналогового алгоритма обнаружения квазидетермини-
рованного сигнала на фоне аддитивной узкополосной гауссовской
помехи состоит из следующих операций (рис. 15.10): воздейст-
воздействия квадратурных составляющих наблюдаемого процесса на две
450
x(t)
A
С
A
С
he
hs
ho
Рис. 15.10. Схема оптимального аналогового обнаружителя квазидетерминиро-
ванного сигнала
группы фильтров с импульсными характеристиками A5.139а),
A5.1396); образования суммы и разности выходных значений в
каждой группе фильтров; двухполупериодного квадрэтического
детектирования суммы и разности; суммирования продетектиро-
ванных величин; сравнения выхода сумматора с порогом.
15.4.7. Обнаружение на фоне аддитивного белого шума. При
обнаружении квазидетерминированного сигнала на фоне аддитив-
аддитивного гауссовского белого шума со спектральной плотностью No
функция U(t) равна [см. A5.132)]:
U(f)=zs(t)/N0.
A5.140)
Из A5.135)—A5.137) находим, что в рассматриваемом случае
оптимальный аналоговый алгоритм обнаружения имеет вид
где параметр
"
0 о
A5.141)
A5.142)
т. е. равен отношению энергии (узкополосного) сигнала к спект-
спектральной плотности шума.
При обнаружении гармонического сигнала s(t) =a0cos(<oo/-f
+ фо) со случайной фазой статистика в левой части A5.141)
1/2
A5.143)
Учитывая, что квадратурные составляющие A(t) и C(t) на-
наблюдаемой реализации x(t) медленно меняются по сравнению с
15* 451
cos (not, sin coo/, A5.143) можно записать в виде1
A5.144)
При этом
*--?—%¦ A6145)
Учитывая A5.138) и опуская постоянный множитель в
,A5.144), представим рассматриваемый оптимальный аналоговый
алгоритм гармонического сигнала в виде
2л A5.146)
где
xc = — / x (/) cos coo t&U xa=jx (t) sin coo t dt. A5.147)
т о о
Случайные величины хс и х8 — гауссовские, причем из A5.147)
следует
A5.148а)
ks\H\} =по sin фо, A5.1486)
Hi}=2N0/T, A5.148в)
A5.148г)
При выводе формул A5.148в,г) принималось во внимание, что
для центрированного белого шума ml{x(u)x(v)\H0}=N06(u—v).
При гипотезе Но (сигнала нет) статистика A5.146), как сум-
сумма квадратов независимых центрированных гауссовских величин
с одинаковыми дисперсиями, подчиняется экспоненциальному рас-
распределению (^-распределению с двумя степенями свободы) с
плотностью
WX2 (*|Я0Н-^-ехр/ --^j\ z>0, Ра==~7- A5.149)
т
Используя A5.149), находим порог с2 в A5.146) при заданной ве-
вероятности а ложной тревоги из соотношения
(-с2/2р2)=а,
1
т
% Например, J *(/)coscoota/= J* Л(/)соэ2 соо^+ — J C(f)sin2coo/df»
о о 2 о
1 о
452
Рис. 15.11. Схема оптимального
аналогового обнаружителя гар-
гармонического сигнала со случай-
случайной фазой на фоне белого шума
откуда следует
%
KB
KB
4
•in —
a
A5.150)
При гипотезе #i (сигнал присутствует) статистика Хт подчи-
подчиняется обобщенному рэлеевскому распределению с плотностью
хт
г Г
ехр
Вероятность правильного обнаружения
оо Г
In
A5.151)
При dr»i обобщенное рэлеевское распределение асимптотически
нормальное (см. п. 3.2.3), и тогда из A5.151) находим
l-P~F[/21n(l/a)-dr], A5.152)
Таким образом, при dT^$>l рабочую характеристику оптимально-
оптимального аналогового алгоритма обнаружения гармонического сигнала
на фоне аддитивного гауссовского белого шума можно предста-
представить в виде
A5.153)
1/2
у2 In A/а) - *!_р = dT = (EJN0)
где jci-э —процентная точка нормального распределения.
Устройство, реализующее алгоритм A5.146), (рис. 15.11) со-
состоит из двух линейных фильтров Фс и Фв, согласованных с сиг-
сигналами cos (dot и sin<<Dof, квадраторов, сумматора и безынерцион-
безынерционного порогового элемента.
15.5. ПОСЛЕДЕТЕКТОРНЫЕ ОПТИМАЛЬНЫЕ
АЛГОРИТМЫ ОБНАРУЖЕНИЯ СИГНАЛОВ
15.5.1. Постановка задачи. В § 15.4 для синтеза оптимальных
алгоритмов обнаружения узкополосных сигналов использовалась
комплексная огибающая z(t) наблюдаемого узкополосного про-
процесса, зависящая и от огибающей r(t) и от фазы O(i) процесса
[см. A5.112а)]. Во многих случаях при практической реализа-
реализации приемных устройств до какой-либо специальной обработки
наблюдаемый высокочастотный процесс детектируется, т. е. вы-
455
деляется либо его огибающая r(t), либо фаза 0@- Поэтому на-
наряду с рассмотренными в § 15.4 оптимальными алгоритмами, ис-
использующими и огибающую, и фазу наблюдаемого процесса
(или обе квадратурные составляющие A(t) и C(t)) представля-
представляют интерес последетекторные алгоритмы обнаружения узкополос-
узкополосных сигналов: амплитудные — при амплитудном детектировании,
когда используется только огибающая наблюдаемого процесса, и
фазовые — при фазовом детектировании, когда используется
только фаза наблюдаемого процесса. Оптимальные последетектор-
последетекторные алгоритмы обнаружения не могут быть лучше тех, кото-
которые были рассмотрены в § 15.4, так как процесс детектирования
неизбежно связан с потерей полезной информации. Как и в § 15.4,
предполагается, что наблюдаемый процесс представляет либо ре-
реализацию центрированной гауссовской помехи с известной кор-
корреляционной функцией (гипотеза Яо), либо аддитивную омесь
узкополосного сигнала с этой помехой (гипотеза Н\). При прие-
приеме высокочастотные процессы до детектирования усиливаются,
например, в усилителе промежуточной частоты. Предполагается,
что ширина полосы пропускания додетекторного усилителя мно-
много больше ширины спектра принимаемого сигнала.
15.5.2. Оптимальный дискретно-аналоговый амплитудный ал-
алгоритм обнаружения. Рассмотрим задачу синтеза оптимального
правила выбора решения о наличии или отсутствии сигнала по
реализации огибающей наблюдаемого процесса, представляюще-
представляющего либо стационарную узкополосную гауссовскую помеху (гипо-
(гипотеза Яо), либо сумму этой помехи и детерминированного узкопо-
узкополосного сигнала s(t) = a(t)cos[<oot—^s@] (гипотеза Hi). Веро-
Вероятностные характеристики этих процессов приведены в гл. 10.
Используя указанную там терминологию, можно рассматривае-
рассматриваемую задачу сформулировать так: проверяется гипотеза Яо, что
наблюдаемая огибающая является рэлеевским процессом, против
альтернативы Яь что она — обобщенный рэлеевский процесс1.
Следуя общей методике, необходимо в качестве наблюдае-
наблюдаемых координат огибающей принять некоррелированные величины
t)dt, A5.154)
где r(t)—реализация огибающей на интервале наблюдения
(О, Т), Хи и фл(О—собственные числа и собственные функции
интегрального уравнения
<p(t) = XSBE(y-t)<p(y)dy, 0<*<7\ A5.155)
о
Де(т)—известная корреляционная функция огибающей по-
помехи.
1 Заметим, что распределение огибающей суммы квазидетерминированного
сигнала со случайной фазой и нормального шума также обобщенное рэлеевское
(см. п. 10.2.1).
454
Для того, чтобы найти функцию распределения случайной ве-
величины rk согласно A5.154), необходимо решить одну из самых
сложных задач теории случайных процессов (см. п. 7.3.1): опре-
определить распределение процессов на выходе линейной системы,
когда распределение процесса на ее входе отлично от нормаль-
нормального (в рассматриваемом случае его распределение рэлеевское).
Случайные величины г&, А=1,2, ..., не являются ни гауссовскими,
ни рэлеевскими, и из их некоррелированности не следует незави-
независимость. Вычислить отношение правдоподобия для выборки
Л, ..., rN трудно. Поэтому отойдем от приведенной точной поста-
ловки задачи и ценой некоторых допущений упростим задачу К
Допуская, что энергетический спектр помехи равномерный в
полосе А, представим наблюдаемые некоррелированные коорди-
координаты огибающей в виде
sm(tAnk)
tA-nk
где No— спектральная плотность шума.
Кроме того, предполагаем, что время наблюдения
-г а ± ( А \ sin (t А — nk) c / , я k \
Так как при А-^оо функция — — ¦ -> б [ t , то,
\ я / tА — nk \ А /
учитывая принятое условие ГАЗ>1, из A5.156) получаем
или
rk = Eh/oy A5.158)
где а2 = Лг0А/я — дисперсия помехи, Ek = r(nk/A)—выборочное зна-
значение огибающей при t = wk/A.
Таким образом, в качестве наблюдаемых координат приняты
выборочные значения огибающей через равные интервалы време-
времени я/А- Причем эти значения приближенно можно считать не-
коррелированными.
Так как из некоррелированности значений огибающей гауссов-
ского случайного процесса следует их статистическая независи-
независимость (см. п. 10.2.2.), то некоррелированные координаты rh пред-
представляют независимые случайные величины.
Ограничиваясь первыми N координатами, нетрудно записать
функции правдоподобия выборки г(п, ..., rN) для двух указанных
выше гипотез [см. A0.56) и A0.57)]
N
k=\
/ Г2\
--f , rk>0, A5.159)
1 Такой упрощенный подход без достаточно строгих обоснований был един-
единственным в ранних работах по статистической теории обнаружения сигналов (см.,
.например, [49]).
455
1[^] A5.160)
где
ал = а(лй/А)/а, A5.161)
представляет отношение амплитуды сигнала (в момент времени
t=nk/A) к среднеквадратическому значению помехи.
Из A5.154) и A5.160) находим логарифм отношения правдо-
правдоподобия
lnZ(r)=21nI0(rftaft)-4-2 a\. A5.162)
Оптимальный дискретно-аналоговый амплитудный алгоритм
обнаружения детерминированного узкополосного сигнала на фо-
фоне аддитивной гауссовской помехи предписывает сравнение ста-
статистики A5.162) с порогом. Однако определить функцию распре-
распределения статистики A5.162), а следовательно, и вероятности
ложной тревоги и правильного обнаружения в замкнутом виде не-
невозможно. Поэтому аналитическое исследование вероятностных
характеристик указанной статистики продолжим для слабого сиг-
сигнала, когда таха&<с1, и сильного сигнала, когда minafe>l. Ис-
k k
следовать общий случай можно путем статистического моделиро-
моделирования алгоритма на ЭВМ.
15.5.3. Оптимальный амплитудный алгоритм обнаружения сла-
слабого сигнала. Разложим функцию \nlo(rkak) в степенной ряд,
пренебрегая членами, содержащими степени а\ и выше ]:
lnI0(rfcaft)«r2ftaV4. A5.163)
Тогда в соответствии с A5.162) для слабого сигнала опти-
оптимальный дискретно-аналоговый амплитудный алгоритм обнару-
обнаружения
Л A5.164)
Таким образом, алгоритм обнаружения в рассматриваемом
случае сводится к вычислению взвешенной суммы квадратов не-
независимых выборочных значений огибающей и сравнению ее с
порогом, зависящим от выбранного критерия и априорных харак-
характеристик сигнала и помехи.
При больших размерах выборки (N^$>\) и слабом сигнале
(maxak<^l) статистика Rn(v) асимптотически нормальная. Па-
k
раметры нормального распределения находим, используя извест-
1 Разложение в ряд и сделанное приближение должны интерпретироваться
в вероятностном смысле.
456
ные распределения случайных воличин rh при гипотезе Нои аль-
альтернативе Нх [см. A5.159) и A5.160), а также п. 3.2.4]:
= S <*lni{r2k\H0} = 2 2 «1. A5.165а)
k=\ k=\
^ 2 «|'И1Я1}= 2 alB + al), A5.1656)
0}= 2 c*ft{r||//0} = 4 2 oj, A5.165b)
H 2 fl*M1l#i>-4S ei(l+e2)- A5.165r)
Введем величину «расстояния» между статистиками Rn{?) при
гипотезе и алтернативе (с точностью до малых величин поряд-
порядка a4k):
mi{RNlHl}-mi{RNlH0} ,* у/.
Тогда порог с в A5.164) для критерия Неймана — Пирсона и
рабочая характеристика алгоритма определяются по формуле
A5.48) и A5.49), в которых величина dN заменяется величиной
SN. Из сравнения A5.166) с A5.47) следует, что ухудшение ра-
рабочей характеристики последетекторного амплитудного алгоритма
обнаружения A5.164) по сравнению с рабочей характеристикой
алгоритма A5.49) (амплитудно-фазового) связано с тем, что в
первом случае параметр S2N представляет сумму четвертых сте-
степеней отношений сигнал-помеха [см. A5.166)], а во втором пара-
параметр d2N представляет сумму квадратов этих отношений.
15.5.4. Оптимальный амплитудный алгоритм обнаружения
сильного сигнала. Для сильного сигнала, т. е. при minak^>\ из
?15.162), используя асимптотическое разложение функции Бессе-
Бесселя (см. п. 3.2.3), находим следующее выражение для оптимально-
оптимального алгоритма:
Rn(t)= 2akrk ъс A5.167)
*=1 Yo
В отличие от от A5.164) в рассматриваемом случае статистика
Rn (г) — линейная, т. е. представляет линейную комбинацию не-
независимых выборочных значений огибающей наблюдаемого про-
процесса. Алгоритм A5.167) реализуется при помощи линейного ци-
цифрового фильтра.
При N^$>\ и сильном сигнале статистика Rn{v) асимптотичес-
асимптотически нормальная. Параметры нормального распределения можно
найти по аналогии с A5.165а—г). При указанных условиях «рас-
«расстояние» между статистиками Rn{v) при гипотезе и альтерна-
альтернативе
/ N \1/2
d*~ Z*jM <°°- A5.168)
457
Величина Un является параметром рабочей характеристики об-
обнаружения и так же, как в A5.50), равна квадратному корню
из суммы квадратов отношений сигнал-помеха.
15.5.5. Оптимальные аналоговые амплитудные алгоритмы об-
обнаружения. При условии ТА>1 (см. п. 15.5.2) сумму A5.164)'
можно приближенно заменить интегралом и сформулировать та-
таким образом оптимальный амплитудный аналоговый алгоритм
слабого сигнала:
$7*(t)a2(t)dtli с. A5.169)
0 Yo *
Из A5.169) следует, что элементами оптимального приемного ус-
устройства при амплитудном методе обнаружения слабого сигнала
являются квадратичный детектор и коррелометр.
При том же условии ГД^>1, заменяя сумму A5.167) интегра-
интегралом, находим оптимальный амплитудный аналоговый алгоритм
обнаружения сильного сигнала ,
fr(t)a(t)dt?c A5.170)
0 Yo
В этом случае оптимальное приемное устройство содержит линей-
линейный детектор и коррелометр.
15.5.6. Оптимальный фазовый алгоритм обнаружения детерми-
детерминированного сигнала. Рассмотрим задачу синтеза оптимального
правила выбора решения о наличии или отсутствии детермини-
детерминированного сигнала в аддитивной узкополосной гауссовской поме-
помехе по реализации фазы ft(t) наблюдаемого процесса. Вероятно-
Вероятностные характеристики фазы, соответствующие двум гипотезам
#о (фаза помехи) и #i (фаза аддитивной смеси сигнала и поме-
помехи), приведены в § 10.4.
Рассуждая так же, как и при выводе формулы A5.157), вве-
введем некоррелированные координаты фазы
Ол = О(яА/Д). A5.171)
Так как из некоррелированности значений фазы гауссовского слу-
случайного процесса следует их независимость, то координаты О& не-
независимы. Ограничиваясь первыми N координатами, запишем
функции правдоподобия выборки #= (Oi, ..., 0^) для двух указан-
указанных гипотез [см. A0.94)]:
Л я, ;=Т7Й, A5.172)
=i=
= ah cos (Oft - %) F [ah cos (% - %)] x
i-1, N9 A5.173)
L ^ J>
458
где ah определяется по формуле A5.161), а
фЛ = фв(я?/Д). A5.174)
Из A5.172) и A5.173) находим логарифм отношения правдо-
правдоподобия
In /(ф) = 2 In (exp [ - Л-) + Y2ltakx
k=\ I \ 2
x cos (Oft - яу F [ah cos (*fc - %)] exp [ - ^- sin2 (Oft - ^ J },
|Ф|-Ф*1<я, i^TTN. A5.175)
Оптимальный дискретно-аналоговый фазовый алгоритм обна-
обнаружения детерминированного узкополосного сигнала на фоне ад-
аддитивной гауссовской помехи предписывает сравнение статистики
A5.175) с порогом. Однако определить функцию распределения
статистики A5.175) в замкнутом виде невозможно. Поэтому, как
и для амплитудного алгоритма, исследование продолжим для
предельного случая слабого сигнала.
15.5.7. Оптимальный фазовый алгоритм обнаружения слабого
сигнала. Для слабого сигнала (maxafe<cl), используя формулу
A0.96) и пренебрегая малыми порядка а3, находим
2
+ A- cos 2 (Oft - %) -
In I (*) = Д | (-f-J/2 ak cos (\ -
Заменяя квадратичные члены их средними значениями и учиты-
учитывая, что mi{cos2('frk—гЫ} = 0, mi{cos2(O/i—г|)^)} = 1/2, получаем
In Z (¦) » (^-) 2 ** cos (*fc -W-{J a». A5.175a)
Из A5.175а) следует, что оптимальный фазовый алгоритм об-
обнаружения слабого сигнала можно представить в виде
®м (Ф) = 2 Ч cos (*л - *ft) * c- A5.176)
fe=l Yo
При больших размерах выборки iV>l статистика Q)n($)
асимптотически нормальная. Параметр нормального распределе-
распределения находим, используя известные распределения случайных ве-
величин Фь при гипотезе Яо и альтернативе Hi [см. A5.172),
A5.173) и п. 10.5.1] и пренебрегая малыми порядка аъи и выше:
mA^ak cos (\ - %) | Но\ = 0, A5.177а)
'- 2 аЬ A5.1776)
459
2^со8(Фл-^)|Я0, ЯЛ =-!¦ S <& A5.177b)
I*—I J 2 м
Обозначим [ср. с A5.47) и A5.168)]
^-2^. A5.178)
Тогда, учитывая асимптотическую нормальность статистики
Ф#(Ф) и формулы A5.177а и в), находим в A5.176) при задан-
заданной вероятности а Ложной тревоги
c = xadNlV2. A5.179)
Рабочая характеристика алгоритма A5.176) запишется в виде
[см. A5.1776 и в)]
A5.180)
где #a,#i_p — процентные точки нормального распределения ве-
вероятностей.
В отличие от оптимального амплитудного алгоритма обнару-
обнаружения слабого сигнала [см. A5.166)] при оптимальном фазовом
алгоритме, как и при оптимальном алгоритме A5.49) обнаруже-
обнаружения сигнала, рабочая характеристика определяется парамет-
параметром dNy т. е. характеристика обнаружения слабого сигнала при
фазовом методе оказывается лучше 19 чем при амплитудном.
Формула A5.180) получается из A5.50) заменой dN на Y~nJ$dN
(т. е. »0,9djv).
При ГА>1 сумму в A5.176) можно приближенно заменить
интегралом и получить, таким образом, оптимальный аналого-
аналоговый фазовый алгоритм обнаружения слабого сигнала
Г a (t) cos [Ф (/) - г|) (/)] dt J с. A5.181)
0 Yo
Из A5.181) следует, что при оптимальном фазовом методе об-
обнаружения слабого детерминированного сигнала вычисляется
взаимная корреляционная функция между косинусом разности
фаз принятого и детерминированного сигналов и огибающей де-
детерминированного сигнала.
15.5.8. Оптимальный фазовый алгоритм обнаружения слабого
квазидетерминированного сигнала. Рассмотрим задачу синтеза
оптимального дискретно-аналогового фазового алгоритма обнару-
обнаружения слабого квазидетерминированного сигнала на фоне адди-
аддитивной гауссовской помехи. В этом случае к детерминированной
координате tyk фазы сигнала [см. A5.174)] добавляется случай-
1 Этого следовало ожидать, так как функция распределения фазы A5.173)
информативнее функции распределения огибающей [см. A5.160)]. В первом слу-
случае параметры распределения содержат информацию о значениях огибающей и
фазы сигнала, а во втором — только о значениях огибающей сигнала.'
460
ная начальная фаза фо, распределенная равномерно на интервале
(О, 2я).
Из A5.175) находим условное отношение правдоподобия при
фиксированной начальной фазе фо
Г Г— N n N )
I (d^) = ехр 11/ -тг 2 ak cos (®k — % + Фо) 2 al\ A5.182а)
или N
I(*|Фо) = ехР ( У "Y гнcos (<Р°""ф^)/ ехр | ~~ Т" ^ а1 Г
A5.1826)
где
A5.183)
arctg (Im 2 ah exp [i (Ofc - ^ft)]/Re 2 flfc exp
A5.183a)
Усредняя отношение правдоподобия по случайной фазе фо, по-
получаем
Л { J | j ^
= ехр{ - -J- | а\j ^ Jexp [ ]/-f r^ соз(ф0-
A5л84)
Учитывая, что экспоненциальный множитель в A5.184) зави-
зависит только от априорных данных, а функция 1о(х) —монотонная
при х^О, получаем для искомого алгоритма
rNlc, A5.185)
Yo
где порог с по критерию Неймана — Пирсона определяется при
заданном значении а вероятности ложной тревоги. Для этого не-
необходимо знать плотность вероятности wrjv(z) статистики Гм при
гипотезе Но. Используем несколько видоизмененный метод, ука-
указанный в [5, гл. 4, § 4) для задачи о случайных блужданиях, ког-
когда #h — независимые, равномерно распределенные на интервале
(О, 2я) случайные величины [см. A5.183)]. Тогда
WrN (г) = z ]sJ0 (zs) П /0 К s) ds. A5.186)
Из A5.185) и A5.186) следует, что вероятность ложной тревоги
а = ]wr (z)dz=l-c]j,(cs) П^ofes)ds. A5.187)
с 0 k=*\
461
Для гармонического сигнала постоянной амплитуды Ло
а = 1 - k j7x (kx) Jo (x) dx, A5.187a)
где k=c/Ao.
Если размер выборки велик (JV^l), то распределение случай-
случайной величины rN асимптотически рэлеевское, когда верна гипоте-
гипотеза #о, и обобщенное рэлеевское, когда верна гипотеза Нх (см.
5, с. 187—188]). Параметры этих распределений равны соответ-
соответственно [см. A5.177а—в)]! d2Nf2 и /я/8 d2Nt d2Nf2, где d2N опре-
определяется по формуле A5.178). Тогда при N^1 находим в A5.185)
c=dN(\nl/a)V2 A5.188)
и рабочую характеристику обнаружения
1_Р=1_ехр ( --jj-d) Y ( y[y^
A5.189)
15.6. ОПТИМАЛЬНЫЕ АЛГОРИТМЫ ОБНАРУЖЕНИЯ
ГАУССОВСКОГО СИГНАЛА НА ФОНЕ АДДИТИВНОЙ
ГАУССОВСКОЙ ПОМЕХИ
15.6.1. Постановка задачи, априорные данные. Предположим,
что на интервале 0^/^Г наблюдается реализация x(t) случай-
случайного процесса X(t)t относительно которого выдвигается гипотеза
#о, что этот процесс представляет гауссовскую помеху с нулевым
средним и известной корреляционной функцией B0(t, u)=Bn\(t,u)t
против альтернативы Ни что процесс X(t) представляет аддитив-
аддитивную смесь указанной помехи и гауссовского сигнала с нулевым
средним и известной корреляционной функцией Bc(t, и). Предпо-
Предполагается, что сигнал и помеха — независимые случайные процес-
процессы. Поэтому при альтернативе Нх корреляционная функция на-
наблюдаемого процесса
Задача состоит в том, чтобы синтезировать оптимальный алго-
алгоритм принятия решения 71 о наличии сигнала (о том, что верна
альтернатива Hi) или решения -уо об отсутствии сигнала (о том>
что верна гипотеза Яо).
Сначала рассмотрим задачу синтеза дискретно-аналогового ал-
алгоритма обнаружения, а затем — аналогового. Для решения пер-
первой задачи используется фильтровый способ дискретизации на-
наблюдаемой реализации (см. п. 15.1.7).
Если выбрать в качестве координат наблюдаемой на интерва-
интервале @, Т) реализации х(t) величины [см. A5.40)]
4 = VhSx(t)<Pk(t)dtt A5.190)
о
462
где Кь и q>h(t) —собственные числа и собственные функции интег-
интегрального уравнения [см. A5.38)]
ЗД u)q>(u)du, 0<f<7\ A5.191)
то эти координаты не коррелированы, если справедлива гипотеза
#о, но будут коррелированы, если верна гипотеза Нь
Можно, однако, выбрать координаты процесса так, чтобы они
не были коррелированными (следовательно, независимыми в силу
нормального распределения) и при гипотезе Яо, и при #i, с той
лишь разницей, что при одной гипотезе дисперсии всех координат
единичны, а при другой — различны для разных координат. Здесь
имеет место аналогия с известным результатом высшей алгебры,
согласно которому одним линейным преобразованием можно одну
квадратичную форму привести к нормальному виду (т. е. к сум-
сумме квадратов переменных), а другую — к каноническому (см., на-
например, [3]).
Пусть координаты процесса x(i) и для гипотезы Яо, и для ги-
гипотезы Нх определяются согласно A5.190), причем Kk и q>k(t) —
собственные числа и собственные функции (ненормированные) ин-
интегрального уравнения
JIBJ*, u)-XB0(t, u)]q>(u)du = 0, 0</<7, A5.192)
о
а нормировка собственных функций производится относительно
корреляционной функции ?0(?, ^), т. е.
Xk J / So (/, и) Фл (/)Фт (и) dt da = 6ftm. A5.192а)
о о
Тогда
Щ{xkхт\Н0} = VhKn$ S Во(/, и)фА(/)Фт(и)dtdu = 8km,
о о
A5.193а)
mi {xkxm\Hi} =Ыит, A5.1936)
mi{xk\HOi Hl}=0. A5.193b)
15.6.2. Оптимальный дискретно-аналоговый алгоритм обнару-
обнаружения. Используя A5.193а—в), нетрудно записать логарифм от-
отношения правдоподобия для N наблюдаемых независимых коор-
координат х^ k=l9 N9 реализации гауссовского случайного процесса:
lnf(x)-i-S (\X)xl —L lln^, A5.194)
Z k=l Aft Z k=l
Из A5.194) следует, что оптимальный дискретно-аналоговый
алгоритм обнаружения гауссовского сигнала на фоне аддитивной
гауссовской помехи
yN(x)A (%k~X)xl %c, A5.195)
AJ=1 *k Yo
463
где xh определяются соглаено A5.190), а^и yk(t) —собственные
числа и собственные функции уравнения A5.192).
Нетрудно найти характеристическую функцию статистики
#\г(х). Так как ** — гауссовская случайная величина, то харак-
характеристические функции &-го слагаемого суммы при гипотезах Но
и Hi соответственно:
6 (и | #о) = [1-И>*-
Учитывая независимость случайных величин хк, находим одно-
одномерные характеристические функции статистики *Мх) как про-
произведения характеристических функций слагаемых суммы A5.195):
A5.1966)
где
vk=(%k—l)-K A5.196b)
Обратным преобразованием Фурье можно из A5.196а и б) най-
найти плотности вероятности статистики yN (x).
15.6.3. Оптимальный аналоговый алгоритм обнаружения гаус-
совского сигнала на фоне белого шума. Рассмотрим задачу син-
синтеза оптимального аналогового алгоритма обнаружения гауссов-
ского сигнала для случая, когда аддитивная гауссовская поме-
помеха— белый шум, т. е. когда ?п(т)=Л/о6(т;). В этом случае в фор-
формуле A5.194) собственные числа
Xk=l + lf(Noiih)9 A5.197)
где \ih — собственные числа линейного однородного интегрального
уравнения
<р(*) = (л J Bc(t, y)y(y)dy, A5.198)
о
причем собственные функции q>h(t) исходного уравнения A5.192)
связаны с собственными функциями уравнения A5.198) соотно-
соотношением
<pft(f) = (N0hh)i/2<Ph(t). A5.199)
Из A5.194) находим дисперсии логарифма отношения правдопо-
правдоподобия
2 ("Ц^У- A5.200а)
(*2 {in /(x)\HJ - 2 (h - If. A5.2006)
464
Так как в рассматриваемом случае аддитивного белого шума
[см. D.61)]
оо оо | 1 Т Т
то существует функционал отношения правдоподобия (регуляр-
(регулярный случай) —предел при N-+oo выражения A5.194).
Рассмотрим предел при N-^oo статистики A5.195). Подстав-
Подставляя в A5.195) выражение для координат xk из A5.190) и учи-
учитывая A5.198), A5.199), получаем
оо /^ }\Х2 7 71 Г во^г-— Т
*™^ л ~~" •! J J . I ^"^ V t*S I f AT I
A5.201)
Функция двух переменных
U /1, гЛ S Ф^ (") °Pfe (и) П ^ 9П^
Л (w, c/j = 2j ~^ ^io.zuzj
удовлетворяет интегральному уравнению
/вс(«, u)h(u, v)du + Noh(t, v) =
о
= ВС(/, о), 0<^<7\ 0<у<Г. A5.203)
Действительно, подставляя в левую часть A5.203) выражение
h(u, v) из A5.202), изменяя порядок суммирования и интегриро-
интегрирования и учитывая A5.198), получаем
Первая сумма представляет ортогональное разложение корреля-
корреляционной функции сигнала
а вторая сумма в соответствии с A5.202) равна iVi0A(^, v). Отсю-
Отсюда следует A5.203).
Используя A5.201) и A5.202), представим оптимальный ана-
аналоговый алгоритм обнаружения гауссовского сигнала на фоне
аддитивного гауссовского белого шума в виде
Ут & @1 =-тгП h ("• v)х (")х Ши dv i c> A5.204)
где А (и, v) —решение интегрального уравнения A5.203) и x{t) —
реализация наблюдаемого на интервале @, Т) случайного про-
процесса. %'
Характеристические функции статистики ут[х(t)] [см. A5.204)]
при гипотезе и альтернативе получаются предельным переходом
465
при iV-^oo из A5.196а), A5.1966). Заметим, что распределение
статистики Ут[х{Щ не подчиняется нормальному закону, хотя эта
статистика представляет бесконечную сумму независимых случай-
случайных величин [см. A5.201)]. Это происходит потому, что в рас-
рассматриваемом случае условие применимости центральной пре-
предельной теоремы не выполняется [см. C.109)].
15.6.4. Пример сингулярного алгоритма обнаружения. Предпо-
Предположим, что нормированные корреляционные функции независи-
независимых гауссовских сигнала и помехи одинаковы, а дисперсии раз-
различны и равны а2с — для сигнала и о2о — для помехи. Тогда
Bo(t)=gV?(t), В1(т)=а21/?(т), где o2i = a2c+o2o. Обозначим
cTi/ao=p и пусть рф1. Тогда из A5.192) находим
откуда следует, что собственные числа интегрального уравнения
постоянны и равны Xk=p2. Логарифм отношения правдоподобия
в соответствии с A5.194) преобразуется к виду
и, следовательно,
1 о2 — 1 1 N
lim — In I (x) =- ~ lim — v xl ~~ 'n P =
iv-»oo N 2p2 a/->oo ^V Л==1 k
\ (p2 — l)/Bp2) — In p < 0, если верна гипотеза Яо,
(р2—1)/2 —1пр>0, если верна гипотеза Яг,
= 1
N
2k
1
так как последовательность случайных велР1чин — 2 x2k сходит-
ся по вероятности к единице, если верна гипотеза Яо и к р2, если
верна гипотеза Н\,
Из A5.205) следует, что
lim ln/(x)=—оо, если верна гипотеза Яо,
lim lnZ(x)=oo, если верна гипотеза Яь
Таким образом, рассматриваемый случай сингулярный и по-
поэтому возможно при любом (произвольно малом) времени наблю-
наблюдения выбрать правило проверки гипотезы с вероятностью едини-
единица. Такое правило непосредственно следует из A5.205), если вме-
вместо координат Xk подставить их выражения через наблюдаемую
реализацию. Если для наблюдаемой на интервале @, Т) реали-
реализации x{t)
Hm -i-S А*(/*@фьЮ#У=1, A5.206)
N-*oo N кщв1 \$ J
466
то принимается гипотеза Но (дисперсия процесса равна а2о), a
если предел в A5.206) равен р2, то принимается гипотеза #i (дис-
(дисперсия процесса равна cr2i), Очевидно, что в рассматриваемом слу-
оо
чае 2 (Ik— lJ = oo, так как ta=p2, т. е. условие регулярности
k=\
нарушено.
15.6.5. Общее условие сингулярности. Для случая, когда спектр
стационарного гауссовского процесса представляет дробно-раци-
дробно-рациональную функцию частоты, сформулировано необходимое и до-
достаточное условие сингулярности при проверке гипотезы #о о
том, что наблюдаемая реализация принадлежит процессу со спек-
спектром So (со), против альтернативы #i, что она принадлежит про-
процессу, спектр которого равен Si (со). Это условие состоит в том,
чтобы
lim [SiH/SoHl^l. A5.207)
@->оо
Указанное выше [см. A5.206)). сингулярное правило1 соответ-
соответствует частному случаю A5.207), когда Si (со)/So (со) = р2Ф\. Ес-
Если при со->-оо предел отношения дробно-рациональных спектров
равен единице, то всегда будет иметь место регулярный случай,
которому соответствуют отличные от нуля вероятности ошибоч-
ошибочных решений.
Достаточным условием сингулярности является также сущест-
существование конечного интервала частот, на котором один из энерге-
энергетических спектров Si (со) или S0(co) тождественно равен нулю, а
другой не равен нулю. Поэтому использование математической
модели случайного процесса с ограниченным спектром приводит
к сингулярности.
Наконец, укажем, что регулярный случай будет иметь место
всегда, если при каждой из двух гипотез гауссовский процесс со-
содержит аддитивную компоненту в виде белого шума одинаковой
интенсивности, так как условие A5.207) безошибочной проверки
гипотез основывается на использовании различия высокочастот-
высокочастотной части энергетического спектра. Так как белый шум (представ-
(представляющий, например, тепловые шумы) всегда присутствует в лю-
любых реальных устройствах, то добавление его устраняет парадокс
сингулярности и приближает математическую модель к изучаемо-
изучаемому физическому процессу.
15.7. ЗАДАЧИ
15.1. а) Показать, что согласованным фильтром для постоянного сигнала
s(t)z=a является идеальный интегратор с импульсной характеристикой
h(t)=*au(t)9 A)
где u(t) —единичный скачок;
1 Заметим, однако, что сингулярное правило A5.206) имеет место не только
для дробно-рационального, но и для произвольного спектра.
457
б) показать, что для импульсного синусоидального сигнала
s(t)=asma>ott Oz^t^T, (о0Г=B/г+1)я, л=0, 1, 2,... B)
импульсная характеристика согласованного фильтра равна
h(t)=a sin <o0t, f>0. C)
15.2. Показать, что плотность вероятности суммы квадратов N независи-
независимых случайных величин, каждая из которых распределена по обобщенному
рэлеевскому закону
w\r) =,гехр[—(г2+а2)/2]10(аг), г>0.
подчиняется нецентральному ^-распределению с параметром нецентрально-
нецентральности а:
чш
\(N-\)/2 ,
exp [-
Получить из D) частный случай при а = 0 распределения суммы квадратов N
независимых рэлеевских случайных величин (^-распределение с 2N степеня-
степенями свободы)
15.3. Используя результаты задачи A5.2)? найти вероятности ложной тре-
тревоги а и пропуска сигнала р при обнаружении по алгоритму A5.164) синусо-
идеального сигнала (отношение амплитуды сигнала с среднеквадратичному зна-
значению шума мало). Показать, что при произвольном N
u=\—T(Nt 2cla*)IT(N), E)
где T(Nt z) —неполная гамма-функция,
2
~ о *' "
-Т
2с " ' -'-----¦-—' Eaj
причем последний интеграл представляет табулированное интегральное обоб-
обобщенное распределение Рэлея [4].
15.4. Определить оптимальный по критерию Неймана — Пирсона аналого-
аналоговый алгоритм обнаружения квазидетерминированного сигнала s(t) =acos(co0t+
+Ф) на фоне аддитивного гауссовского белого шума со спектральной плот-
плотностью No при условии, что амплитуда а распределена по рэлеевскому зако-
закону с параметром сга, а фаза равномерна на интервале i@, 2я), причем ам-
амплитуда и фаза независимы, если наблюдается реализация x[t) на интервале
(О, Т) и вероятность ложной тревоги должна быть не больше, чем а. Показать,
468
что согласно этому алгоритму принимается решение, что сигнал присутствует,
если
/ 2 т V / 2 т \2
4= I— f x(t) cos a>otdt) + — J * (/) sin w0/#) >с, F)
\ * о / \ ¦* о '
ГДе с= DЛ/о/ГIпA/а) [ср. с A5.150)]. Доказать, что вероятность правильного
обнаружения и вероятность ложной тревоги связаны соотношением
a G)
15.5. Исследовать оптимальный алгоритм обнаружения на фоне аддитив-
аддитивной гауссовской помехи с нулевым средним и корреляционной матрицей М
квазидетерминированного сигнала общего вида
*(/, о)= 2 вЛфЛ(о = а'Феь (8)
где Ф@ = {ф*@}—заданная система линейно-независимых детерминирован-
детерминированных функций, #'= (Оь ..., От) — вектор случайных параметров с заданным
распределением шт(#). Гипотеза Но состоит в том, что наблюдаемая выбор-
выборка х= (#i,..., xn) представляет только помеху, а альтернатива Я4 — что на-
наблюдаемая выборка х представляет смесь сигнала »(8) с помехой. Доказать,
что обобщенное отношение правдоподобия в рассматриваемой задаче имеет вид
Л(х) = р(х|0)шт(<>)<«>, (9)
в
где
.A0)
у=х'М-*Ф/, В=Ф'М-4Ф (И)
и Ф — прямоугольная матрица размером myN с элементами ф1(/<)> *=1> N,
/=1, т. Сравнить A0) при /п=1 с A5.24).
15.6. В условиях задачи A5.5) предположить, что
wm (О) = Bя)-"/*(det С)-i/2exp[——(О—#0)'С-1 (О—#<>)], A2)
и доказать, что при условии A2) формула (9) преобразуется к виду
1 1
2 2
Указание: представить /(х|Ф) в виде
Г 1 1 1
/(х|О) = ехр — у'В-1 у — (у — ВО)' В-1 (у — ВО) A4)
и вычислить свертку двух нормальных распределений, учитывая симметрич-
симметричность матрицы В.
15.7. Вычислить усредненный функционал отношения правдоподобия
A5.133) для случая, когда плотность вероятность фазы равна
^(фо) = [2jtlo(a)]-1exp[acos(&—Фо)], ]фо| ^я
469
и показать, что
Л[г(/)] = [2я1о(а)]-1е"/21о(/?т), A6)
где
R2T=r2T+a2-\-2arT cos(q>T—b).
Убедиться, что при а=0 (равномерное распределение фазы) формула A5)
совпадает с A5.134). Доказать, что величина Rt при гипотезе Но подчиняется
обобщенному распределению Рэлея.
15.8. Показать, что вероятность правильного обнаружения синусоидаль-
синусоидального сигнала постоянной амплитуды по при ао/а> 1, когда используется алго-
алгоритм A5.185) 9 может быть определена по формуле
A6)
где Г (т% z) — неполная гамма-функция и порог с определяется заданной ве-
вероятностью а ложной тревоги.
15.9. Доказать, что оптимальный по критерию Неймана — Пирсона ампли-
амплитудно-фазовый дискретно-аналоговый алгоритм обнаружения узкополосного
сигнала s(t) =a(*)cos (dot+b(t)sm coo/ на фоне аддитивной, центрированной
узкополосной помехи, спектр которой симметричный относительно частоты ©о,
имеет вид
-^с, , A7)
Yo
где a'=(ai,..., ап), ui = a(ti), b'=)(&i,... ,bn), bi = b(ti)t x'=(xu..., xn),
Xi = x(ti), y'=(#i,..., yn)t yi=y{ti), x(t), y(t) —квадратурные составляющие
наблюдаемой реализации узкополосного случайного процесса, К — общая ко-
ковариационная матрица выборок х и у, причем при гипотезе Но (сигнала нет)
где Вх(х) =Ву(т) — корреляционные функции квадратурных составляющих.
Глава 16
НЕПАРАМЕТРИЧЕСКИЕ АЛГОРИТМЫ
ОБНАРУЖЕНИЯ СИГНАЛОВ НА ФОНЕ ПОМЕХ
16.1. НЕПАРАМЕТРИЧЕСКИЕ АЛГОРИТМЫ
ОБНАРУЖЕНИЯ ДЕТЕРМИНИРОВАННЫХ СИГНАЛОВ
НА ФОНЕ АДДИТИВНЫХ ПОМЕХ
16.1.1. Постановка задачи и априорные данные. В гл. 15
была изложена теория синтеза и анализа оптимальных алгорит-
алгоритмов обнаружения сигналов на фоне аддитивных гауссовских по-
помех. Эти алгоритмы становятся неоптимальными, если предполо-
предположение о нормальном распределении вероятностей помех не вы-
470
полняется. Представляют практический интерес алгоритмы обна-
обнаружения сигналов в условиях непараметрической априорной не-
неопределенности, когда класс помех шире класса гауссовских по-
помех (см. § 13.7). В этом случае задача обнаружения детермини-
детерминированного сигнала Xs(t), Я>0, |s(f)|^l, на фоне аддитивной
помехи формулируется как задача проверки непараметрической
гипотезы Я о том, что независимая выборка х= (х\,..., хп) из
реализации x(t) наблюдаемого на интервале (О, Т) случайного
процесса принадлежит распределению помехи с плотностью
A6.1а)
против непараметрической альтернативы сдвига К о том, что ука-
указанная выборка принадлежит распределению аддитивной смеси
сигнала и помехи с плотностью
Их|Я)= П «>(**-A, s*|tf)f A6Лб>
rjxexh=x(tk), sk=s(tk), k=l, n, tkt={0, T).
Алгоритм обнаружения назовем непараметрическим, если ве-
вероятность ложной тревоги при его использовании сохраняет по-
постоянное значение при гипотезе Я, т. е. при любых выборках,
принадлежащих непараметрическому классу с плотностью распре-
распределения A6.1а) (см. п. 13.7.2). Критерием качества непараметри-
непараметрического алгоритма обнаружения служит КАОЭ (см. п. 13.7.5). Как
отмечалось в п. 13.8.1, непараметрические алгоритмы проверки
гипотез синтезируются на эвристической основе с использованием
специальных статистик, которые при условии, что выборка для
гипотезы Я— однородная, независимая, обладают непараметри-
непараметрическим свойством по отношению к этой гипотезе. Самым сущест-
существенным ограничением является предположение от однородности и
независимости выборки при гипотезе Я, которое означает, что
рассматриваемые далее алгоритмы обнаружения сигналов обла-
обладают непараметрическим свойством только в случае стационар-
стационарных помех и при условии, что интервал временной дискретиза-
дискретизации наблюдаемого процесса настолько превосходит интервал кор-
корреляции помехи, что выборку можно считать практически неза-
независимой 1.
16.1.2. Знаковый алгоритм обнаружения детерминированного
сигнала. Рассмотрим сформулированную в п. 16.1.1 задачу обна-
обнаружения детерминированного сигнала Xs(t), A,>0, на фоне адди-
аддитивной однородной, независимой помехи при дополнительном
предположении, что плотность распределения w(x) помехи сим-
симметрична и среднее значение помехи равно нулю. В этом случае
для обнаружения сигнала можно использовать следующий знако-
1 Условие независимости выборки выполняется точно, если помеха представ-
представляет Г-зависимый процесс (см. п. 4.2.7).
471
Рис. 16.1. Схемы знаковых обнаружителей детерминированного сигнала
вый (цифровой) непараметрический алгоритм: принимается реше-
решение, что сигнал присутствует (отвергается гипотеза Я), если1
п
Уп Iх/ — L и \sk xk) ^ су \l°-^)
и решение, что сигнала нет, если выполняется неравенство, про-
противоположное A6.2). В A6.2) использованы обозначения Sk и Хи —
такие же, как в A6.16), а и(г) — функция единичного скачка. По-
Порог с определяется заданной вероятностью а ложных тревог. Схе-
Схема знакового обнаружителя детерминированного сигнала, функ-
функционирующего согласно алгоритму A6.2), приведена на рис. 16.1,а.
Неравенство A6.2) можно переписать в виде [см. A3.165) ]
П 1 П
Из A6.3) следует, что в структурной схеме знакового обнаружи-
обнаружителя операция умножения может следовать после ограничения
наблюдаемого процесса x(t) и детерминированного сигнала s(t)
(см. рис. 16.1,6).
Характеристическую функцию статистики A6.3) можно за-
записать и при гипотезе Н (сигнала нет), и при альтернативе К
(сигнал присутствует). Обозначим
pk = P{xh^O\K}=P{sgnxk=l \K}= J w{x—%sh)dx,
A6.4а)
qh=l-pk=P{sgnxh=-l\K}. A6.46)
При гипотезе Н pk=qk=l/2. Так как характеристическая функ-
функция случайной величины sgnA^ при альтернативе К
©sgn xk(v) = pkexp(i v) +qhexp(-i v),
1 Заметим, что u
u(SkXk) при
472
то из A6.3) находим характеристическую функцию статистики
уп (х) при альтернативе К
Характеристическая функция статистики уп(х) в A6.3) при ги-
гипотезе Н получается из A6.5), когда Рл=<7л=1/2
®уп (v\H) = exp ( И2-\ cos" ( — sgn sA = exp (^-\ cos" ( — )
2 A6.6a)
или
> = -i-fexp(iir) + l]\ K16.66)
Из A6.66) следует, что распределение статистики уп(х) в A6.3)
при гипотезе Н не зависит от распределения помехи и подчиня-
подчиняется биномиальному распределению с параметрами (п, 1/2). Тог-
Тогда для определения порога с в алгоритме A6.3) можно исполь-
использовать формулу A3.177), а при /г>1—формулу A3.180). Таким
образом, цифровой алгоритм A6.3) обнаружителя детерминиро-
детерминированного сигнала — непараметрический.
Используя C.71а), получаем, дифференцируя логарифм харак-
характеристикой функции A6.5), среднее и дисперсию статистики
Уп{х) при альтернативе К:
тг {Уп (к)\К) = — [In вУп (и)];=0 - JL + -L ? Bpk - 1) sgnSft, A6.7)
1 z l fc=i
f*2 ton WiK) -= - [In @yn(n)]^0 - S PkA - Pft). A6.8)
l
При гипотезе Н gft=l/2 и mi{yn(x) \H}=n/2, [i2{yn(x)\H}=n/4t
как для биномиального распределения с параметрами (я, 1/2).
Когда амплитуда сигнала К мала, из A6.4а) находим
Pk=l/2+kshw@)+o{X)9 A6.9)
и тогда из A6.7) и A6.8), пренебрегая малыми о (Я), получаем
[A6.10а)
A6.106)
При /г>1 знаковая статистика уп(х) в A6.3) асимптотически
нормальная с параметрами, определяемыми по формулам A6.10а)
и A6.106) для слабого сигнала. Вероятность пропуска сигнала
при этих условиях
)]9 A6.11)
473
где
в|.|.« = —SKI- A6.11а)
п k===i
Порог с определяется по формуле A3.180):
с==(ХаУп + п)/2 A6.116)
и ха — процентная точка нормального распределения.
Соотношение A6.11) определяет асимптотическую (при Пг+оо)
рабочую характеристику рассматриваемого знакового алгоритма
обнаружения детерминированного сигнала, у которую с учетом
A6.116) можно переписать в виде
ха -#i_p = 2К Vnw@) Яш , п, A6.12)
где ха, х\~$—процентные точки нормального распределения.
16.1.3. Относительная эффективность знакового обнаружителя.
Сравним знаковый алгоритм A6.3) обнаружения детерминирован-
детерминированного сигнала на фоне аддитивной независимой помехи (с симмет-
симметричной плотностью распределения) с линейным алгоритмом
Zskxh%c, A6.13)
который, как известно [см. A5.10)], представляет оптимальный
по критерию Неймана — Пирсона алгоритм обнаружения детер-
детерминированного сигнала на фоне аддитивной гауссовской помехи
по независимой выборке наблюдений.
Предположим, что линейный алгоритм, оптимальный при нор-
нормальном распределении помехи, используется для обнаружения
детерминированного сигнала %s(t), Я>0, на фоне аддитивной по-
помехи с нулевым средним и произвольной симметричной плотностью
распределения с конечной дисперсией о2.
При условии
/ п
lim maxs| / 2 SI=- °> A6.14)
которое практически всегда выполняется, статистика в левой ча-
части A6,13) согласно центральной предельной теореме при произ-
произвольном распределении выборочных значений асимптотически нор-
нормальна с параметрами 0, ne2Wsn при гипотезе Н (сигнала нет) и
hnWsn, no2Wsn при альтернативе К (сигнал присутствует), причем
1Р.п« —2 sl A6.15)
Асимптотическая рабочая характеристика алгоритма A6.13) при
указанных условиях определяется следующим соотношением меж-
между вероятностью |3 пропуска сигнала и заданной вероятностью а
ложных тревог [ср. с A5.20)]:
. [A6.16)
474
Найдем КАОЭ знакового алгоритма A6.3) по отношению к ли-
линейному A6.13). Сравнивая A6.16) с A3.188), а A6.12) с
A3.189в), приходим к выводу, что указанный коэффициент полу-
получается из A3.190^ умножением на величину
\s(t)\dt
где аш,п и Wsn определены согласно A6.11а) и A6.15).
Таким образом, искомый КАОЭ
A6.17)
V. A6.18)
Заметим, что К5^1, причем l/s=l для постоянного сигнала
{см. A3.190)].
16.1.4. Знаково-ранговый алгоритм обнаружения детерминиро-
детерминированного сигнала. Непараметрический знаково-ранговый алгоритм
обнаружения детерминированного сигнала на фоне аддитивной
стационарной независимой помехи с нулевым средним и с симмет-
симметричной плотностью распределения w(x) .эффективнее рассмот-
рассмотренного непараметрического знакового алгоритма. Решение о на-
наличии сигнала принимается в тех случаях, когда
A6.19)
где R+= {Л+и ..., i?+n) — вектор положительных рангов выборки
х (см. п. 13.8.5).
Схема обнаружителя, функционирующего согласно алгоритму
A6.19), приведена на рис. 16.2.
Неравенство A6.19) можно переписать в виде [см. A3.193),
A4.193а)]
>=ть5,
k=\
или
A6.20a)
A6.206)
1=1
Если выполнено условие A6.14), то статистика Sn(x) асимпто-
асимптотически (при /г->оо) нормальна. Определим среднее значение и
Рис. 16.2. Схема знаково-
рангового обнаружителя
сигнала
У.
I
Z
1>
л
475
дисперсию статистики Sn(x). При гипотезе Н (сигнала нет) из
A6.20а) находим
Rt} is
k=\
1 n n k /1
n
2 (=i ft=i n 4
ИЛИ
«i{S»(x)|/0-[»(«+l)/4]a№, A6.21)
aen = — 2 «i A6.21a)
n <=i
— постоянная составляющая сигнала.
При л>1 из A6.21) следует
m,{S.(x)i//}~naaW4. A6.22)
Средний квадрат статистики Sn(x) при гипотезе Н (см. [42,
€.72})
= 4-«i ( 2 2 **s/(RtRf
^ /J^sgn xj + Rf Rf sgn x} + /tf i?f) J
4 t=i
4" 2 2
42^S+f(s
откуда дисперсия статистики Sn(x) при гипотезе Н
или
ji2 {Sn (х)| Я} ='[я (я+1)Bл+1)/24] В7.п, A6.23)
где Wsn определяется по формуле A6.15).
При /г>1 из A6.23) следует
MSn(x)|tf}~rt*WW12. A6.24)
Используя A6.22) и A6.24) и асимптотическую нормальность
статистики 5п(х), находим порог с в алгоритме A6.19) при 1
[ср. с A3.200)]:
fi У± Тук} A6'25)
476
где ха — процентная точка нормального распределения, опреде-
определяемая по заданной вероятности а ложных тревог.
16.1.5. Относительная эффективность знаково-рангового обна-
обнаружителя. Определим эффективность алгоритма A6.19) по отно-
отношению к линейному A6.13). Для этого получим предварительно
асимптотическую рабочую характеристику алгоритма A6.19) при
л» 1 и слабом сигнале (амплитуда X малая).
Используя A6.206), находим среднее значение статистики
5П (я) при альтернативе К (сигнал присутствует)
m1{Sn(x)|/C}=2sftP{%>0|/(}+2 2 ьР{хг + Х]>0\К}.
A6.26)
Далее [ср. с п. 13.8.10 и с A6.9)]
^ ), A6.26а)
jx!?{y)dy+o{X). A6.266)
Подставляя A6.26а и б) в A6.26), получаем
4
A6.27)
Таким образом, из A6.27) при /г>1 и lYn=const следует
^ ^2 ]w*(y)dy. A6.28)
С учетом A6.25) вероятность пропуска сигнала при п>1 [ср. с
A3.1996)]
(i6-29)
Асимптотическая рабочая характеристика алгоритма A6.19) за-
лишется теперь в виде
/2 ] A6.30)
477
Из A6.30) и A6.16) КАОЭ знаково-рангового алгоритма
A6.19) относительно линейного алгоритма A6.13)
A6.31)
WS V-oo
где as= lim aS7l1 Ws= lim W8n.
П->оо n->oo
При as=0, т. е. при отсутствии у сигнала постоянной состав-
составляющей КАОЭ знаково-рангового алгоритма обращается в нуль.
Для постоянного сигнала s(^) = l отношение aAs/Ws=l, и тог-
тогда формула A6.31) совпадает с A3.202). Для периодической не-
модулированной последовательности импульсов длительностью т
и периодом повторения Т это отношение равно (т/ГK, а при ам-
илитудно-импульсной модуляции с индексом /па
16.1.6. Ранговые алгоритмы обнаружения узкополосных сигна-
сигналов. Узкополосные высокочастотные радиосигналы не содержат
постоянной составляющей. Поэтому при додетекторной обработке
наблюдений использовать знаково-ранговые алгоритмы неэффек-
неэффективно, так как по отношению к линейному алгоритму КАОЭ этих
алгоритмов, как уже отмечалось, при нулевой постоянной сос-
составляющей равен нулю. Более эффективными непараметрически-
непараметрическими алгоритмами обнаружения узкополосных радиосигналов (без
постоянной составляющей) являются ранговые. Их, конечно, мо-
можно использовать и для обнаружения сигналов с постоянной сос-
составляющей, однако в этом случае их эффективность ниже эффек-
эффективности соответствующих знаково-ранговых алгоритмов обнару-
обнаружения.
Пусть Ks(t)y K>0 — детерминированный сигнал и х= (хи ...
..., хп) — наблюдаемая независимая выборка, которая принадле-
принадлежит либо стационарной помехе (плотность распределения кото-
которой необязательно симметрична), либо сумме детерминированно-
детерминированного сигнала и помехи. Правило принятия решения, базирующееся
на так называемой линейной ранговой статистике, формулируется
следующим образом: сигнал присутствует, если
» (X)- 2
A6.32)
где ty(k)—функция целочисленного аргумента й=1, п.
Схема обнаружителя, функционирующего согласно алгоритму
A6.32), приведена на рис. 16.3.
- #1
Рис. 16.3. Схема рангово-
рангового обнаружителя сигнала
478
Частными видами алгоритма A6.32) являются медианный
~n~ir)>c' A6-33)
Вилкоксона
A6.34)
П
Ван-дер-Вардена
) A6.35)
где F^) — функция, обратная интегралу Лапласа.
Определим среднее значение и дисперсию статистики Гп(х)
при гипотезе Н (сигнала нет). Так как при стационарной незави-
независимой помехе распределение рангов равномерное, то
т1{Гп(х)|Я}= 2 siml{^(Ri)\H} = -±- v s. 2 *(Л)
и, обозначая
^n = — i^ik),
получаем
тг {Тп (х) | H}=nasn^n, A6.36)
где asn — постоянная составляющая сигнала [см. A6.21а)].
Дисперсия статистики Тп (х) при гипотезе Н
1Х2{Тп(х)\Н}=пЬ2еП^\9 A6.37)
где
Щп = — S (s, - ^SnJ - Wsn - ?^, A6.37а)
ft f=i
Ф5 = -Ц?№№)-*п]2. A6.376)
Если постоянная составляющая сигнала asn=0, то при гипотезе Н
т1{Гп(х)|Я}==0, |х2{^п(х)|Я}=п^п^;. A6.38)
Если выполняется условие A6.14), то статистика Гп(х) асим-
асимптотически нормальна, и тогда порог с в алгоритме A6.32) свя-
связан с заданной вероятностью ложных тревог а следующим соот-
соотношением 1
с = ха{пЬ28ПЦ2пУ/2 +na8nqn. A6.39)
16.7.1. Коэффициент асимптотичеашй относительной эффектив-
эффективности алгоритма Вилкоксона. Вычисление среднего и дисперсии
479
Гп(х) при альтернативе для произвольной функции 4|э представ-
представляет трудную задачу1. Ограничимся линейным ранговым алго-
алгоритмом Вилкоксона A6.34) и перепишем его в виде [см. A3.168а)]
2/1
Тп (х) - 2 st 2 и (xi - xj) = -L 2 2 ^ sgn (jc, - *,) + 2-?22-. A6.40)
Найдем среднее значение sgn (я*—Xj) при альтернативе К:
Щ {sgn (xs - xj) \K) =l-2P{xt- xj) <0\K} =
= 1-2 ]F1(z-ks,)w(z-Xsj)dz =
где w(z), F\(z)—плотность вероятности (необязательно симмет-
симметричная) и функция распределения стационарной аддитивной по-
помехи. Раскладывая Fi(z+Xs) в ряде по степеням а, получаем
mt {sgn (х, - Xj)\K] = 2К(st - Sj) ]w* (z) dz + o (X). A6.41)
—oo
Из A6.40) и A6.41) следует, что при л>1 и xKn=const
Щ {Тп (х) | К} = X J w* (z) dzi S sf(s, - s;) +
+ «!u2L = X n* (W8n - al) + -^. A6.42)
При том же условии [см. A6.37)]
/l2. A6.43)
Тогда, с учетом асимптотической нормальности статистики Тп(х)
вероятность пропуска сигнала при использовании алгоритма Вил-
Вилкоксона A6.34):
A6.44)
где в соответствии с A6.39) порог
с = ха Ь8П У л8/12 + п2 ашп/2. A6.45)
Из A6.44) и A6.45) находим асимптотическую рабочую ха-
характеристику алгоритма Вилкоксона
A6.46)
1 Для этого можно использовать теорему Чернова — Севиджа (см. [42]).
480
Теперь, используя A6.46) и A6.16), нетрудно записать выра-
выражение для КАОЭ алгоритма обнаружения Вилкоксона A6.34) по
отношению к линейному алгоритму A6.13)
О6-47)
где а2 — дисперсия помехи, bs = Hm bsn-
Если as = 0, то b2s=Ws, и тогда
р0 - 12a2! J ш2 (z) dz\ . A6.47а)
Отношение р/р0 коэффициентов асимптотической относительной
эффективности алгоритма A6.34) для сигналов с ненулевой по-
постоянной составляющей и узкополосного с нулевой постоянной
составляющей
p/9o = b2s/Ws= l—a2s/Ws. A6.476)
Следовательно, эффективность рангового алгоритма A6.34)
при обнаружении нецентрированного сигнала по сравнению с эф-
эффективностью алгоритма при обнаружении центрированного сиг-
сигнала уменьшается на значение, равное отношению квадрата по-
постоянной составляющей к мощности сигнала. Ясно, что a2s^Ws
(так как h2s^0), причем &s = 0 при постоянном сигнале s(t)=a.
Наконец, сравним ранговый алгоритм A6.34) со знаково-ран-
говым A6.19). Из A6.31) и A6.47) следует, что коэффициент
асимптотической относительной эффективности рангового алго-
алгоритма по отношению к знаково-ранговому равен
A6.48)
Из A6.48) следует, что р~>оо при as->0, что соответствует уже
отмеченной нулевой эффективности знаково-рангового алгоритма
при обнаружении сигнала без постоянной составляющей. Напро-
Напротив, при a2s-+Ws исчезающе малой становится эффективность
рангового алгоритма по отношению к знаково-ранговому. При
граничном значении отношения квадрата постоянной составляю-
составляющей к мощности сигнала a2s/Ws=Qfi2 [см. A6.48)], р=1, т. е. эф-
эффективность обоих рассматриваемых алгоритмов одинакова.
Таким образом, для обнаружения детерминированного сигна-
сигнала при a28/W8<.Ofi2 более эффективен ранговый алгоритм, а при
a2s/Ws>Ofi2 более эффективен знаково-ранговый. Однако при
использовании алгоритма Вилкоксона относительно центрирован-
центрированного сигнала, т. е. алгоритма
п
2(Si-<*Mn)Ri>c9 A6.49)
16-87 481
КАОЭ такого алгоритма по отношению к знаково-ранговому ра-
равен Wsla2s^l, Иначе говоря, ранговый алгоритм обнаружения
детерминированного сигнала эффективнее знаково-рангового.
16.2. НЕПАРАМЕТРИЧЕСКИЕ АЛГОРИТМЫ
ОБНАРУЖЕНИЯ СТОХАСТИЧЕСКИХ СИГНАЛОВ
НА ФОНЕ АДДИТИВНЫХ ПОМЕХ
16.2.1. Оптимальная двухканальная система обнаружения га-
уссовского сигнала на фоне гауссовской аддитивной помехи. Для
обнаружения стохастического сигнала на фоне аддитивной неза-
независимой помехи используется иногда двухканальная система
(разнесенный 'прием). Когда сигнала нет, в каждом из каналов
присутствует только помеха и наблюдаемые в них про-
процессы независимы. Когда сигнал появляется в обоих каналах,
возникает статистическая связь указанных случайных процессов.
Рассмотрим сначала задачу обнаружения гауссовского сигна-
сигнала на фоне независимой гауссовской помехи. Предположим, что
средние значения сигнала и помехи равны нулю, а дисперсии
сигнала и помехи известны и равны соответственно a2s и а2. Если
x(t) и y(t)—процессы, наблюдаемые в первом и во втором ка-
каналах, то в отсутствие сигнала (гипотеза Я)
A6.50a)
Rxv=ml{x(t)y(t)}l<fi=0, A6.506)
а когда присутствует сигнал (альтернатива К), то
A6.51а)
^ г —^г = г- A6.516)
Логарифм отношения правдоподобия для одного наблюдения
, у\Н) 2[(a2 + as2J — oj]
[()D
Если имеется п независимых наблюдений в каждом из кана-
каналов, то
т[()^] A6-52)
482
Рис. 16.4. Схема опти-
оптимального двухканального
обнаружителя гауссов-
гауссовского сигнала
Из A6.52) следует оптимальное по критерию Неймана — Пир-
Пирсона правило обнаружения сигнала: сигнал присутствует, если
п
2 (xi + Уд2 ^ с> A6.53)
и сигнала нет, если выполняется неравенство, обратное A6.53).
Схема обнаружителя, реализующего алгоритм A6.53), пред-
представлена на рис. 16.4.
При гипотезе Н статистика в левой части A6.53) асимпто-
асимптотически нормальна с параметрами
{ 2 (** + У*J1 #} = 2/га2,
-l
A6.54а)
A6.546)
Тогда при фиксированной вероятности а ложных тревог и
находим в алгоритме A6.53) порог
c = o*V8h(xa + V"v2)f A6.54b)
где ха — процентная точка нормального распределения.
При альтернативе К статистика в левой части A6.53) также
асимптотически нормальна, причем
\ 2
2
и при условии o2s<Ca2 (слабый сигнал)
A6.55а)
A6.556)
Тогда вероятность пропуска сигнала
P = F(;p.-Vr2nPiZoi) A6.56
и, следовательно, при /г^>1 асимптотическая рабочая характерис-
характеристика рассматриваемого оптимального обнаружителя гауссовско-
гауссовского сигнала
A6.57)
16.2.2. Коррелятор. Для обнаружения гауссовского сигнала на
фоне аддитивной независимой гауссовской помехи вместо опта-
16* 4»3
мального алгоритма A6.53) можно использовать алгоритм, со-
согласно которому принимается решение о наличии сигнала, если
п
2Xiyi>c. A6.58)
Статистика в левой части A6.58), представляющая корреляци-
корреляционную сумму, асимптотически нормальна с параметрами
f 2 *«0*1 #1=0, т1 \^хгуг\к\ =ti(tl, A6.59a)
*. d*<o*. A6.596)
i=i J I *=i I
Используя A6.59а и б), находим при я»1 в алгоритме
A6.58) порог
с = о2}/"пха A6.60)
и вероятность пропуска сигнала (при g2s^>g2)
$ = F(xa-VnoW), A6.61)
откуда следует, что асимптотическая рабочая характеристика
обнаружителя (коррелометра)
ха-х^ = УпоЬо*. A6.62)
Заметим, что параметр рабочей характеристики A6.62) в J/2
раз меньше параметра рабочей характеристики A6.57), т. е.
КАОЭ коррелометра по отношению к оптимальному обнаружи-
обнаружителю равен 0,5.
Когда средние и дисперсии гаусовских Сигнала и помехи не-
неизвестны, задача обнаружения сигнала формулируется как за-
задача проверки гипотезы Н о том, что при произвольных значе-
значениях средних и дисперсий сигнала и помехи коэффициент корре-
корреляции г процессов x(t) и y(t) равен нулю против альтернативы /С,
что г>0. Оптимальное несмещенное правило обнаружения пред-
предписывает в этом случае сравнение с порогом оценки максималь-
максимального правдоподобия коэффициента корреляции (см. [50, § 4.2])
__ п _ 1/2 у*
A6.63)
где
Можно показать (см. [50], теорема 4.2.6), что статистика г
асимптотически нормальна со средним г и дисперсией A—г2J/п.
484
Тогда в алгоритме A6.63) при /г^>1 и фиксированной вероятно-
вероятности а ложных тревог
c = xjVn. A6.64)
Асимптотическая рабочая характеристика при г2<С'1 (слабый сиг-
яал) имеет вид
Xa-Xi-Jb^rYn. A6.65)
Ясно, что при х=у = 0 и известных дисперсиях A6.63) переходит в
<16.58),а A6.65) —в A6.62).
16.2.3. Коррелятор совпадения полярностей. Предположим, что
плотности вероятностей центрированных сигнала и помех описыва-
описываются функциями, симметричными относительно начала координат,
и что известны дисперсии сигнала и помех и четвертые централь-
центральные моменты распределения помех. Плотности вероятностей по-
помех в первом и во втором каналах и плотность вероятности сигна-
сигнала обозначим соответственно через Шц(х), Wi2(x), W\s(x) диспер-
дисперсии помех и сигнала — о2ь о\ ст28; четвертые центральные момен-
моменты помех — |Л4ь [Х42- Задача обнаружения стохастического сигнала
состоит в проверке гипотезы Н о том, что наблюдаемые в канале
процессы x(t) и y(t) независимы, т. е. что их совместная плотность
распределения в совпадающие моменты времени
о/а(*, y\H)=wn(x)wi2(y)9 A6.66)
против альтернативы К, что эта плотность равна
Щ(х, у\К)= J»u(х-z)w1%(у-z)wl8(z)dz. A6.67)
Подынтегральная функция в A6.67) представляет совместную
трехмерную плотность вероятности независимых аддитивной по-
помехи и сигнала.
Для обнаружения стохастического сигнала на фоне аддитивных
независимых помех (при указанных предположениях) использу-
используем следующий знаковый алгоритм: принимается решение, что
присутствует сигнал (отвергается гипотеза Я), если
2 sgnxt sgn yt > сг. A6.68)
Предполагается, конечно, что компоненты векторов наблю-
наблюдений х и у независимы.
Алгоритм A6.68) соответствует коррелятору совпадения по-
полярностей (называемому иногда просто полярным коррелятором,
рис. 16.5).
Учитывая связь функций sgn л: и и(х), можно алгоритм
A6.68) переписать в виде
A6.69)
485
Рис. 16.5. Схема корре-
коррелятора совпадения по-
полярностей
Сумма A6.69), равная числу совпадения знаков наблюдений
в каналах, подчиняется биномиальному закону с параметрами
(п, 1/2), если справедлива гипотеза Я, и с параметрами (я, р)„
если справедлива альтернатива /С, причем
[Fi1 (г) ~ 1"
]ll-F11(z)]ll-F12(z)]wl8(z)dz^
* {z) dZt A670>
т+2
При использовании алгоритма A6.69) вероятность ложной
тревоги
A6.71)
Формула A6.71), которая не отличается от A3.177), позволя-
позволяет найти постоянное значение порога с в A6.69) для любых сим-
симметричных плотностей вероятностей помех и сигнала. Иными
словами, порог, устанавливаемый в полярном корреляторе, при
заданной вероятности а совпадает с порогом, устанавливаемым в
знаковом обнаружителе постоянного сигнала. Таким образом,
при указанных ограничениях коррелятор совпадения полярно-
полярностей представляет непараметрический обнаружитель стохастиче-
стохастического сигнала на фоне аддитивных независимых помех.
При п^$>1 статистика в левой части A6.69) асимптотически
нормальна со средним пр и дисперсией пр{\—р), причем р=1/2
при гипотезе Н. Порог с в A6.69) в этом случае определяется па
формуле A3.179а), а рабочая характеристика алгоритма — па
формуле A3.181), где р вычисляется с помощью A6.70). При
слабом сигнале a2s<a2i + a22. Из A6.70) находим р^ 1/2 +
+ 2а2вШц@)ш12@), и тогда асимптотическая рабочая характерис-
характеристика коррелятора совпадения полярностей
ха - *,_р = 4qs wix @) w12 @) У п. A6.72)
16.2.4. Относительная эффективность коррелятора совпадения
полярностей. Определим КАОЭ алгоритма A6.69) по отношению
к алгоритму A6.53) обнаружения стохастического сигнала, оп-
оптимального при нормальном распределении сигнала и помех.
Предположим, что алгоритм A6.53) используется при произвола
486
ных симметричных плотностях распределений сигнала и незави-
независимых аддитивных стационарных помех. При гипотезе Н (сигна-
(сигнала нет)
A6.73а)
f-oj), A6.736)
а,при альтернативе К (сигнал присутствует)
2) п> A6-74а)
\ A6.746)
o<o
Статистика в левой части A6.53) асимптотически нормальна с
параметрами, определяемыми согласно A6.73а, б). Тогда при
^ 1 и заданной вероятности а ложных тревог порог
A6.75)
а асимптотическая рабочая характеристика
ха - *,_э = 4as2 Vni^ + fx42 + 4a? oi - a? - a42)/2. A6.76)
Для гауссовских помех 1141 = 1x42=3a4 при ai = a2 = a, и формулы
A6.75), A6.76) совпадают с A6.54) и A6.57) соответственно.
Из A6.72) и A6.76) непосредственно следует (как из сопо-
сопоставления многих аналогичных соотношений) выражение для
КАОЭ коррелятора совпадения полярностей ою отношению к об-
обнаружителю, оптимальному при гауссовских помехах:
A6.77)
Если распределение помех нормальное с одинаковыми диспер-
дисперсиями, то w2u@) =w2l2@) = Bло2)-\ 1x41 = ^42=За2 и
р=8а4/Bшт2J = 2/я2, A6.78а)
т. е. коррелятор совпадения полярностей в этом случае сущест-
существенно уступает по эффективности оптимальному обнаружителю
стохастического сигнала.
Однако при лапласовских помехах (см. п. 13.8.7) w2n@) —
= ш212@) = Bа2)-1, |i4i=|i42 = 6a4 и р = 14а4/Bа2J=3,5. A6.786)
Для помех, распределенных равномерно на интервале
и
p=19a4/5( 12a2J =19/720^0,03, A6.78в)
т. е. в этом случае эффективность коррелятора совпадения поляр-
полярностей по сравнению с оптимальным мизерная.
487
Наконец, для помехи в виде синусоиды со случайной фазой
(см. п. 13.8.7) w2n@)=w2l2@) = Bn2o2)-1, |*4i = |*42=3cr4/2 и
) «0,01. A6.78г)
Если W\@)=0t т. е. если плотность вероятности помех равна
нулю в начале координат (мультимодальные, симметричные рас-
распределения), то из A6.77) следует р = 0.
Используя A6.62) и A6.76), находим КАОЭ коррелятора сов-
совпадения полярностей по отношению к обычному коррелятору
A6.79)
Из A6.79) следует, что при гауссовских помехах р^0,4, а при
лапласовских р = 4.
16.2.5. Ранговые алгоритмы обнаружения стохастического сиг-
сигнала. Пусть х= (х\у... tXn) и у= (уи ..., уп)—выборки наблюде-
наблюдений в двух каналах и пусть R= (R\,... ,^п) и Q=(QU ..., Qn) —
ранговые векторы этих выборок. Для проверки гипотезы Н —
сигнала нет (выборки х и у независимы) — против альтернативы
К—сигнал присутствует в обоих каналах (выборки х и у зави-
зависимы) — можно использовать следующее правило: принимается
альтернатива К, если
A6.80)
1=1
и она отклоняется, если выполняется неравенство, обратное
A6.80).
Статистика Sn в A6.80) называется коэффициентом ранговой
корреляции Спирмена. Среднее и дисперсия этой статистики при
гипотезе Я
4, A6.80а)
li2{Sn(x, у)\Н}=пЦп+1)Цп-\)Пи. A6.806)
Так как статистика Sn асимптотически нормальна, то при
л>1 в A6.80) порог
где ее—заданная вероятность ложных тревог и ха—процентная
точка нормального распределения.
Эквивалентным по эффективности алгоритму A6.80) является
алгоритм, использующий статистику Кендалла:
Sn (х. у) =Л2 2 sgnfo-^sgnfo,--^). A6.81)
Схема обнаружителя стохастического сигнала, функционирующе-
функционирующего согласно алгоритму A6.80), изображена на рис. 16.6.
Можно показать, что при гауссовских помехах КАОЭ ранго-
рангового алгоритма A6.80) обнаружения стохастического сигнала по
отношению к алгоритму A6.53), оптимальному при гауссовских
488
Рис. 16.6. Схема рангового об-
обнаружителя стохастического
сигнала
помехах, равен 9/Bя2)~0,45, по отношению к алгоритму A6.58)
(коррелятор) 9/я2~0,91 и по отношению к алгоритму A6.69)
(коррелятор совпадения полярностей) 2,25.
16.3. НЕПАРАМЕТРИЧЕСКИЕ АЛГОРИТМЫ ОБНАРУЖЕНИЯ
СИГНАЛОВ НА ФОНЕ ПОМЕХ ПО НЕЗАВИСИМЫМ
ГРУППАМ КОРРЕЛИРОВАННЫХ ВЫБОРОК
16.3.1. Постановка задачи и априорные данные. Пусть на ин-
интервале (О, Тн) наблюдается реализация x(t) случайного про-
процесса X(t), который может представлять помеху ^(t) (гипотеза
Н) или аддитивную смесь помехи и детерминированного сигнала
%s(t), Я>0, |s(f)|^l (альтернатива К). Предположим, что по-
помеха ?(?)—стационарный в узком смысле центрированный слу-
случайный процесс, удовлетворяющий условию равномерно сильного
перемешивания [см. D.44а)]. Тогда можно указать такой интер-
интервал времени Г, что при %>Т коэффициент перемешивания ф(т)<
<е, где е — малая положительная константа. Поэтому для при-
принятой вероятностной модели наблюдаемого процесса существует
такая частота дискретизации го=1/Т реализации этого процесса,
на которой при всех г^.г0 выборки х(и) и x(v) при \и—v\^T
можно считать практически независимыми. В частном случае Т-
зависимой помехи (см. п. 4.2.7) указанные выборки будут строго
независимы. Для указанной модели аддитивных помехи можно,
как будет показано далее, использовать модификацию знаковых
и ранговых алгоритмов обнаружения детерминированного сигна-
сигнала, которая позволяет синтезировать непараметрические алгорит-
алгоритмы обнаружения по независимым группам коррелированных вы-
выборок.
Рассмотрим два этапа преобразования наблюдаемого процес-
процесса. На первом осуществляется временная дискретизация реализа-
реализации x(t) в моменты времени (рис. 16.7)
где
NT
mN
=1, n,
Т = NT
л н — V i >
причем m, n, N и М — целые числа. В результате указанной дис-
дискретизации получаем М групп выборок, каждая из которых со-
содержит п выборочных значений на интервале длительностью Тт:
=l, М, /=1, п,
489
Рис. 16.7. Независимые группы коррелированных выборок
где индекс i—номер группы, а индекс / — номер выборочного
значения в данной группе. Векторные выборки хь х2,..., хм пред-
представляют совокупность независимых (практически) я-мерных
случайных величин, а компоненты каждого вектора хг-, i=l,JM9
коррелированы. Независимость случайных векторов следует иа
того, что интервал между моментом выбора последнего элемен-
элемента выборки Xi и первым элементом выборки хг+1
i(Tr + T) + — ~{i-l)(Tr + T)-— = Тг + Г — ^——-Г = 7.
m mm
Второй этап преобразования состоит в редукции данных, при
которой устанавливается соответствие между случайным векто-
вектором Хг- И СКаЛЯрНОЙ СЛучаЙНОЙ ВеЛИЧИНОЙ У{ = (р(х{), 1=*Л,М, И,
следовательно, между совокупностью векторных выборок хг-,
i=l, М, и М-мерным случайным вектором Y= (Yu ..., YM) с не-
независимыми компонентами, которые при гипотезе Н подчиняют-
подчиняются одному и тому же распределению стационарной помехи. По-
Поэтому векторная статистика Y может быть использована для син-
синтеза непараметрических (знаковых, ранговых) алгоритмов об-
обнаружения детерминированного сигнала на фоне аддитивной ста-
стационарной коррелированной помехи.
16.3.2. Использование линейных статистик. Пусть Cj, j=l,n—¦
заданные константы. Образуем скалярные случайные величины
i = 1, M. A6.83)
Каждая из случайных величин Уг представляет линейную комби-
комбинацию выборок i-й группы, причем весовые коэффициенты Cj, / =
= 1,л, зависят от номера выборочного элемента группы, а не от
номера группы.
При гипотезе Н (сигнала нет) случайные величины Уь..., Ум-
независимы, распределены одинаково с плотностью вероятности
wY(y), определяемой распределением помехи, причем среднее
значение каждой из этих величин равно нулю, а дисперсия
п п г Т 1
q\ = u2{Yj\H\ = q2 2 2 cJckRt 0 — k) — » A6.84)
490
где а2 5 и Ri (т)—дисперсия и нормированная корреляционная
функция помехи. Вводя корреляционную матрицу размером пХп
помехи Ki={a2iRi[(j—k)T/m]), j,k=A,ny можно A6.84) пере-
переписать в виде
а2у=с'К&с, A6.84а)
где с — вектор весовых коэффициентов.
При альтернативе К (сигнал присутствует) плотность вероятно-
вероятности случайной величины Уг равна wY(y—ЯЛ*), где
/-1, M. A6.85)
16.3.3. Знаковые и ранговые алгоритмы обнаружения детерми-
детерминированных сигналов на фоне аддитивных коррелированных по-
помех. Из A6.83) и A6.85) следует, что для обнаружения детерми-
детерминированного сигнала на фоне аддитивной коррелированной по-
помехи, удовлетворяющей условию равномерно сильного перемеши-
перемешивания, с симметричной плотностью распределения можно ис-
использовать знаковый алгоритм A6.3) или более эффективный
знаково-ранговый алгоритм A6.19), если в указанных алгоритмах
независимые выборки х= (хи ..., хп) заменить вектором статистик
Y= (Уь ..., YM)у а вектор сигнальных значений s= (su ..., sn)—век-
sn)—вектором h= (Ль ..., hM). При аналогичной замене можно использо-
использовать ранговые алгоритмы A6.32), при этом отпадает условие
симметрии плотности вероятности помехи.
Заметим, что за общее время наблюдения TH=NT при ука-
указанном в начале п. 16.3.1 соотношении между периодом дискре-
дискретизации Т и коэффициентом перемешивания ср(т) можно полу-
получить N независимых выборок. В рассматриваемых алгоритмах
используется пМ = nmN/(n + m—1) коррелированных выборок
(т. е. в mnl(n + m—1) раз больше, чем при независимых выбор-
рах) и M=mN/(n+m—1) независимых групп коррелированных
выборок. Отсюда следует, что на формирование одной независи-
независимой выборки затрачивается время Г, а на формирование незави-
независимых групп коррелированных выборок — время Тт+Т [см.
A6.82а)], т. е. в (m + n—\)jm раз больше, чем для независимых
выборок. Это следует учитывать при сравнении непараметриче-
непараметрических алгоритмов обнаружения сигналов на фоне независимых и
коррелированных помех.
Эффективность непараметрического алгоритма 8К обнаруже-
обнаружения сигнала на фоне аддитивной коррелированной помехи отно-
относительно аналогичного алгоритма 8Н, использующего независимые
выборки помехи, характеризуется так называемым асимптотиче-
асимптотическим относительным временем обработки (АОВО), определяемым
из соотношения
= рFк, 6„O7(ГГ+Г)=рFк, 6н)т/(т + л—1), A6.86)
где р(8к, 8н) — КАОЭ алгоритма 8К по отношению к алгорит-
алгоритму «н.
491
16.3.4. Знаковый алгоритм обнаружения постоянного сигнала
на фоне коррелированной помехи. Для обнаружения постоянного
сигнала на фоне аддитивной коррелированной помехи, удовлетво-
удовлетворяющей указанным в п. 16.3.3 условиям, в [51] предложен и ис-
исследован следующий знаковый алгоритм: принимается решение,,
что сигнал присутствует, если
1 М
4т 2 sgnYt>ct A6.87>
м
где Yi определяются согласно A6.83), если все константы Cj по-
положить равными единице. Для сравнения алгоритма A6.87) со
знаковым алгоритмом обнаружения постоянного сигнала при
независимых выборках используется величина таово [см. A6.86)].
Показано, что
> f A6.88>
w* @) ™ + n — 1
где wY(y)—плотность вероятности случайных величин Уг-, t =
= l,M, a w(x)—симметричная плотность вероятности помехи»
Если т-^оо, я/m-^oo, то
^ , A6.88а>
где i/?s(r)—нормированная корреляционная функция помехи. Во
МНОГИХ СЛучаЯХ Таово>1.
Заметим, что даже при обнаружении постоянного сигнала для
повышения эффективности алгоритма обнаружения целесообраз-
целесообразно использовать статистики Y^ с переменными весовыми коэффи-
коэффициентами, согласованными с корреляционной функцией помехи.
Глава 17
СИНТЕЗ АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫХ
АЛГОРИТМОВ ОБНАРУЖЕНИЯ СИГНАЛОВ
(МАТЕМАТИЧЕСКИЕ ОСНОВЫ)
17.1. АСИМПТОТИЧЕСКАЯ ОПТИМАЛЬНОСТЬ
17.1.1. Асимптотический принцип синтеза алгоритмов
обнаружения сигналов. Задачи синтеза алгоритмов обнаружения
сигналов, рассмотренные в гл. 12—16, решались с использовани-
использованием выборок конечных размеров. Однако во многих случаях анализ
рабочих характеристик алгоритмов удается провести только при
неограниченном увеличении размеров выборок, например на основе
коэффициента асимптотической относительной эффективности
(КАОЭ). Асимптотический принцип можно использовать и лри
492
синтезе алгоритма обнаружения сигнала, применив затем такой
алгоритм в допредельной ситуации, т. е. при конечном размере
выборки.
Предположим, что одновременно амплитуда сигнала А,п-Я) и
размер выборки дг-^оо. Тогда при заданной вероятности а ложной
тревоги существует предельное значение (отличающееся от 0 и 1)
вероятности C пропуска сигнала, если только
К Vn=yny 0<<уп<оо. A7.1)
Ясно, что для любого состоятельного алгоритма 8П вероятность
пропуска сигнала Р(8П, ^п)-^0 при я-^оо, если 'кп-^Х>0. Условие
A7.1) допускает простое объяснение: значение №пп, пропорцио-
пропорциональное отношению мощности сигнала к мощности помехи после
обработки, и, следовательно, это условие ограничивает указанное
отношение при предельном переходе (см., например, п. 13.7.5).
При более быстром стремлении к нулю амплитуды сигнала отно-
отношение сигнал-помеха стремится к нулю, а при более медлен-
медленном — неограниченно возрастает. В первом случае вероятность
1—р правильного обнаружения стремится к нулю, а во втором—
к единице. Ограничение A7.1) исключает, таким образом, син-
сингулярные алгоритмы обнаружения1.
17.1.2. Определение асимптотически оптимального алгоритма.
Дадим теперь точное определение понятия асимптотической оп-
оптимальности. Условимся, как обычно в теории обнаружения сиг-
сигналов, считать оптимальным такой алгоритм обнаружения 6°п,
который при фиксированной вероятности ап ложных тревог обес-
обеспечивает для заданного размера п выборки минимальную веро-
вероятность рп(8°п, Хп) пропуска сигнала Xns(t) (критерий Нейма-
Неймана — Пирсона).
Пусть %и ... Дп— последовательность амплитуд сигнала, опре-
определенным образом сходящаяся к нулю, когда размер выборки п
неограниченно возрастает. Рассмотрим последовательность {6П}
алгоритмов обнаружения сигналов амплитудами Хп- Обозначим
вероятность пропуска сигнала, соответствующую 8П и %п, через
Рп(8п, Яп). Назовем последовательность алгоритмов {8АОП} асим-
асимптотически оптимальной, если для любой другой последователь-
последовательности алгоритмов {бп} имеет место соотношение
lira [pn (бП) К) ~ Р„ (б?°, К)\ > 0 A7.2)
при фиксированном уровне вероятности а ложных тревог, кото-
который следует трактовать также асимптотически, т. е.
lim ап (8П) = lim an (б?°) = а. A7.3)
1 См., например, формулу A5.20а), из которой следует, что при обнаруже-
обнаружении сигнала Xs(t) на фоне аддитивной независимой гауссовской помехи параметр
обнаружения_^2п=Я2/г1^П5/а2=Я2/г(С/П)вх. При с?п->0, Р~>1, при dn-+°° p->0.
При %~\/п=у предельная рабочая характеристика алгоритма обнаружения
[(CIU)]i/2
имеет вид ха~-х 1__^=
493
Скорость сходимости последовательности Хп к нулю при п-+<х> не
произвольна. Должно выполняться условие
К = Уп/Уъ A7.4)
где уп — ограниченная положительная константа, пропорциональ-
пропорциональная отношению сигнал-помеха.
Для асимптотически оптимального алгоритма при условии
A7.4) существует предел
limрп(б?°, yjVn) = рFАО, т), A7.5)
/1-Х»
(8АО, Т)<1. A7.5а)
Предельный алгоритм 8А0 использует предельную нормиро-
нормированную статистику с конечными параметрами распределения этой
статистики, зависящими от константы у. При больших размерах
выборки п рабочая характеристика асимптотически оптимального
алгоритма 8АОП мало отличается от аналогичной характеристики
алгоритма 6°п, оптимального по критерию Неймана — Пирсона.
Использование асимптотически оптимального алгоритма в
допредельном случае окажется целесообразным при быстрой схо-
сходимости к оптимальному. Заметим, что при решении практиче-
практических задач амплитуда сигнала может и не удовлетворять усло-
условию A7.4). Но и тогда в допредельном случае можно использо-
использовать асимптотически оптимальный алгоритм обнаружения сигна-
сигнала. При этом рабочая характеристика алгоритма определяет
верхнюю границу вероятности правильного обнаружения при Х~
~n~v, v>l/2 и нижнюю границу этой вероятности при %~п~у,
0^v<l/2 (когда алгоритм обнаружения состоятельный).
17.1.3. Асимптотически наиболее эффективные алгоритмы об-
обнаружения сигналов. Рассмотрим две последовательности 8nfe и
8** алгоритмов обнаружения сигнала, для которых пределы
вероятностей ложных тревог при /z/i->oo, я^-^оо, когда &->-оо,
совпадают:
Нт ап. (8„.) = lim 'а. (Ь*А - а. A7.6)
Пусть Xnfe, Xn*k — последовательности амплитуд сигнала, сходя-
сходящиеся к нулю при &->-оо, и пусть существует общий предел веро-
вероятностей пропуска сигнала для указанных последовательностей
алгоритмов
. A7.7)
Введем КАОЗ рр (8*, 6) уровня C последовательности алгоритмов
494
6*ri'k относительно последовательности б„Л [см. A2.34) и
A2.34а)]:
рр(б*. S) = limnfe/n;, A7.8)
где nk-+oo9 я^-^оо, 8п?->8, 8*n *k -*Ч$*, когда &->-оо.
Назовем последовательность 8*71*^ асимптотически наиболее
эффективной (АНЭ) последовательностью алгоритмов обнаруже-
обнаружения сигнала, если для любых bnk и заданных величин а, р
рэ(8*, 8)>1. A7.9)
Если при фиксированном значении а неравенство A7.9) выпол-
выполняется для любых р, то алгоритм 8*п*^ называется равномерно
асимптотически наиболее эффективным (РАНЭ).
Из A7.2), A7.7) и A7.9) следует, что асимптотически опти-
оптимальный алгоритм обнаружения сигнала является также и асим-
асимптотически наиболее эффективным алгоритмом. Это позволяет
использовать КАОЭ в качестве показателя асимптотической опти-
оптимальности.
17.1.4. Коэффициент асимптотической относительной эффек-
эффективности. Из определения A7.8) непосредственно не следует ме-
метод вычисления КАОЭ. Однако можно показать, что при усло-
условии существования конечных пределов (что имеет место для
асимптотически оптимальных алгоритмов)
limpn(en, Y/f«) = PF, у), A7.10а)
limр„ (8;, y*lVn) = РF*, ?*) A7.Юб)
Л-»оо
КАОЭ алгоритма 8* по отношению к произвольному алгоритму 8
[ср. с A3.162)]
Pf*o(8*> 8) = (Yo/Y*oJ> A7Л1)
где 7о и y*o — минимальные корни уравнений
Р(8, т) = Ро, Р(8*, т*)=Ро. A7.12)
Интуитивное обоснование формулы A7.11) следует из того,
что при заданном значении ро существуют последовательности
tik и я*&, неограниченно возрастающие при &-*~оо, для которых
Yo- A7.13)
17.1.5. Количественная мера устойчивости асимптотически оп-
оптимальных алгоритмов обнаружения сигнала. При практическом
применении асимптотически оптимальных алгоритмов возникает
вопрос: насколько чувствительны характеристики обнаружения
сигнала к изменению распределения вероятностей помех, для ко-
которого используемый алгоритм асимптотически оптимальный.
Свойство алгоритма сохранять в определенных пределах свои
495
Таблица 17.1 характеристики при изме
помеховой обстановки назо-
Алгоритм 62 (») б» (а) вем его устойчивостью. у
Пусть w — плотность р ас-
Гипотеза Н 0; о\ 0; а2 пределения помехи, по отно-
о шению к которой алгоритм
Альтернатива* у аг, о\ у а, о* 6* (ш) в реализованном обна-
обнаружителе сигнала асмиптоти-
чески оптимальный, и пусть и — плотность распределе-
распределения помехи в изменившихся условиях. В качестве меры устойчи-
устойчивости примем КАО*Э р алгоритма 8*м(^), используемого при «чу-
«чужой» помехе (с плотностью распределения и), по отношению к
алгоритму 8*(а), асимптотически оптимальному для этой («чу-
(«чужой») помехи.
Предположим, что односторонние алгоритмы 8*и(^) и 8*(и)
обнаружения сигнала предписывают сравнение с порогом асимп-
асимптотически нормальных статистик. Пусть среднее значение и дис-
дисперсия для предельного нормального распределения при гипотезе
Н (сигнала нет) и при альтернативе К (сигнал присутствует)
принимают значения, приведенные в табл. 17.1.
При заданной вероятности а ложных тревог вероятности про-
пропуска сигнала равны: при использовании алгоритма 8*п(ш)
P(8*u, v)=F(x(X—уа\/в\), A7.14а)
при использовании алгоритма 8*(^)
рF*, y)=F(xa-yafo), A7.146)
где ха — процентная точка нормального распределения.
Подставляя A7.14а, б) в A7.12), находим
Yo = (ха — *1-|з) v/a, Yq == (x(x ~ *i-p) ai/#i- A7.15)
Вследствие монотонности интеграла Лапласа F(z) полученные
величины являются единственными корнями уравнений A7.12).
Подставляя A7.15) в A7.11), определяем КАОЭ алгоритма
8*u(w) по отношению к алгоритму 6*(и)
р=:(а1/а1Р(а/аJ. A7.16)
Заметим, что отношения а/а и а\/в\ можно рассматривать как
меры «расстояний» между предельными распределениями статис-
статистик при гипотезе Я и альтернативе К соответственно.
17.1.6. Неоднозначность асимптотически оптимальных алго-
алгоритмов. Пусть 8 A) и 8 (9) —две последовательности алгорит-
Пк nk
A) , ч
мов обнаружения сигнала, использующие статистики у щ (х) и
уп(
B) A)
УяB) Vх) и пусть алгоритм опA) асимптотически оптимальный.
к k
Если при az^V-^oo, дгB)ь->оо, когда
П) , ч B) ,
0 A7.17)
496
при ^'ипотезе Я, то алгоритм обнаружения 6лB) также асимпто-
асимптотически оптимальный1.
Указанное обстоятельство открывает возможность поиска
асимптотически оптимальных алгоритмов с желаемыми дополни-
дополнительными свойствами, например с более простой структурой, чем
оптимальные при конечных размерах выборок, или с непарамет-
непараметрическими свойствами. Конечно, различные асимптотически опти-
оптимальные алгоритмы будут иметь различную скорость сходимости
допредельных алгоритмов к предельным и в этом отношении одни
асимптотически оптимальные алгоритмы будут лучше других.
17.1.7. Асимптотически достаточные статистики. Синтез асимп-
асимптотически оптимальных алгоритмов обнаружения сигналов на фо-
фоне помех основан на исследовании асимптотических свойств лога-
логарифма отношения правдоподобия и определении в результате
асимптотически достаточной статистики. Если отношение правдо-
правдоподобия факторизуется (т. е. логарифм отношения правдоподобия
представляет сумму случайных величин) и если применена цент-
центральная предельная теорема, то распределение указанной ста-
статистики асимптотически нормальное2. Можно ожидать, что струк-
структура асимптотически оптимального алгоритма, использующего
такую асимптотически нормальную достаточную статистику, бу-
будет аналогична структуре оптимального алгоритма обнаружения
сигнала на фоне гауссовской помехи. Специфическим будет лишь
устройство формирования асимптотически достаточной статисти-
статистики, параметры которой определяются только распределением ве-
вероятностей помехи.
Прежде чем приступить к исследованию асимптотических
свойств логарифма отношения правдоподобия, необходимо сфор-
сформулировать условия, которым должны удовлетворять вероятност-
вероятностные модели наблюдений — помехи и смеси сигнала с помехой.
17.2. ВЕРОЯТНОСТНЫЕ МОДЕЛИ НАБЛЮДЕНИЙ
17.2.1. Независимая выборка. Предположим сначала, что на-
наблюдается независимая выборка х— (хи ..., хп) конечного разме-
размера п. Обозначим через ш(х|0) плотность вероятности помехи и
через w(x\b) плотность вероятности смеси сигнала с помехой.
1 Соотношение A7.17) удовлетворяется и при альтернативе /С, если после-
последовательности распределений наблюдаемых выборок (векторных) контигуальны
и при гипотезе, и при альтернативе (см. п. 17.3.1).
2 Центральная предельная теорема формулируется относительно нормирован-
нормированных сумм (см. п.п. 3.4.4, 3.4.6, 5.2.7). Далее часто используем термин «асимпто-
«асимптотически нормальная статистика» для ненормированных сумм, имея в виду, что
при большом числе слагаемых распределение таких сумм аппроксимируется нор-
нормальным, параметры которого зависят от числа слагаемых суммы.
497
Предположим, что функция w(x\$) непрерывна и дифференци-
дифференцируема по параметру ¦& в точке Ф=0 при всех значениях х и
ш(х\0)ф0, A7.18),
^?О. A7.19)
w
Из A7.19) следует
= ]f(x)w(x\0)dx=0. A7.20)
—оо
Функцию f(x) можно представить в виде:
Величина
представляет информацию по Фишеру о параметре О, содержа-
содержащуюся в распределении с плотностью ш(л:|'&) [см. A4.37)]. Вве-
Введем величину
1/ = т1{/2»|Я}= ]p(x)w(x\0)dx (П.22)
—оо
и предположим, что 0<1/<оо. Из A7.21) и A7.22) следует
1, = 1@), A7.22а)
т, е. при Ф = 0 дисперсия нелинейного преобразования f(x) выбо-
выборочного значения х помехи равна информации по Фишеру. По-
Поэтому величину I/ будем называть информацией Фишера о поме-
помехе (или кратко — информацией по Фишеру).
Основным условием, которому должна удовлетворять плот-
плотность вероятности смеси сигнала с помехой, является возмож-
возможность ее представления в виде
w(x\®) =w(x\0){l+ftf(x) +№д(х9 #)], A7.23)
причем для любого е>0 всегда найдется такое значение де, что
для всех значений х
т1{82(х^)\Н}<г, |0|<Фе- A7.23а)
17.2.2. Независимая последовательность векторных выборок.
Рассмотрим случай, когда каждое из независимых наблюдений
представляется коррелированной выборкой х размером г. Обозна-
Обозначим через ш(х|Ф) многомерную плотность вероятности векторной
выборки смеси сигнала с помехой, где # — векторный (г-мерный)
параметр. Предположим, что функция ш(х|#) непрерывна и диф-
дифференцируема по параметру # в точке $ = 0 при всех х и что
оу(х|0)=И=0. A7.24)
498
Введем вектор f (х) = (/i(x),... ,/г(х)), где
^4/=ТГл A7-25)
Из A7.25) следует
mi{f(x)|#}=0. A7.26)
По аналогии с A7.22) назовем элементами информационной мат-
матрицы Фишера I/ помехи следующие величины:
I*; = m1{f<(x)/j(x)|/0<«>f M=l~ A7.27)
Предполагается, что матрица I/ положительно определенная, т. е.
det 1^0.
Основным условием, которому должна удовлетворять много-
многомерная плотность вероятности смеси сигнала с помехой, является
возможность ее представления в виде
^(x|#)=^(x|0)[l+#'f(x)+|#|26(x, #)], A7.28)
причем для любого е>0 всегда найдется такое #8, что для всехх
т,{62(х, #)|Я}<е, |О|<0е. A7.28а)
17.2.3. Многосвязная марковская последовательность. Пусть
х*-1;-^, i'= ...,—1, 0, 1,..., я, представляет /г-связную марковскую
последовательность, стационарную при гипотезе Н (см. п. 5.4.3).
Такая последовательность полностью характеризуется ^-мерной
плотностью ау(у|#), где у и # — ^-мерные векторы, и плотностью
вероятности перехода w(x\y, #) из состояния у в состояние х
(здесь # — векторный (&+1)-мерный параметр). Нулевой вектор
О=0 соответствует помехе.
Введем (^+1)-мерный вектор z=(x, у) и предположим, что
функция w(z\'&) непрерывна и дифференцируема по параметру
О в точке v = 0 при всех z и что
шB|0)=^0. A7.29)
Введем также вектор f(z|O) =[/1B),..., fk(z)], где
r A7-30)
Из A7.30) следует
m,{t(z)\y, Н}=0. A7.31)
По аналогии с A7.27) назовем величину
Ii = m1{f(z)f(z)/^} A7.32)
информационной матрицей Фишера помехи и предположим, что
I/ — положительно определенная.
Основным условием, которому должна удовлетворять переход-
переходная плотность вероятности многосвязной марковской последова-
последовательности, является возможность представления ее в виде
A7.33)
499
причем для любого е>0 всегда найдется такое Фе, что для всех z
mi{fi2(z, #)|Я}<8, |<>|<0е. A7.33а)
Для существования разложения A7.33) достаточно, чтобы в ок-
окрестности точки #=0
w{xly ^}<с A7-ззб)
17.2.4. Логарифмы отношения правдоподобия. Запишем для
рассмотренных вероятностных (моделей наблюдений выражения
статистики логарифма отношения правдоподобия при фиксирован-
фиксированных размерах п выборок. В этих выражениях будет представлена
в явном виде связь параметра -0 со значениями обнаруживаемого
сигнала.
Пусть х= (jti,..., хп) — независимая выборка из реализации
x(t) наблюдаемого процесса, причем Xf=x(ti)9 i=l,n9 ti>tj при
i>j. Выборку детерминированного сигнала в момент t = ti обозна-
обозначим KnSi, где Si = s(ti) и%п — амплитуда сигнала, зависящая, вооб-
вообще говоря, от размера выборки п. Безразмерная функция s(t) оп-
определяет форму сигнала. Параметр -О*, от которого зависит плот-
плотность вероятности выборочного значения xt смеси сигнала с по-
помехой,
Qi^KnSu i=l,n. A7.34)
Логарифм отношения правдоподобия
ln/(x|O) = lnn w{XilKsi) = Sin *>(*№*si> . A7.35)
t=l w(xt\0) i==l w(xt\O)
Если рассматривать линейную модель сигнала
т
s @ = 2 ci <Pt W = с' Ф @. A7.36)
где с/= (С\,..., сш) — совокупность коэффициентов разложения сиг-
сигнала s(t) в базисе ср(^) =i[cpi(/),... , <pm(t)]9 то
S{ = C (p(ti) =С фг» A7.о7)
Пусть теперь хь..., хп — независимая последовательность г-
мерных векторных выборок, где
Обозначим через Sij значение сигнальной функции s(t) в момент
t = tij. Тогда векторный параметр плотности вероятности выбороч-
выборочного значения х* -смеси сигнала с помехой при фиксированном
векторе моментов времени U= (Uu ... , tir) запишется в виде
9 1 = пгГ A7.38)
500
В этом случае логарифм отношения правдоподобия
,..., xj¦,,..., О„) = S \nw{Xim . A7.39>
• **' •* **' "¦• х. /— |л\ * '
Наконец, рассмотрим выборку хп-*+1 = (x-k+u •••»*n) разме-
размером k + n ^-связной марковской последовательности. Ее распреде-
распределение полностью определяется априорной плотностью fe-мерного*
вектора х°_ь+1 и плотностями перехода о^х^х**-*, ft*), i=l,n9.
где (k+l) -мерный параметр
•<-Лп8<,нь A7.40)
sU-k=(Si-k, ..., 5,). A7.40а)
Из факторизации плотности вероятности многосвязной марков-
марковской последовательности [см. E.66)] следует
откуда логарифм отношения правдоподобия
17.3. КОНТИГУАЛЬНОСТЬ
17.3.1. Определение контигуальности. Асимптотические свой-
свойства статистики логарифма отношения правдоподобия нужно ис-
исследовать и при гипотезе Н (сигнала нет), и при альтернативе
К (сигнал присутствует). Оказывается, что многие свойства этой
статистики автоматически сохраняются и при гипотезе Я, и при
альтернативе К, если использовать понятие асимметрической эк-
эквивалентности (контигуальности) последовательности распреде-
распределений, введенное Ле Камом (см. [52, 53]).
Последовательности распределений JFn(x|#) и Fn(*\K) назы-
называют контигуальными, если для любой статистики tn (x) сходи-
п.в
мость по вероятности ?п(х) —>¦ 0 для выборки х из распределе-
Л-»оо
ния Fn(x\H) имеет место тогда и только тогда, когда^
п. я
tn(x) —>¦ 0 для выборки х из распределения FnMK).
rt-»oo
Понятие контигуальности выражает близость последователь-
последовательностей вероятностных мер. Свойство контигуальности транзитив-
но: если последовательности /7ПA) и /V2) контигуальны и FnW и
^пC) контигуальны, то последовательности Fn{1) и FnC) также
контигуальны.
501
Можно доказать (см. [53], § 1.2), что из сходимости двух
последовательностей распределений по норме Li при /г->оо
х
следует контигуальность этих последовательностей. Обратное, во-
вообще говоря, неверно, т. е. контигуальность является более сла-
слабой мерой близости последовательностей вероятностных мер, чем
сходимость по норме L\.
17.3.2. Достаточное условие контигуальности. Рассмотрим от-
отношение правдоподобия
ln(x)=wn(x\K)fwn(x\H) A7.43)
и пусть Фп{г)—функция распределения статистики A7.43) при
гипотезе Я, когда выборка х принадлежит распределению
Мх|Я):
Фп(г)=Р{1п^2\Н}. A7.44)
Имеет место следующая лемма (см. [42], с. 256):
Лемма 1. Предположим, что последовательность функций
Фп(г), определенных согласно A7.44), при /г->оо сходится к
функции распределения Ф{г), такой, что
Jzd<D(z)=l. A7.45)
п
Тогда последовательности распределений
Fn(xJO)= }wn(*\H)dx A7.46a)
—оо
Fn(x|d)= jwn(x\K)dx A7.466)
—оо
контигуальны.
Если вместо функции Фп(г) ввести функцию распределения
логарифма отношения правдоподобия
qn(v)=P{In ln^v\H} A7.47)
и если при /2->оо
<фп (у)-м|) (о), A7.47а)
то, используя замену переменной y = lnz в A7.45), можно доста-
достаточное условие контигуальности записать в виде
= 1. A7.48)
Предположим, что функция г|) (v) представляет нормальное рас-
распределение с параметрами а, а2. Тогда из A7.48) находим
а
502
A7.48а)
Равенство A7.48а) выполняется, если а = —о2/2. Таким образомгг
как следствие леммы 1 получаем следующее достаточное усло-
условие контигуальности: если логарифм отношения правдоподобия
при гипотезе Я асимптотически нормальный с параметрами
•—ст2/2, а2, то последовательности распределений Fn(x|#) и
Fn{x\K) контигуальны.
17.3.3. Распределение статистик при альтернативе. Для кон-
тигуальных последовательностей распределений имеет место сле-
следующее утверждение (см. [53; следствие теоремы 7.1]):
Лемма 2. Если распределение статистики логарифма отноше-
отношения правдоподобия при гипотезе Н сходится к нормальному с
параметрами —а2/2, а2, то при альтернативе К распределение
этой статистики также сходится к нормальному с параметрами
G2/2, a2.
Пусть уп(х)—векторная статистика размером т, которая
при гипотезе Н асимптотически нормальна с параметрами О, В,
где В — невырожденная ковариационная матрица размером
тХт. Пусть Fn(x\H) и Fn(x\K)—последовательности распре-
распределений выборки х при гипотезе Я и альтернативе КУ причем рас-
распределение Fn(x\K) зависит от m-мерного векторного параметра
О1. Предположим, что распределение логарифма отношения
правдоподобия 1п/п(х) при гипотезе Я сходится (п-+-оо) к нор-
нормальному с параметрами — fKBfl1^, fKBfl1. Тогда последователь-
последовательности распределений Fn(x\H), Fn(x\K) контигуальны. Если, кро-
кроме того, при гипотезе Я
1п/п(х)-Ф'Уп(х)^—у-Ф'ВФ, A7.49>
то имеет место следующая лемма (см. [53, теорема 7.2)]:
Лемма 3. Распределение векторной статистики уп(х) при аль-
альтернативе К сходится к нормальному с параметрами ВО1, В.
17.4. АСИМПТОТИЧЕСКОЕ РАЗЛОЖЕНИЕ
ЛОГАРИФМА ОТНОШЕНИЯ ПРАВДОПОДОБИЯ
17.4.1. Независимая выборка. Используя условия A7.4) и
A7.23), представим логарифм отношения правдоподобия A7.35)
для независимой выборки х= (xiy ..., хп) в виде
или
taZ(x|O)-2ln|l+^./(*l)|+t4')(x.^)> A7.51)
A7.51а>
503
-и функция f(x) определена согласно A7.19). Введем условие
max|sf|<C, A7.52)
которое практически всегда выполняется.
Докажем сначала, что при гипотезяе Н последовательность
случайных величин т]пA) сходится по вероятности к нулю. Из
условия A7.52) и ограниченности информации по Фишеру
A7.21) следует, что при гипотезе Н
*0, A7.53)
у п
так как
^2
Из A7.53) и A7.23) следует, что при гипотезе Я г]пA)
Так как при
0.
то, учитывая A7.52), представим A7.51) в виде
S sf/(x,)-^-
2
2
где
A7.54)
A7.54a)
Согласно закону больших чисел (см. п. 3.4.3) при гипотезе Н
второй член в правой части A7.54) сходится по вероятности к
постоянной величине, равной
limm1 - — 2 s2./2(a:z.) = —— 1/^
n->oo I 2/i ы l J 2 J
где
/t->-OO tl ?_j
A7.55)
A7.56)
A7.56a)
Используя оценку
n i=1
.504
можно доказать, что при гипотезе Н случайная величина г\п{2>
сходится по вероятности к нулю.
Теперь рассмотрим первый член разложения A7.54). Потре-
Потребуем, чтобы выполнялось условие
Urn max s\ /^s^O, A7.57).
которое является достаточным для применимости центральной
предельной теоремы [см. C.111)]. Тогда сумма -Ц= 2 Sif(Xi)
асимптотически нормальная с нулевым средним и дисперсией
y2lfWSt где Ws и у определены согласно A7.56), A7.56а).
Итак, первый член разложения A7.54) асимптотически нор-
нормальный с параметрами 0, y2lfWs, второй сходится к константе
— (y2/2)lf\Vs, а последние два члена сходятся к нулю. Распреде-
Распределение статистики lnl(x\-&) при гипотезе Н также асимптотически
нормальное с параметрами —(y2/2)lfWSt y2lfWs. На основании
леммы 1 (см. п. 17.3.1) отсюда следует, что последовательности
распределений логарифма отношения правдоподобия при гипоте-
гипотезе и при альтернативе контигуальны. Поэтому свойства асимпто-
асимптотического разложения A7.54), доказанные при гипотезе Я, сохра-
сохраняются и при альтернативе /С, причем согласно лемме 2 (см.
п. 17.3.2) распределение статистики In / (х |О) и при альтернати-
альтернативе К асимптотически нормальное с параметрами (y2/2)lfW*r
y4fWs.
Таким образом, получаем следующую теорему:
Теорема 1. При выполнении условий A7.4), A7.52) и A7.57)
имеет место следующее разложение логарифма отношения прав-
подобия при гипотезе Н и при альтернативе К:
A7.58)
где
A7.59)
A7.59а)
Распределение логарифма отношения правдоподобия при п-+оо
асимптотически нормальное и при гипотезе, и при альтернативе.
Параметры предельного распределения при гипотезе Н равны
-~ — IfWs, y2lfWs, а при альтернативе К равны— lfWSr
y2lfWs.
17.4.2. Независимая последовательность векторных выборок.
Результаты п. 17.4.1 обобщаются на независимую последователь-
последовательность r-мерных векторных выборок хь ..., хп (см. п. П.2.2). Пусть
r-мерная плотность вероятности каждой векторной выборки удо-
50S
влетворяет условиям A7.24) — A7.28). Введем матрицу Q разме-
размеров гХг с элементами '[см. A7.38)]
Qu = lim— Я shishJf /, / = 177, A7.60)
ш предположим, что эта матрица положительно определенная.
Обозначим
KjVn = ynj> 0<Yn;<°o, A7.61a)
i = yjf 0<y}<oo, A7.616)
причем Y=(Yb »., Yr). (Если Ятц_=А,п, /=1, г, то v = ve, где е —
единичный вектор и y= Urn %nVn-)
n~*oo
Предположим, что для всех /=1, г
C, A7.61в)
lim max s\. ? ^/ = 0. A7.61r)
Тогда при гипотезе Я имеет место следующее асимптотическое
разложение логарифма отношения правдоподобия
п( х?, ^у A7.62)
где rin —>¦ 0 и xni=(xi, ..., хп). Компоненты вектора yn(xin) в
разложении A7.62)
ynj ( X») = -^- S ^/; (*|), / = ТГг, A7.63)
где fj(x)—компоненты вектора f(x), определенные согласно
A7.25), а В — матрица размером гХг с элементами Bij = QtjIii
[см. A7.27)]. Используя A7.26) и многомерный вариант цент-
центральной предельной теоремы (см. п. 3.4.6), можно при сформули-
сформулированных условиях доказать, что первый член разложения
у'Уп(х) при гипотезе Н слабо сходится к гауссовской случайной
величине с нулевым средним и дисперсией у'Ъу. Распределение
статистики 1п/(х|#) при гипотезе Н также асимптотически нор-
нормальное с параметрами —у'Ъу/2, у^у. На основании леммы 1
(см. п. 17.3.1) отсюда следует, что последовательность функций
распределения указанной статистики при гипотезе И и при аль-
альтернативе К контигуальны. Поэтому асимптотическое разложение
A7.62) сохраняется и при альтернативе, причем согласно лемме
.2 (см. п. 17.3.2) статистика In /(x |ф) при альтернативе асимпто-
асимптотически нормальна, а параметры предельного распределения рав-
равны y'byj2, y^y- Таким образом, получаем следующую теорему:
506
Теорема 2. При выполнении условий A7.24) —A7.28), A7.61)
имеет место разложение A7.62) логарифма отношения правдопо-
правдоподобия и при гипотезе Я, и при альтернативе /С. Распределение ло-
логарифма отношения правдоподобия асимптотически нормальное и
при гипотезе, и при альтернативе, а параметры предельного рас-
распределения равны соответственно
17.4.3. Многосвязная марковская последовательность. Исполь-
зуя A7.33), можно получить следующее асимптотическое разло-
разложение логарифма отношения правдоподобия для эргодической
^-связной марковской последовательности при гипотезе Я:
| > A7.64>
где f(z)—вектор компоненты которого согласно A7.30)
A7.65>
If —информационная матрица Фишера [см. A7.32)], Q — поло-
положительно определенная матрица размером kxk с элементами
Qtj = lim _L j; Sh Sf_l+k = Q/_t. A7.66>
Заметим, что компоненты векторов f(z^) и f(Zj) попарно некор-
релированы, если Zi=j?=Zj, т. е.
m^xV-^MxVfc) \H} = hq8ij, A7.67)
где 1/д = /П1{^(х^-А)^(хг'г-А) | Я} — элементы информационной
матрицы Фишера I/.
Эргодическая конечносвязная марковская последовательность
удовлетворяет условию сильного перемешивания (см. например,,
[22], с. 181 и [Н], с. 233), при котором применима центральная
предельная теорема (см. п. 5.2.7). Тогда, учитывая A7.31) и
A7.67), можно доказать, что первый член разложения A7.64)
Уп (х) = г^г- S Ч x/_ft) sf'_ft = ^-Н
У
при гипотезе Я слабо сходится при /г->оо к гауссовской случай-
случайной величине с нулевым средним и дисперсией
2 S l*Qtf. Q«/<~. A7.6O>
507
При доказательстве предполагается выполнение следующих ус-
условий [54]:
tr[QIf]>0, т!{[Г(х)е]4|Я}<оо,
ц\де е—(&+1)-мерный единичный вектор.
Распределение статистики In /(х|О) при гипотезе Н асимпто-
асимптотически нормальное с параметрами— — tr[QIf ], Y2tr[QIf ]. На
основании леммы 1 (см. п. 17.3.1) отсюда следует, что последова-
последовательности распределений указанной статистики при гипотезе Я
я при альтернативе К контигуальны. Поэтому асимптотическое
разложение A7.64) оохраняется и при альтернативе, причем соглас-
согласно лемме 2 (см. п. 17.3.2) статистика 1п/(х|#) также асимптоти-
асимптотически нормальна, а параметры предельного распределения равны
,G2/2)tr[QIf ],Y2tr[QI ].
Таким образом, получаем следующую теорему:
Теорема 3. При сформулированных условиях имеет место раз-
разложение A7.64) логарифма отношения правдоподобия при гипо-
гипотезе Н и при альтернативе К. Распределение логарифма отноше-
отношения правдоподобия асимптотически нормальное и при гипотезе,
я при альтернативе. Параметры предельного распределения
равны соответственно — (v2/2)tr[QI ], уЧт [Ql ] и (у2/2)Х
Xtr[QIf ], 72tr [QIf ].
17.4.4. Расстояние между предельными распределениями. Рассмотренные
асимптотические свойства статистики логарифма отношения правдоподобия
имели место при сближающихся гипотезе и альтернативе, т. е. при сближаю-
сближающихся вероятностных мерах наблюдаемых выборок, когда сигнала нет и когда
сигнал присутствует. Следует, однако, подчеркнуть, что сближаются распреде-
распределения только выборок, но не статистик логарифма отношения правдоподобия
при гипотезе и при альтернативе. Основное условие A7.4), исключающее син-
сингулярные решения, влечет за собою конечное «расстояние» между предельны-
ными распределениями статистик логарифма отношения правдоподобия при
гипотезе и при альтернативе. Мерой такого расстояния может служить вели-
величина
A7-70)
Из полученных результатов следует, что расстояние между предельными рас-
распределениями статистик логарифма отношения правдоподобия равно: в случае
независимой выборки (см. теорему 1)
/2, A7.70а)
в случае независимой последовательности векторных выборок (см. теорему 2)
rf=' [y'By]1/2, A7.706)
в случае многосвязной марковской последовательности (см. теорему 3)
J = 7[trQI/]1/2. A7.70b)
508
17X5. Локаэдотя асимптотическая нормальность. Асимптотическая нор-
нормальность статистики логарифма отношения правдоподобия используется не
только при проверке близких гипотез, но и при исследовании статистических
оценок (см. ]]55, гл. 2)]).
Пусть Т — переменная величина, характеризующая длительность наблюде-
наблюдения Хт, представленного в векторной форме или в форме непрерывной реали-
реализации. Обозначим через P{T)q, бев, 0eR\ вероятностную меру на интервале
Т, зависящую от параметра 6. Производную Радона — Никодима
h (Хт |в1# в2) = dPg>/d PJ?> A7.71)
абсолютно непрерывной компоненты Р{Т)&2 по Р{Т)&1 на наблюдении Хт наг
зовем отношением правдоподобия (функционалом отношения правдоподобия).
Семейство мер Р(ТH называется локальной асимптотически нормальным
в точке 60ев при Г-^оо, если для некоторой невырожденной матрицы ф(Г,
Gjo) размером kxk и любого y^.Rh справедливо представление
(ХТ\Г. %)=
, в0). A7.72)
При Т-+оо распределение случайного вектора Ат,@ сходится по мере
к .нормальному с нулевым средним и единичной ковариационной матрицей раз-
размером &Х&, а остаточный член i|?t(y> в0) сходится по той же вероятностной
мере к нулю для любого veRft-
Рассмотренные асимптотические разложения логарифма отношения прав-
правдоподобия (для дискретного времени) являются частными случаями разложения
A7.72). Например, при k=\. Т=п, 60 = 0, <р(Т, 60) = (nIfW8L2 из A7.72) сле-
следует A7.58), если положить
Г1/2 2 s*/(**)- 07.73)
17.5. ПРЕДЕЛЬНЫЕ РАСПРЕДЕЛЕНИЯ
ОТНОСИТЕЛЬНО СМЕЩЕННЫХ ГИПОТЕЗ
17.5.1. Постановка задачи. В § 17.4 исследовалось асимптоти-
асимптотическое разложение логарифма отношения правдоподобия
ln/(x|*)=ln[ai(x|*)/w(x|0)] A7.74)
в задаче проверки гипотезы Я — выборка х принадлежит распре-
распределению ш (х|0)—против «близкой» альтернативы К_—выборка
х принадлежит распределению ш(х|'в'), где ft=ysfV п. Рассмот-
Рассмотрим теперь асимптотическое разложение статистики A7.74) при
смещенных гипотезе и альтернативе: выборка х принадлежит рас-
распределению и(х|0) (смещенная гипотеза Я*) или распределению
и(х\$) (смещенная альтернатива /С*).
17.5.2. Независимая выборка. Предположим, что при гипотозе
Я* плотность вероятности и(х|0) выборочного значения помехи
удовлетворяет условию вида A7.23). Тогда аналогично A7.50) ло-
509
гарифм отношения правдоподобия для независимой выборки по-
помехи при условии A7.4) можно представить в виде
?[y?44^)] <1775>
где
dk A7J6>
A7.76a)
n*i fe(*) I//•}=<>, A7.766)
lg=ml{gi(x)\H*}, 0<Ig<oo. A7.77)
Следуя той же последовательности рассуждений, что и в п. 17.4.1,
можно получить следующее асимптотическое разложение:
lnl*(x\ti)=yy*n(x)-(y*/2)lgWt+r\*n(x, y/Vn), A7.78)
где
Уп (х) = —тг 2 st ё (*«)» tf 17.79)
хГ ^Х 0. A7.79а)
Статистика г/*п(х) асимптотически нормальная и при гипотезе
Я*, и при альтернативе К* с параметрами 0, lgW8 и y^^s» I*^«
соответственно.
Как показано в п. 17.4.1, асимптотическое разложение лога-
логарифма отношения правдоподобия A7.74) определяется статисти-
статистикой A7.59). Найдем среднее значение этой статистики при сме-
смещенной гипотезе Я*, т. е. когда плотность распределения выбороч-
выборочного значения х\ равна и(х\0):
it. A7.80)
Введем вместо уп (х) статистику
). A7.81)
Уп м
где
s~=— Ssft. A7.81a)
510 ,
Тогда очевидно
ш1{упо(х)|Я*}=0. A7.816)
Дисперсия статистики A7.81) при гипотезе Я*
MW*)I^==M/(*)I#*}— S (Si-~s)* = lfU Wgn0, A7.82)
п t=i
где
1/*=М/(*)!#*Ь J f*(x)u(x\0)dx-
—oo
-(jf(x)u(x\O)dx>j\ A7.83)
Wen0 - — 2 (si - s)« = - 2 *? - s2- A7-84)
Ковариация статистики г/*п(х) и г/по(х) при гипотезе Я*
"*! {^п (х) г/„0 WI ^*} = «1 f — 2 «I в («i) X
х 2 (Si-
Следовательно,
«1 {У*п (х) г/„о (х)} =me}Wsn0, A7.85)
где
mg/ ¦= Щ {§ (х) f (х) |Я*} = J g (х) f (х) и (х\0) их. A7.86)
—оо
Для вектора с компонентами (уп0(х), In /* (х|О)) выполняют-
выполняются условия двумерной центральной предельной теоремы. По-
Поэтому при гипотезе Я* предельное распределение этого век-
вектора— нормальное, с параметрами: средние значения компонент
О, —(y2l2)lgWs, ковариационная матрица
0 ymgf Ws0\
s, f\gWs У К
где
rso = limrsno. A7.87a)
Можно показать (см. [42, с. 263]), что и при альтернативе К*
статистика jfao(x) асимптотически нормальна с параметрами
gfWso, lfuW8o.
17.5.3. Независимая последовательность векторных выборок.
Результаты п. 17.5.2 обобщаются на независимую последователь-
511
ность векторных выборок. Используя обозначения п. 17.4.2 и сфор-
сформулированные там условия, запишем аналогично A7.62)
A7.88J
<17-88а>
Компоненты вектора y*n (xni):
Vni (х?) = -^ Ъ sugj (xf), i-TTr , A7.89)
где
= о, у = Т7Т, f=-T77i. A7.896)
Статистика 7'y*n(xni) асимптотически нормальна с нулевым сред-
средним и дисперсией 7 ***7 при гипотезе Я*, и со средним 7^*7 и
той же дисперсией при альтернативе К*. Элементы матрицы В*
размером гХг
BUi=QulUb A7.90J
где Qij определены согласно A7.60), а величины 1*^ получаем
из A7.27) заменой функции / на функцию g. Статистика A7.88)
также асимптотически нормальна и при гипотезе Я*, и при аль-
альтернативе /С* с одинаковыми дисперсиями, равными 7^*7» и с0
средними значениями —yfB*yf2 при гипотезе Я* и 7^*7/2 при
альтернативе К*.
Найдем среднее значение статистики A7.63) при гипотезе Я*а
= J/7-(x)a(x|0)dx-L2%. A7.91)
х bV>>;- Уп w
Введем центрированные статистики
= -L 2 (su-Ъ) fj (xi)> / = ~r . A7-92)
У n t=i
где
^•—Е^. A7.92а)
Тогда
ml{ynjo(xnl)\H*}=O. il7.926)
512
Ковариация статистик ynjo(^ni) и j/ngo(xni) при гипотезе Я*
— 2 2 foj -~si) Eft« -~sq) cov"* tf / (xi) /q Ы}. A7.93)
П
Так как x* и xft при i^fe независимы, то
covh* {/j (x»)f9 (хл)} =6<fcaig, A7.94)
где
a,-, = соуя- {/; (x) fq(x)} - J fj (x) /g (x) a (x|0) dx -
X
-J/;(x)w(x|0)dx J/e(x)a(x|0)dx. A7.94а)
X X
Подставляя A7.94) в A7.93), получаем
COVh* {ynjo(Xn\)ynqo(Xni)}=Gjq(Qq}— SqSj). A7.95)
Ковариация статистик #*nj(xni) и f/ngo(xni) при гипотезе Я*
= — S S ^ (skg -lg) соуя* {g; (x,) /g (A»)}. A7.96)
n 1=1 fe=i
Далее
covh* {й(^)/в(^)}=*^Лэ A7.97)
где
vig = созя* te; (x) /, (x)} = J gy (x) fq (x) u (x|0) dx. A7.97a)
X
Подставляя A7.98) в A7.96) и учитывая A7.896), находим
COVH* {У*^(ХП!)уП9о(ХП1) =Vjq{Qqj—SqSj). A7.98)
[5] {
{У^()у9() jq{qjqj) ()
Можно доказать (см. [56]), что векторная статистика Упо{хп\) с
компонентами A7.92), при гипотезе Я* асимптотически нормаль-
нормальная с нулевым вектором средних и ковариационной матрицей, эле-
элементы которой определены в A7.95), будет также асимптотически
нормальной и при альтернативе К* с той же ковариационной мат-
матрицей и вектором средних y'N, где N — матрица с элементами, оп-
определяемыми согласно A7.98).
17.5.4. Многосвязная марковская последовательность. Пред»
положим, что переходная плотность вероятности и(х\у, О) мно»
госвязной марковской последовательности удовлетворяет услови-
условиям, указанным в п. 17.2.3. Тогда аналогично A7.64) асимптотиче-
асимптотическое разложение логарифма отношения правдоподобия
?2 g(xU)s!_ft
^Ц Х-/Ч-. . ^) , A7.99)
17-87 513
где g (x) — вектор с компонентами
A7.100)
h=mi{g(x)S'(x)\H*} A7.101)
— информационная матрица Фишера, Q — положительно опреде-
определенная матрица с элементами, определенными в A7.66), и
п.в
т)п -*• 0.
П-ЬОО
Статистика
Уп (х) - -^ 2 б' (*U) sLk A7.102)
Уп i=\
асимптотически нормальна и при гипотезе Я*, и при альтернати-
альтернативе К* с параметрами 0, tr[QIg] и у*г[Фе]» tr[QIg] соответственно
4см. п. 17.4.3).
Среднее значение статистики A7.68) при гипотезе Я*
^{Уп(х)|Я*} = ^ 2 2 mAfjti-idmSi-j. A7.103)
Введем также центрированную статистику
Упо(х) =Уп(х)-т1{уп(х) |Я*}. A7.104)
Дисперсия статистики уп{х) при гипотезе Я*
МУп(х) \Н*}=гпг{у*п(х) \Н*}-т^{уп(х) |Я*}.
Далее
-!-^ 2 2 2 mi(/i(xU) X
Обозначая элементы матриц Vm)jU и Q<m>:
1у") = m, {/7. (xj-k) fq (х^_т)|Я*}, A7.105а)
<> lJ ^_,s,_,_m, A7.1056)
лолучаем при
roiten(x)|tf*}- lim J1 tr[\\?Q{m)] =
= tr [l}«0) Q@)] + 2 lim^f1 tr [l|?) Q(m)]. A7.106)
514
Ковариация статистик #V(x) и #по(х) при гипотезе Н* (при
)
{Уп (х) (/по (х)|#*} = lim т1 \ — х
/1-юо ^ Л
X 2 2 *,(x'-*)si-; 2 2
+ 2 lim s tr[CQ(m)], A7.107)
n-*«>m=l
где Vm)gfu — матрица размером kxk с элементами
$m) - «i iei (*i-k) f (xtk-m)\H% A7.107a).
Если существуют конечные пределы
lim " trII^Q^l-Яу., A7.108a)»
lim L"i' trlCQ^l-Я^, A7.1086>
то для векторной статистики с компонентами [t/no(x), (|)
выполняются условия двумерной центральной предельной теоремы.
Поэтому при гипотезе Н* предельное распределение этого векто-
вектора нормальное с параметрами: средние значения компонент 06
(—Y2/2)tr[QIg], ковариационная матрица
Y2tr[QIg] )
Можно доказать (см. [42], с. 263), что статистика упо{х) и при
альтернативе К* асимптотически нормальна с параметрами
5Г5
Глава 18
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЕ
ДИСКРЕТНО-АНАЛОГОВЫЕ АЛГОРИТМЫ
ОБНАРУЖЕНИЯ СИГНАЛОВ НА ФОНЕ
АДДИТИВНЫХ ПОМЕХ
18.1. АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЙ АЛГОРИТМ
ОБНАРУЖЕНИЯ ДЕТЕРМИНИРОВАННОГО СИГНАЛА
НА ФОНЕ НЕЗАВИСИМОЙ ПОМЕХИ
18.1.1. Синтез алгоритма. Рассмотрим задачу обнару-
обнаружения детерминированного сигнала ks(t), Л>0 на фоне аддитив-
аддитивной независимой помехи l(t) с плотностью распределения w(x),
органичиваясь классом дискретно-аналоговых алгоритмов. После
временной дискретизации наблюдаемой реализации x(t) в мо-
моменты времени tu ..., U получаем выборку х=(хи ..., хп) раз-
размером n, Xi=x(ti), t=l, я, и тогда задача обнаружения сигнала
состоит в проверке гипотезы Н (сигнала нет):
*=1, п, A8.1а)
против альтернативы К (сигнал присутствует):
Xi=li+Xsit Si=5(/i), i=l, n. A8.16)
Если выполнены условия теоремы 1 (см. п. 17.4Л), то асимпто-
асимптотически оптимальный дискретно-аналоговый алгоритм обнаруже-
обнаружения детерминированного сигнала на фоне аддитивной независи-
независимой помехи имеет следующий вид:
^2sJ(**)IU A8.2)
У Л /=1 Yo
где
f{X)-^—\-d^-^-j-\nw{x). A8.3)
w (х) ах ах
Предельное (при п-*оо, %Yn=y<.oo) распределение статистики
A8.2) нормальное с параметрами 0, lfWs при гипотезе Яис па-
параметрами ylfWs, lfWs при альтернативе /(. Величина Ws опреде-
определяется согласно A7.56), I/ — информация по Фишеру для помехи
(см. A7.22)J. Заметим, что статистика уп(х) при гипотезе Я всег-
всегда центрирована, даже если распределение помехи несимметрично.
18.1.2. Анализ алгоритма. Предельная рабочая характеристи-
характеристика алгоритма A8.2)
Xn-x^-d-vlhWjW, A8.4)
где мл, *i-a — дроцентные точки стандартного нормального рас-
516
пределения для заданных вероятностей а ложной тревоги и 1—р
правильного обнаружения сигнала. При этом в A8.2) порог
c=xa[lfW8y2. A8.5)
Отметим, что при фиксированных значениях а, р, I/, W8 фор-
формула A8.4) определяет минимально необходимую (пороговую)
амплитуду сигнала
К = ylV~n--= (ха - *1-р)/И/ Ws]l/2. A8.6)
Определим КАОЭ асимптотически оптимального алгоритма
A8.2) по отношению к линейному алгоритму
Ум (х) = —=. Ъ sixi $^о» Aо-7)
оптимальному при любом размере выборки, если помеха гауссов-
ская. Так как рабочая характеристика алгоритма A8.7) обнару-
обнаружения сигнала Xs(t) на фоне аддитивной центрированной гауссов-
ской помехи с дисперсией а2 [см. A5.20)]
то, используя формулу A7.11), находим из A8.4) и A8.8) иско-
искомый КАОЭ
Р = а21/, A8.9)
где [см. A7.22I
h
Т Г— \nw(x)]2w(x)dx.
_ оо I dx I
A8.10)
18.1.3. Структурная схема алгоритма. Алгоритм обнаружения
сигнала A8.2) допускает простую интерпретацию (рис. 18.1). Об-
Обнаружитель сигнала состоит из трех блоков: безынерционного не-
нелинейного преобразователя наблюдаемых выборок, дискретного
коррелометра, устройства сравнения с порогом выхода корреломет-
коррелометра. Характеристика f(x) нелинейного преобразователя зависит
только от распределения помехи. Размер порога определяется ве-
вероятностью а ложной тревоги, мощностью Ws сигнала и информа-
информацией по Фишеру I/ о помехе:
18.1.4. Информация по Фишеру для некоторых типов помех.
Найдем информацию по Фишеру I/ для помех с фиксированной
дисперсией а2 и часто используемыми распределениями вероятно-
вероятностей.
Рис. 18.1. Схема асимптотиче-
асимптотически оптимального обнаружите-
обнаружителя детерминированного сигна-
сигнала на фоне независимой помехи
517
Для центрированной гауссовской помехи с плотностью
из A8.10) получим
1/=1/а2. A8.12)
Для лаплассовского распределения с плотностью
ш(*) = -4=ехр. -Л/ — \х\ A8.13)
из A8.10) получим
1, = 2/а2. A8.14)
Рассмотрим обобщенное экспоненциальное распределение с
плотностью
/fli^П A8.15)
w(x)xp/fl
где
А1(с)=.а[ГA/с)/ГC/с)]1/2, 01/2. A8.15а)
Функция A8.15) (рис. 18.2) симметрична относительно нуля, уни-
унимодальна, а параметр а2 представляет дисперсию. Нормальное и
лапласовское распределения являются частными случаями A8.15)
при с=2 и с=1 соответственно. Информация по Фишеру для по-
помехи с плотностью A8.15)
1 = (с/оJГC/с)ГB— \/с)/ГЦ1/с). A8.16)
Для логического распределения с плотностью
<Ш7)
из A8.10) после замены переменной интегрирования
получим
1/==л;2/(9а2). A8.18)
Заметим, что при |л:|/а>1 плотности лапласовского и логиче-
логического распределений, как и плотность
w (х) ={2о ch {пх/2в)]~1 A8.19)
практически совпадают.
Рассмотрим обобщенное распределение Стьюдента с плотно-
плотностью
w(x)= с1д(*/2, 1/с)]-1 ^ + [|^|/,4 (V c)]c}-(v/2+i/c) A8.20)
2^2(v,c)
где
T(v/2 — 2/с)ГC/с)
518
п./. vc>4(C>0( A8.20а)
J
ъи(х/в)
-1
2 x/6
Рис. 18.2. Обобщенное экспоненци- Рис. 18.3. Распределение Стьюдента
альное распределение
причем бета- и гамма-функции связаны соотношением
B(v/2, l/c)=r(v/2)r(l/c)/T(v/2+l/c).
Плотность A8.20) симметрична относительно нуля, унимодальна,
параметр а2 представляет дисперсию. При с=2 из A8.20) полу-
получаем известное распределение Стьюдента с v—2 степенями свобо-
свободы [ср. с A4.111)]:
На рис. 18.3 построена зависимость A8.21) для v=3, штриховой
линией показана плотность нормального распределения. Инфор-
Информация по Фишеру для помехи с плотностью A8.20)
I = (cv/2 + 1J Г C/2) Г B - 1 /с) Г (у/2 —2/с) Г (у/2 + 1/с) Г (у/2 + 2/с)
A8.22)
При с=2 (распределение Стьюдента) из A8.22) следует
I/==v(v+l)/[a2(v-2)(v+3)], v>2. A8.23)
При v-^oo из A8.23) следует 1/->1/ог2, как и должно быть, пото-
потому что при v->oo функция A8.21) сходится к плотности нормаль-
нормального распределения (см. п. 14.5.4).
Заметим, что во всех рассмотренных случаях I/^l/a2, причем
знак равенства соответствует гауссовской помехе. Можно доказать
(см. [7], с. 558), что в классе всех дифференцируемых плотностей
w(x), —оо<;л;<;оо с заданной дисперсией а2 значение I/ инфор-
информации по Фишеру минимально при нормальном распределении.
18.1.5. Характеристики нелинейных преобразователей для не-
некоторых типов помех и соответствующие асимптотически опти-
оптимальные алгоритмы обнаружения. Для гауссовской помехи с ну-
нулевым средним и дисперсией а2 из A8.3) и A8.11) получим
!(х)=ф\ A8.24)
т. е. характеристика преобразователя линейная. Асимптотически
оптимальный алгоритм обнаружения в этом случае совпадает с
оптимальным по критерию Неймана — Пирсона алгоритмом об-
обнаружения сигнала при любом размере выборки [см. A8.7)].
519
О 1
-1
f(x)/ts Для лапласовской помехи с плот-
ностью A8.13)
/W = K2M2sgnx, A8.25)
2 х/& где sgnx — знаковая функция [см.
A3.63)]. Нелинейный преобразователь
наблюдаемых выборок представляет в
этом случае идеальный ограничитель
Рис. 18.4. Характеристика иде- (рис. 18.4). Подставляя A8.25) в A8.2)
алыюго ограничителя • и учитывая A8.5), A8.24), находим
асимптотически оптимальный алгоритм
обнаружения детерминированного сигнала на фоне аддитивной не-
независимой лапласовской помехи
A8.26)
У Л i=\ Yo
Для обобщенного экспоненциального распределения [см. A8.15)]
f(x)=c[Ai(c)]-*\x\*+sgnx% 01/2. A8.27)
Для помехи с логическим распределением [см. A8.17)]
/(ж)-- » thf-S^.
A8.28)
Нелинейный преобразователь в этом случае представляет сгла-
сглаженный ограничитель (рис. 18.5). Аналогичная характеристика
преобразователя получается и для помехи с плотностью A8.19).
Подставляя A8.28) в A8.2) и учитывая A8.5), A8.18), нахо-
находим асимптотически оптимальный алгоритм обнаружения детер-
детерминированного сигнала на фоне аддитивной независимой логисти-
логистической помехи
п f=i
A8.29
1
-2
f(x)M
2
1
-1 /
-
- /
/ i
0 1
2 щ?в
f(x)/6
-2 -1
Рис. 18.5. Характеристика
сглаженного ограничителя
520
О 1 2 х/6
Рис. 18.6. Характеристика нели-
нелинейного преобразователя для
помехи, распределенной по за-
закону Стьюдента
Для помехи с распределением Стьюдента [см. A8.21)}
f(x) = v-±± ^ , v>2. A8.30)
Зависимость A8.30) при v=3 представлена на рис. 18.6.
Подставляя A8.30) в A8.2) и учитывая A8.5), A8.23), нахо-
находим асимптотически оптимальный алгоритм обнаружения детер-
детерминированного сигнала на фоне аддитивной независимой помехи,
распределенной по закону Стьюдента
— 2 s,*i I 1 + -^Г Wk.—Г . A8.31)
Ул,Г, L o"(v-2)J ^ a [ ev-l J l
Для обобщенного распределения Стьюдента [cfo. A8.20)]
f(x) = (v/2+l/c)[A2(v9 с)]-*\х\*-*{1 +
+{\x\/A2(vt c)]*}-lsgnx9 vc>4, c>0. A8.32)
18.1.6. Эффективность асимптотически оптимальных алгорит-
алгоритмов относительно линейного. Линейный алгоритм A8.7), наибо-
наиболее простой для практической реализации, оптимален только при
обнаружении детерминированного сигнала на фоне аддитивной не-
независимой гауссовской помехи. Если линейный алгоритм исполь-
используется для обнаружения сигнала на фоне негауссовской помехи,
то его рабочая характеристика ухудшается, иногда весьма суще-
существенно. С другой стороны, при произвольном распределении по-
помехи можно использовать асимптотически оптимальный алгоритм
A8.2), который хотя, и сложнее линейного, но обладает лучшей
рабочей характеристикой. Количественным показателем такого
улучшения служит КАОЭ, определяемый по формуле A8.9).
Воспользуемся результатами п. 18.1.4 для определения КАОЭ
асимптотически оптимальных алгоритмов обнаружения сигнала по
отношению к линейному для некоторых типов аддитивных помех.
Дисперсия помехи а2 во всех рассматриваемых случаях одинако-
одинакова. При обнаружении на фоне гауссовской помехи [см. A8.12),]
«сак и следует ожидать,
р=1. A8.33)
При обнаружении на фоне лапласовской помехи [см. A8.14)]
р = 2, A8.34)
т. е. асимптотически оптимальный алгоритм эффективнее линей-
линейного в два раза. При обнаружении на фоне логистической помехи
[см. A8.18)]
р = я2/9. A8.35)
При обнаружении на фоне помехи, распределенной по закону
Стьюдента [см. A8.23)],
p = v(v+l)/[(v—2)(v+3)], v>2. A8.36)
Из A8.36) следует, что при увеличении параметра v КАОЭ моно-
521
тонно уменьшается и стремится к единице при v-^oo. Если v — це-
целое число, то максимальное значение КАОЭ р=2, соответствую-
соответствующее v=3.
18.2. УСТОЙЧИВОСТЬ АСИМПТОТИЧЕСКИ
ОПТИМАЛЬНОГО АЛГОРИТМА ОБНАРУЖЕНИЯ
ДЕТЕРМИНИРОВАННОГО СИГНАЛА
18.2.1. Устойчивость асимптотически оптимальных алгоритмов.
Предположим, что алгоритм обнаружения детерминированного
сигнала, асимптотически оптимальный относительно аддитивной
независимой помехи с плотностью распределения w(x), использу-
используется для обнаружения сигнала на фоне аддитивной независимой
помехи с другой плотностью и(х). Обозначим, как и в п. 17.1.5»
этот алгоритм через 6u\w а алгоритм обнаружения, асимптотиче-
асимптотически оптимальный относительно помехи с плотностью распределе-
распределения и(х), через 8U. Алгоритм 6U \w использует центрированную
статистику #по(х) [см. A7.81)], а алгоритм 8и — статистику #*п(х)
[см. A7.79)]. Согласно п. 17.5.2 эти статистики асимптотически
нормальные с параметрами
mi{yno\H*}=O, ml{yno\K*}=ymgfW8o, A8.37a)
= ix2{ynO\K*} = lfuWso, A8.376)
=0, mi{yn\K*}=ylgW89 A8.37в)
= lx2{y*n\K*} = IgW8, A8.37r)
где W8, lg, Wso, lfUi mgf определяются согласно A7.56), A7.77),
A7.84), A7.83), A7.86) соответственно.
Теперь, используя A7.16), нетрудно найти КАОЭ алгоритма
6W \w по отношению к алгоритму би. Из A8.37а) следует
al=m8fWaof o2i = lfuWs0, a=lgW89 o2 = lgW8. A8.38)
Подставляя A8.38) в A7.16), получаем
^^ A8.39)
или, учитывая A7.77), A7.83), A7.86),
ту/ I оо \2
P(SW|«,,6J = ^^ I g(x)f(x)u(x)dxj х
X {Г ] f2(x)u(x)dx^
-I] f(x)u (x) dxj] ] g2 (x) и (x) dxy\ A8.40)
Если плотности w(x) и и(х) симметричны относительно нуля,
оо
то J f(x)u(x)dx=0, и нет необходимости центрировать статисти-
—оо
522
ку A7.59). В этом случае W8o/Ws=l9 а выражение A8.40) приоб-
приобретает более простой вид
РFИ,„,8J = I ] g(х) f (х)и (х)dxY х
X I J f*(x)u(x)dx J g2(x)u(x)dx\~\ A8.41)
[_ oo —00 J
Формула A8.41) представляет квадрат коэффициента корреляции
случайных величин f(x) и g(x)> когда плотность распределения
случайной величины х равна и(х). Поэтому р^1, причем равен-
равенство достигается при f(x) =g(x).
18.2.2. Устойчивость линейного алгоритма. Как уже отмечалось,
линейный алгоритм A8.17) оптимален при аддитивной независи-
независимой гауссовской помехе. Предположим, что линейный алгоритм
используется для обнаружения детерминированного сигнала на
фоне аддитивной независимой негауссовской помехи с дисперсией
а2 и плотностью распределения и(х). Найдем КАОЭ алгоритма
Ъи |н по отношению к алгоритму 8и, асимптотически оптимальном
при помехе с плотностью и(х). Так как для линейного алгоритма
f(x)=x/a29 то [см. A8.41)]
Р(8и|н, SJ = ( J xg(x) и (х) dx\ х
х Г J **u(x)dx J g2(x)u(x)dx]~1
I— oo —oo J
xg(x)u(x)dxY/(o*\g).
Далее, учитывая, что g(x) =^
dx
OO схэ
J xg (x) u(x)dx= — J xdu (x) = 1,
— oo —oo
получаем
. A8.42)
Кроме того, из A8.10) находим
8W|h). A8.43)
Тогда из п. 18.1.6. непосредственно следует, что КАОЭ линейно-
линейного алгоритма, применяемого для обнаружения сигнала на фоне
аддитивной независимой помехи по отношению к асимптотически
оптимальному алгоритму при той же помехе, равен:
при лапласовской помехе
н,6„)=1/2, A8.44а)
523
при логистической
рFы|н,6иН9/я2, A8.446)
при помехе, распределенной по закону Стьюдента,
(v^ + 3)v>2. A8.44b)
H,6a)^ ,v>2.
18.2.39. Устойчивость знакового алгоритма. Знаковый алгоритм
A8.26)—асимптотически оптимальный при обнаружении детер-
детерминированного сигнала на фоне аддитивной независимой лапла-
совской помехи. Предположим, что знаковый аглоритм 6и\л ис-
используется при помехе с плотностью и{х)у отличающейся от лап-
ласовской. Фиксируя дисперсию а2 помехи и сохраняя предполо-
предположение о симметрии функции и(х), а также учитывая A8.35), на-
находим из A8.41)
Р F»|л, 6J = I J sgnxg (х) и (х) dx х
X Г J g^x)u(xydxY\
Но
J sgn xg (x) u(x)dx = - У sgn xdu (x) =¦¦
и, следовательно,
рF«|л,6я) = 4и2(())/1*. A8.45)
Из результатов, приведенных в п. 18.1.4, непосредственно сле-
следует, что КАОЭ знакового алгоритма, используемого для обна-
обнаружения сигнала на фоне аддитивной независимой помехи, по от-
отношению к алгоритму, асимптотически оптимальному при той же
помехе, равен:
при гауссовской помехе
Р (бщ л. 6«) = 4а2 а2 @) = 2/я, A8.46а)
при логистической
Р FИ|Л, 6J - 36а2 и2 @)/я2 = 3/4, A8.466)
при помехе, распределенной по закону Стьюдента,
Из A8.46в) следует, что при v = 3 р = 8/л2, а при 3^v^c» КАОЭ
изменяется в пределах 08064
524
18.3. АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЙ АЛГОРИТМ
ОБНАРУЖЕНИЯ ДЕТЕРМИНИРОВАННОГО СИГНАЛА
НА ФОНЕ КОРРЕЛИРОВАННОЙ ПОМЕХИ
18.3.1. Синтез алгоритма. Рассмотрим задачу обнаружения де-
детерминированного сигнала Ks(t) на фоне аддитивной А-связной
марковской помехи. Используем исследованные в п. 17.4.3 асимп-
асимптотические свойства достаточной статистики логарифма отноше-
отношения правдоподобия. Если выполнены условия теоремы 3, то асим-
асимптотически оптимальный дискретно-аналоговый алгоритм обнару-
обнаружения детерминированного сигнала на фоне аддитивной й-связ-
ной марковской помехи имеет следующий вид [см. A7.68)]:
Уп(хН-^2 f'(xU)sU =
Уп 1=1
= -р 2 2 U (*U) * Vi-j) Ь С A8.47)
Уп *=1 /=0 Yo
где fj — компоненты вектора V [см. A7.30)].
Предельное (при /z-^oo, XK^=7<°°) распределение статис-
статистики f/n(x) —нормальное с параметрами 0, tr[QIf] при гипотезе
Н (сигнала нет) и с параметрами у tr[QIf ], tr[QIf ] при альтер-
альтернативе К (сигнал присутствует), где
A8-48)
Ijq и Qqj — элементы матриц If и Q, определенные в A7.32) и
A7.66).
18.3.2. Анализ алгоритма. Предельное значение порога с в
A8.47)
A8.49
а предельная рабочая характеристика алгоритма A8.47)
A8.50)
При фиксированных значениях вероятностей а ложной тре-
тревоги и 1—р правильного обнаружения, а также величины tri[QI
минимально необходимая (пороговая) амплитуда сигнала
К- Y/f"H*a-*i40("tr[QIf])-i/2. A8.51)
Определим КАОЭ алгоритма A8.47) по отношению к линейно-
линейному алгоритму
^0)(х)--т=2 ЩХгЪс* , A8.52)
Уп t=l Yo
где вектор п=(ии ..., ип) равен u = s/K~1, К — корреляционная
матрица помехи, когда этот линейный алгоритм используется для
обнаружения детерминированного сигнала на фоне аддитивной
525
Л-связной марковской помехи. Как показано в п. 15.1.5 алгоритм
A8.52) обнаружения детерминированного сигнала на фоне адди-
аддитивной коррелированной гауссовской помехи оптимальный по
критерию Неймана — Пирсона для любого размера п выборки.
Статистика у{%(х) в A8.52) при гауссовской помехе распре-
распределена нормально с параметрами 0, s'Krls/n при гипотезе Н и
Y^s'K-^s/rt, srK~!s/n при альтернативе К, где уо==кУп, О<7о<°°.
Величина со определяется по формуле:
*'К-1 s/n)*/2. A8.53)
A8.54)
Рабочая характеристика алгоритма A8.52)
ха — Xi—0 — dnf
где
A8.55)
При неограниченном увеличении размера п выборки распределе-
распределение статистики у(%(х) остается нормальным с ограниченными
средними значениями и дисперсиями при гипотезе и альтернати-
альтернативе, если только
lim d2nlvl - lim s' К-1 s/л = e* < oo. A8.56)
П-»оо
Предельная рабочая характеристика получается из A8.54) за-
заменой параметра dn его предельным значением
voe. A857)
Из A8.50) и A8.54) с учетом A8.57) находим КАОЭ алго-
алгоритма A8.47) по отношению к линейному алгоритму A8.52):
P=(Yo/?J=tr[QI,]/e2. A8.58)
18.3.3. Структурная схема алгоритма. Алгоритм A8.47)
(рис. 18.7) предписывает следующую последовательность опера-
операций:
л
г.
Рис. 18.7. Схема асимптотически оптимального обнаружителя сигнала на фоне
многосвязной марковской помехи
626
1) накопление k выборок x°_fe+1 и k+1 значений сигнальной
функции sL-jh-i;
2) наблюдение в момент времени t = t\ выборки x\ = x(t\);
3) вычисление компонент вектора f(x1_ft+i);
4) вычисление корреляционной суммы f(xL-ft+i^-fc+i;
5) наблюдение в момент времени t=t2 выборки x2 = x(t2);
6) повторение операций 3 и 4 при x2_fe+2, s2_k+2;
7) повторение операций 3 и 4 после наблюдения х$,..., хп\
8) суммирование п корреляционных сумм;
9) сравнение результата суммирования с порогом;
10) принятие решения.
Обнаружитель сигнала состоит из четырех блоков: инерци-
инерционного нелинейного преобразователя наблюдаемых выборок, со-
состоящего из линии задержки ЛЗ («память») и ^-канального
спецвычислителя компонент вектора f; коррелометра К, в кото-
котором выполняются операции перемножения выходных значений
спецвычислителя со значениями сигнальной функции s и сумми-
суммирования полученных произведений; накопителя корреляционных
сумм и сумматора накопленных значений в конце наблюдения;
устройства сравнения с порогом. От вида распределения помехи
зависят только характеристика инерционного нелинейного пре-
преобразователя и величина порога.
18.3.4. Асимптотически оптимальный алгоритм обнаружения детерминирован-
детерминированного сигнала на фоне аддитивной односвязной марковской помехи. Рассмотрим
частный случай алгоритма A8.47), когда k=A и плотность вероятности перехо-
перехода равна w(xi\xi-\). В этом случае асимптотически нормальная статистика
ffn(x)=-7z 2 toMx'-iJ + si-iMxi-!)], A8.59)
У Я ?=1
где
/о (*i-i)= - "^7 lna>fal*i-ib A8.59a)
il*i-i). A8.596)
OXi~1
При*сипотезе Н среднее значение статистики A8.59) равно нулю, а дисперсия
+ st si-t щ {/о (x,L i) /i (x'-i) I Я} + si S|_i тх {h (x,'_,) /0 (x{_,) | Я) +
+ si-i si-t щ {/, (x,L,) h (A-\)
Но в соответствии с A7.67)
527
Поэтому
4" 2 $
2 (— 2 в,в,_Л т1{/§(х{_1)/1(х{_
2 в?»
1 п
Hm — 2 «J,
п-+оо П ^j *
При п-+&
lim \x
rt-»oo
где
Io = /71}
I01 = m
Обозначая
перепишем A8.61) в виде
tr[QI/]=Ws(Io+2rs
I n
— 2
!)—
В рассматриваемом случае односвязной марковской помехи [см.
КАОЭ алгоритма A8.47) по отношению к линейному A8.52)
где
e2 = lim s' К
п-»оо
и К — корреляционная матрица марковской помехи размером пХп.
A8.60)
A8.61)
A8.6la)
A8.616)
A8.61b)
A8.61r)
A8.62)
A8.63)
A8.58)]
A8.64)
A8.64)
18.3.5. Асимптотически оптимальный алгоритм обнаружения
детерминированного сигнала на фоне 7-зависимой помехи. Пред-
Предположим, что наблюдаемая реализация x(t) представляет либо
Г-зависимую помеху (гипотеза Я), либо аддитивную смесь этой
помехи с детерминированным сигналом (гипотеза /С). Если реа-
реализация x(t) подвергается временной дискретизации через интер-
интервал Т/т, то из mN зависимых скалярных выборок можно сфор-
сформировать M=mN/(m+n—1) независимых n-мерных векторных
528
ВЫбОрОК Xi, ... , ХМ
s=l,A2, и моменты tij определяются согласно A6.82).
Из теоремы 2 (см. п. 17.4.2) непосредственно следует, что в
рассматриваемом случае асимптотически достаточной является
векторная статистика ум(хм!) с компонентами
A8.65)
\nw(xil9..., xin), A8.65a)
ш(^1, ..., zn) —многомерная плотность распределения помехи.
Предельное при М-^оо распределение статистики ум(хм0
нормальное с параметрами О, В при гипотезе Н и у В, В при аль-
альтернативе К (см. п. 17.4.2).
Рассмотрим статистику
У ( xf) = с' УЛ| (О = 2 cj УМ! ( xf). A8.66)
/=•1
которая представляет скалярное произведение вектора с/=(сь...
..., см) постоянных весовых коэффициентов и векторной статис-
статистики ум(хм!). Статистика A8.66) асимптотически нормальна с
нулевым средним и дисперсией tr[Q*I ] при гипотезе Я и с пара-
параметрами ytr[Q*Ii], tr[Q*If ] при альтернативе /С, где Q* — мат-
матрица с элементами
Q*qj = cqCjQqh q, /=1, M. A8.67а)
причем величины Qqj определяются согласно A7.60), a If—мат-
If—матрица с элементами
^ i— / \ д
o(zlf..., zn)-—lnw(z1$..., Zn)}, /, q=l, M.
OZj OZq )
A8.676)
Асимптотически оптимальный алгоритм обнаружения детерми-
детерминированного сигнала на фоне аддитивной Г-зависимой помехи
запишем в виде
У(х*)$с, A8.68)
Yo
где порог с определяется по формуле A8.49), а рабочая харак-
характеристика алгоритма — по формуле A8.50), если в этих форму-
формулах матрицу Q заменить матрицей Q* [см. A8.67а)], а элементы
информационной матрицы вычислять согласно A8.676).
Коэффициент асимптотической оптимальной эффективности
алгоритма A8.68) по отношению к линейному A8.52) определя-
определяется по формуле A8.58) с указанной очевидной заменой матриц
529
Q и If. Так как вектор весовых коэффициентов с не ограничи-
ограничивался никакими условиями, то можно н^йти оптимальный вектор
Со, для которого КАОЭ максимален.
Другой подход к редукции векторной статистики для синтеза
асимптотически оптимального алгоритма обнаружения сигнала на
фоне Г-зависимой помехи, который состоит в формировании ска-
скалярной статистики из каждой векторной выборки х*, i=U M (см.
п. 16.3.2), приведен в [57].
18.4. АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЙ АЛГОРИТМ
ОБНАРУЖЕНИЯ КВАЗИДЕТЕРМИНИРОВАННОГО
СИГНАЛА НА ФОНЕ НЕЗАВИСИМОЙ ПОМЕХИ
18.4.1. Синтез алгоритма. Рассмотрим задачу обнаружения на
фоне аддитивной независимой помехи с плотностью распределе-
распределения w(x) квазидетерминированного сигнала Ks(t), где
т
s(*) = c'<p(*)= lew®, A8.69)
/=i
с — вектор, вообще говоря, зависимых случайных мешающих па-
параметров, ф(/) —заданная вектор-функция. Задача состоит в
проверке гипотезы Н: Я = 0 (сигнала нет), против альтернативы
К: Х>0 (сигнал присутствует). Амплитуда сигнала X является,
таким образом, информативным параметром.
После временной дискретизации наблюдаемой реализации в
моменты t{, i=l,/i, получаем независимую выборку х=(л'ь...
... ,xn)j причем значения сигнальной функции
= ** = С <р ft) = 2*;Фу&). *=1> п> A8.69а)
Если выполнены условия теоремы 1 (см. п. 17.4.1), то можно
записать асимптотическое разложение логарифма отношения
правдоподобия при фиксированном векторе с и при у= lim ?wi ]/"/!,
П»о
n (x, yc/Vn), A8.70)
где ф(*>=[ф1(*<),... ,'<Pm(*i)L а функция f(x) и информация по
Фишеру If определяются согласно A7.19), A7.22). Элементы
матрицы А размером тХт
akJ = lim J- 2 Ф. (tt) Ф; (ti) = lim -^ / Фл (t) ^ (t) At A8.71)
Как и в A7.58), остаточный член r]n(x, ус/ Уп) сходится по веро-
530
$тности при п-^оо к нулю и при гипотезе Я, и при альтернати-
альтернативе К. Распределение статистики A8.70) при условии
п-*оо
lim тахф2(^)/ 2фК^) = 0, fe=l,m, A8.72)
-асимптотически нормальное, причем параметры предельного рас-
распределения равны —G/2I/0'Ac, y2I/c/Ac при гипотезе Н и
-J- I/с'Ас, 721/сгАс при альтернативе К.
Векторная m-мерная статистика
Уп(х) = -тг- 2<P(
A8.73)
также асимптотически нормальна и при гипотезе, и при альтер-
альтернативе с параметрами 0, I/A и 7*/А> I/A соответственно.
Пусть w(c) —совместная m-мерная плотность вероятности
случайных параметров квазидетерминированного сигнала. Опус-
Опуская в A8.70) остаточный член и усредняя отношение правдопо-
правдоподобия по векторному параметру с, получаем
Л [у, (х), vl = J» (с) ехр [у с' у„ (х) - (^/2) с'Ас] dc, A8.74)
С
где векторная статистика уп(х) определяется согласно A8.73).
Распределение статистики усредненного отношения правдоподо-
правдоподобия уже не является асимптотически нормальным.
Асимптотически оптимальный дискретно-аналоговый алгоритм
обнаружения квазидетерминированного сигнала на фоне аддитив-
аддитивной независимой помехи можно представить в виде
Л[уп(х). т]$с*, A8.75)
Yo
где порог с* определяется из уравнения
Р{Л[Уп(х), у]^с*\Н}=а A8.76)
при заданной вероятности а ложной тревоги. Вероятность пропус-
пропуска сигнала
Р = Р{Л[уп(х), у)<с*\К}. A8.77)
При заданных величинах а и р уравнения A8.76) и A8.77) пред-
представляют систему уравнений относительно неизвестных констант
с* и у.
18.4.2, Структурная схема алгоритма. Обнаружитель, функ-
функционирующий согласно алгоритму A8.75), состоит из трех блоков
(рис. 18.8). Первый блок представляет многоканальное устройст-
устройство для вычисления компонент векторной статистики A8.73)
Упк (х) = ^- S <Pft (<«) / (*i). k -ITS. A8.78)
531
Рис. 18.8. Схема асимптотиче-
асимптотически оптимального обнаружите-
обнаружителя квазидетерминированного
сигнала на фоне независимой
помехи
Структура каждого канала в этом устройстве подобна структуре,
изображенной на рис. 18.1 [см. первые два блока на рис. 18.1 с
очевидной заменой в k-м канале сигнала s(t) базисной функци-
функцией (fk(t)]. Во втором блоке по известному априорному распреде-
распределению случайных параметров сигнала вычисляется усредненное
отношение правдоподобия Л. Третий блок — устройство сравне-
сравнения с порогом, значение которого определяется в результате ре-
решения системы уравнений A8.76), A8.77). Как и в обнаружите-
обнаружителе детерминированного сигнала, от распределения помехи зави-
зависят характеристика f(x) нелинейных элементов многоканального
устройства и значение порога.
18.4.3. Нормальное распределение случайных параметров сигнала. Пред-
Предположим, что совместная плотность вероятности до (с) случайных параметров
сигнала — нормальная с нулевым средним и диагональной ковариационной мат-
матрицей hi. Вычисляя интеграл A8.74) как свертку нормальных плотностей (см.,
например, [18, с. 24]), получаем
Л [уп (х), у) = /im/2 [det (A + ЦК)]- !/2 х
X exp Jу- У; А-1 уп - y Уп (А + Y2 '/ А' А/Л)-1 уп ] .
A8.79)
Усредненное отношение правдоподобия A8.79) монотонно зависит от статис-
статистики
Ф[Уп(х), 7]=У/пА-1уп— y'n(A+Y2^/A'A/n)-iyn. A8.80)
При ортонормированных базисных функциях
1 т
lim — Г ф.@я
Т-+оо Т X J
( 18.81)
Из A8.71) и A8.81) следует, что матрица А — единичная, и тогда из A8.80)
находим
), у] =
1Уп(х)Р.
A8.82)
1
л
Асимптотически оптимальный алгоритм обнаружения квазидетерминированно-
го сигнала рассматриваемого вида запишем следующим образом:
<Vh(ti)f(xi) ^c*. A8.83)
J Ya
Из результатов, приведенных в п. 18.4.1, следует, что статистика в левой
части неравенства A8.83) представляет сумму квадратов асимптотически нор-
532
Г п
2
мальных независимых случайных величин с параметрами 0; 1 при гипотезе Н
Y^fe/I/, 1 при альтернативе К для фиксированных значений компонент вектора
с. Следовательно, эта статистика при п-+оо подчиняется ^-распределению с т
степенями свободы при гипотезе Н и нецентральному ^-распределению с т
степенями свободы с параметром нецентральности
т2G)=721/|с|2 A8.84)
при альтернативе /С. Случайная величина |с|2 также подчиняется %2-распре-
делению с т степенями свободы.
Для заданной вероятности а лоишой тревоги в A8.83)
«—Х«в(*). A8-85)
где %2а(?п)—процентная точка ^-распределения с т степенями свободы.
Прежде чем определять вероятность пропуска сигнала, необходимо ус-
усреднить плотность W(z\ m\ т2) нецентрального ^-распределения по случай-
случайному параметру нецентральности т2. Используя соотношение (см. [43, задача
8.11])
W(z; т; т*) = ехр ( ~"у) ^ "л" ("f") Г (г ; m + 2/; °)' A8'86>
получаем
оо
Г* (z) = J W (г ; т ; у ly1*2 v) W (v ; m ; 0) dvg A8.87)
о
где
f
Подставляя A8.87а) в {il8.87) с учетом A8.86), получаем
*=о (у/ Vl/ + l)/+m/2 Г (т/2) Г (* + 1)
Вероятность пропуска сигнала
r(*; m; 0)= ^тш (f)«ф (-т )^>°- A8-87а)
;0). A8.88)
р= J W*(z)dz. A8.89)
о
18.4.4. Асимптотически оптимальный алгоритм обнаружения
модулированного сигнала со случайной фазой. Рассмотрим сиг-
сигнал Xs(t)
s(t) =a(t)cos[(*0t+y(t)— ф0], A8.90)
где a{t), ^(t)—медленно меняющиеся по сравнению с cos coo*
детерминированные процессы. Обозначая
Ф1 @ =а @ cos[©o*—ф @ ]. (i8-91 a)
A8.916)
533
замечаем, что при случайной начальной фазе фо квазидетермини-
рованный сигнал A8.90) можно представить в форме A8.69) при
771 = 2.
Векторная статистика A8.78) в рассматриваемом случае дву-
двумерная и ее компоненты
Ут (х) = —1— 2 / (*«) *i cos (coo /, - ф,), A8.92a)
Уп t=i
Уп2 (х) = -L- 2 / (**)««sin (соо f, - ^), A8.926)
где
fl< = fl('<), !>< = *('<). A8.92b)
Совместное распределение статистик t/nl и #П2 асимптотически
нормальное с ковариационной матрицей I/A, причем в соответст-
соответствии с A8.71) элементы матрицы А
аХ1 = lim — Г а2 (/) cos2 [co01 - ^(t)] dt« IF, A8.93a)
Г-юо Г 0
1 T
a22 = lim — Г а2 (/) sin2 [ю0 f -1|) (/)] Л «IF, A8.936)
7юо Г 0
Hm — f a2 (<) cos [©0 < - * «)] sin [coo t - ф (/)] d/« 0,
Г->оо Г J
A8.93b)
где
Ц7 = Hm — P a% (t) dt A8.93r)
— мощность квазидетерминированного сигнала A8.90). Условие
A8.93в) означает асимптотическую независимость компонент век-
векторной статистики. Средние значения этих компонент равны нулю
при гипотезе Я, а при альтернативе К (см. п. 18.4.1)
mi {упг | К} =yI/№cos фо, A8.94а)
mi {у2п | К} = yhW sin фо. A8.946)
Предположим, что фаза фо распределена равномерно на интервале
0,2я. Тогда совместная плотность распределения параметров с\ и
с2 [см. A8.91в) и п. 3.1.2]
L), I^Kl, |сь1<1. A8.96)
Из A8.93а и 6) следует
=^. A8.96)
534
Подставляя A8.92а, б), A8.95), A8.96) в A8.74), находим усред-
усредненное отношение правдоподобия
Л[у„(х), у]= J J ] 8(Со-УТ^Ц) х
-1 -1 як 1 — с2
откуда следует
А[Уп(х), 7]=exp(-72I/IF/2)Io{7[i/2ni(x)+^n2(x)]V2}. A8.97)
Так как усредненное отношение правдоподобия A8.97)—моно-
A8.97)—монотонная функция статистики |уЛ(х)|2, то асимптотически опти-
оптимальный алгоритм обнаружения рассматриваемого квазидетер-
минированного сигнала на фоне аддитивной независимой помехи
можно записать в виде
\Уп (x)|2/(I/ W) = 1у*х (х) + yl2 (x)]/(I, W) § с*, A8.98)
где упХ и уП2 определены согласно A8.92а и б).
При гипотезе Н статистика в левой части неравенства A8.98)
представляет сумму двух асимптотически нормальных случайных
величин с параметрами 0, 1, которая при я->оо подчиняется %2-
распределению с двумя степенями свободы (т. е. экспоненциаль-
экспоненциальному распределению). Поэтому в A8.98) при заданной вероятно-
вероятности а ложной тревоги порог
с*-Х2аB)=-1па. A8.99)
При альтернативе К статистика в левой части неравенства
A8.98) при п-*оо подчиняется нецентральному ^-распределению
с двумя степенями свободы и с параметром нецентральности
%2 = yIfW. A8.100)
Если zvB, т2)—процентная точка указанного распределения, то
рабочая характеристика алгоритма A8.98)
Zl_3B, y\fW) = ]n(Ua). A8.101)
18.4.5. Структурная схема алгоритма. Из A8.98) следует, что
дискретно-аналоговый асимптотически оптимальный обнаружи-
обнаружитель модулированного сигнала со случайной равномерно распре-
распределенной начальной фазой на фоне аддитивной независимой
помехи представляет некогерентный приемник с двумя каналами
(рис. 18.9), в которых вычисляются суммы A8.92а и б), а затем,
как обычно при некогерентном приеме, следуют квадраторы. Вы-
Выходные сигналы каналов суммируются, а накопленная в конце
наблюдения сумма сравнивается с порогом. Рассматриваемая
535
f
Уп1
KB -
f
Уп2
KB -
]
z
*
Рис. 18.9, Схема асимптотически оптимального обнаружителя сигнала со случай-
случайной фазой
структура отличается от структуры обнаружителя сигнала со слу-
случайной фазой на фоне аддитивной независимой гауссовской по-
помехи только наличием в каждом из двух каналов нелинейного
безынерционного преобразователя с характеристикой /(*), зави-
зависящей от распределения помехи.
18.5. АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЙ АЛГОРИТМ
ОБНАРУЖЕНИЯ КВАЗИДЕТЕРМИНИРОВАННОГО
СИГНАЛА НА ФОНЕ КОРРЕЛИРОВАННОЙ ПОМЕХИ
18.5.1. Синтез алгоритма. Рассмотрим задачу обнаружения
квазидетерминированного сигнала Xs(t), где s(t) определяется
согласно A8.69), на фоне аддитивной й-связной марковской по-
помехи. Если выполнены условия теоремы 3 (см. п. 17.4.3), то при
фиксированном m-мерном векторе с параметров сигнала асимп-
асимптотическое разложение логарифма отношения правдоподобия (при
7= НтЯ \^п> 7<Соо) имеет следующий вид:
(x1k+l) = тс'уп (х^
- J?- с' Be.
A8.102)
A8.103)
где yn(xn_H_i) — векторная статистика с компонентами
ink .
~\/п i=i /=о
причем, как и в A8.47), компонента fj вектора f определяется со-
согласно A7.30). Матрица В составлена из элементов
Bpq = tr[APQlf], p, G=1, т, A8.104)
где If — информационная матрица Фишера [см. A7.66)], а эле-
элементы матрицы Apq
i _L j фр (t + i T) фд (t + / т) &t, i, / = 6Д, A8.105)
Г->оо
где х — интервал временной дискретизации.
Статистика yn(xn-k+\) асимптотически нормальна и при гипо-
гипотезе Я, и при альтернативе К. Параметры предельного распреде-
распределения этой статистики равны 0, В и уВс, В при гипотезе и при
альтернативе соответственно.
536
Усредненное по случайным параметрам сигнала отношение
правдоподобия [см. A8.102)]
Л[уп(х11к+1)]= J ^(с)ехрГтс'уп(х2.л+1)-3!!^с ]dc. A8.106)
Асимптотически оптимальный алгоритм обнаружения квазиде-
терминированного сигнала на фоне аддитивной конечносвязной
марковской можно записать, использовав решающую функцию
Ф(уп) (см. п. 13.1.2): сигнал присутствует, если
Ф[Уп(х»-Л+1)] = 1, А(уп)^с*; A8.107а)
сигнала нет, если
Ф[Уп(х*-Л+1)]==0, А(уп)<с*. A8.1076)
Порог с* и константа у определяются заданными вероятностями
а ложной тревоги и 1—р правильного обнаружения из системы
двух уравнений
Bя)-*/2 (det В)-1/2 J J Ф (у) ехр Г - -±- (у-
- у Be)' В-' (у - у ВсI w (с) dydc = P'J^ °' Q A8.108)
18.5.2. Структурная схема алгоритма. Асимптотически опти-
оптимальный обнаружитель квазидетерминированного сигнала на фо-
фоне многосвязной марковской помехи состоит из тех же блоков,
которые изображены на рис. 18.8. Однако в этом случае более
сложным является вычислитель компонент векторной статистики
[см. A8.103)]. По входной реализации наблюдаемого процесса
формируется векторная выборка xVft, которая используется для
получения значений fj(x^), j=O,k. Эта общая часть вычислите-
вычислителя не отличается от вычислителя на рис. 18.9. При помощи гене-
генераторов базисных функций (pi(t), 1=1, т, формируются векторы
<pz= [(pi(ti-h),..., q>j('i)]> которые совместно с компонентами fj ис-
используются в т однотипных коррелометрах для вычисления кор-
k
реляционных сумм 2/j(xV-fc)q>i ('*-;)• Вычисления повторяем для
/о
всех значений индекса i=l,n, затем суммируем и в результате
получаем значения компонент A8.103).
18.5.3. Нормальное распределение случайных параметров сиг-
сигнала. Предположим, что совместная плотность распределения
w(c) параметров сигнала — нормальная с нулевым средним и
корреляционной матрицей D. Нетрудно показать (см. [18, с.
172]), что в этом случае усредненное отношение правдоподобия
монотонно зависит от статистики
ф(Уя) =y/nB-1yn-y'n(B+T2B'D-iB)-iyn= y'nGyn, A8.109)
где
1. A8.109a)
537
Следовательно, асимптотически оптимальный алгоритм обнару-
обнаружения квазидетерминированного сигнала в рассматриваемом слу-
случае можно записать в виде
Уп(х^+1)ОУп(х%+1) § с*, A8.110)
Ye
причем константы с* и у находятся из системы уравнений
a, A8.111а)
= l—р. A8.1116)
Как известно (см., например, [58, с. 478]), существует ортого-
ортогональное преобразование квадратичной формы y'nGyn в сумму квад-
квадратов с коэффициентами, определяемыми корнями характеристи-
характеристического уравнения
|G—Я1|=0, A8.112)
где I — единичная матрица. Алгоритм A8.110) преобразуется при
этом к виду
2 2nkW ^ Cj A8.113)
fe=l %k Yo
где гщ,..., гпт—совокупность независимых гауссовских случай-
случайных величин с нулевыми средними и единичными дисперсиями.
18.5.4. Асимптотически оптимальный алгоритм обнаружения
модулированного сигнала со случайной фазой. Рассмотрим зада-
задачу обнаружения сигнала Ks(t)9 где s(t) определяется согласно
A8.90), а функции <pi(/), фг(О и компоненты с\, с2 вектора слу-
случайных параметров сигнала — согласно A8.91а—в). Тогда [см.
A8.105)]
/
Z1 0
= ± BA[(i-j)x], A8.114а)
ац=аи=о, t, j=о. (i8.i нб)
Элементы матрицы В [см. A8.104)]
Ь = В11 = В22=-1- 2 S hrBA[(l-r)t], A8.115а)
и квадратичная форма
c/Bc=c2lBn + c22B22^b. A8.116)
538
Компоненты векторной статистики уп(хп-к+\) [см. A8.103)]
4= 2 2
A8.117а)
-') sin
-Л. A8.1176)
Усредняя отношение правдоподобия по случайным парамет-
параметрам, получаем [см. A8.95)]
1 1
-1-1
X ехр [ус1Уп1 (х
2. A8.118)
Используя фильтрующее свойство дельта-функции, выполняем
интегрирование по переменной е2, а затем, заменяя Ci = coscp,
приводим выражение A8.118) к виду
Л[уп (xJL^^l-Io [у|Уп (xlfc+i)!! <*p (~Т2Ь/2). A8.119)
Из A8.119) следует, что усредненное отношение правдоподобия
является монотонной функцией статистики
1
х cos
2 2
f=l /=0
A8.120)
Асимптотически оптимальный алгоритм обнаружения моду-
модулированного сигнала со случайной равномерно распределенной
фазой на фоне аддитивной fe-связной марковской помехи имеет
вид неравенства
!Уп (*Lft
A8.121)
Yo
левая часть которой определена в A8.120).
Компоненты векторной статистики yn(xn-h+\) асимптотически
нормальны, а при гипотезе Н — независимые, центрированные с
одинаковыми дисперсиями, равными Ь [см. A8.115а)]. Поэтому
при заданной вероятности а ложной тревоги порог с* в A8.121)
определяется из соотношения [ср. с A8.99)]:
с* = ЫпA/а). A8.122)
539
При альтернативе К указанные компоненты также асимптотиче-
асимптотически нормальны, независимы, их средние значения равны yb, a
дисперсии равны Ь. Следовательно, при альтернативе статистика
К подчиняется нецентральному х2~Ропределении) с двумя степе-
степенями свободы и параметром нецентральности yb. Вероятность
правильного обнаружения
A8.123а)
откуда получаем [ср. с A8.101)}
ln(l/a). A8.1236)
Глава 19
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЕ ЦИФРОВЫЕ
АЛГОРИТМЫ ОБНАРУЖЕНИЯ СИГНАЛОВ
НА ФОНЕ АДДИТИВНЫХ ПОМЕХ
19.1. АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЙ ЦИФРОВОЙ
АЛГОРИТМ ОБНАРУЖЕНИЯ ДЕТЕРМИНИРОВАННОГО
СИГНАЛА НА ФОНЕ НЕЗАВИСИМОЙ ПОМЕХИ
19.1.1. Оптимальный по критерию Неймана—Пирсона
цифровой алгоритм обнаружения сигнала. В отличие от дискрет-
яо-аналоговой обработки три цифровой обработке наблюдаемый
процесс квантуется не только во времени, но и по амплитуде.
Предположим, что значения наблюдаемого процесса квантуются-
на М уровней >по закону (см. п. 8.3.1 и рис. 8.2)
Q{x)=ak, xe(zft-i, zh)=Ek, Л=1, M, A9.1)
. м
причем ЕгГ)Е; = 0, i?=j, i, /=1, М, [) Ek = XK
k=\
Закон амплитудного. квантования определяется двумя векто-
векторами: вектор a=(ai, ..., ам) и вектором граничных точек интер-
интервалов квантования z= (—oo = z0, zu ..., Zm = oo).
На выходе аналого-цифрового преобразователя (АЦП) из
наблюдаемой независимой выборки х= (х\ хп)9 Xi=x(ti), по-
получаем независимую выборку того же размера п дискретных слу-
случайных величин аA>, ..., а(п), со значениями из заданного множе-
множества аи ..., ам, т. е.
м
** — Vc \Л1/ — Лл uh Aft. K^i/i V1*7*^'/
где
— индикатор множества Eft.
540
При гипотезе Н (сигнала нет)
P{aii) = ah\H}= J w(x)dx = pk,k=l,M, A9.4a)
zk~i
м
причем S Pfe=l и вероятность pk не зависит от индекса i, так
как при гипотезе Н выборка однородная. При альтернативе К
(сигнал присутствует)
zk
f=T7nf A9.46)
2 Ры (K&i) = 1. i'=T7n, A9.4в)
где Si = s(^t), Phi{0)=Pk и до(х), ш(х—^s) — плотности распреде-
распределения помехи и смеси сигнала с аддитивной помехой.
Оптимальный по критерию Неймана — Пирсона цифровой ал-
алгоритм обнаружения детерминированного сигнала на фоне неза-
независимой помехи предписывает сравнение с порогом статистики
логарифма отношения правдоподобия
м
ln/Q(x)= 2 I Inf^»^] %h(*t). A9.5)
I P J
Pk
J
19.1.2. Асимптотическое разложение логарифма отношения
правдоподобия. Как и для дискретно-аналоговых алгоритмов, при
синтезе асимптотически оптимальных цифровых алгоритмов об-
обнаружения сигналов используется асимптотическое разложение
логарифма отношения правдоподобия. Предположим, что для всех
значений k—\% M функция Pk{$) дифференцируема по парамет-
параметру О, Pk=Ph{0)>0 и
] A9.6)
причем для любого е>0 всегда найдется такое до, что
П?И |*| <^о.
В A9.6) величина a*h= — In Ра(^) |^=о равна
или
J
J a>(y)djr,*-l,M. A9.7)
541
После элементарных преобразований
г
к
а;= J f{x)w{x)dx J w(x)dx, k= 1, Л! , A9.7a)
Ч-i I zk-i
где [ср. с A7.19)]
f(x)= - — 1пи/(*). A9.76)
Ясно, что [см. A9.7)]
2 «; ft = 2 I» fa-i) - » («к)! = 0. A9.7в)
Предположим, что количество информации по Фишеру для не-
независимых квантованных выборок помехи
Iq-= 2 [^-inPfcWIib-oj'pfc- 2 <2Pk A9.8)
ограничено, не равно нулю, выполняются условия A7.52) и
A7.57), а также XnVn=*yn, 0<Yn<<». При указанных предпо-
предположениях логарифм отношения правдоподобия A9.5) допускает
следующее асимптотическое разложение:
In lQ (x) = JL j s, Q* (x,) - ^- Iq. Гв + Чп (x, Yn s//n), A9.9)
где We определено согласно A7.56), a
Q*W- 2 ^-taftWI*-oXfcW= 2 "Uk(x)> A9.10)
п.в
причем v= lim yn и r\n—>0 и при гипотезе Я, и при альтерна-
тиве /С.
Статистика A9.9) асимптотически нормальна с параметрами
— {y42)IQ*W8i y2IQ*W8 при гипотезе Я и с параметрами {у2/2) X
XIq*W8, y2lQ*W8 при альтернативе /С. Доказательство приведен-
приведенных утверждений аналогично доказательству теоремы 1 в п. 17.4.1.
Статистика [первый член разложения A9.9)]
y»(xH-^-2*iQ*(*f) A9.11)
У
асимптотически нормальна с параметрами 0, Iq*Ws при гипотезе
Н и ylQ WSy lQ*Ws при альтернативе К.
Из A9.5), A9.8) л A9.10) следует
m!{Q*(*) |Я}=0, V2{Q*{x)\H} = lQ.9 A9.12)
так как
mihk(x)\H}=m2{%k(x)\H} = P{xi^Eh} = pk. A9.12а)
542
Q*(x)\
—*K^>
Заметим, что статистика A9.11)
получается из A7.59) заменой
функции f(x) на Q*(#), а парамет-
параметры предельного распределения ста-
статистики A9.11) — из параметров
предельного распределения статис-
статистики A7.59) заменой I/ и Iq*.
19.1.3. Асимптотически оптималь-
оптимальный цифровой алгоритм обнаруже-
обнаружения детерминированного сигнала.
Из A9.11) непосредственно следует,
что цифровой асимптотически оптимальный алгоритм обнаружения
детерминированного сигнала на фоне аддитивной независимой ста-
стационарной помехи
Рис. 19.1. Схема асимптотически
оптимального цифрового обнару-
обнаружителя детерминированного сиг-
сигнала
тг2
~\/п i=l
A9.13)
Yo
где функция Q*(x) определена согласно A9.10). Учитывая асимп-
асимптотическую нормальность статистики #п(х) и значения парамет-
параметров предельного распределения, нетрудно определить порог
и предельную рабочую характеристику обнаружения
A9.13а)
A9.14)
Заметим, что алгоритм A9.13) — цифровой, так как наблю-
наблюдаемая реализация случайного процесса подвергается временной
дискретизации и квантованию по уровню (см. п. 12.2.4). Однако
при формировании корреляционной суммы в A9.13) используют-
используются неквантованные весовые коэффициенты s^ i=l, п. Полностью
цифровая обработка предусматривает предварительное кванто-
квантование этих весовых коэффициентов.
19.1.4. Структурная схема алгоритма. При заданном разбие-
разбиении диапазона возможных значений наблюдаемой выборки на
области Efe, k=l, Му асимптотически оптимальный закон ампли-
амплитудного квантования описывается формулой A9.10), где величины
а*к зависят от распределения помехи [см. A9.7)], а %h(x) — ин-
индикатор множества Ek [см. A9.3)]. Асимптотически оптимальный
цифровой обнаружитель детерминированного сигнала состоит из
трех блоков (рис. 19.1): аналого-цифрового преобразователя на-
наблюдаемых выборок с характеристикой A9.10), дискретного кор-
коррелометра К и устройства сравнения с порогом.
Если множества Е* стягиваются в точки (zjr«ft-i), которые
заполняют всю действительную ось, то из A9.7а) и A9.10) сле-
следует, что Q*(x)-*f (x) и цифровой алгоритм A9.13) совпадает с
543
дискретно-аналоговым A8.2), а структурна» схема на рис. 19.1 —
со структурной схемой на рис. 18.1 !.
19.1.5. Коэффициент асимптотической относительной эффек-
эффективности асимптотически оптимального цифрового алгоритма по
отношению к асимптотически оптимальному дискретно-аналого-
дискретно-аналоговому алгоритму. Из A9.4) и A9.14) следует, что при обнаруже-
обнаружении детерминированного сигнала на фоне аддитивной независи-
независимой помехи с произвольной плотностью распределения
P = Iq-/I/, A9.15)
где Iq* и I/ определены согласно A9.8) и A8.20).
Покажем, что в A9.15) р^1. Согласно неравенству Буняков-
ского — Шварца при w(x)>0
( f /(x)w(x)dx] < f /a(x)w(x)dx /* w(x)dx.
Тогда из A9.7а) следует
*l2Pk = ( jk f(x)w(x)dx] / f w(x)dx^ j* f*(x)w(x)dx.
Таким образом,
V-Sfl?A<S J* f*(x)w(x)dx= ]f*(x)w(x)dx = lf,
т. e.
Iq*<I/. A9.16)
Разность If—Iq* равна среднему квадрату отклонения f(x) от
Q* (х) при гипотезе Я. Действительно,
M zk M
19.1.6. Квантование на два уровня. Рассмотрим случай, когда
амплитуда квантуется на два уровня: М = 2, zo =—oo, 2i=0, z2 =
= oo. Из A9.7) получаем
- w @) / $w (x) dx, x < 0, A9.17a)
]w(x)dx, ^>0. ' A9.176)
о
1 Исключение составляет случай лапласовской помехи, для которой опти-
оптимальным является квантование на два уровня (знаковый алгоритм).
544
При симметричном распределении центрированной помехи
а*я=—a*i = 2o>@), A9.18)
р1 = р2 = 1/2. A19.19)
В этом случае согласно A9.13) цифровой асимптотически опти-
оптимальный (АО) алгоритм обнаружения детерминированного сиг-
сигнала можно представить в виде
-±rhi"(xt)*c. A9.20)
У 71 t«l Yo
Этот алгоритм аналогичен знаковому алгоритму обнаружения де-
детерминированного сигнала на фоне аддитивной стационарной не-
независимой ломехи, который три симметричной плотности распре-
распределения помехи обладает непараметрическим свойством (см.
п. 16.1.2).
Из A9.8), A9.18) и A9.19) находим информацию по Фишеру
lQ* = ai*2pi + a2*2P2 = 4w2@) A9.21)
и, следовательно, в рассматриваемом случае КАОЭ цифрового
АО алгоритма обнаружения сигнала по отношению к дискретно-
аналоговому АО алгоритму ['см. A9J15)]
A9.22)
Для гауосовокой помехи, используя A8J11) и A8.12), полу-
получаем :
р = 2/я, A9.23)
что соответствует A8.46а). Для лапласовской помехи, используя
A8.13) и A8.14), р=1, так как при этом цифровой АО алго-
алгоритм при М = 2 (т. е. знаковый алгоритм) совпадает с дискретно-
аналоговым алгоритмом.
Для помехи с обобщенным экспоненциальным распределением
используем A8.15) и A8.16):
p=[T(h/c)TB-l/c)]-K A9.24)
Для помехи с логистическим распределением, используем
A8.17) и A8.18), и в результате
Р = 3/4, , A9.25)
что соответствует A8.466).
Для помехи с распределением Стьюдента используем A8.21)
и A8.23):
'v+ Г
I
v>2,
что соответствует A8.46в).
18-87 . 545
Для помехи с обобщенным распределением Стьюдента с по-
помощью A8.20) и A8.22) оолучим
v/2+l/c+l Г» (у/2+1/с) П927)
v/2+l/c ГB1/с)Г(у/2 + 2/??)Г(у/2)ГA/с) '
v/2+l/c
19.1.7. Оптимальный выбор граничных точек интервалов кван-
квантования. Эффективность асимптотически оптимального цифрово-
цифрового алгоритма обнаружения сигнала пропорциональна информа-
информации по Фишеру Iq* квантованной выборки помехи. Эта величина
зависит не только от закона амплитудного квантования, но и от
выбора граничных точек zu интервалов квантования наблюдаемых
выборок. Возникает задача определения оптимального вектора
z* граничных точек ингерва^л квантования, для которого при
фиксированном числе уровней квантования
A9.28)
Система уравнений
д
¦IQ.(z) = O, fc=l, М-I A9.29)
определяет экстремальные точки z*b ..., z*M-\ и тем самым опти-
оптимальное разбиение диапазона возможных значений выборок на
интервалы квантования. Подставляя A9.8) в A9.29), получаем
Из A9.7) находим
дгк h> k dzh
--V.
так как
то система уравнений A9.29) приводится к виду
-2/B01=0, fe-1, Af-1. A9.30)
Если плотность до (л;) распределения аддитивной помехи уни-
унимодальна, то функция f(x) монотонно возрастающая. Тогда из
A9.30) следует
)/2f ('19.31)
причем величины a*k(Zk-u zk) определены согласно A9.7).
546
/При квантовании на два уровня- a*2 + a*i = 0 [см. A9.18)] и
тогда из A9.31) получаем уравнение
f(*i)=0 A9.32)
для определения тючки z*u которая оптимально делит область
возможных значений выборки на два интервала (—оо, z*\) и (г*\,
оо). Учитывая A9.76), замечаем, что для симметричных унимо-
унимодальных плотностей распределения (см. п. 18.1.5) корнем урав-
уравнения A9.32) является 2*i = 0. Таким образом, указанная в п. 19.1.6
граничная» точка оптимальна по критерию эффективности цифро-
цифрового алгоритма с квантованием выборочных значений на два
уровня.
19.1.8. Устойчивость асимптотически оптимального цифрового
алгоритма обнаружения сигнала. Предположим, что алгоритм
A9.13) используется для обнаружения детерминированного сиг-
сигнала на фоне аддитивной независимой помехи с плотностью рас-
распределения и(х). Обозначим этот алгоритм через ьЪ% , а через
6гг(ц) — асимптотически оптимальный цифровой алгоритм обнару-
обнаружения для помехи с плотностью и(х). Определим КАОЭ алгорит-
алгоритма б!фу по отношению -к алгоритму 8и(ц) по формуле A8.41), за-
замени© функцию f(x) на Q*(x) [см. A9.10) ] и функцию g(x) на
G*(*HS blXk(x)9 A9.33)
где
l Zfe
Ь\ = — J g(x)u(x)dxt A9.33a)
qk 4-х
qk= f u{x)dx. A9.336)
4-1
Если плотности w(x) и и(х) симметричны относительно ну-
нуля, то
М \2
м
Ясно, что р(8^э Su(u))^l, так как при
< 2 *?Чк I b*k*qk. A9.34а)
Отметим, что знаковый алгоритм A9.20) обладает абсолют-
абсолютной устойчивостью, так как в этом случае Af = 2, a*2 = —а*\ —
2@) & = — Ь*1 = 2и@), qx = q2=l/2 и из A9.34) следует
18* 547
19.2. АСИМПТОТИЧЕСКИЕ СВОЙСТВА
РАНГОВЫХ СТАТИСТИК
19.2.1. Асимптотика выборочного значения и его ранга. Как
шзвестно, случайная величина Л(?) распределена равномерно на
интервале @, 1), если Fx(z) — функция распределения случай-
случайной величины |. Рассмотрим однородную независимую выборку
x=(xi, ..., хп) ;и соответствующий ей ранговый вектор R=(/?b ...
..., Rn). Случайная величина
распределена равномерно на интервале @, 1).
Так как хг — х{***} го условная плотность вероятности
' c\Ri = r) определяется по формуле A3.167а). Тогда, учитывая
A9.35), находим плотность вероятности порядковой статистики
при равномерном распределении выборочных значений:
w^(u)==n(r!—l\ur-i(i-U)n-ry о<и<1, г=ГГп. A9.36)
Так как для любых целых положительных чисел тип
J ит A - uf du = т\ n\\(m + n + 1)!, A9.37)
о
то из A9.36) находим
=l, n, A9.38a)
A9.386)
При п>1 1из A9.386) следует
VL2{Fi(xi)\Ri=r}~r/n2. A9.38в)
Согласно неравенству Чебышева [см. B.29)] при Ri = r
т. е. (вероятность того, что случайная величина Fi(xi) существен-
существенно отличается от величины Ri\/(n+l), мала при /г>1. Иными
словами, имеет место асимптотическая эквивалентность выборки
Xi и преобразованного по закону Frl[Ri/(n+l)] ранга /?; этой
выборки, где Frl(z) — функция, обратная функции распределе-
распределения выборки.
Аналогичные соображения можно высказать и относительно
•связи \xi\ с положительным рангом. Если плотность вероятности
©ыборки симметрична относительно нуля, то распределения слу-
случайных величин Xi и \xi\ связаны соотношением
Pl(x) = ±. + ±Fl(\x\). A9.39)
548
Тогда из A9.38а, б) и A9.39) получим
A9.40а)
^^^ ()
A9.406)
Следовательно, имеет место асимптотическая эквивалентность
случайных величин \хг\ и Fj'l — + — —*- , а также асимпто-
асимптотическая эквивалентность л;г= |xi|sgn;Ct и/Т* ~5Г + "^ *~Т х
19.2.2. Асимптотическая эквивалентность ранговых и неран-
неранговых статистик. В п. 13.8.4 отмечалось, что синтез оптимальных
ранговых алгоритмов проверки гипотез при конечном размере вы-
выборки практически нереализуем. Поэтому особое значение приоб-
приобретает асимптотический подход. Как уже указывалось в п. 17.1.6,
асимптотически оптимальный алгоритм обнаружения сигнала на
фоне помех не определяется однозначно. Может существовать
широкий класс алгоритмов, в котором любой алгоритм при боль-
больших размерах выборок будет оптимальным при обнаружении сла-
слабого сигнала. При определенных условиях .в этом классе содер-
содержатся также и непараметрические ранговые алгоритмы обнару-
обнаружения сигналов на фоне (помех, эквивалентные по характеристи-
характеристикам обнаружения неранговым асимптотически оптимальным ал-
алгоритмам.
На первый взгляд приведенное утверждение кажется недоста-
недостаточно обоснованным, поскольку при ранжировании выборки часть
полезной информации теряется. Однако, !как было показано в
п. 19.2.1, при достаточно большом размере п однородной незави-
независимой выборки функция Fi(Xi) выборочного значения, где F\(z) —
функция распределения xiy незначительно отклоняется по веро-
вероятности от величины Ri/{n+l), где /?г- — ранг элемента Хг в вы-
выборке х= (х1у ..., хп). Поэтому заменой значения Xi величиной
/ Rt \
— в неранговом асимптотически оптимальном алгоритме
л+ 1 /
можно получить асимптотически оптимальный ранговый алгоритм
обнаружения сигнала.
19.2.3. Выборка из равномерного распределения. Сформулиру-
Сформулируем сначала условия, при которых имеет место асимптотическая
эквивалентность ранговых и неранговых статистик, в предполо-
предположении, что исходная выборка принадлежит равномерному рас-
549
пределению на интервале (О, 1). Пусть функция
удовлетворяет условиям
j
о о
Определим ступенчатую функцию
и потребуем, чтобы
\imj[bn(u)--A(u)]2du = O.
n>oo
A9.41)
A9.42)
A9.43)
Бели щу ..., ип — независимая выборка из равномерного распре-
распределения на интервале @, 1) и Ri — ранг щ, то условие A9.43)
означает сходимость в среднеквадратическом последовательности
случайных величин Дп[^г/(я + 1)] к случайной величине Д(^г).
Рассмотрим теперь две статистики
Уп
Предположим, что последовательность чисел su
ряет условиям
<cf
|Д(и,), A9.44)
sn удовлетво-
A9.46а)
A9.466)
A9.47)
•где хп сходится по вероятности к нулю при п-^оо. Учитывая, кро-
кроме того, условие A9.43), можно в A9.47) функцию Дп в A9.45)
заменить функцией Д.
19.2.4. Произвольное распределение независимой выборки. Оп-
Определим введенную в п. 19.2.3 функцию А(и) следующим обра-
образом:
A(u)=f[Frl(u)]t O^u^l, A9.48)
где f(x) определяется согласно A7.19) и Frl(u) — функция,
обратная функции распределения помехи. Функция A9.48) удов-
550
lim maxsW 2 ^2 = 0.
Тогда можно доказать (см. [42], л. 6.2.4), что
летворяет условиям A9.41), так как при подстановке A9.48) в
A9;41) и замене переменной x=Fcl(u) получаем [см. A7.20),
< 17.22)]
\u)]du= ]f(x)w(x)dx = 0, A9.49a)
T1
J72 [FT (и)] du = $f2(x)w(x)dx = lf<oo. A9.496)
0 —°о
При выборе функции Д (и) согласно A9.48) статистика A9.44)
преобразуется к виду
^ \ п
Уп («1, - , Un) - -— V St Д (Щ) =
= -^-2««/(^) = Уп(^-. ^п) A9-50)
и, следовательно, совпадает с достаточной статистикой, исполь-
используемой в асимптотически оптимальном алгоритме обнаружения
детерминированного сигнала на фоне аддитивной независимой
помехи с произвольным распределением i[cm. A8.2)]. Из A9.47)
следует асимптотическая эквивалентность (при я->оо) неранго-
неранговой статистики уп{х\, ..., хп) [см. A9.50)] и ранговой статистики
A9.51)
у ii п+
Аналогично для выборки помехи с симметричной плотностью
распределения устанавливается асимптотическая- эквивалентность
неранговой статистики A9.50) и знаково-ранговой статистики
При этом снимается ограничение A9.46а) об отсутствии у сиг-
сигнала постоянной составляющей.
До сих пор асимптотическая эквивалентность нерангавых и
ранговых статистик устанавливалась при условии, что выборка
однородная и независимая, что соответствует (Предположению о
стационарности независимой помехи (гипотеза Я). Используя по-
понятие контигуальности (см. § 17.3), можно доказать (см. [42],
гл. 6), что указанная эквивалентность сохраняется и при наличии
сигнала (альтернатива /С), (когда выборка неоднородная, так как
при этом плотность вероятности w(xi\ynSi/Yп) выборочного зна-
значения Хг зависит от Siy причем yn=%nYn, lim 7n=7<°°-
551
19.3. АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЕ РАНГОВЫЕ
АЛГОРИТМЫ ОБНАРУЖЕНИЯ ДЕТЕРМИНИРОВАННОГО
СИГНАЛА НА ФОНЕ НЕЗАВИСИМОЙ ПОМЕХИ
19.3.1. Синтез асимптотически оптимального рангового алго-
алгоритма. Из результатов, приведенных в п. 19.2.4, следует, что
асимптотически оптимальный ранговый алгоритм обнаружения де-
детерминированного сигнала Ks(t) на фоне аддитивной стационар-
стационарной помехи имеет вид
h, A9.53)
где Si = s(U), Ri — ранг выборки xit Fi(x) — функция .распреде-
.распределение помехи и
А(и) =
A9.53а)
[см. A8,3)].
Порог в правой части A9.53) зависит только от заданной
вероятности а ложной тревоги, а не от распределения w(x) по-
помехи. Иными словами, алгоритм обнаружения A9.53), асимптоти-
асимптотически оптимальный для помехи с функцией распределения Fi(x),
является также непараметрическим.
При условиях A9.46а, б) статистика zn(R) в A9.53) асимп-
асимптотически нормальна и при гипотезе Н (сигнала нет), и при аль-
альтернативе К (сигнал присутствует) с параметрами 0, lfWs и
ylfWSy \fWs соответственно (см. п. 18.1.1). Ясно, что КАОЭ ран-
рангового алгоритма A9.53) по отношению к неранговому алгорит-
алгоритму A8.2) обнаружения сигнала при той же помехе равен еди-
единице.
Схема рангового алгоритма A9.53) (рис. 19.2) отличается от
структурной схемы на (рис. 18.1) дополнительным устройством
ранжирования выборки на входе обнаружителя сигнала и нели-
нелинейным преобразователем рангов, характеристика -которого
A9.54)
зависит от распределения помехи.
Заметим, что непараметрический алгоритм A9.53) можно ис-
использовать для обнаружения- сигнала как с нулевой, так и с не-
ненулевой постоянной составляющей. Однако в первом случае ал-
алгоритм эффективнее, чем во втором.
R
f
К
Рис. 19.2. Схема асимптотиче-
асимптотически оптимального рангового
обнаружителя детерминирован-
детерминированного сигнала
552
19.3.2. Синтез асимптотически оптимального знакового-рангово-
знакового-рангового алгоритма. Из результатов, приведенных в п. 19.2.4, следует,
что асимптотически оптимальный знаково-ранговый непараметри-
непараметрический алгоритм обнаружения детерминированного сигнала на
фоне аддитивной стационарной независимой помехи с симметрич-
симметричной плотностью распределения имеет следующий вид:
Jc. A9.55)
Как и ранговая статистика в A9.53), знаково-ранговая ста-
статистика zn('R+) в A9.55) асимптотически нормальна и ори гипо-
гипотезе Я, и при альтернативе /С, причем параметры предельных
распределений те же, что и у ранговой статистики, а КАОЭ ал-
алгоритма A9.55) по отношению к соответствующему неранговому
алгоритму A8.2) равен единице. Заметим, что непараметрический
алгоритм A9.55) целесообразно использовать лишь для обнару-
обнаружения сигнала, постоянная составляющая которого не равна
нулю.
Схема асимптотически оптимального знаково-рангового алго-
алгоритма A9.55) представлена на рис. 19.3.
19.3.3. Примеры асимптотически оптимальных ранговых алго-
алгоритмов. Рассмотрим несколько конкретных распределений поме-
помехи при фиксированной дисперсии а2 и нулевом среднем значе-
значении.
Для гауссовской помехи [см. (.18.24)]
(A(tt)=F-i(tt)/a2f A9,56)
где F-l(u) — функция, обратная интегралу Лапласа. Из A9.53)
и A9.56) следует, что асимптотически оптимальный ранговый ал-
алгоритм обнаружения детерминированного сигнала на фоне адди-
аддитивной независимой гауссовской помехи
~~-1 stF [JT-;)^C A9.57)
совпадает с ранговым алгоритмом Ван дер Вардена [см. A6.35)].
Таким образом установлено, что ранговый алгоритм Ван дер Вар-
Вардена — асимптотически оптимальный при обнаружении сигнала
на фоне аддитивной гауссовской помехи.
и(х)
т
т
к
t.
Рис. 19.3. Схема асимптотически оптимального знаково-рангового обнаружителя
детерминированного сигнала
553
Для лапласовской помехи [см. A8.13)]
где знак «минус» соответствует л;<0, а знак «плюс» х>0. Из
A9.58) находим
sgn х = sgn Bu — 1), 0 ^ и < 1,
Но так как для лапласовской помехи i[cm. A8.25)] f(x) =
= B/o2)l/2sgnx, то
A{u) = {2/o2y/2sgnBu— 1). A9.59)
Из A9.53) и A9.59) следует, что асимптотически оптимальный
ранговый алгоритм обнаружения детерминированного сигнала на
фоне аддитивной независимой лапласовской помехи
$ с, A9.60)
Yo
т. е. совпадает с медианным ранговым алгоритмом [см. A6.33)].
Таким образом, установлено, что медианный ранговый алгоритм —
асимптотически оптимальный при обнаружении сигнала на фоне
аддитивной лапласовской помехи.
Для логистической помехи [см. A8.17)]
Fi(x) = [l + ехр {—ял:/ (a V?>)} ] -1 = и,
а так как для этой помехи [см. A8.18)]
то
[' ПB\^ . A9.61)
Из A9.53) и A9.61) следует, что асимптотически оптимальный
ранговый алгоритм обнаружения детерминированного сигнала на
фоне аддитивной независимой логистической помехи
-^hiRtUc A9.62)
Уп i=) Yo
совпадает с ранговым алгоритмом Вилкоксона [см. A8.35)]. Та-
Таким образом, установлено, что ранговый алгоритм Вилкоксона —
асимптотически оптимальный при обнаружении сигнала на фоне
аддитивной логистической помехи.
554
19.3.4. Примеры знаково-ранговых асимптотически оптималь-
оптимальных алгоритмов. Рассмотрим задачу обнаружения постоянного
сигнала Xs(t)y s(?) = l на фоне аддитивной независимой помехи
с симметричной плотностью распределения. Для гауствской по-
помехи из A9.55) и A9.56) находим
=- 2 u(xt)F-1 {-^L + ±]$c, A9.63)
Уп ?ГУг/ \2п+2 ' 2
что совпадает с знаково-ранговым алгоритмом Ван дер Вардена
[42]. Для лапласовской помехи из A9.55) и A9.59) находим
-}=- 2 и(xt)sgn\-=-^-iu(Xi) $ с, A9.64)
У П i=\ /1+1 уп t=l Yo
что совпадает с односторонним знаковым алгоритмом [см. A8.26)].
Для логистической помехи из A9.55) и A9.61) находим
— 5и(х,)^|с, A9.65)
Уп t=l Yo
что совпадает с знаково-ранговым (одновыборочным) алгорит-
алгоритмом Вилкоксона [42].
19.4. УСТОЙЧИВОСТЬ АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫХ
РАНГОВЫХ АЛГОРИТМОВ ОБНАРУЖЕНИЯ
ДЕТЕРМИНИРОВАННЫХ СИГНАЛОВ
19.4.1. Предельные распределения ранговых статистик отно-
относительно смещенных гипотез. Предположим, что ранговый алго-
алгоритм обнаружения A9.53), асимптотически оптимальный при по-
помехе с функцией распределения F\(x) и плотностью w(x)> ис-
используется для обнаружения детерминированного сигнала на фо-
фоне аддитивной независимой помехи с функцией распределения
U\(x) и плотностью и(х).
Рассмотрим две ранговые статистики:
A9.66)
«-71/ V»V ._ Al "г I
Уп i=\
zng(R) = -^ Sl^ffftfr'f-^r)]. A9-67)
где
=о, A9.68)
о. A9.69)
8(x) ?T?ru
и (х) о и
Пусть проверяется гипотеза Я*, что наблюдаемая выборка х
принадлежит независимой помехе с распределением Ux(x) про-
против близкой альтернативы /С*, что эта выборка принадлежит ад-
555
дитивной смеси детерминированного сигнала с указанной поме-
помехой. При гипотезе Я* и при условии A9.46) статистики zn/ и zng
асимптотически нормальны. При гипотезе Я* (см. п. 17.5.2) сред-
среднее значение и дисперсия статистики A9.67)
= IgWs, A9.70)
оде Ig — информация по Фишеру помехи, Ws — мощность сиг-
сигнала. Из A9.66) при /г->оо находим среднее значение статистики
Znf при гипотезе Я*
|([(А)]|о. 09.71)
Кроме того,
Ii2 {znf | Я*} = ц2 {znf | Я} = lf Ws. A9.72)
При этом ковариация статистик гп/ и zng
где
= J/ [^Г1 («)] g [U71 (и)) du. A9.74)
о
Для вектора (znfi zng) выполняются условия центральной пре-
предельной теоремы. Поэтому при гипотезе Я* предельное распреде-
распределение этого вектора нормальное с нулевым вектором средних и с
ковариационной матрицей
W. migWA
{mfgW. \gWs J
Тогда согласно п. 17.5.2 статистика znf и при альтернативе К*
асимптотически нормальна с параметрами ymfgWs, IfWs.
19.4.2. Устойчивость асимптотически оптимального рангового
алгоритма. Устойчивость асимптотически оптимального (АО) ран-
рангового алгоритма обнаружения сигнала, как и нерангового алго-
алгоритма, будем характеризовать значением КАОЭ рангового алго-
алгоритма, используемого в неоптимальных условиях, по отношению
к АО ранговому алгоритму.
Предположим, что ранговый алгоритм АО относительно адди-
аддитивной (независимой помехи с плотностью распределения w(x), ис-
используется в неоптимальных условиях, т. е. для обнаружения сиг-
сигнала на фоне аддиТ|ИВ(НОй независимой помехи с 'плотностью рас-
распределения и(х). Обозначим этот алгоритм через бЗД , а через
8м(р) — ранговый алгоритм, асимптотически оптимальный относи-
относительно помехи с плотностью распределения и(х). Используя ре-
E56
зультаты, приведенные в п. 17.1.5 и о. 19.4.1, не трудно определить
КАОЭ алгоритма b{j\w по отношению к алгоритму 8W(P). Этот
КАОЭ и характеризует устойчивость асимптотически оптимально-
оптимального рангового алгоритма 8«?(р).
В обоз/начениях, принятых в п. 17.1.5, имеем
ai = mfgWSy o2i = lfWs, a = lgWs, o2 = \gWs. A9.76)
Подставляя A9.76) в A8.39), получаем
= ( J / [FT1 («)] g [UTl («)] d«W (I/ У- A9.77)
Так как
\f = JfW» (jc) Ле - J / [/71 («)] da, A9.78a)
—oo 0
oo 1
\g = J g2 (л:) w (x) dx = Jg [(УГ (u)] d>u> A9.786)
—oo 0
то формулу 19.77) можно переписать в (виде
р = IJ / [FT1 (и)] g [UT1 (и)] du]2 (/ / [FT1 (и)] du j? [UT] (u)] duV .
A9.79)
Выражение A9.79) представляет квадрат коэффициента корреля-
корреляции между двумя функциями от равномерно распределенной слу-
случайной величины. Поэтому р^1, как и должно быть.
Формулы A9.77) и A9.79) симметричны относительно функ-
функций w(x) и и(х). Это означает, что устойчивость рангового алго-
алгоритма, АО <по отношению к помехе с плотностью распределения
w(x) при использовании его при «чужой» помехе с плотностью
и(х), та же, что и устойчивость рангового алгоритма, АО по от-
отношению к помехе с плотностью и(х), при использовании его при
«чужой» помехе с плотностью w(x). Например, из A9.77) следует,
что устойчивость медианного алгоритма A9.60) при обнаружении
детерминированного сигнала на фоне гауссовской аддитивной по-
помехи характеризуется КАОЭ
р = —i Г—f-1 (u)-i-±-sgnBu-l)du) =
2\о2 с 'J4 ' I
Tzexp- (J—\dzY = — . A9.80)
Такой же величиной будет определяться устойчивость рангового
алгоритма Ван дер Вардена A9.57) при обнаружении сигнала
на фоне лапласовской аддитивной помехи.
557
Устойчивость рангового алгоритма Вшжоксона A9.62) при об-
обнаружении детерминированного сигнала ina фоне гауссовской ад-
аддитивной помехи характеризуется ,КА03
2«- 1L,)'-
= ^. A9.81)
Такой же величиной будет определяться устойчивость рангового
алгоритма Ван дер Вардена при обнаружении сигнала на фоне
лапласовской аддитивной помехи.
Заметим, что формула A9.77) и ее частные случаи A9.80) и
A9.81) остаются справедливыми и для знаково-ранговых алго-
алгоритмов.
19.4.3. Сравнение устойчивости рангового и нерангового асим-
асимптотически оптимальных алгоритмов. Из A8.41) и A9.77) находим
КАОЗ рангового алгоритма обнаружения детерминированного сиг-
сигнала по отношению к неранговому при условии, что эти алгорит-
алгоритмы, асимптотически оптимальные при помехе с плотностью рас-
ределения w(x), используются для обнаружения сигнала на фо-
фоне помехи с плотностью и(х):
Р* = (/ f IFT[ (и)] g [UTl (и)) duJ j> (x) и(х) dxx
х М ]f(x)g(x)u(x)dxjy\ A9.82)
Формула A9.82) представляет отношение правых частей формул
A9.77) и A8.41). Из A8.46а) и A9.80) следует, что значение р*
для медианного и знакового алгоритмов, используемых для обна-
обнаружения сигнала на фоне аддитивной гауссовской помехи, равна
единице. Однако для алгоритма Ван дер Вардена и линейного не-
нерангового алгоритма, используемых для обнаружения сигнала на
фоне аддитивной лапласовокой помехи, как следует из A8.44а) и
A9.80), р* = 4/я^ 1,27. Для тех же алгоритмов обнаружения сиг-
сигнала на фоне аддитивной логистической помехи, как следует из
из A8.446) и A9.81), р* = 3/@,9я)«1,06. Приведенные примеры
свидетельствуют о том, что устойчивость асимптотически оптима-
оптимального рангового алгоритма при гауссовской помехе выше устой-
устойчивости линейного нерангового алгоритма обнаружения детерми-
детерминированного сигнала. В [59] высказано предположение, что ука-
указанное свойство ранговых алгоритмов имеет место при любом рас-
распределении аддитивной помехи.
558
Глава 20
РАЗЛИЧЕНИЕ СИГНАЛОВ НА ФОНЕ ПОМЕХ
20.1. ОПТИМАЛЬНЫЕ АЛГОРИТМЫ РАЗЛИЧЕНИЯ
СИГНАЛОВ
20.1.1. Общая постановка задачи различения сигналов. Рас-
Рассмотрим наиболее общую структурную схему системы передачи
информации (рис. 20.1). Предположим, что источник информа-
информации передает т+1 сообщений, которым соответствуют сигналы
so(t), ..., sm(t). На входе приемника наблюдается смесь одного из
переданных сигналов со случайной помехой, искажающей сигнал
при его прохождении через канал связи К Задача различения сиг-
сигналов на фоне помех состоит в том, чтобы используя заранее
выработанное правило, вынести решение о том, какой из т+1
возможных сигналов содержит • наблюдаемый процесс.
Обозначим через x(t) реализацию случайного процесса X(t),
наблюдаемую на интервале О^^Г на входе приемника. Пред-
Предположения о том, что был передан тот или иной сигнал, форма-
формализуются в виде статистических гипотез Яо, ..., Ят, где Hi —
гипотеза о том, что был передан сигнал Si(t). Если верна гипо-
гипотеза Я^, то случайный процесс
B0.1)
характеризует взаимо-
X(t)=Si(t)®Z(t)t i = 0, m,
где l(t) —случайная помеха, а символ
действие сигнала Si(t) с помехой ?(/).
Задача различения сигналов so(t), ..., sm(t) на фоне помехи
представляет многоальтернативный вариант задачи проверки ста-
статистических гипотез Яо, ..., Нт (см. п. 13.3.1). Решением уи в
этом случае является принятие гипотезы Ни и отклонение ос-
остальных гипотез Яг, гфк. Обнаружение сигнала на фоне поме-
помехи, которому была посвящена гл. 16, является частным случаем
бинарной задачи различения двух сигналов при so(O—0. Заме-
Принятое
Сообщение Сигнал Сигнал на входе сообщение
Источник
информа-
информации
\
Передатчик
Канал
i
Источник
помех
L
Приемник
L
Адресат
Рис. 20.1. Структурная схема системы передачи информации
меху.
1 Собственные шумы передатчика и приемника включены в указанную по-
559
тим, что из общей формулировки многоальтернативной задачи
различения (т;>1) при so(t)^O следует задача совместного об-
обнаружения и различения сигналов. /
20.1.2. Априорные данные. Общая формулировка задачи раз/
личения сигналов, приведенная в п. 20.1.1, должна быть допол,*-
нена априорными данными. Сведения о том, как часто передают-
передаются те или иные сигналы, можно использовать для задания ап-
априорного распределения вероятностей гипотез
{, / = 0, т. B0.2)
Когда передача любого сигнала равновероятна,
Po = Pi= ... =pm=l/(m+l). B0.2а)
Помеха l(t) предполагается аддитивной и, следовательно, сим-
символ ® в B0.1) означает суммирование. Кроме того, в большей
части этой главы, за исключением § 20.4, аддитивная помеха —
стационарный центрированный гауссовский случайный процесс с
известной корреляционной функцией.
Проводится синтез как аналоговых, так и одношаговых дис-
дискретно-аналоговых алгоритмов различения сигналов. В послед-
последнем случае, как и в задаче обнаружения сигнала, непрерывная
реализация x(t) подвергается временной дискретизации, и на-
наблюдение представляется неоднородной выборкой заданного раз-
размера п. Каждая выборка
x=(*i, ..., хп), Xi = x{ti), xeXn, Ut=(O, Т), i = ~n B0.3)
является элементом векторного выборочного пространства, на ко-
котором задана система функций правдоподобия W(x\Hj), / = 0, т.
Если аддитивная помеха — гауссовская, то [ср. A5.4) ]
W (x\Hj) = B д)-"/2 (det К)-1/2 х
X ехр { - -1 (х - sjY К-1 (х - s,) J , B0.4)
где
Sj={sju ..., sjn), Sji = Sj{ti),j = O9 m, i=l, я, B0.4а)
К — корреляционная матрица размером пХп, элементы Ки кото-
которой определяются корреляционной функцией помехи:
Ян = Яе(/*-*,),и=ТЯ B0.46)
Элемент Щ,- матрицы потерь является платой, соответствую-
соответствующей событию yuOHj, т. е. совмещению решения о передаче сигна-
сигнала Sky когда истинной была гипотеза Hj о передаче сигнала Sj.
Если Ukj=l—6ftj, где 6kj — символ Кронекера, то матрицу потерь
называют простой. В этом случае платы за правильные решения
равны нулю, а за ошибочные — одинаковые. В задачах различе-
различения сигналов в системах связи чаще всего используется простая
функция потерь.
560
20.1.3. Синтез оптимальных алгоритмов различения сигналов.
имеется полный комплект априорных данных, то можно
синтезировать оптимальный байесовский алгоритм различения
Сипналов по критерию минимума среднего риска [см. A3.50)]
т т
'¦= 2 S П„р,РЫЯ,}. B0-5)
/=,0 k=0
Байесовским алгоритмом различения сигналов является также
^алгоритм, оптимальный по критерию минимума апостериорного
риска (см. п. 12.4.2):
4= 2 П„Р{//,|х}. B0.6)
/=о
Ограничимся байесовскими алгоритмами различения сигналов
при простой функции потерь. Теперь из B0.5) следует
B0.7)
где Р{уи\Hj} при кф]' представляет вероятность перепутывания
сигналов sk и S;. Поэтому формула B0.7) определяет вероятность
рош ошибочного решения. Эту формулу можно также переписать
в виде
1-Я=1-рош = /7пр = f РкР{Ун\Нк), B0.8)
которая определяет вероятность правильного решения.
Таким образом, при простой функции потерь байесовский ал-
алгоритм оптимален по критерию максимума вероятности правиль-
правильного различения сигналов. При этом из B0.6) следует
Jk=l-P{Hh\x}9 B0.9)
т. е. байесовский критерий оптимальности совпадает с критерием
максимума апостериорной вероятности гипотезы (см. п. 13.3.4).
Оптимальный дискретно-аналоговый алгоритм различения сиг-
сигналов (оптимальное правило выбора решения) формулируется в
рассматриваемом случае следующим образом [см. A3.56)]: при-
принимается решение уь, о том, что передан сигнал Sk{t), если
pkW(x\Hh)= max pjW (x\H,)9 k = 07m, B0.10)
Так как логарифм монотонная функция, то оптимальное пра-
правило B0.10) можно переписать в виде
]nW (x\Hk) + \npk= max [\nW (x\Hj) + \npj\, k = (?rn. B0.11)
0
20.1.4. Достаточные статистики. Минимальной достаточной
статистикой в рассматриваемой задаче синтеза оптимального ал-
561
горитма различения сигналов является т скалярных функцй*
векторной выборки х — отношений правдоподобия
/г(х)-Ц7(х|Яг)/^(х|Яо), i= 1, т, B0.12а)
или логарифмов отношений правдоподобия
|Я0)]; 1=ТГт. B0Л26)
В регулярном случае (см. п. 13.9.2) существует предельная до-
достаточная статистика — т функционалов отношения правдоподо-
правдоподобия
h [* (t)] = Hm l% (x), / = lm, B0.13а)
П->оо
или т логарифмов функционалов отношения правдоподобия
In lt [х (*)] = Hm In lt (x), i = lTm. B0.136)
М-»оо
Используя достаточную статистику B0.126), можно оптималь-
оптимальный по критерию максимума апостериорной вероятности дискрет-
дискретно-аналоговый алгоритм B0.41) различения сигналов представить в
следующем виде [см A3.57) ]: принимается решение о том, что
передан сигнал Sh(t), если
In lk (x) + In pk = max [In lj (x) + In pj], k = \jny B0.14)
B0.14a)
и решение о том, что передан сигнал So(O» если
, /=Т77п. B0.146)
Если в соотношениях B0.14), B0.14а,б) отношения правдопо-
правдоподобия заменить функционалами отношения правдоподобия
B0.13а), то получим оптимальные по указанному выше критерию
аналоговые алгоритмы различения сигналов.
20.2. РАЗЛИЧЕНИЕ ДЕТЕРМИНИРОВАННЫХ СИГНАЛОВ
НА ФОНЕ АДДИТИВНОЙ ГАУССОВСКОЙ ПОМЕХИ
20.2.1. Оптимальный дискретно-аналоговый алгоритм разли-
различения. Предположим, что передаваемые сигналы so(t), ..., sm{t)
детерминированы, а помеха в канале связи—аддитивная центри-
центрированная гауссовская помеха с известной корреляционной функ-
функцией. Наблюдаемая на входе приемника на интервале @, Т) ре-
реализация x(t) смеси сигнала с помехой подвгргается временной
дискретизации, в результате которой получаем векторную вы-
выборку х заданного размера п [см. B0.3)]. Эта выборка представ-
представляет векторную гауссовскую случайную величину с вектором
средних Sj [см. 20.4а)], если верна гипотеза Hj (передан сигнал
Sj(t)), и с одинаковой для всех гипотез корреляционной матри-
матрицей К [см. B0.46)].
562
Из B0.11), учитывая B0.4), находим оптимальный по крите-
критерию максимума апостериорной вероятности дискретно-аналого-
дискретно-аналоговый алгоритм различения детерминированных сигналов на фоне
аддитивной гауссовской помехи. Принимается решение о том, что
сигнал su(t)t если
max
(s'.K-1 х- — s'.K'1 s^ + lnлЛ # B0.15)
\ ' 2 ' У
Обозначим величины, зависящие только от априорных данных,
аналогично тому, как это сделано в п. 15.5.1:
u'^s'jK-1, B0.16)
Cj = d\5l2-\nph d*nj = s'jK-%, B0.17)
и перепишем B0.15) более компактно:
u'kх — ch = max (и.х — с3). B0.18)
Для равновероятных сигналов pj=l/(m-f-l) и одинаковых для
всех сигналов величин dnj = dn оптимальный алгоритм различения
сводится к определению максимального скалярного произведе-
произведения
Уп/(х)= 2 uJixi = uJx9j = 0~m. B0.19)
Итак, рассмотренное оптимальное правило различения сигна-
сигналов основано на формировании из векторной выборки х и век-
вектора строки (матрицы размером пХ 1) u/= (u'o, ..., и^) вектор-
векторной достаточной статистики
yn(x)=u'x B0.20)
с последующим сравнением компонент ynj(x), / = 0, m этой ста-
статистики (или разностей ynj(x)—Cj) для определения максималь-
максимальной.
Если х — выборка помехи, то статистика B0.20)— векторная
гауссовская случайная величина с нулевым вектором средних
значений и ковариационной матрицей размером (m+l) X {tn+ 1),
элементы которой равны s'iK-^,-; /, / = 0, т.
Если после временной дискретизации наблюдаемой реализа-
реализации получена независимая выборка, то корреляционная матрица
К = а21, где а2 — дисперсия помехи, I — единичная (диагональная)
матрица. В этом случае из B0.16) следует u/j = s/jl/a2 и из
B0.19), B0.20), опуская постоянный множитель I/a2, получаем
векторную достаточную статистику
yn(x)=s% B0.21)
563
где s'= (so, ..., sm). Компоненты такой статистики представляют
скалярные произведения сигнальных и выборочных векторов
4, /чг\ с' v — \^ с v * —— ГУ tn
l/Tij V / / — 2^ ji ™ii J — ^*> "••
Из B0.17) находим, что в рассматриваемом случае
- i
B0.22)
B0.23)
Заметим, что каждая из статистик B0.19) аналогична доста-
достаточной статистике A5.25) при обнаружении детерминированного
сигнала на фоне аддитивной коррелированной гауссовской поме-
помехи, а каждая из статистик B0.20) аналогична достаточной ста-
статистике A5.10) при обнаружении на фоне независимой гауссов-
гауссовской помехи. При этом параметры d2nj совпадают (при фиксиро-
фиксированном сигнале) с соответствующими параметрами рабочей ха-
характеристики обнаружения [см. A5.31) и A5.20)].
20.2.2. Структурная схема оптимального дискретно-аналогового
алгоритма различения. Учитывая отмеченную аналогию достаточ-
достаточных статистик в задачах обнаружения и различения сигналов на
фоне аддитивной гауссовской помехи, нетрудно представить
структурную схему оптимального алгоритма B0.18) (см. п. 15.1.5
и рис. 15.4). Как показано на рис. 20.2, устройство, реализующее
алгоритм B0.18) состоит из набора т+\ цифровых фильтров h^
с испульсными характеристиками [ср. с A5.33)]
hWn-d = Uji, /=*0, m, i=l, п. B0.24)
Когда на входы фильтров поступают выборочные значения, на
их выходах в конце наблюдения формируются статистики
B0.19). После вычитания констант Cj [см. B0.17)] все статисти-
статистики y<nj(x)—Cj поступают в устройство сравнения (компаратор),
выбирающее максимальное значение, которое и определяет при-
принятие решения уи в соответствии с алгоритмом B0.18). Если
Cj = c, то операция вычитания в схеме B0.2) опускается и значе-
значения статистик с выходов фильтров непосредственно поступает в
блок сравнения.
Рис. 20.2. Схема алгоритма
различения сигналов
564
При независимой выборке х импульсная харатеристика /-го
фильтра [ср. с. A5.23)]
Уп_* = 5;г, /=0Гт. 1=ТГл, B0.25)
f9 е согласованный [с сигналом Sj(tf)] цифровой фильтр.
20.2.3. Вероятность правильного решения. Примем за рабочую
характеристику оптимального алгоритма различения сигналов
|20.18) зависимость вероятности рпр правильного решения от ап-
априорных данных. Ограничимся анализом этой характеристики
для равновероятных сигналов и одинакового для всех сигналов па-
параметра d2n [см. B0.17)]. Из B0.8), B0.4) находим
1
2 B n)-n/2 (det к)-*/* J exp ( - ± (x-sft)' K (x-
-sft)|dx, B0.26)
где Хь — область выборочного пространства Хп, определяемая
соотношением [см. B0.18)]
и;х- max vl'.x. B0.27)
После несложных преобразований находим из B0.26)
/?пр = -i— ехр ( - ^Л 2 Bя)-«/2 (det К)-1/2 X
/я -f- 1 V 2 / ft=o
X J ехр (ы^х) ехр ( х' К" х ] dx =
xft \ 2 /
= —— ехр ( - — ) тх {ехр ( max u'.x)}, B0.28)
причем усреднение происходит по распределению гауссовской по-
помехи.
Используя B0.19), введем нормированные случайные величи-
величины
y*j = ynj(x)/dn, / = 0, т. B0.29)
Если выборка х принадлежит гауссовской помехе, то случайные
величины B0.29) подчиняются нормальному распределению с
нулевыми средними значениями и ковариациями
= ^j> U / = 6Г^, B0.30)
которые представляют нормированные билинейные формы сиг-
сигнальных значений
565
с коэффициентами, являющимися элементами обратной корреля-
корреляционной матрицы помехи.
Функция распределения случайной величины У= max y*j
М</ = ) 1 ... f wu. (z0, - , zm) dz0 ... dzm, B0.31)
—oo —oo
где Wy*(z0, ..., zm)—многомерная плотность нормального распре-
распределения вероятностей с нулевым вектором средних и корреляци-
корреляционной матрицей Л={^,-}. Из B0.31) следует
wY(y)=- — Г J ... | Bn)-№W (detA)-1^ x
У J_—oo —oo
X exp f - -L z' A-« z ) dz0 ... dZ;n ] , B0.32)
где z'= (г0, ..., zm).
Используя B0.28), B0.29) и B0.32), находим
= exp
l
~ 4) mi {exp (dn Y)) =
exp ( - -=2-1 B я)-С"+1 )/2 (det Л)-'/2 х
m+ 1
xf f [f ... I exp(--lz'A->z)dzlexp(dny)df/.
— oo ЯУ L—oo — oo \ / J
B0.33)
Когда Л=1, т. е. кц = 6ц9 в B0.33) интегрирование по переменным
?<>, •••, ^т разделяется и тогда вероятность правильного решения
X exp (dn у) dy = -±— ] F"{x + dn) exp ( - ^Л dx, B0.34)
/2я -со \ 2 I
где f(x)—интеграл Лапласа. В этом случае вероятность пра-
правильного решения, как и рабочая характеристика обнаружения
сигнала (см. п. 15.1.6), полностью определяется единственным
параметром dn-
20.2.4. Синтез оптимального дискретно-аналогового алгоритма
различения сигналов при фильтровом способе дискретизации. В
п. 20.2.1. при синтезе оптимального алгоритма исполь-
использовалась мгновенная дискретизация реализации х({) в фиксиро-
фиксированные моменты времени. Как отмечалось в п. 15.1.7, можно ис-
использовать другой — фильтровой — способ дискретизации, при
котором элементы выборки (координаты) оказываются некорре-
некоррелированными, а для гауссовской помехи — независимыми.
566
Оставим обозначение х=(хи ..., xN) для векторной выборки,
#огда ее компоненты, полученные фильтровым способом, пред-
представляют совокупность независимых гауссовских случайных ве-
величин, причем
h$ (t)(t)dt, B0.35)
f Sj(t)Vh(t)dt, B0.36)
i(*k - shJ) (хг - su)\Hj) = 8ы, КI = LN,1 - 0, m, B0.37)
— собственные числа, {щ$)}—ортонормированная сово-
совокупность собственных функций интегрального уравнения A5.38).
Функция фь@ определяет импульсную характеристику линейно-
линейного фильтра, на выходе которого в конце интервала наблюдения
выделяется координата хи реализации x(t) (см. A5.39) и рис.
15.6).
Из B0.35) — B0.37) находим функцию правдоподобия выбор-
выборки независимых координат при гипотезе Hf
W (x\Hj) = B л)-"/* ехр [ - -i- (х - s,)' (х - •,) ] -
= B д)-^/2 ехр Г - ± s (*t - siiI] . B0.38)
Используя B0.38) и повторяя рассуждения в той же после-
последовательности, что и в п. 20.2.1, получаем следующее оптималь-
оптимальное по критерию максимальной апостериорной вероятности пра-
правило различения детерминированных сигналов на фоне аддитив-
аддитивной гауссовской помехи: принимается решение, что передан сиг-
сигнал Sh(jt), если
s'kx-ck= max (s^.x-С/), B0.39)
где
c^\s^l2-lnpi9 / = 0, m. B0.40)
При равновероятных сигналах и при
|s,|» = 2 4 = <&,/= Mi, B0.40a)
i=i
оптимальный алгоритм различения B0.39) состоит в определе-
определении максимума (по индексу /) величины
N
jfor/(x) = s,'x= 2 su^,/-0,m. B0.41)
Структурная схема алгоритма B0.30) не отличается от изо-
изображенной на рис. 20.2, но при иной интерпретации обозначений:
567
x — выборка размером N, полученная фильтровым способом (см.
рис. 15.6); №> — линейный цифровой фильтр, импульсная харак-
характеристика которого определяется «сигнальными» координатами
B0.36). по формуле, аналогичной B0.25); Cj — константы, вычис-
вычисляемые по B0.40).
Вероятность правильного решения при использовании алго-
алгоритма B0.39) для равновероятных сигналов и фиксированного
значения d2N определяется по формуле B0.34) с подстановкой
dN вместо параметра dn [см. B0.40а)].
Как уже отмечалось в п. 15.1.8, не следует отождествлять ал-
алгоритм для мгновенной дискретизации при независимой выборке
с алгоритмом для фильтровой дискретизации при коррелирован-
коррелированной выборке. Независимая выборка при мгновенной дискретиза-
дискретизации отличается от выборки независимых координат, а детермини-
детерминированные величины Skj в B0.36) отличаются от сигнальных зна-
значений, определяемых согласно B0.4а), так как «сигнальная» ко-
координата Skj зависит не только от сигнала Sjtf), но и от корреля-
корреляционной функции помехи, которая служит ядром интегрального
уравнения A5.38).
Соображения, приведенные в п. 15.1.9 при сопоставлении дис-
дискретно-аналоговых алгоритмов обнаружения сигналов, использу-
использующих различные способы дискретизации наблюдаемой реализа-
реализации x(i), можно отнести и к рассмотренным дискретно-аналого-
дискретно-аналоговым алгоритмам различения сигналов.
20.2.5. Оптимальный аналоговый алгоритм различения сиг-
сигналов. Как указано в п. 20.1.4, оптимальный по критерию макси-
максимума апостериорной вероятности аналоговый алгоритм различе-
различения сигналов формируется из B0.14) подставкой вместо лога-
логарифмов отношений правдоподобия логарифмов функционалов от-
отношения правдоподобия. Полученное в п. 15.2.2 выражение для
логарифма функционала отношения правдоподобия для случая
различения двух детермированных сигналов на фоне аддитивной
гауссовской помехи очевидным образом обобщается на случай
произвольного числа сигналов.
Для сигнала Sj{t) логарифм функционала отношения прав-
правдоподобия
In h [x @1 = / U @ - S'(O+S°(O1
[V, (t) - Vo (t)] dU i=Uh,
B0.42)
где Vj(t)—решение неоднородного интегрального уравнения
/ Bt (t, у) Vj (у) dy = sj (t). 0 < / < Г, / - 0^h. B0.43)
о
Статистика B0.42) представляет линейный функционал гауссов-
568
ского случайного процесса — случайную величину, распределен-
распределенную по нормальному закону с параметрами
т1 {In tj [x (t)]|Hj} = (я2 {In lj [x (t)\Hj) =
=¦ 4" / 1SJ @ - so @1 [Vj it) - Vo (t)] dt, j « f7^. B0.44)
2 о
Регулярный случай имеет место, если величины, определяемые
формулой B0.44), ограничены.
Используя B0.2), получаем следующий оптимальный аналого-
аналоговый алгоритм различения детерминированных сигналов на фоне
аддитивной гауссовской помехи: принимается решение о том, что
передан сигнал Sk(t)9 если
(t) Vk (t) dt-ck~ max^ Г/ x (t) V, (t) dt - Cj\ , B0.45)
0
где
Cj=d*Til2r-\npi, B0.46)
4/= fs,(/)V,(9<tf =
= / / Bi (t, y) Vj (t) Vj (y) dtdy. B0.47)
о о
Структура аналогового алгоритма B0.45) аналогична струк-
структурам дискретно-аналоговых алгоритмов B0.18) и B0.39). Ве-
Весовые коэффициенты Uj и Sj при линейной обработке выборки за-
заменяются весовой функцией Vj[t) при линейной обработке не-
непрерывной реализации, причем эти весовые функции, как и ука-
указанные весовые коэффициенты, зависят от вида сигналов и от
корреляционной функции помехи.
Указанная аналогия распространяется и на структурную схему
аналогового алгоритма B0.45), которая получается из структур-
структурной схемы, изображенной на рис. 20.2, иной интерпретацией эле-
элементов этой схемы. Блок №\ на входы которых поступает на-
наблюдаемая реализация x(t)y представляет аналоговые линейные
фильтры с импульсными характеристиками
h, (т)= I J*' ~Т'' --т^ ' B0.48)
10, т<0,т>7\/ = 0,т.
Константы Cj вычисляются по формуле B0.46).
Если сигналы равновероятны, а величины d2Tj = d2T одинаковы
для всех сигналов, то из B0.45) следует
Г х (t) Vk (t) dt = max f x (t) V* (t) dt, B0.49)
т. е. блоки вычитания констант Cj в схеме на рис. 20.2 отсутству-
отсутствуют. Вероятность правильного решения в этом случае определяется
569
по формуле B0.33), в которой параметр d2n заменяется величи-
величиной d2T, а элементы матрицы А определяются по формуле
= — / / Bi (и, v) Vt (и) Vj (v) dudv. B0.50)
d\ о о
и
d\ о о
20.2.6. Различение детерминированных сигналов на фоне бе-
белого гауссовского шума. Корреляционная функция белого шума
со спектральной плотностью No равна Bg (/—y)=N08(t—у)
[см. D.116)]. В этом случае использование фильтрующего свой-
свойства дельта-функцйи позволяет очень просто найти решение ин-
интегрального уравнения B0.43):
Vj(t)=sJ{i)/NOt 0<f<r, / = 0, m. B0.51)
Подставляя B0.51) в B0.45), получаем оптимальный аналоговый
алгоритм различения сигналов на фоне аддитивного белого га-
уссовского шума: принимается решение о том, что передан сиг-
сигнал Sk(t), если
— / sk (t) х (t) dt-ck= max \— / Sj (t) x (t) dt - cj] , B0.52)
О О O^j^tri Ion I
где Cj определяется по формуле B0.46), в которой параметр
B0.53)
т. е. равен отношению энергии Ej сигнала Sj(t) на интервале
наблюдения к спектральной плотности белого шума.
Для равновероятных сигналов одинаковой энергии Ej = E со-
соотношение B0.52) перепишется в виде
т т
Г sk (t) x (t) dt = max f Sj (t) x (t) dt. B0.54)
0 0^/^m 5
T
Корреляционный интеграл j Sj(i)x(t)dt определяется на вы-
o
ходе согласованного с сигналом Sj(t) аналогового фильтра (см.
п. 15.3.4), поэтому блоки №> на структурной схеме алгоритма
(рис. 20.2) представляют согласованные фильтры.
При использовании алгоритма B0.54) вероятность правильно-
правильного решения вычисляется по формуле B0.33), где параметр d2n
заменяется величиной d2T=E/N0i а элементы матрицы А
ь-и = 4 / s^ W sj @ л> l> i = о^- B0-55)
ь о
Для ортогональных сигналов Xij = 6ij и тогда [см. B0.34)]
570
Если Aij = X<l, то
IFm (x+ V^)exp (-f
Можно доказать (см., например, [44]), что временной коэф-
коэффициент % взаимной корреляции сигналов не может быть мень-
меньше — 1//п и, следовательно, максимальная вероятность правиль-
правильного решения
B0.566)
При различении двух сигналов so(t) и S\(t) одинаковой
энергии Е минимальное значение Х= — 1 соответствует противо-
противоположным сигналам $i (/) =—So{t), а в соответствии с B0.566)
при т=\ вероятность правильного различения таких сигналов
на фоне белого гауссовского шума
():- B0-58в)
20.3. РАЗЛИЧЕНИЕ КВАЗИДЕТЕРМИНИРОВАННЫХ
УЗКОПОЛОСНЫХ СИГНАЛОВ НА ФОНЕ АДДИТИВНОЙ
ГАУССОВСКОЙ ПОМЕХИ
20.3.1. Постановка задачи. Предположим теперь, что каждый
из /п+1 передаваемых сигналов представляет узкополосный ра-
радиосигнал (ср. с. п. 15.4.1)
Sjtf) = a, (t) cos [<юо*—гЫ*)+фо], 0</<7\ / = 0, /п, B0.57)
где aj(t)y г|ъ(О—детерминированные процессы (определяющие
амплитудную и фазовую модуляции сигнала), которые медленно
меняются за один период Го = 2я/соо, а фо — случайная фаза, рас-
распределенная равномерно на интервале @, 2я). Как и в § 20.2,
предполагается, что в канале связи сигнал B0.57) искажается
аддитивной гауссовской центрированной стационарной помехой с
известной корреляционной функцией 5| (т). Известны также ап-
априорные вероятности pj передачи каждого из сигналов.
Наблюдаемая на входе приемника реализация x(t) случайно-
случайного процесса является аддитивной смесью неизвестного сигнала и
помехи. Задачи различения квазидетерминированных сигналов
B0.57) состоит в синтезе оптимального алгоритма, позволяющего
по наблюдаемой реализации x{i) принять решение с том, какой
из /п+1 возможных сигналов содержит эта реализация. Под оп-
оптимальным критерием будем понимать максимальную апостери-
апостериорную вероятность гипотезы о переданном сигнале (см. п. 20.1.3).
Отличие рассматриваемой задачи от задачи синтеза алгорит-
алгоритмов различения детерминированных сигналов состоит в том, что
571
в ее постановке содержится параметрическая априорная неопре-
неопределенность, связанная со случайностью начальной фазы ф0 сиг-
сигнала (некогерентный прием). В этом случае оптимальные алго-
алгоритмы различения в качестве достаточных статистик используют
усредненные по случайной фазе отношения правдоподобия (при
синтезе дискретно-аналогового алгоритма) или функционалы от-
отношения правдоподобия (при синтезе аналогового алгоритма).
20.3.2. Оптимальный дискретно-аналоговый алгоритм различе-
различения узкополосных сигналов. Для синтеза оптимального дискрет-
дискретно-аналогового алгоритма различения сигналов B0.57) на фоне
аддитивной гауссовской помехи используем фильтровой способ
дискретизации, в результате которой получаем независимую вы-
выборку лоордиисп х=^ \Хх, „., л/v), где xki &—1, N, определяется uj
формуле B0.35). «Сигнальные» координаты [см. B0.36)]
skj = т1 {xk\Hj} = sckj cos ф0 - sj7 sin cp0, k = TjV, j = 67m, B0.58)
где
4i = V^ / aj (t) cos [coo t - ty (О] щ (t) dty B0.59)
о
s\. = VK / Щ (t) sin [coo / - $j (t)} Фй (i) dt. B0.60)
0
Формулу B0.58) можно записать в виде
Skj = Skj cos (фо—ф/tj), B0.61)
где
]V*, B0.61a)
B0.616)
Так как координаты Xk, k=l, N представляют совокупность
независимых гауссовских случайных величин с дисперсиями, рав-
равными единице, и со средними значениями при гипотезе Hjy рав-
равными Skj [см. B0.61)] то, при фиксированной фазе ф0 функция
правдоподобия векторной выборки этих координат
W (x\Hh фо) - B я)-"/2 exp j - -i 2 [** - Su cos (Фо - Ф,;)]21 .
B0.62)
Из B0.62) получаем выражение логарифмов усредненных по
начальной фазе ф0 отношений правдоподобия
[2Я / 2Я 1
J W (х\Н„ Ф0) йщ I J W (х| Но, Фо) d ф0 =
-Qo(x),/=r^, B0.63)
572
где
t2n ( N \
I exp 2 XiSu cos (qo-<pu) x
о w=i J
X exp J - ~- ]g SJ, cos2 (Фо - <р„) J dcp0 j, / = бГт . B0.64)
йепользуя B0.63), получаем оптимальный дискретно-аналоговый
-алгоритм различения сигналов: принимается решение ук [присут-
[присутствует сигнал Sfc@]> если
Qk (х) + In ph = max [Q, (x) + Щ p,]. B0.65)
2U.3.3. Оптимальный аналоговый алгоритм различения узко-
полосных сигналов. Из B0.42) следует, что логарифм усреднен-
усредненных по начальной фазе >ф0 функционалов отношения правдоподо-
правдоподобия
lnAj[x(t)]=Qj[x(t)]—Qo[x(f)y] /—1. m, B0.66)
где
J- J exp H U@-a,@cos[co0^
- ^ @ + Фо1/2] Vj (t) dt} d Фо j , B0.67)
а функции Kj(/) представляют решение интегрального уравнения
{см. B0.43)]
/ % (t, у) Vj (у) dy = aj (t) cos [©01 - ^j (i) +
о
+ Фо1» ° < t < 7, / = 67m. B0.68)
Используя B0.66), получаем оптимальный аналоговый алго-
алгоритм различения сигналов: принимается решение у&, присутствует
сигнал Sk(t)> если
Qk [х (Щ + In pk = max [Q, [x (/)] + In p^]. B0.69)
Алгоритм B0.69), как и алгоритм B0.65), достаточно слож-
сложный. Его можно значительно упростить тогда, когда аддитивная
помеха представляет гауссовский белый шум.
20.3.4. Оптимальный аналоговый алгоритм различения узко-
узкополосных сигналов на фоне белого шума. Для белого шума на-
находим следующее решение интегрального уравнения B0.68)
[см. B0.51)]:
1
Vj @ = — aj (t) cos [coo t - %• (t) + <p0], / = 0, m. B0.70)
Теперь результат усреднения функционала отношения правдопо-
573
добия по случайной начальной фазе можно представить в замк-
замкнутом виде. Для этого заметим сначала, что для узкополосных
сигналов B0.57) при coo 71!
Ej - J a] (t) cos2 [coo t - % @ + Фо] dt « 4~ J fl/ @ d/- B0-71)
О 2 0
Подставляя B0.70) в B0.67) и учитывая B0.71), получаем
— J exp J — J * (/) ау @ cos [соо / — -фу @ +
2я 0 l^o о
+ Фо1 dt ] d ф0] - -J- / a2 @ d/, / = Mi. B0.72)
J J 4yv° о
Обозначив
xcj = -J- J x (t) aj (/) cos [coo t - ^ @1 dt, B0.72a)
"о о
xw- = 7Г / * @ «7 @ sin К * - ty @1 dt, B0.726)
^o о
г2г; = х2е;+х2^, B0.73)
T|)rj = arctg(x6j/xCj). B0.73a)
Запишем B0.72) в виде
— J exp{rr/cos(q>0 +
гп 0
/)) d фл f #2. @ d/, / = 0, m. B0.74)
J ^A о о
Интеграл в первом слагаемом выражения B0.74) представляет
модифицированную функцию Бесселя нулевого порядка:
]о (rTi) = — j exP {т/ cos (ф0 + -фг/)} dфo. B0.74а)
2л 0
Подставляя B0.74а) в B0.74) и обозначая
d\f = — J fl2 (/) d^ B0 746)
получаем
Г' = 0ГлГ B0.75)
В соответствии с общим алгоритмом B0.69) оптимальный анало-
аналоговый алгоритм различения узкополосных сигналов на фоне ад-
аддитивного гауссовского белого шума состоит в определении мак-
574
B0.75): принимается решение, что передан сигнал
> если
In Io (rTk) -ch= max [In Io (rr/) - c,], B0.76)
B0.77)
Если сигналы равновероятны и энергии Ej сигналов на интер-
щщ наблюдения одинаковы, т. е. d2Tj = d2r = ?VAfo, то, учитывая
Анотонность функции Io (я) Бесселя при х^О, приходим к более
|шостому алгоритму: принимается решение, что передан сигнал
^fe{0>если
Tk'
max r\. ,
B0.78)
r2Tj определяется по формуле B0.73).
Структурная схема алгоритма B0.78) изображена на рис. 20.3.
20.3.5. Вероятность правильного решения. Определим вероят-
вероятность /?пр правильного решения при использовании оптимального
даиюритма B0.78) и дополнительном условии ортогональных сиг-
сигналов
Указанную вероятность можно записать в виде
= max rTi}y
B0.80)
?ак как равенство, заключенное в фигурных скобках B0.80), и
равенство B0.78) — эквивалентные события.
Случайные величины xcj и x8j, / = 0, т [см. B0.72а и б)], как
фшнейные функционалы гауссовского случайного процесса, пред-
ф
ф
ф*
хсо
X
KB
кв
KB
KB
Рис. 20.3. Схема алгоритма различения квазидетерминированных сигналов на фо-
фоне белого шума:
'Ф] и Ф*^ — линейные фильтры, согласованные с сигналами aj{t)cos[wot—ф;-@]
и <ij(t)sin[wot—i|5j@] соответственно [см. B0.72а и б)]
575
ставляют гауссовские случайные величины. Принимая во внима-
внимание соотношение B0.71), которое характеризует узкополосность
рассматриваемых сигналов, нетрудно определить средние значе-
значения и ковариации случайных величин xCj и x8j:
mi {xcj | Hk} = d2T6h j cos Фо, B0.81)
mi {x8j | Hh) = d22 8kj sin фо, B0.82)
hj, k9 / = 0, m. B0.83)
Из B0.73), а также B0.83), следует, что случайные величины
rTj, / = 0, m, представляют модули случайных векторов на плос-
плоскости, компоненты xcjuxsj которых независимы, распределены по
норхМальному закону с постоянной для всех векторов дисперсией,
равной й2т> т. е. отношению энергии сигнала к спектральной плотно-
плотности белого шума. При ]фк средние значения компонент xCj и xSj
равны нулю [см. B0.81), B0.82)] и, следовательно, распределение
случайных величин ttj подчиняется закону Рэлея с параметром
d2T [см. C.51)]. При j = k случайная величина гТк подчиняется
обобщенному распределению Рэлея [см. C.50)] с плотностью
ехр [_ {^Щ h(j^).x>0. B0.84)
Так как при \фк совместная плотность распределения случайных
величин гти / — 0, т,
m у ( X2- \
W (х х^ Гг. i х ) — ГТ 7 *™ i L
/^* B0.85)
то в соответствии с B0.80) вероятность правильного решения
с» XX
0 0 0
... , xm) dx0 ... d%_t dxk+1 ... dxm dx, B0.86)
где WrTk к W определяются согласно B0.84), B0.85). После
подстановки указанных функций плотности в B0.86) и ряда
преобразований с использованием табличного интеграла получа-
получаем окончательно
Рпр = m , |
(см. например, [60], п. 5.7.9).
20.3.6. Последетекторная обработка наблюдаемой реализации
случайного процесса. Часто целесообразно оптимальную обработ-
обработку наблюдаемой реализации узкополосного случайного процесса
осуществить после ее амплитудного и (или) фазового детектиро-
детектирования, т. е. используя медленно изменяющиеся огибающую г it)
576
Я фазу ф(/) узкополосного процесса (или квадратурные состав-
составляющие Xci^t) и xs(t) наблюдаемой реализации x(t)). Поскольку
смодулированное колебание cos((oo?4-(po) не содержит инфор-
информации о передаваемых сигналах и служит лишь переносчиком
этой информации, то оптимальные последетекторные алгоритмы
различения сигналов, использующие огибающую и фазу, столь же
аффективны, как и оптимальные додетекторные алгоритмы. Та-
Такие последетекторные алгоритмы назовем амплитудно-фазовыми.
Однако могут быть синтезированы оптимальные алгоритмы, ос-
,$юванные на обработке только огибающей или только фазы на-
наблюдаемого процесса.
Далее будут рассмотрены лишь амплитудно-фазовые опти-
оптимальные алгоритмы различения квазидетерминированных сигна-
сигналов на фоне аддитивной гауссовской помехи. Для этого использу-
используем тот же подход, что и в § 15.4 для синтеза амплитудно-фазовых
оптимальных алгоритмов обнаружения квазидетерминированных
сигналов. Оптимальные амплитудные и оптимальные фазовые ал-
алгоритмы различения квазидетерминированных сигналов могут
гбыть получены обобщением алгоритмов обнаружения, рассмот-
рассмотренных в § 15.5.
Для синтеза последекторных алгоритмов используем понятие
комплексной огибающей (см. п. 15.4.2). Узкополосные сигналы
B0.57) и гауссовская помеха %(t)
i)otI /=0, m, B0.88)
I (t) = Re Z\ (t) exp (i ©<>/), B0.89)
где ZSj(t)exp(icpo) и Z\(t) —комплексные огибающие сигнала
Sj(t) и помехи, причем
t ZSj (t) = aj (t)exp[—i^@]. B0.90)
Введем также комплексную огибающую Z(t) наблюдаемой
реализации
*(O=ReZ(/)exp(i(Do/). B0.91)
При гипотезе Hjy / = 0, т:
Z(t)=xc(t)—ixs(t)=ZSl(t)exp([yo)+Zl (t). B0.92)
20.3.7. Дискретно-аналоговый амплитудно-фазовый оптималь-
оптимальный алгоритм различения квазидетерминированных сигналов.
Рассмотрим координаты комплексных огибающих Z(t) наблюдае-
наблюдаемой реализации смеси сигнала и аддитивной гауссовской помехи
и Zs. (t) сигнала (J)
** = xh + i yk =
*kj = "kj + bhJ =
19-87
VK
S ¦
0
0
Z(t)q>h
zSi 0)
(f)dt,k =
<fh(t)dt,k
UN,
= \,N,
B0.93)
B0.94)
577
где Xh>0 и фь(/)—собственные числа и собственные функции
комплексного интегрального уравнения [ср. с E.115)]
<p(*) = A,J Я26(*-и)ф(и)?*и, 0<f<7\ B0.95)
о
?Ц (т) — корреляционная функция комплексной огибающей ста-
стационарной гауссовской помехи.
Компоненты хи Уи •••, xNf \)n координат комплексной огибаю-
огибающей Z{t) представляют совокупность независимых гауссовских
случайных величин с дисперсиями, равными единице при любой
гипотезе, и со средними значениями [ср. с A5.119)]
т\ {хи | Hj) = akj cos фо—bkj sin фо, B0.96a)
mi {yk| Hj} =akj sin q>o+bkj cos фо, B0.966)
так как
i<vo)f *=1, N, / = 0, m. B0.96b)
Как и при выводе формулы A5.122), находим следующие вы-
выражения усредненных по равномерно распределенной фазе отно-
отношений правдоподобия:
Aj(z19 ... , z*Hexp Г-4- (^/-ЗД ГГТ- /= !'т' B0'97)
где
r2 __
- Ьи xtf | f / = 0,т, B0.98)
d*Ni= S I^vl2= 2 К+ *?,). / = 0Т^. B0.99)
i=i f=i
Из B0.97) получаем следующий дискретно-аналоговый, ам-
амплитудно-фазовый оптимальный алгоритм различения квазиде-
терминированных узкополосных сигналов: принимается решение,
что передан сигнал Shit), если
In Io (rNk) -ск= max [In Io (rNi) - cj[, B0.100)
где
Cj=d2Nji/2—lnpjt /=0, m. B0.101)
Заметим, что алгоритм B0.100) проще алгоритма B0.65), хо-
хотя оба они обладают одинаковой эффективностью.
При равновероятных сигналах и при dNj = dN из B0.100), учи-
учитывая монотонность модифицированной функции Бесселя при
578
получим более простой алгоритм: принимается решение,
что передан сигнал Sk(t), если
г%г B0.102)
20.3.8. Аналоговый амплитудно-фазовый оптимальный алго-
алгоритм различения квазидетерминированных сигналов. Для перехо-
перехода к пределу при N-+oo в B0.97) используем тот же подход, что
и в п. 15.4.4 для комплексных огибающих Z(t) наблюдаемой реа-
реализации и ZSj (t) сигнала Sj(t), / = 0, т. В результате получим
следующее выражение усредненного по фазе функционала отно-
отношения правдоподобия [ср. с A5.134) и B0.97)]:
Л,- [Z (*)] = Г - — Щ.- d2ro) 1 ^^-, / - пт, B0.103)
где
J Uj(t)Zjt)dt ,/ = 07m, B0.104)
о
d%. = J щ (t) ZSj (t) dt, } - 0,m, B0.105)
0
а функция Uj (t) — решение неоднородного линейного комплексно-
комплексного интегрального уравнения
/ Вч (t - у) щ (у) dy = Zs/ @, 0 < t < T, j = 0Г^, B0.106)
0
где Bzg (т)—корреляционная функция комплексной огибающей
стационарной гауссовской помехи.
Из B0.103) получаем следующий аналоговый амплитудно-
фазовый оптимальный алгоритм различения квазидетерминиро-
квазидетерминированных узкополосных сигналов: принимается решение, что пере-
передан сигнал Sk(t), если
InIo (тл) -ch= max [InIo (rT}) -cjl, B0.107)
где
Cj = d2Tj/2—inpj9 / = 0, m. B0.108)
Заметим, что алгоритм B0.107) проще алгоритма B0.69), хотя
оба они обладают одинаковой эффективностью.
При равновероятных сигналах и при dTj=dT из B0.107) полу-
получим более простой алгоритм: принимается решение, что передан
сигнал Sk(t), если
rTk= max rTi. B0.109)
19* 579
20.4. АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЕ АЛГОРИТМЫ
РАЗЛИЧЕНИЯ СИГНАЛОВ
20.4.1. Основные положения. Асимптотический принцип синтеза
алгоритмов, рассмотренный в гл. 17 и 18 применительно к зада-
задачам обнаружения сигнала, можно использовать и для синтеза
асимптотически оптимальных дискретно-аналоговых алгоритмов
различения сигналов на фоне помех с произвольным распределе-
распределением вероятностей.
Предположим, »что в результате временной дискретизации на-
наблюдаемой реализации случайного процесса на входе приемника
получена выборка размером п
x=.(*i, ..., Хп), Xi=x(ti), *4е@, Г), i=l, п. B0.110)
Выборку значений /-го сигнала в моменты времени /i, ..., tn запи-
запишем в виде
XnSj=(XnSijy ..., Ksnj), Sij = Sj(ti), / = 0, m, B0.111)
причем [ср. A7.1)]
XnV~n = Vn, 0<7n<oo. B0.112)
Для состоятельного алгоритма 6П различения сигналов веро-
вероятность правильного решения рпрFп, Яп)—И при п-+ооу если
Хп-^Х>0 (см., например, B0.34) при dn-+<x>). Ограничение
B0.112), при котором Яп-^0, когда я-^оо, позволяет, как и в за-
задачах обнаружения сигнала, синтезировать алгоритмы различе-
различения, асимптотически несингулярные.
Назовем последовательность алгоритмов 6пао различения сиг-
сигналов асимптотически оптимальной, если для любой другой по-
последовательности 8п
Ит [/7пр (б*0, К) - /7ПР (бп, %п)\ > 0. B0.113)
Для асимптотически оптимального алгоритма различения сигна-
сигналов при условии B0.112) существует отличный от единицы и ну-
нуля предел
Нт рпр («Г, Уп/Vn) = Pop (Sa°, Y). B0-113а)
Синтез асимптотически оптимальных алгоритмов различения
сигналов на фоне помех основан на исследовании асимптотичес-
асимптотических свойств логарифмов отношений правдоподобия B0.126). Для
этого можно непосредственно воспользоваться результатами, при-
приведенными в гл. 17, 18, если представить выражение B0.126) в
виде
1п/,-(х)= Ы*,-(х)—Ы*о(х), /= 1. т, B0.114)
где
, / = 0, т B0.115)
и W(x) —функция правдоподобия помехи.
580
20.4.2. Асимптотически оптимальный алгоритм различения де-
детерминированных сигналов на фоне аддитивной независимой по-
помехи. Запишем асимптотическое разложение статистики
ln/*j(x), определенной согласно B0.115), опустив член, который
яри я->оо сходится по вероятности к нулю [см. A7.58), A8.3)]:
lnl*j(x)=yyni(x)—y2lfWj/2, /=Tm, B0.116)
где
УпИ*) = = S stjfixi), B0.117)
Vn ,=1
/(*)=- — 1поф), B0.118)
dx
Wj = lim — 2 s?/ '20.119)
и I/ — информация по Фишеру о помехе [см. A7.22)].
Распределение статистики B0.116) при п-*оо асимптотически
нормальное с параметрами
ml{l*j(x)\Hh}=y4fWjh—y4fWjJl2; /, ? = 0, т, B0.120а)
где
U7/ft = lim-J- ? SiJ S(k, Wjj = Wh B0.1206)
у, fe==Of т. B0.120b)
Из B0.14) и B0.116) следует, что при использовании незави-
независимой выборки х асимптотически оптимальный алгоритм различе-
различения сигналов на фоне аддитивной помехи можно представить сле-
следующим образом: принимается решение, что передан сигнал
sk(t), если
У Упк (х) - V1 If Wkl2 + bph = max [y ynj (x) -
-?lfWjl2 +In pj]. B0.121)
Для равновероятных сигналов одинаковой нормированной
мощности Wj=W8 алгоритм B0.121) существенно упрощается и
сводится к сравнению статистик B0.117) с выбором наибольше-
наибольшего значения
ynk(x)= max ynJ(x). B0.122)
В этом случае структурная схема устройства различения сигна-
сигналов проста и состоит из безынерционного преобразователя выбо-
выборочных значений с характеристикой f(x) [см. B0.118)], дискрет-
дискретных корреляторов К и блока сравнения с выбором максимума
(рис. 20.4).
581
№
Ко
Рис. 20.4. Схема асимптотически оп-
оптимального алгоритма различения де-
детерминированных сигналов
Для определения вероятности
правильного решения можно ис-
использовать формулу B0.26), в
которой область ХА выборочного
пространства определяется соот-
ношением B0.122). При этом сле-
дует учесть, что распределение
статистики B0.177), как и статистики B0.116), асимптотически
нормальное, а параметр d2n в формулах п. 20.2.3 заменяется ве-
величиной lfWs- Таким образом, получаем следующее выражение
вероятности правильного решения:
ехр (-
тах
-123>
где Упз(х) определяется согласно B0.117) и усреднение происхо-
происходит по распределению помехи. Если х — выборка независимой по-
помехи, то случайные величины
I/a, / = 0, m, B0.124)
подчиняются асимптотически нормальному распределению с ну-
нулевыми средними и ковариациями
... , ... ... , 1
1
lfW8n
lfWan
2 2
1=1 Г=1
¦-i-г
ИЛИ ПрИ
mi {y*njy*m} = WnjW=
м W,
B0.125)
Тогда вероятность правильного решения можно вычислить по
формуле B0.33), в которой элементы матрицы Л определяются
согласно B0.125), а параметр d2n = I/\^s-
Если различаемые сигналы ортогональны, то Wji/W=6ji и ма-
матрица Л становится единичной. В этом случае вероятность пра-
правильного решения [см. B0.34) ]
'-—)dx, B0.126)
где ^(л:) — интеграл Лапласа.
20.4.3. Асимптотически оптимальный алгоритм различения мо-
модулированных гармонических сигналов со случайными фазами на
фоне аддитивной независимой помехи. Предположим, что разли-
582
чаемые нормированные сигналы представляют модулированные
колебания вида
У=0, m, X20.127)
где aj(f), i|3j(/) —заданные медленно изменяющиеся по сравнению
с coscooi функции времени, cooj — фиксированные частоты и (pOj,
/=0, т — совокупность независимых начальных фаз, каждая из
которых распределена равномерно на интервале @,2я). Допустим
также, что априорные вероятности появления сигналов и их мощ-
мощности одинаковы.
Пусть х — независимая выборка заданного размера /г, получен-
полученная путем временной дискретизации наблюдаемой реализации ад-
аддитивной смеси сигнала и помехи, a XnSj — векторная выборка зна-
значений t-ro сигнала [см. B0.110), B0.111)]. На основе этих выбо-
выборок определим следующие статистики:
\УшMl1 = ОДУ(х)]2 + ОДУМ]1, / = 0, т, B0.128)
где
М = -J=r 2 / (*i) fl« cos (o)o; /, - %j), B0.129)
w
П i=l
i, 1=ТГп,} = 0Гт, B0.131)
функция /(а:) определена согласно B0.118).
Используя результаты, приведенные в п. 18.4.4, при выполне-
выполнении условия B0.112) и по аналогии с B0.122) получаем следую-
следующий асимптотически оптимальный алгоритм различения квази-
детерминированных сигналов B0.127) на фоне" аддитивной неза-
независимой помехи: принимается решение, что передан сигнал Sk(t)t
если
^(x)|2. B0.132)
Компоненты #(i)nj(x) и #B)nj(x) асимптотически нормальны,
независимы, а их дисперсии одинаковы и равны мощности сиг-
сигнала:
W8 = Wj = lim f a) (t) dU B0.133)
Результаты, приведенные в § 17.4, 18.3 и 18.5, можно исполь-
использовать и для синтеза асимптотически оптимальных алгоритмов
различения сигналов на фоне коррелированных помех, которые
здесь не рассматриваются.
583
Глава 21
ОЦЕНИВАНИЕ ПАРАМЕТРОВ И ФИЛЬТРАЦИЯ
СИГНАЛОВ НА ФОНЕ ПОМЕХ
21.1. ОПТИМАЛЬНЫЕ АЛГОРИТМЫ ОЦЕНИВАНИЯ
ПАРАМЕТРОВ ДЕТЕРМИНИРОВАННОГО СИГНАЛА
НА ФОНЕ АДДИТИВНОЙ ГАУССОВСКОЙ ПОМЕХИ
21.1.1. Постановка задачи в априорные данные. Обоз-
Обозначим через x(t)* реализацию случайного процесса X(t)t наблю-
наблюдаемую на интервале (О, Т). Априори предполагается, что про-
процесс X(t) представляет аддитивную смесь детерминированного
сигнала s(t\ ft) и случайной помехи l(t)
X(t)=s(t; ft)+t(t), B1.1)
где
¦=(«ь..., От), 0^6, B1.2)
— вектор неизвестных параметров сигнала.
Необходимо на основании определенного правила (алгоритма),
оптимального по некоторому критерию, сформировать вектор оце-
оценок ft неизвестных параметров сигнала как векторный функционал
от наблюдаемой реализации:
ft=ft[x(t)], 'е=@, Г), {21.3)
причем дев, так как обычно пространство оценок совпадает с
пространством оцениваемых параметров.
Задача оценивания неизвестных параметров сигнала на фоне
помехи в отличие от задач обнаружения и различения сигналов
представляет вторую разновидность задач теории статистических
решений (см. п. 12.1.2). Для ее решения необходимы дополнитель-
дополнительные априорные данные.
Будем предполагать, что аддитивная помеха ?(/)—центриро-
рованный гауссовский случайный процесс с известной корреля-
корреляционной функцией B(ty у). Сначала рассмотрим аналоговый ал-
алгоритм оценивания, оптимальный по критерию максимального
правдоподобия (см. п. 14.6.3). Для указанных априорных данных
логарифм функционала отношения правдоподобия [ср. с A5.56)]
[(*)—Ls(/; O)]tff B1.4)
0 L 2 j
где V(t\ ft)—решение неоднородного линейного интегрального
уравнения
$ B(t, u)V(u\ ft)du = s(t\ ft), 0<*<7\ B1.5)
i
21.1.2. Оценки максимального провдоподобия. Аналоговые оцен-
оценки максимального правдоподобия получаются решением системы
уравнений максимального правдоподобия [см. A4.136]). Для это-
этого определим, прежде всего, частные производственные по пара-
параметрам от логарифма функционала отношения правдоподобия
B1.4):
д ln
о
д
B1.6)
z 0 0®
Но из B1.5) следует
$V(t; ®)~-s(t; b)dt = fV(t; •)[/*(*. u)-?-V(щ Ъ) du]dt
/
0
= !-TrV(u; d)s(«; *)d«. B1.7)
Подставляя B1.7) в B1.6), получаем
д
Js(/;*)]?ttf f=l, m. B1.8)
Из B1.8) непосредственно следует система уравнений макси-
максимального правдоподобия
J s(/; *)]d/ = 0, i=lTm. B1.9)
Решая систему уравнений B1.9) относительно неизвестных па-
параметров <h,..., Фт, находим оценку максимального правдоподо-
правдоподобия векторного параметра ft сигнала
B1.10)
при дополнительном условии, что информационная матрица Фи-
Фишера с элементами
Т т д
U' y)dudy* if i"l'm*
B1.11)
при '0i='0'Mn положительно определенная (см. п. 14.2.7).
58S
Если %(t) представляет белый гауссовский шум со спектраль-
спектральной плотностью No, то из B1.5) следует
V(t; tf)=s(/; #)/JV0 B1.12)
и система B1.9) значительно упрощается:
l? . B1.13)
О ™i
Для белого шумд элементы информационной матрицы Фишера
[см. B1.11)]
L± ^ *, /=Г^. B1.14)
iv
0
21.1.3. Линейная модель сигнала. Рассмотрим линейную отно-
относительно неизвестных параметров модель сигнала
s(t; О) =2 <>;М0. B1.15)
где Sj{t), /= 1, т — известные функции.
Найдем совместные оценки максимального правдоподобия па-
параметров 01,..., Фт. Подставляя B1.15) в правую часть B1.5), за-
заменяем интегральное уравнение B1.5) системой уравнений
т
Г B(ty u)Vi(u)du = Si(f), 0</^7\ i=l,m. B1.16)
о
Функция V(t\ 0), от которой зависит логарифм функционала
отношения правдоподобия,
V(t\ O)= 2fyVy@. B1-17)
у *
Из B1.17) находим
Подставляя B1.18) в B1.9), получаем систему уравнений мак-
максимального правдоподобия
jy^] B1.19)
о L J
или
2 ¦// Vt (t) sj (t) dt = ]vt (t) x (t) dt, i = TT^. B1.20)
/=1 0 0
Обозначим
STti = fvt(i)!ij(f)dt, B1.21a)
0
xTt = SVt(f)x(f)dt. B1.216)
о
586
Тогда система линейных уравнений B1.19) запишется в виде
, = х„, i = T7~m, B1.22)
или в матричной форме
sTtf=xT, B1.23)
где sT — матрица размером тХт, элементы которой равны sTi,j,
а * и хг — векторы-столбцы, элементы которых fy и Хт% соответ-
соответственно.
Полагая, что для всех /
[ s){f)dt<oo B1.24)
и что В(/, и)—положительно определенная функция, приходим к
заключению, что существует матрица sr, обратная матрице sT.
Тогда решение уравнения B1.23) приводит к следующим оценкам
максимального правдоподобия неизвестных параметров:
*Mn = s?ixr. B1.25)
Используя левую часть B1.19), найдем элементы информаци-
информационной матрицы Фишера [см. B1.11)]:
' п = m11} Vt (и) \х (и) - 2 *ft sk (и) ] da x
(о L *=i J
о L n=*i
= J [ В (и, v) Vt (и) Vj (v) du dv
T
$u)bj(u)dut i, j=l, m. B1.26)
о
Из B1.26) следует, что информационная матрица Фишера по-
положительно определенная вследствие положительной определен-
определенности корреляционной функции помехи, причем элементы этой
матрицы не зависят от параметров Оч, •••, Фт. Таким образом, ре-
решение B1.25) действительно представляет оценку максимально-
максимального правдоподобия векторного параметра #.
Заметим, что правые части формул B1.21а) и B1.26) совпа-
совпадают, т. е. информационная матрица Фишера 1Т совпадает с ма-
матрицей St. Тогда формулу B1.25) можно переписать в виде
Для белого гауссовского шума с интенсивностью No из B1.16)
следует, что
1=!7Я B1.28а)
587
и элементы матрицы sT и вектора хг преобразуются к виду [см.
B1.21а) и B1.216)]
B1.286)
Y — 1_ f с (f\y(f\ М i—\m /91 9Rr\
No о
21.1.4. Анализ оценки максимального правдоподобия. Дока-
Докажем, что векторная оценка B1.25) несмещенная. Из B1.25) на-
находим
тг {#мц} = s^:1 тг {хТ}. B1.29)
Но
m T m
Щ i*Ti} = 2 fy J si W ^г @ ^^ = 2 ^ sTij
и, следовательно,
/tzi {xr} = srfl1. B1.30)
Подставляя B1.30) в B1.29), получаем
mi iKu} = *» B1.31)
что и доказывает утверждение о несмещенности оценки B1.25)
максимального правдоподобия векторного параметра линейной мо-
модели сигнала.
Найдем корреляционную матрицу М рассматриваемых оценок
максимального правдоподобия
М - тг {(Ьшп - О) (*мп - *)'}. B1.32)
После несложных преобразований и подстановки вместо дмп ее
выражения из B1.25) имеем с учетом симметричности матрицы sT
= S71m1{xrx'r}s71-«•«•'. B1.33)
Но
тг {хТ{ хт/} = / / В (и, v) V, (и) V} (v)
о о
и, следовательно [см. B1.16)],
mi {хгх'г} = sr + StM'st. B1.34)
Подставляя B1.34) в B1.33), находим i
M=st=I-1t. .B1.35)
588
Из B1.35) следует, что рассматриваемые оценки максималь-
максимального правдоподобия параметров линейной модели сигнала совме-
совместно эффективнее.
21.1.5. Оценку амплитуды детерминированного сигнала. Рас-
Рассмотрим оценку максимального правдоподобия неизвестной ампли-
амплитуды а детерминированного сигнала as(t) на фоне аддитивной га-
уссовской помехи. Эта оценка является частным случаем рассмо-
рассмотренной в п. 21.1.3 оценки при т=1 и <&i = a. Из B1.25) для рас-
рассматриваемого скалярного случая следует
<*мп = / V@х@dtljv(t)s(t)dt = VV B1 -36)
0 /0
где
xT= J V(t)x(t)dt, B1.37a)
о
sT=}v(t)s(f)dt, B1.376)
0
V(t)—решение линейного интегрального уравнения [см. B1.16)]
J B(t9 u)V(u)du = s(t)fi^t^T. B1.38)
о
Из общих результатов анализа оценки максимального правдо-
правдоподобия векторного параметра линейной модели сигнала, приве-
приведенных в п. 21.1.4, следует, что оценка B1.36) амплитуды сигнала
несмещенная м эффективная», т. е.
т1{амп}=а, B1.39а)
. B1.396)
Оценка B1.36) является линейным функционалом гауссовско-
го случайного процесса. Поэтому она представляет гауссовскую
случайную величину со средним а и дисперсией s~lT. Это позво-
позволяет довольно просто получить интервальную оценку амплитуды
сигнала (см. п. 14.5.3). Так как
где F(z) —интеграл Лапласа, то доверительный интервал для неиз-
неизвестной амплитуды сигнала может быть представлен неравенствами
Ямп - x{x-4wlY7T <a< aM>n + х{1-у)/2/УГТ, B1.40)
где Х(\~у)/2 — процентная точка нормального распределения, опре*
деляемая по заданному коэффициенту доверия у.
589
Для белого гауссовского шума V(t)=s(t)fN0 и из B1.36) сле-
следует
амп = J s (t) х (t) dt I / s2 @ dt. B1.41)
0 / 0
В этом случае отношение дисперсии оценки к квадрату оцени-
оцениваемой амплитуды сигнала
= #0/?, B1.41а)
т. е. равно отношению спектральной плотности белого шума к
энергии сигнала на интервале наблюдения.
21.1.6. Реализация оптимального аналогового алгоритма оце-
оценивания амплитуды сигнала. Для реализации оптимального ана-
аналогового алгоритма оценивания амплитуды сигнала на фоне ад-
аддитивной гауссовской помехи необходимо вычислить нормирован-
нормированный корреляционный интеграл B1.36). Эту операцию можно осу-
осуществить при помощи аналогового коррелометра или физически
реализуемого линейного фильтра с импульсной характеристикой
(см. п. 15.3.2)
W I 0, т<0, т>7\ '
Эта импульсная характеристика зависит от нормированного сиг-
сигнала s(t) и корреляционной функции B(t, и) помехи, которые оп-
определяют решение V(t) интегрального уравнения B1.38).
Сравнивая B1.42) и A5.95), обнаруживаем аналогию опти-
оптимальных устройств обнаружения детерминированного сигнала и
оценки его амплитуды на фоне гауссовской помехи. Это сравне-
сравнение показывает, что оптимальная оценка амплитуды получается
в конце наблюдения на выходе фильтра, используемого в обнару-
обнаружителе, если только импульсная характеристика фильтра норми-
нормируется величиной sT (или умножается на дисперсию оценки). За-
Заметим, что значение Sr>0 совпадает с параметром d2T рабочей
характеристики обнаружения [см. A5.90)].
Подобная аналогия в структурах обнаружителя и устройства
оценивания имеет место при использовании дискретно-аналоговых
алгоритмов (см. задачу 21.2).
При оценке амплитуды сигнала на фоне аддитивного белого
гауссовского шума
( s(T -т) /Is4t)dt, 0<т<7,
/ф)Ч •' 7 5 B1.43)
I 0 , т<0, т>7\
В этом случае оптимальная оценка амплитуды получается на вы-
выходе согласованного фильтра (см. п. 15.3.4), импульсная характе-
характеристика которого нормируется интегралом [ s2(t)dt.
о
590
21.1.7. Линейная оценка с минимальной дисперсией. Хотя B1.36) представ-
представляет оценку максимального правдоподобия амплитуды сигнала в том случае,
когда помеха — аддитивная, гауссовская, эта оценка сохраняет некоторые важ-
важные свойства и для нег^уссовских помех. Ясно, что эта оценка всегда несме-
несмещенная. Кроме того, молЦо показать, что в классе линейных оценок она име-
имеет минимальную дисперсию.Х
Пусть оценка амплитудьХ
Т
a=\g{t)x{t)dt B1.44)
о
при условии несмещенности
т
[g(t)s(t)dt=\. B1.44а)
Тогда по аналогии с B1.396)
т т
M«W I g(t)g(u)B(ttu)dtdu. B1.45)
о о
Найдем нижнюю границу значений дисперсии для всевозможных1 функций g(t)
при соблюдении условия B1.44а), которое с учетом B1.38) можно переписать
в виде
т т
J f g(t)V(u)B(t,u)dtdu = l.
о о
Воспользовавшись неравенством Буняковского-Шварца, получим
откуда следует, что [см. B1.45)]
= ( J 1 g@V(«M(U)^) <
\o о /
T T T T
j V (t) V (и) В (tt u) dtdu j j g @ g («) Я (*, и) d/d«,
0 0 0
дует, что [см. B1.45)]
От т ч-i / г x-i
[ J У@К(и)В(/,и)ЛЛ|| =( J V(/)s(/)tf )
или [см B1.376)]
M'2W>5-1r. B1.46)
Таким образом, нижняя граница дисперсий линейных оценок амплитуды
сигнала на фоне произвольной аддитивной центрированной помехи с корреля-
корреляционной функцией B(t, и) достигается при g(t)=h(t), где h(t) — импульсная
характеристика фильтра, определенная согласно B1.42). При негауссовой по-
помехе дисперсию оценки можно уменьшить, используя нелинейный алгоритм
оценивания. При гауссовой помехе линейная оценка амп обладает минимально
1 Предполагается, конечно, что класс функций g(t) ограничен не только ус-
условием B1.44а), но и требованием ограниченности \лг{а}, т. е. сходимости в сред-
неквадратическом стохастического интеграла B1.44).
591
возможной дисперсией, которую уже невозможно уменьшить» применяя нели-
нелинейный алгоритм обработки наблюдаемой реализации хШ. Приведенные вы-
выше результаты справедливы при
т т
sT = j \ V(t)V(u)B(t,u)dtdu>OJ B1.47)
О 6
т. е. когда корреляционная функция положительно определена. Это условие,
как отмечалось в гл. 15, соответствует регулярному случаю. Если же Sr = 0,
то имеет место сингулярный случай. Наличие аддитивного белого шума явля-
является достаточным для выполнения условия B1.47), так как при B(t, и) =
т т т
sT = j j" V(t) V(u)B1(ttu)dtdu+N0 j V*(t)dt>Q> B1.47a)
0 0 0
потому что первое слагаемое в B1.47а) неотрицательное, а второе — положи-
положительное. Следовательно, наличие аддитивного белого шума исключает сингу-
сингулярный алгоритм оценивания.
21.1.8. Оценки амплитуды и фазы гармонического сигнала.
Проиллюстрируем общие результаты п. 21.1.3 еще на одном при-
примере, в котором сигнал s(t\ #)—гармонический с известной ча-
частотой coo и неизвестными амплитудой а и фазой <р:
s{t\ <h, ^2) =а cos ((not—ф) =
=a cos ф cos (aot+a sin <p sin ш0^ B1.48)
и, следовательно, [см. B1.15)]
<01=acosq), x}2=asin(p, B1.49а)
Si(t)= cos(uOt, S2(t)—s'm®0t. B1.496)
Выпишем элементы вектора хт и матрицы sr [см. B1.21а и б)]:
/ B1.50)
ST2l
где Vi
T
0
T
SB
0
II II
(t)
(t,
(t.
0
о
и
и)
и)
'2(/)COS(D
Va(t)-
V1 (a) da =
1/ A1\ fi 1 i -
0/Л, sTl2
otdt, sT22
0
т
P
0
Vt(f)simaotdt,
решения интегральных уравнений
= cos©0f, 0<^<T,
^sinaH^,
B1.51a)
B1.516)
B1
B1
.52a)
.526)
fi(f, a) — корреляционная функция аддитивной гауссовской по-
помехи.
592 .
Подставляя\B1.50), B1.51) в B1.23) и решая систему двух
линейных относительно <h и Фг уравнений, получаем оценки мак-
максимального правдоподобия этих параметров:
т т \
j J V (и, ») х (и) sin co0 v du dv
АО) о о\ /9
т
f
0
т
г
0
т
S
V(u,
т
oJFl
\
v) co\co0 и sin cd0 vdudv
\
\
[и у v) х (t?)\cos coo vdudv
^B1 -536,
J j F(tt, y) cos co0 a sin coo vdudv
о о
где
V(u, v) = V1(u)V2(v)-V1(v)V2(u). B1.54)
Для белого гауссовского шума с интенсивностью No из B1.52а
и б) следует
Vi(t)=No-lcos®ot, V2(t) =iVo-1sincoo^ B1.55)
и
у (мэ t;) = iVo [cos coo м sin сэ0 и—cos coo ^sin coo ti]. B1.56)
Подставляя B1.56) в B1.53а, б) и полагая (о0Т=2п% где k —
целое число, находим после простых вычислений
= — J х (a)cos соо ada, B1.56а)
т о
^ — J ^ (a)sin (oo ada. B1.566)
Т о
Оценки B1.56а и б) некоррелированы (так как для белого шу-
шума sr2i=sT2i=0), а следовательно, и независимы, в силу того, что
распределение каждой из этих статистик нормальное. Дисперсии
указанных оценок одинаковы:
Средние значения этих несмещенных оценок
тЛСЧ-acos_q>, тЛйпЧ-азШф. B1.58)
Оценки максимального правдоподобия B1.56а и б) можно ис-
использовать для получения оценок амплитуды и фазы сигнала на
фоне аддитивного белого гауссовского шума:
Г /
Т \2 ТЩ i T \ 2~| 1/2
= |/-Lf x(t) cos <u0tdt) +(— Г x(t) sin <»01 dt) \ , B1.59)
г /г
arctg(Cn /*in ) = [ x(t)sina.idt \x(t) cosco0/Л. B1.60)
0 / Q
593
Можно доказать (см., например, [60], гл. 6.1.2),,что для белого
шума оценки B1.59) и B1.60) являются оценкой максимально-
максимального правдоподобия амплитуды и фазы сигналу B1.49).
Используя результаты, приведенные в п/3.2.3, находим, что
оценка B1.59) амплитуды распределена по обобщенному закону
Рэлея со средним
и дисперсией
т\\й), B1.616);
где
d2T=BTfNo)a2. B1.61b)
Из B1.61а) видно, что оценка B1.59) амплитуды смещенная.
Но при d2T->oo эта оценка асимптотически несмещенная, так как
при d2r»l
m1{a}csDa[l+B/rf2T)]. B1.62а)
Если <22т»1, то из B1.616) и B1.62а) следует также
T. B1.626)
Функция распределения оценки B1.60) фазы <р для аддитив-
аддитивного белого шума определяется по формуле C.57). Так как это
распределение симметрично, то оценка фазы несмещенная. В со-
соответствии с C.65) дисперсия этой оценки
Щ{ф>—Г" + 4я*2 (- 1)"— . B1-63)
где
^У - B1-63а>
Распределение оценки ф асимптотически нормальное при
со средним ф и дисперсией (см. п. 3.2.5)
21.2. БАЙЕСОВСКИЕ АЛГОРИТМЫ ОЦЕНИВАНИЯ
СЛУЧАЙНОЙ АМПЛИТУДЫ КВАЗИДЕТЕРМИНИРОВАННОГО
СИГНАЛА НА ФОНЕ АДДИТИВНОЙ ГАУССОВСКОЙ ПОМЕХИ
21.2.1. Постановка задачи и общее решение. Предположим, что на интер-
интервале @, Т) наблюдается реализация x(t) случайного процесса, представляюще-
представляющего смесь случайной помехи с квазидетерминированным сигналом as(t), ампли*
594
туда л которого^ случайна с известной плотностью распределения до (а). Необ-
Необходимо, используя\реализацию x(t), синтезировать оптимальную по байесовско-
байесовскому критерию оценкК амплитуды сигнала. В соответствии с A4.140) общее ре-
решение этой задачи представляет апостериорное среднее значение оцениваемой
амплитуды сигнала, т. eN
оо \
U6=$aWla\x(t)]da, \ B1.64)
. -оо \
где
W[a\x{t)]= _*)П
J до (a) l[x(t)\a)da
— оо
Как указывалось в п. 14.6.3, условное среднее B1.64) является байесовской
оценкой для любых четных функций потерь и для унимодальных, симметрич-
симметричных относительно моды апостериорных плотностей вероятности Ща| *(?)]•
Если помеха — аддитивная, центрированная, гауссовская с известной кор-
корреляционной функцией B(t, у), то функционал отношения правдоподобия
I [а @ | а] = exp (axT—a2sT/2), B1.66)
где Хт и sT определяются по формулам B1.37а, б).
21.2.2. Нормальное распределение амплитуды сигнала. Предположим, что
амплитуда а квазидетерминированного сигнала является гауссовской случай-
случайной величиной с известными средним значением а0 и дисперсией о20. Тогда
Плотность вероятности амплитуды
J/B(J2o)]. B1.67)
Определим апостериорную плотность вероятности амплитуды, используя
реализацию x(t) аддитивной смеси сигнала и гауссовской помехи. Из B1.65) —
{21.67) следует
W [a\x (t)) = ехр[-(а- ао)УB а20)) ехр (ахт - a* sT /2) х
ехр [ — (а — 4J/Bап) + а (хт ~~ asT /2)I da г
-00 J
Вычисляя интеграл, заключенный в фигурных скобках, получаем после не-
несложных преобразований
W [a/x(t)] = A + a2 sT )'/2 B яа2)- х
Г l+a^Sf ( ao + alxT \2]
*">[—^"("--TT^rjJ- B1№)
Из B1.68) следует, что в рассматриваемом случае апостериорная плотность
вероятности описывается функцией нормальной плотности вероятности с пара-
параметрами: условное среднее значение
п
щ {а\х (t)} = °°ХТ B1.69)
1 ~т~ ^о ^т
; 595
и условая дисперсия
|А2{а|*(О}=а2о/A+а2о*т). B1-70>
Ясно, что функция плотности B1.68) унимодальна и симметрична относительна
условного среднего mx{a\x(t)}. Поэтому в рассматриваемом случае для любой»
четной функции потерь искомая байесовская оценка амплитуды а квазидетер-
минированного сигнала [см. B1.69) и B1.36)]
а0 + o-q хт
аб= = (ao +
\ + 2
где йып — оценка максимального правдоподобия,
v2=(j2oSt >B1.72>
— отношение дисперсии априорного распределения амплитуды к дисперсии ее
оценки максимального правдоподобия [см. B1.396)].
Из B1.71) следует, что байесовская оценка представляет среднее взвешен-
взвешенное двух величин: оценки максимального правдоподобия и априорного среднего
а0, причем отношение веса, приписываемого первой величине, к весу второй
равно v2. Ясно, что в рассматриваемом случае байесовская оценка распределен-
распределенной по нормальному закону амплитуды сигнала совпадает с оценкой макси-
максимальной апостериорной плотности ^б = #мап.
Если отношение v2 неограниченно возрастает, т. е. дисперсия оценки мак-
максимального правдоподобия много меньше дисперсии априорного распределе-
распределения, то
аб~амп, B1.73а)
т. е. байесовская оценка приближается к оценке максимального правдоподо-
правдоподобия. Если дисперсия априорного распределения много меньше дисперсии оцен-
оценки максимального правдоподобия, то
Дб~а0, B1.736)
т. е. наблюдаемая реализация не влияет на оценку, которая принимается рав-
равной априорному среднему оцениваемого параметра.
Для белого гауссовского шума из B1.41а) и B1.71) следует
B1.74)
В этом случае
v2=l(a2o/a2)i(?s/Wo), B1.75)
т. е. равна отношению дисперсии априорного распределения к квадрату амп-
амплитуды сигнала, умноженному на отношение энергии сигнала к спектральной
плотности белого шума.
Рассмотрим некоторые свойства байесовской оценки амплитуды квазиде-
терминированного слагаемого. Так как эта оценка получается линейной обработ-
обработкой наблюдаемой реализации x(t), то распределение ее нормальное (как и оценки
максимального правдоподобия). Найдем среднее и дисперсию байесовской оцен-
596 |
ки Яб, причем сначала получим условные средние и дисперсию при фиксиро-
фиксированном а, а затем безусловные, усредняя по а. Из B1.71) следует
m1{a6|a}=a0+(a-a0)v2/(l+v2),
щ{аб | а}=v2 A +v2) -2 [(J2o+v2 (a-a0J],
и так как m!{a}=a0, |Л2{я}=оо, то усредняя по а, получаем
B1.76а)
(j2o. B1.766)
При v2-4) дисперсия байесовской оценки также стремится к нулю, а при.
асимптотическое значение этой дисперсии равно о*2о.
21.2.3. Асимптотические свойства байесовской оценки амплитуды сигнала с
произвольным распределением. Запишем выражение байесовской оценки ампли-
амплитуды квазидетерминированного сигнала с произвольной плотностью w(a) при^
наблюдении реализации аддитивной смеси сигнала с гауссовской помехой. Из^
B1.64)—B1.66) находим
~ / a*sT \
] aw (a) exp I axT — da
— :
? / a*sT \
\ w (a) exp I axT - -y- J da
a6 = — : - B1.77)
? / a*s \
где
т т
xT = \ V(t)x(t)dt, sT = I V(t)s(t)dtt
о о
V(t) — решение интегрального уравнения
т
J B(tf u)W(u)du=s(t)f 0<t<T.
о
Дополняя экспоненты в подынтегральных выражениях до полных квадра-
квадратов, после элементарных алгебраических преобразований находим из B1.77)
( 8T Nl/2 Г ST ( XT vi
a) exp a —
При Г->с» значение st неограниченно возрастает. Тогда
/ sT У'2 I 8т ( хт \2'\ J *т\
—— ехр — -— а — \-+ 6 [а
и из B1.78), предполагая непрерывность w(a) и используя фильтрующее свой-
свойство дельта-функции, получаем асимптотическую формулу для байесовской?
оценки амплитуды при Г->-оо:
=амп. B1.79)
59Г
Независимо от вида априорного распределения w(a) байесовская оценка аъ
«амплитуды а сходится при Т^оо к оценке максимального правдоподобия.
Для белого гауссовского шума
а*8т =7Г 1 st<ftdt=7T •
т. е. указанная асимптотика имеет место при неограниченном увеличении отно-
отношения энергии сигнала на интервале наблюдения к спектральной плотности
шума.
Асимптотические свойства байесовских оценок векторного случайного пара-
параметра квазидетерминйрованного сигнала для широких классов распределений
помех и параметра, а также функции потерь исследованы в [61].
21.3. ОПТИМАЛЬНАЯ ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ
21.3.1. Постановка задачи и априорные данные. Предположим
теперь, что на интервале наблюдения (О, Т) получена реализация
x(t) аддитивной смеси сигнала l(t) и помехи r\{t), которые пред-
представляют центрированные случайные процессы с известными кор-
корреляционными функциями Bt(u, v) и Вц(и, v), причем и сигнал,
и помеха необязательно гауссовские. Необходимо синтезировать
оценку ?(/) стохастического сигнала по наблюдаемой реализации
х(%), О^т^Г.
Определение оценки l(t) как функционала от л:(т) при t=T
называется задачей фильтрации сигнала, при 0<?<Г— задачей
интерполяции сигнала и при t>T — задачей экстраполяции (или
прогнозирования) сигнала. Располагая реализацией аддитивной
смеси сигнала и помехи, иногда необходимо определить также
оценку ?(*) некоторого другого стохастического сигнала ?@,
представляющего требуемую операцию над сигналом ?(?). Это
может быть линейная операция (сдвиг, одйократные или много-
многократные дифференцирование и интегрирование) или даже нели-
нелинейная.
Рассмотрим задачу оптимальной линейной фильтрации сигна-
сигнала на фоне аддитивной помехи, которая формируется следующим
образом. В качестве оценки сигнала принимается линейный функ-
функционал
i(t) = ]h(t, t-u)x(t-u)du, B1.80)
о
т. е. значение процесса на выходе линейного фильтра с импульс-
импульсной характеристикой h(t, т), когда на вход действует наблюда-
наблюдаемая реализация смеси сигнала с помехой. Необходимо в классе
этих линейных фильтров определить фильтр, оптимальный по кри-
критерию минимума среднего квадрата ошибки оценивания
min ol (t) = min mx (e2 {t)}, B1.81)
h h
.598
где
s(t)=l{t)-l(t). B1.82)
Так как по предположению сигнал и помеха — центрирован-
центрированные случайные процессы, то средний квадрат ошибки совпадает
с ее дисперсией. Поэтому критерий B1.81) будем называть кри-
критерием минимума дисперсии ошибки.
Далее будет показано, что для определения импульсной харак-
характеристики h*(t, т) такого оптимального фильтра достаточно рас-
располагать указанными априорными данными о сигнале и помехе.
Рассматривается наиболее распространенная ситуация, когда сиг-
сигнал и помеха некоррелированы, хотя без существенных усложне-
усложнений решения задачи это предположение можно опустить, если ап-
априори заданы взаимные корреляционные функции сигнала и поме-
помехи (см., например, [60]).
Достаточно полное изложение теории оптимальных линейных
дискретно-аналоговых и аналоговых алгоритмов фильтрации, ин-
интерполяции и экстраполяции стохастических сигналов дано в [62].
Первыми основополагающими работами в области теории опти-
оптимальной линейной фильтрации были работы А. Н. Колмогорова
[63] иН. Винера [64].
21.3.2. Импульсная характеристика оптимального фильтра.
Предположим сначала, что реализация х{%) аддитивной смеси сиг-
сигнала и помехи определена для всех действительных значений т.
Тогда линейную оценку сигнала можно представить в виде
?(/) = ]h(t9 T)x(T)dx. B1.83)
—оо
Дисперсия ошибки оценивания
оо оо
+ J Я
—оо —оо
или
-2 fh(t9 T)m1{x(T)l(f)}dx +
—оо
, u)h(t\ v)m1{x(u)x(v)}dudv
= ЯбС 0-2 Jfttf, т)В6(т, t)dt +
+ J Jh(t, u)h(t, v)Bx(u, v)dudv, B1.84)
ОО ОО
так как
ml{x(u)x(v)}=Bx(u, v)=Bl{u, v)+B1](u, v), B1.85a)
=*«l(*. П=Вф9 t). B1.856)
599
Из B1.84) следует, что дисперсия линейной оценки зависит толь-
только от корреляционных функций сигнала и помехи и не зависит от
распределения вероятностей этих случайных процессов.
Обозначим через й*(?, т) импульсную характеристику опти-
оптимального по критерию B1.81) линейного фильтра. Покажем, что
функция /i*(?, т) должна удовлетворять интегральному уравнению
, 0= jW. У)ВХ(% y)dy B1.86)
— ОО t
¦или с учетом B1.85а)
В% (т, /) = ]h* (t, у) [В| (т, у) + В„ (т, у)] dy. B1.86а)
Подставляя B1.86) во второе слагаемое B1.84), получаем
0-2 J ]h(t, x)h*(t, y)Bx{t, y)dxdy +
ОО JO
]h(t, u)h(t, v)Bx(u, v)dudv =
- J ]h*(t, t)h*(t, у)Вх(т, y)dxdy +
—oo —oo
J ]вх(и, v)[h{t; u)-h*(t, u)]]h(t, v)-h*(t, v)]dudv.
— oo —oo
B1.87)
Так как только последний член в B1.87) содержит неизвест-
неизвестную функцию h(t, и) и так как он неотрицательный в силу поло-
положительной определенности корреляционной функции Вх(и, v), то
минимальное значение а2е будет соответствовать такому фильтру,
импульсная характеристика которого обращает его в нуль. Как не-
трудно видеть, это будет иметь место при условии h(t,u) =/**(?,и),
что и требовалось доказать.
Обозначим через s*(t) ошибку оценивания сигнала при опти-
оптимальной линейной фильтрации. Тогда, учитывая B1.86), находим
тг {х (т) е* (f)} = тг \х (т) J/i* (/, у) х (у) dy - х (т) g (*)} =
I —оо J
= ]h* (t, у) Вх (т, у) dy - В8(х, 0 = 0, B1.88)
—оо
т. е. процессы х(т) и s*(t) некоррелированы. Соотношение B1.88)
выражает так называемый принцип ортогонального проецирова-
проецирования, который, как 'показано, является достаточным условием ми-
минимума дисперсии ошибок оценивания сигнала. Можно доказать,
что это условие является также необходимым (см., например,
[62]).
600
При использовании оптимального линейного фильтра мини-
минимальное значение дисперсии ошибки
°е* @ = Bz (/, t) - J J /i* (*, и) h* (/, у) Вх (и, v) dudv B1.89)
— OO —OO
или с учетом B1.86), B1.86а)
о». (О = ЗД О- !&*(*, «)Вб(«, 0** =
u)Bn(t, u)d«. B1.89a)
В силу положительной определенности Вх(и, v) вычитаемое в
B1.89) неотрицательно и, следовательно,
^@<^(/, t). B1.90)
Из B1.89) и G.40) следует
<&(<) = SeC. 0-%(^ 0, B1.91)
т. е. минимальная дисперсия ошибки равна разности дисперсий
оцениваемого процесса и оценки.
Используя B1.91), можно выразить величину а2е* (/) также
через интеграл от разности мгновенных энергетических спектров
процесса ?(/) и его линейной оценки i(t) (см. п. 4.3.10)
°l*(t) = -+-]m(t, <о)-Фг(г, <o)]d0, B1.91а)
где Ф(/, со) —мгновенный спектр, а индекс при символе Ф ука-
указывает, какому процессу соответствует спектр.
Для белого шума с интенсивностью No имеем Вц (/, и) =
='N06(t—u) и из B1.86а) и B1.89а) следует
Bi (т, t) = No h* (t, т) + ]h* (t, у) В% (т, y) dy, B1.92)
OO
o2e.(t) = N0h*(t,t). B1.93)
21.3.3. Фильтрация стационарного сигнала. Если сигнал ?(?)
и помеха r\(t) стационарны (по крайней мере, в широком смыс-
смысле), а фильтр представляет линейную систему с постоянными во
времени параметрами, то интегральное уравнение B1.86) преоб-
преобразуется к виду
= ] h*(u)Bx(i-u)du =
—оо
] h* (и) [Bt(x-u) + Bn (т - «)] du. B1.94)
—оо
601
Из B1.89а) находим минимальную дисперсию ошибки
°|. (О = Яе(О)- J h*(u)Bi(u)du B1.95)
—оо
или
o2.~B6@)-fis@), B1.95а)
т. е. минимальная средняя дисперсия оценки равна разности сред-
средних мощностей оцениваемого сигнала и оценки.
Выражая средние мощности через спектры процессов [см.
G.50а)], запишем .минимальную дисперсию в виде
ае*= Г"] lSiH-'Sx(<o)\k*(i(o)\*]cfo, B1.96)
2л 0
где
), B1.96a)
А* (ко) —передаточная функция оптимального фильтра.
Так как правая часть уравнения B1.94) представляет свертку
функций, преобразования Фурье которых равны соответственно
A*(ico) и S^(co), to, совершая преобразование Фурье от обеих ча-
частей уравнения B1.94), получаем
k* (i со) =¦ Si (co)/[S| (со) +Sn (со)]. B1.97)
Формула B1.97) представляет в явном виде решение задачи об
определении характеристики оптимального фильтра, если не учи-
учитывается физическая реализуемость фильтра [используются не
только все прошлые, но и все будущие значения реализации х(т)].
Фильтр совершает оценку сигнала в заданный момент времени с
бесконечным запаздыванием. Так как правая часть в B1.97) дей-
действительна, то она представляет частотную характеристику оп-
оптимального линейного фильтра (фазовая характеристика в этом
случае тождественно равна нулю).
Подставляя B1.97) в B1.96), находим
е* 2л J 5^(со) + 5л(со) V '
Из B1.98) следует, что дисперсия ошибки при оптимальной
фильтрации равна нулю (сингулярность) тогда, когда спектры сиг-
сигнала и помехи не перекрываются, т. е. когда Sg(co)Sn (со) =0 при
всех со. Для того чтобы не было перекрытия, необходимо, очевид-
очевидно, чтобы спектры S^(co) и Stj (со) на некоторых интервалах оси
частот тождественно обращались в нуль.
При фильтрации сигнала на фоне белого шума со спектральной
плотностью No из B1.98) следует
j^- B1.99)
т. е. наличие аддитивного белого шума исключает сингулярность.
602
Фильтр с передаточной функцией B1.97) можно представить-
двумя последовательно соединенными фильтрами с передаточными
функциями &i(ico) и &2(ico), квадраты модулей которых
|^(ico)|2=[Sx(co)]-i, B1.100а)
)]2/S*(<o), B1.1006)
iG>). B1.100в)
Ясно, что при воздействии на вход первого фильтра реализацией
х(%) получаем на его выходе белый шум единичной интенсивно-
интенсивности. Второй фильтр осуществляет оптимальную обработку белого
шума для получения оценки l(t) с минимальной дисперсией.
Фильтр с передаточной функцией B1.100а) называют обеляющим.
21.3.4. Физически реализуемый оптимальный фильтр. Условие
физической реализуемости означает, что для фильтрации исполь-
используется только предыстория реализации л:(т) до момента времени,
когда производится оценка. Оценка сигнала при помощи физиче-
физически реализуемого линейного фильтра имеет вид
6@ = / Л (*, т) * (т) dx, B1.101),
—оо
где используются все значения реализации л;(т), предшествующие
моменту /, для которого производится оценка. Если наблюдается
реализация x(t) конечной длительности, т. е. если оценка в момент
t производится по результатам наблюдения на интервале @, t),
то вместо B1.101) получим
6@ = / ft(/,x)*(x)dx. B1.102)
о
Выполняя те же преобразования, что и в п. 21.3.2, нетрудно пока-
показать, что наилучшую по критерию минимума дисперсии ошибки
линейную фильтрацию сигнала из его аддитивной смеси с помехой
осуществляет такая линейная система, импульсная характеристи-
характеристика которой удовлетворяет интегральному уравнению Винера —
Хопфа
Bi (t, т) - J Л* (t, и) [fig (т, и) + Вц (т, и)] du, 0 < т < /. B1.103)
о
Заметим, что и в рассматриваемом случае оптимальной физи-
физически реализуемой фильтрации необходимым и достаточным яв-
является условие некоррелированности ошибки и наблюдаемой ре-
реализации [см. B1.88)].
При использовании оптимального физически реализуемого филь-
фильтра минимальная дисперсия ошибки [ср. с B1.89а)]
et* @ = Bl С 0 - / h* (tf и) Вг (ц, i) du =
о
- J h*(t, u)B^(t9 u)du. B1.104)
о
eoa
Для белого шума из B1.103) и B1.104) следует
Bt(t,T) = Noh*(t, т)+ J А*(/, и) Я6(и, x)da, 0<т<*, B1.105)
°l.(t) = Noh*(t,t). ° B1.106)
21.3.5. Оценка стационарного сигнала физически реализуемым
оптимальным фильтром. Если и сигнал, и помеха стационарны, а
фильтр представляет линейную систему с постоянными во време-
времени параметрами, то из B1.103), при t-^оо следует, что импульсная
характеристика h*(t) оптимального фильтра определяется реше-
решением интегрального уравнения
)- J h*(y)Bx(r-y)dy^0, т>0. B1.107)
о
При этом минимальное значение дисперсии ошибки [см. B1.104)]
а|.= J h* (и) Вц (и) du. B1.107а)
о
Обозначим левую часть уравнения B1.107) через g(x). Ясно,
что g(i)==Q при t^sO, причем преобразование Фурье G(ico) от
функции g{x) имеет полюсы лишь в нижней полуплоскости. Из
B1.107) преобразованием Фурье получаем
Sg(co)— fe* (ico) Sa («ю) = G (io>). B1.108)
Передаточную функцию &*(ico) оптимального фильтра можно
найти из B1.108), если выполнить условие регулярности функции
G(ico) в верхней полуплоскости. Для этого предположим, что
спектр Sjc('o>) допускает факторизацию, т. е. может быть представ-
представлен в виде произведения
S*((o)=Z*(i©)Z*(-i©), B1.109)
причем все полюсы и нули функции Zx(ico) находятся в нижней по-
полуплоскости (т. е. функция Zx(ico) представляет передаточную
функцию физически реализуемой линейной системы). Подставив
B1.109) в B1.108), и разделив обе части уравнения B1.108) на
Zx(—ico), получим
Si(to)IZx(—i®)—k*(m)Zx(iv)=G(m)/Zx(—w). B1.110)
Представим первый член в левой части B1.110) в виде суммы
функций
Sg(cD)/Z*(—iw)=#(ko)++#(ico)--, B1.111)
где #(ico) + регулярна в нижней полуплоскости, a //(ico)- — в
верхней. Разложение B1.111) выполняется просто, если левая
часть этого выражения — дробно-рациональная функция часто-
частоты со.
Из B1.110) и B.111) следует
#(!©)+—**(i©)Z*(io) = G(i(D)/Zx(—ico)— Я (ico)-. B1.112)
€04
Левая часть B1.112) регулярна в нижней полуплоскости, а пра-
правая— в верхней. Отсюда следует, что и левая, и правая части
уравнения B1.112) должны быть тождественно равны нулю. Из
последнего условия находим передаточную функцию оптимально-
оптимального физически реализуемого фильтра
/e*(iw)=#(ico)+/Z*(i(D). B1.113)
Обратным преобразованием Фурье из B1.113) находим импуль-
импульсную характеристику /**(/) оптимального физически реализуемого
фильтра (решение уравнения Винера — Хопфа).
Таким образом, определение оптимального физически реализу-
реализуемого фильтра сводится к факторизации спектра аддитивной сме-
смеси сигнала и помехи и разложению функции S% (co)/Zx(—ico) на
сумму сопряженных функций. Указанная факторизация может
быть всегда выполнена, если выполнено условие Винера — Пэли
7 |1п **<">¦ <fo«x>. B1.114)
Условие B1.114), справедливое для дробно-рациональных спект-
спектров, не выполняется, например, для гауссовского спектра, пропор-
пропорционального ехр(—(ко2), р>0. Заметим, что если спектр процес-
процесса не удовлетворяет этому условию, то значения сигнала с вероят-
вероятностью единицы могут быть экстраполированы по реализации
x(t), наблюдаемой на любом интервале конечной длительности.
Оптимальный фильтр с передаточной функцией B1.113) можно
представить двумя последовательно соединенными фильтрами:
«обеляющим» с передаточной функцией [^(ico)], на выходе ко-
которого получаем белый шум, и оптимальным с передаточной функ-
функцией #(ico) + для выделения сигнала на фоне белого шума [ср. с
B1.100b)].
21.3.6. Пример оптимального фильтра. Проиллюстрируем методику решения
уравнения B1.107), изложенную в п. 21.3.5, .на простом примере, когда спектр
сигнала
5^(со)=5о/[1 + (со7<J], B1.115)
а аддитивная помеха — белый шум со спектральной плотностью No. Спектр
наблюдаемой реализации
??7
факторизуется очевидным образом и
Zx (i ю) = (У50 + NQ + i со Т УЩ1(\ + icoT). B1.117)
Из B1.115) и B1.117) находим
So
B1Л18)
605
Разлагая правую часть B1.118) на элементные дроби, получаем
откуда следует, что
Подставляя B1.119) и B1.117) в B1.113), находим передаточную функцию
оптимального фильтра (фильтра Винера)
k* (ico) = —# — ° — = fl . ^4 , B1.120)
(VSQ +NQ + VN0 ) (V57+Ж0 + icoT V^) A +ico7\)
где
Л2
B1.120a)
№ = SqIN0 — отношение энергии сигнала к спектральной плотности белого шума.
Из B1.120) следует, что в рассматриваемом случае оптимальный фильтр*
представляет последовательное соединение усилителя с коэффициентом усиле-
усиления &о* и интегрирующей цепи с постоянной времени То (см. п. 7.2.6).
Из B1.120) обратным преобразованием Фурье находим импульсную харак-
характеристику оптимального фильтра
?(->0. B1.121)
о \ * о /
и минимальную дисперсию ошибки [см. B1.107а)]
21.3.7. Другой подход к решению задачи синтеза оптимально-
оптимального фильтра. Если спектр сигнала представляет рациональную
функцию переменной со2, то можно использовать другой подход к
решению задачи синтеза алгоритма фильтрации, оптимального по
критерию минимума среднего квадрата ошибки, предложенный
в [65]. Проиллюстрируем этот подход на примере, рассмотрен-
рассмотренном в п. 21.3.6.
Сигнал l(t) со спектром B1.115) получаем на выходе форми-
формирующего фильтра, структура которого определяется дифферен-
дифференциальным уравнением первого порядка (см. п. 7.2.4 и рис. 7.2)
*m + ±i(f) = v(f)9 B1.123)
dt т
где v(t) —белый шум со спектральной интенсивностью So. Пред-
Предположим, что помеха г]@ также представляет белый шум с ин-
интенсивностью No, причем v){t) и v(t) некоррелированы.
606
Используем линейную оценку сигнала B1.102). Импульсная
характеристика оптимального фильтра удовлетворяет уравнению
B1.103). Тогда из B1.102) находим
B1Л24)
Далее из B1.103) следует
^^ = / dJ}~lrL B*d, «) du + h* (t, t) Bx (t, t). B1.125a)
Но, учитывая B1.123) и B1.103), получаем
= - — J A* (t, и) Вх (и, т) du. B1.1256)
т о
Кроме того, при т</
Вх (/, т) = В| (/, т) = J A* (t, и) Вх {и, т) du. B1.125b)
о
Из B1.125а—в) следует
г —' ' и' + h* (/, t) h* (t, u)-\ A* (t, u) Bx (u, x) du = 0.
i I dt T >\
B1.126)
Для того чтобы интеграл B1.126) был равен нулю при произ-
произвольной функции Вх{и, т), выражение в квадратных скобках дол-
должно быть равно нулю, т. е.
dJl^rL = ~|Л* (*, и) - А* (*, t) A* (*, и). B1.127)
Подставляя B1.127) в B1.124), получаем
- i- i A*(*,T)*(T)dx-
1
dt Г 0
- А* (*, 0 J Л* (/, т) х (т) d% + h* (t, t) x (t)
0
или
= - V I (t) +k (t) [x (t) - I @1, B1.128)
1
at
где
k(t)=h*(t, /). B1.129)
Выражение B1.128) представляет оптимальный по критерию
минимума дисперсии ошибки алгоритм фильтрации сигнала со
607
Рис. 21.1. Схема фильтра Калмана
спектром B1.123) на фоне аддитивного белого шума. Соответст-
Соответствующая этому алгоритму структурная схема оптимального фильт-
фильтра (фильтра Калмана) изображена на рис. 21.1, где, кроме того,
показана структурная схема формирующего фильтра, на выходе
которого получаем сигнал со спектром B1.115).
Заметим, однако, что алгоритм B1.128) полностью еще не оп-
определен, так как осталась неизвестной функция k(t) [см. B1.129)],
которую называют коэффициентом усиления. Но из B1.106) сле-
следует
B1.130)
т. е. коэффициент усиления полностью определяется минималь-
минимальным значением дисперсии ошибки при линейной фильтрации сиг-
сигнала.
21.3.8. Дифференциальное уравнение, определяющее мини-
минимальную дисперсию ошибки. Используя B1.128), запишем снача-
сначала дифференциальное уравнение, которому удовлетворяет ошиб-
ошибка e*(t)=i(t)—?(/) при оценивании сигнала ?(/):
+k(t)r\(f)-v(f).
Обозначив
Р @ - af. (t) = Щ {[е* (t)]*},
получим с учетом B1.131)
B1.131)
B1.132)
и так как ml{e*(t)i\(t)}=k(t)N0/2t ml{E*(t)v(t)}=—SolBT2),
то получаем следующее нелинейное дифференциальное уравнение
первого порядка (уравнение Риккати) для дисперсии ошибки
_ А п/л_ _L n«ft)+ A . B1.133)
dt
При t-**oo дисперсия ошибки p(t) и, следовательно, коэффи-
коэффициент усиления k(t) стремятся к постоянному значению, опреде-
608
ляемому из условия lim dp(t)/dt=Q. В результате решения квад-
t-+oo
ратного уравнения с учетом р>0 имеем
р = р (оо) = NJT {V1 + S0/N0- 1) - N0k(oo). B1.134)
Используя обозначение k2 = So/No, принятое в B1.122), можно пе-
переписать B1.134) в виде
р= J^d/r+T^-i)^ S°/T f B1 134а)
П2 ' У1 + Л2+1 v ' ;
откуда видно, что предельное значение дисперсии ошибки для
алгоритма Калмана оценивания сигнала совпадает с дисперсией
ошибки, соответствующей фильтру Винера.
При начальном условии /?@)=0 общим решением уравнения
Риккати является (см., например, [66])
B1.135)
По изложенной методике можно синтезировать алгоритмы
фильтрации, использующие более общую модель формирующего
фильтра, определяемого системой дифференциальных уравнений
относительно переменных состояния [см. F.46), F.47)]. Такие
алгоритмы, как аналоговые, так и дискретно-аналоговые, пред-
представленные в матричной форме, приведены, например, в [66]
(см. также [16], табл. 7.1).
21.4. НЕЛИНЕЙНАЯ ФИЛЬТРАЦИЯ
21.4.1. Постановка задачи. В § 21.3 рассматривались оценки
сигнала па фоне помехи, получаемые линейной фильтрацией на-
наблюдаемой реализации, и определялись характеристики линейных
фильтров, оптимальных по критерию минимума среднего квадра-
квадрата ошибки. Если отказаться от условия линейности алгоритма
обработки наблюдаемой реализации, то в более широком классе
допускаемых оценок можно, вообще говоря, получить оценки, ко-
которые по заданному критерию минимума среднего квадрата
ошибки будут лучше линейных оценок.
Из результатов, приведенных в п. 14.6.3, следует, что в общем
случае оптимальной по критерию минимума среднего квадрата
ошибки оценкой сигнала %(t) по наблюдаемой реализации х(т)
аддитивной смеси сигнала с помехой r\(t) является условное сред-
среднее1
(t)\x(T)}=-- J uW[u,t\x(i:)]du, B1.136)
1 Этот же функционал представляет оптимальную оценку и по критерию
минимума среднего риска при квадратичной функции потерь, а также для любой
четной функции потерь, если только апостериорная плотность процесса унимо-
унимодальна и симметрична относительно моды.
20—87 609
где W[u, t\x{i)] — апостериорная плотность сигнала l(t) после
наблюдения на интервале @, t) реализации х(х) случайного про-
процесса i(t)+r\{t).
За исключением гауссовских процессов g(/) и т](/) вычисле-
вычисление нелинейного функционала B1.136) встречает значительные
трудности, связанные прежде всего с определением апостериор-
апостериорной плотности вероятности.
Один из подходов к решению задачи оптимальной нелиней-
нелинейной фильтрации состоит в ограничении класса исследуемых про-
процессов марковскими или их компонентами. При таком ограниче-
ограничении удается преодолеть трудности, связанные с вычислением
апостериорной плотности оцениваемого процесса. После этого
можно получить оценку по критерию минимума среднего квадра-
квадрата ошибки. Вопросу нелинейной фильтрации марковских случай-
случайных процессов посвящена основополагающая работа [67] (см.
также [68]). Рассмотрим другой подход, основанный на аппрокси-
аппроксимации нелинейного функционала i(t)=F[x(%), О^т^/] рядом
Вольтерра [см. F.9)].
21.4.2. Представление оценки сигнала рядом Вольтерра. При
линейной фильтрации связь между оценкой сигнала l(t) и на-
наблюдаемой реализацией х(г) описывается достаточно простым
интегральным соотношением B1.80). Когда для оценки исполь-
используется нелинейная инерционная система, то связь уже не столь
проста. Можно, однако, и при нелинейной фильтрации установить
явную связь процессов g(/) и х(т), если воспользоваться пред-
представлением нелинейного функционала от реализации х(х) рядом
Вольтерра [см. F.9)]
оо оо оо
= 2 J ... S ^m(ui,-,um)x(t-u1)...x(t-um)du1...dum,
т=\ —оо —о©
0<т<*. B1.137)
Если /Cm52=0 для всех т>1, то получаем линейный функционал и
К\(и) можно трактовать как импульсную характеристику линей-
линейного фильтра. Добавление членов ряда B1.137) при т>\ озна-
означает введение нелинейности. Совокупность функций Кт{и\,...
..., мт), m=l,n, характеризует нелинейный фильтр /г-го порядка.
Ограничение суммы B1.137) первыми п членами позволяет ап-
аппроксимировать функционал F[x(i:)] процессом на выходе фильт-
фильтра п-то порядка при входном воздействии х{%).
21.4.3. Оптимальная нелинейная коррекция второго порядка.
Пусть х(т)—реализация суммы центрированных сигнала и по-
610
в качестве оценки1
мехи, определенная для всех действительных значений т. Примем
тве оценки1
= ] K1(u1)x(t-ul)du1 +
— сю
оо со
+ J J K2 (uL, u2) x(t- и,) х (t - «„) du, du2, B1.138)
— оо —оо
где K\{ii[) =h*(ii\)—импульсная характеристика оптимального
фильтра, определенная из уравнения B1.88).
Оценка B1.138) отличается от линейной наличием нелиней-
нелинейного слагаемого. К оценке, оптимальной в классе линейных фильт-
фильтров, добавляется корректирующее слагаемое за счет использова-
использования нелинейности. Для формирования оценки B1.138) использо-
использована простейшая нелинейная система — фильтр второго поряд-
порядка. Задача состоит в том, чтобы определить характеристику
Кч(и<\, Иг) нелинейности так, чтобы средний квадрат ошибки
°? (*) =¦¦ "Ч {Е @ ~ t (t)]2} B1.138а)
был минимальным.
Обозначим через ei(/) ошибку, которая получается, если для
оценки ?(/) используется оптимальный линейный фильтр, т. е.
МО =?(')- J h* (щ) х (t - и,) du. B1.139)
00
Ошибка 6i(/) не коррелирована с х(х) [см. B1.88)], т. е.
ml{x(%)e,i(t)}=0. B1.140)
Из B1.138) и B1.139) находим дисперсию ошибки
°?=/пЛГмо- J I ^(«1, u,)x{t-u,)x
( L —оо —оо
X х (t— u2) dux du2 I = BBl @) —
оо оо
— 2 Г J iB (alf w2) ^clX (^i, u2) du1 du2 +
— oo —oo
oo oo oo oo
+ J J J J K* («i- ''2) ^2 (u3, «4) x
— 00 —00 —00 —00
X tnx (ux — u2, u1 — u3, tu — u±) duLdu2du3du4J B1.141)
1 Излагаемая теория легко обобщается на нестационарные процессы и физи-
физически реализуемые фильтры.
20* 611
где с учетом стационарности сигнала и помехи
m9iX (Wi, w2) = т1 {гг (t) x {t—uj x(t-u2)} =
оо
т (% (f\ у (f II \ V (f II W Г h* 111 \ \/
— П1\ 1^ \1) Л \С Ul/ Л \* и2П J \иЗ/ X
— оо
X ml {x (t-uj x{t- «s) x(t- u3)} du3 =
оо
= Щх(и1У и2)— J Л* (и3) mx(ul — u2y ul~ u3) du3i B1.142)
—оо
mx(ui—u2, Mi—м3) =ml{x(i—ux)x(t—u2)x(t—м3)}, B1.143)
B1.144)
a Bei @) совпадает с минимальной дисперсией ошибки, которая
получается при использовании линейных оценок [см. B1.95а)].
Из B1.141) следует, что при использовании в качестве устройст-
устройства оценки нелинейного фильтра второго порядка средний квад-
квадрат ошибки оценки зависит уже не только от корреляционных
функций процессов |(/) и т)(if), но и от смешанных моментов
третьего и четвертого порядков.
Используем тот же прием, что и в п. 21.3.2; можно доказать,
что при заданных смешанных моментах процессов до четвертого
порядка включительно наилучшая (в смысле принятого критерия
минимума среднего квадрата ошибки) нелинейная фильтрация
второго порядка сигнала из аддитивной смеси с помехой реали-
реализуется при условии, что ядро К2(и, v) нелинейного корректирую-
корректирующего члена удовлетворяет интегральному уравнению (см. [60,
п. 4.3.2])
оо оо
^&iX (^1* ^2/ ==г I I j ^9 '^3» ^4/ Ш'Х \^1 ^2» ^1 ^3» ^2 —
— оо —оо
-u4)du3dUi. B1.145)
Минимальное значение дисперсии ошибки
со оо оо оо
о». - В., @) - J J J1 J1 К; (ult u2) К; (и,, и4) тх (и, -
2 — оо —оо -т-о* —оо
— иа, иг — и31 щ- и4) duxdu2du5du^ B1.146)
или
<?• - аЬ - J T Kl I"» u*> m«t* ("!• ) dtti dtta, B1.147)
где
O2* - Bei @) = B? @) - J /i* (и) Brf (и) du. B1.147a)
— минимальная дисперсия ошибки линейной оценки [см. B1.95)].
612
Таким образом, использование оптимального нелинейного кор-
корректирующего звена в фильтре второго порядка позволяет допол-
дополнительно уменьшить дисперсию ошибки на
°1* -°е* = J Т К1 ("!• ) mBlx (и, и2) duxdu2>0. B1.148)
21.4.4. Оптимальный фильтр второго порядка. Рассмотрим за-
задачу об оптимальном фильтре второго порядка, отказавшись от
предположения, что линейная часть оценки B1.138) задана. Най-
Найдем совместно две функции К\(и) и /Сг(м, v), минимизирующие
дисперсию ошибки.
Подставляя B1.138) в B1.138а), находим выражение функцио-
функционала а2е2 , зависящее от двух неизвестных ядер первого и второго
порядка:
оо оо
- 2 J J К2 (и1У и2) mix (uv щ) dux du2 +
— ОО ОО
ОО ОО
J J
+ 2 J J J *i («i) ^2 ("a. "8) m* («l - "г. «i - ««) X
ОС —ОО —ОО
йиг dus+ ] ] ] ] K2 («x, ы2) /С2 («з. «4) х
— оо —оо —оо —оо
X пгх (иг — и2, их — u3t u2 — w4) dux du2 du3 du^. B1.149)
Тем же приемом, который применялся ранее, можно показать,
что дисперсия ошибки минимальна при использовании такого не-
нелинейного фильтра второго порядка, ядра которого удовлетворяют
следующей системе двух интегральных уравнений:
оо оо
J J K*2(u2yu3)mx(u1-u2iu1-u2)du2du3 +
00 ОО
+ J !Cl(u^Bx(u%-u1)dut = Btx(u^ B1.150)
—оо
оо оо
J J K\{u^u/L)mx{u1-u2,u1^u^u2-
—оо —оо
B1.151)
613
Заметим, что для независимых сигналов ?(/) и помехи г}(/), име-
имеющих симметричные распределения, тх(щ—м2, Щ—^з)=0 и сис-
система уравнений B1.150), B1.151) распадается на два уравнения,
первое из которых переходит в B1.94), а второе — в B1.145),
так как при этом mix(uh u2)=meix(u\, u2). Следовательно, при
указанном условии полученное решение задачи об оптимальном
фильтре второго порядка справедливо и тогда, когда нет никаких
априорных ограничений на линейную часть оценки.
21.4.5. Оптимальный фильтр произвольного порядка. Оценку
сигнала по наблюдаемой реализации аддитивной смеси сигнала с
помехой можно Сделать более точной, используя нелинейные
фильтры более высокого порядка. При фильтре я-го порядка [см.
B1.137)]
?(<Н2 J ... ] Ki{ul9...,ui)x(t-ul)...x(t-ut)dx1...dxi.
1=1 —оо —оо
B1.152)
При этом возможны две постановки задачи. Можно попытаться
отыскать такую последовательность ядер К\{щ),... , Kn(tii, •••
... ,ип), которая минимизирует средний квадрат ошибки
-Е J ... J Ki(u1,...,ui)xU~u1)...x(t-ul)du1...dulY\.
i=\ —оо —оо J J
B1.153)
Эта задача сводится к решению системы п интегральных уравне-
уравнений относительно неизвестных ядер, аналогичной системе B1.150),
B1.151) для /i = 2.
Менее общая постановка, приводящая к обозримому результату,
аналогична той, которая формулировалась в начале п. 21.4.3.
Предположим, что К\(и) совпадает с импульсной переходной
функцией оптимальной линейной системы, ядро К2{Щ, и2) кор-
корректирующего нелинейного элемента второго порядка находим
из уравнения B1.145), а ядро Kz{u\9 и2, из) корректирующего
элемента третьего порядка — из условия минимума а28з . Затем
добавим нелинейность четвертого порядка и определим Ka(u\, ...
..., щ) из условия минимума а2е4 и т. д. Найдем рекуррентное
уравнение для К*п(Щ, •••> ип)> если уже известна последователь-
последовательность оптимальных ядер до (я—1)-го порядка включительно.
Обозначим через en-i ошибку, которая получается, если для
оценки ?(/) используется нелинейный фильтр (п—1)-го порядка:
е»-! @ = I @ - "l J ... ] /С, («!, - , Щ) X
1=1 —оо —оо
X x(t-Uj) ... xit-ujd^... dut. B1.154)
614
Тогда из B1.153) находим
°l = mi {[8n-i@- ] ... J Кп (ult ... , ип) х
xx(t- иг) ... X(t- un) day ... d«n] J -
= 5е„_,@)-2 J ... J Kn(u1,...,un)null_lX(ult...,un)du1...dun+
— OO —(X>
СЮ OO
+ J ... J *n("i.- ,"n) #„(«„+!. -.«2n) X
OO —OO
x mx (Mlf ... , u2n) du^ ... dMare> B1.155)
где
™*n-\* (ui> - > ип) = Щ {гп-г (t) x (t-ux) ... x (t-un)}, B1.156a)
mx(uu...,u2n)=m{{x(t—ui) ...x(t—u2n)}, B1.1566)
a B^^O) совпадает с минимальной дисперсией ошибки при ис-
использовании последовательности нелинейных корректирующих
членов до (п—1)-го порядка. Для вычисления дисперсии ошибки
согласно B1.155) требуется уже априорное знание смешанных мо-
моментов наблюдаемых процессов до 2я-го порядка включительно.
Следуя применявшемуся выше приему, нетрудно убедиться,
что оптимальная по критерию минимума дисперсии ошибки нели-
нелинейная фильтрация я-го порядка сигнала l(t) из его аддитивной
смеси с помехой г](/) будет реализована при условии, что ядро
Кп(и>и ..., ип) удовлетворяет интегральному уравнению
тгп-\* ("l> - ' Un) = J ... J К (""+!> - • М2п) X
ОО ОО
X тх (и19 ... , и2п) dun+1 ... du2n. B1.157)
При п = 2 уравнение B1.157) переходит в B1.145).
При использовании нелинейного фильтра я-го порядка мини-
минимальное значение дисперсии ошибки
ol.=ol* - J ... J К К, ... , ип) X
п п—\
_оо _оо
X т\-гх ("и ... , ип) duly ... , dun. B1.158)
При я = 2 формула B1.158) совпадает с B1.148).
Уравнение B1.157) позволяет найти характеристику оптималь-
оптимальной корректирующей нелинейности я-го порядка, если уже из-
известны характеристики оптимальных корректирующих элементов
до (я—1)-го порядка. Рекуррентной является также формула
B1.158), по которой определяется уменьшение минимальной дис-
дисперсии ошибки за счет введения нелинейности я-го порядка. За-
Заметим, что, как и в теории оптимальной линейной фильтрации,
615
изложенную методику можно использовать и для описания более
широкого класса нестационарных процессов l(t) и r\(t)9 а также
для определения физически реализуемых нелинейных фильтров и
для оценок линейных преобразований сигнала.
21.4.6. Фильтрация гауссовского сигнала на фоне гауссовской
помехи. До сих пор не делалось никаких специальных предполо-
предположений о распределении вероятностей сигнала и помехи. Допус-
Допустим, что сигнал и помеха — гауссовские случайные процессы.
Тогда нетрудно убедиться, что добавлением нелинейных элемен-
элементов к оптимальному линейному фильтру нельзя уменьшить
дисперсию ошибки.
Как уже показано, нелинейная фильтрация 2-го порядка сиг-
сигнала %(t) из его аддитивной смеси с помехой r)(t) будет опти-
оптимальной по критерию минимума дисперсии ошибки при условии,
что характеристики К\{и) и К2(и, v) нелинейного фильтра удов-
удовлетворяют системе интегральных уравнений B1.150), B1.151).
Но для гауссовских процессов из B1.140) следует, что х(%) и
e\(t) независимы. Поэтому mei*(""ii и2) — tn\{^\{t)}rn\{x{t—
—U\)x(t—и2)}=0, так как mi{ei@}=0. Тогда из B1.145) следу-
следует, что /С*г(^, i;)=0, т. е. наилучшей в указанном смысле явля-
является линейная фильтрация.
Докажем теперь» что добавление нелинейного элемента про-
произвольного порядка также не уменьшает дисперсию ошибки.
Пусть
CW-ei(Q- J- ]Kn(uv..., un)x
—оо —оо
хх (t - иг)... x(t - ип) dut...dun9 B1.159)
где 8i @—ошибка, которая получается при использовании оп-
оптимального линейного фильтра. Повторив рассуждения, которые
привели к B1.157), убедимся, что дисперсия ошибки минимальна
при условии, что ядро /Сп("ь..., Мп) удовлетворяет интегрально-
интегральному уравнению
хтх(и19...9 u2n)dun+i...du2n, n> 1. B1.160)
Как было указано, для гауссовоких случайных процессов ei(Z) и
x(t) независимы. Поэтому m?lx (u\,..., ип) =mi{e\{t)}mi{x(t—
—U\) ...x{t—un)}=z0 и из B1.160) следует
B1.161)
Таким образом, наилучшая фильтрация гауссовского сигнала
из аддитивной смеси с гауссовской помехой осуществляется оп-
оптимальным линейным фильтром, импульсная характеристика ко-
которого определяется из интегрального уравнения B1.94). Этот
результат обобщается и на нестационарные процессы.
616 !
21.4.7. Интерпретация нелинейных фильтров. Изложенный ме-
метод оптимальной нелинейной фильтрации по критерию миниму-
минимума дисперсии ошибки основан на использовании аппроксимации
непрерывного функционала последовательностями вида B1.152).
При этом фильтр я-го порядка характеризуется последователь-
последовательностью ядер /Ст(#ь ..., #т), т>1> удовлетворяющих интеграль-
интегральным уравнениям B1.157). Решив эти уравнения, можно по задан-
заданной реализации x(t) аддитивной смеси сигнала и помехи сформи-
сформировать оценку сигнала с минимальной в классе нелинейных
фильтров п-го порядка дисперсией ошибки. Практическая реали-
реализация фильтра по заданной последовательности ядер Km связана
или с достаточно сложным вычислительным алгоритмом, или с
какой-либо подходящим образом выбранной интерпретацией ядер.
Одна из таких интерпретаций основана на разложении функции
многих переменных в кратные ряды по ортогональным полиномам
(см., например, [1], п. 9.5.2, а также [24]).
21.5. ЗАДАЧИ
21.1. Рассмотреть задачу п. 21.1.3 в предположении, что наблюдаемая на
интервале (О, Т) реализация x(t) аддитивной смеси сигнала B1.15) и центри-
центрированной гауссовской помехи подвергается временной дискретизации, в резуль-
результате которой получают выборку х=(лгь ..., хп)> Xi=x(ti), /г^@, Г), г = 1, п.
Доказать, что оценка максимального правдоподобия неизвестного векторного
параметра #=(дь ..., ftm) сигнала
Umh-S^X, . A)
где
X-s'k^x, B)
S = s/k-1s, C)
s — матрица размером nYja с линейно-незавиоимыми (в алгебраическом смыс-
смысле) столбцами, причем /-й столбец представляет вектор
ej-N('i). .... S}(tn)], /=1, m, Da)
k=nK/trK D6)
— нормированная матрица (размером п^п) гауссовской помехи. Доказать, что
оценка A) несмещенная, а ее корреляционная матрица
М = 8-ЧгК/я. E)
21.2. Показать, что оптимальная дискретно-а налогов а я оценка неизвестной
амплитуды а сигнала as(t) на фоне аддитивной центрированной гауссовской по-
помехи по критерию максимального правдоподобия
aMn = s/Kx/s'K-1s, F)
где х=(*ь ..., хп), s=(sb ..., sn), Xi=x(ti), Si^s(ti). /г<з@, Г), t='l, лг, К —
корреляционная матрица помехи.
617
Доказать, что оценка F) несмещенная и эффективная, причем информация
по Фишеру
\п(а) =(l/[l2{aMn}=|i2{s/K-1x}=s/Ks. G)
Полезно сравнить F) с B1.36), а G) с \B1.39б).
21.3. Показать, что оптимальная байесовская дискретно-аналоговая оценка
случайной амплитуды а сигнала as(t) на фоне аддитивной центрированной га-
уссовской помехи при условии, что распределение амплитуды подчиняется нор-
нормальному закону B1.67),
a6=(a0+v2aMn)/(l+v2), (8)
где амп определяется по формуле /F) задачи 21.2, v2 = a20s/K-1s. Полезно срав-
сравнить (»8) с B1.71) и убедиться, что оценка (8) представляет оптимальную диск-
дискретно-аналоговую оценку по критерию максимальной апостериорной плотности
оцениваемой амплитуды сигнала.
Глава 22
АДАПТИВНЫЕ АЛГОРИТМЫ
22.1. ОПРЕДЕЛЕНИЕ И КРИТЕРИЙ КАЧЕСТВА
АДАПТИВНОГО АЛГОРИТМА
Термины «адаптация», «адаптивные алгоритмы» тракту-
трактуются весьма широко. Условимся понимать под адаптивным та-
такой алгоритм принятия решения, при построении которого для
преодоления априорной неопределенности используется предвари-
предварительное обучение. Целью обучения является формирование на ос-
основе наблюдаемой реализации изучаемого процесса (выборки)
оценок неизвестных функций распределения (при непараметриче-
непараметрической априорной неопределенности) или оценок неизвестных пара-
параметров распределения (при параметрической априорной неопре-
неопределенности). Эти оценки используются затем вместо неизвестных
вероятностных характеристик при синтезе алгоритма принятия ре-
решения. Так, адаптивные алгоритмы обнаружения и различения
сигналов на фоне помех находят путем подстановки в достаточ-
достаточные статистики отношений правдоподобия, полученные в резуль-
результате обучения оценки неизвестных параметров или неизвестных
функций правдоподобия.
Обучение может происходить «с учителем» по классифициро-
классифицированной обучающей выборке, для которой априори известно, какой
из проверяемых гипотез принадлежит каждый из ее элементов,
или «без учителя» по неклассифицированной наблюдаемой вы-
выборке, по которой формируются статистики, используемые для
принятия решения.
При неограниченном увеличении размеров обучающих выбо-
выборок общим критерием качества адаптивных алгоритмов является
618 ,
их сходимость к соответствующим оптимальным алгоритмам с
полной априорной информацией. Такие адаптивные алгоритмы,
как статистики обучающих выборок, будем называть состоятель-
состоятельными. Так как обучение по случайным выборкам (классифициро-
(классифицированным или неклассифицированным) вносит дополнительную слу-
случайность, то, конечно, не любой адаптивный алгоритм должен
быть состоятельным.
Критерий состоятельности адаптивных алгоритмов не позво-
позволяет однозначно оценить неизвестные параметры или функции с
помощью обучающих выборок. Эти оценки, как правило, выбира-
выбираются эвристически, а затем адаптивный алгоритм проверяют по
критерию состоятельности. Часто за оценки параметров, форми-
формируемых по обучающим выборкам, принимают оценки максималь-
максимального правдоподобия.
22.2. АДАПТИВНЫЕ АЛГОРИТМЫ КЛАССИФИКАЦИИ
НОРМАЛЬНЫХ СОВОКУПНОСТЕЙ
22.2.1. Постановка задачи и общее решение. Многие задачи
техники связи и управления формулируются в терминах теории
классификации наблюдений (распознавания образов). Необхо-
Необходимо отнести наблюдаемый объект к одному из классов, полное
вероятностное описание которого неизвестно. Такую задачу мож-
можно решить при помощи эталонных наблюдений (обучающих вы-
выборок), по которым формируются оценки неизвестных вероятност-
вероятностных характеристик классов. Эти оценки используются вместо не-
неизвестных истинных характеристик классифицируемых объектов в
оптимальном алгоритме классификации проверки статистических
гипотез, полученном при полной априорной информации.
Рассмотрим два класса S2 и S2, которые характеризуются дву-
двумя ^-мерными нормальными распределениями вероятностей с
векторными средними ai и а2 и общей ковариационной матрицей
К. Если аь а2, К известны, то оптимальное байесовское правило
классификации наблюдаемого вектора х размерностью N предпи-
предписывает сравнение с порогом логарифма отношения правдоподобия,
т. е. статистики [см. A3.124)]
У = (х-^±^-ук-1(а2-а1). B2.1)
Статистика B2.1) подчиняется нормальному распределению с па-
параметрами (среднее и дисперсия)
(-—dV2, d2N), x^Si, B2.2a)
(dV2, dV), x<eeS2, B2.26)
где [см. A3.127)]
d2N— (a2—ai)/K~1(a2—ai) B2.3)
— квадрат «расстояния» между классами S2 и Si.
619
Вероятность ошибки классификации при использовании ука-
указанного байесовского правила
Pou1 = Pi[\-F(c/dN + dN/2)]+p2F(c/dN-dN/2)i B2.4)
где ри р2 — априорные вероятности появления классов, с — порог,
с которым сравнивается статистика V [см. A3.15)], F(z)—инте-
F(z)—интеграл Лапласа.
Если векторы аь а2 и матрица К неизвестны, то можно исполь-
использовать адаптивную процедуру классификации вектора х. При обу-
обучении «с учителем» *используют две независимые классифицирован-
классифицированные векторные выборки xiA),... .tf^ из первого и х^2\ ..., х<2)П2
«з второго распределений. В качестве оценок неизвестных векто-
векторов ai и а2 и ковариационной матрицы К принимаются оценки
максимального правдоподобия
а, = — 2 х[Д /=1; 2, B2.5)
К = (пг + п2 - 2)-* I ? (xU) - ах) (х<п - а,)' +
L
B2.6)
Подставляя аь а2, К в B2.1) вместо неизвестных ai, a2, К,
получаем классифицирующую статистику
k-4L-L). B2.7)
При фиксированной размерности N и неограниченном увели-
увеличении размеров щ и п2 обучающих выборок статистика V сходит-
сходится по вероятности к статистике V.
Исследуем более подробно свойства классифицирующей ста-
статистики B2.7) при ограниченных размерах обучающих выборок
(см. также [81]).
22.2.2. Одномерный случай. Начнем с простейшего случая N=
= 1, когда классы Si и S2 характеризуются одномерными нор-
нормальными распределениями с неизвестными средними п\ и а2 и
известными дисперсиями а2. При обучении «с учителем» получе-
получены классифицированные обучающие независимые выборки
х^\ ..., х{\, из класса Si и х^2\..., яB)П2 из класса S2. Примем
за оценки неизвестных средних оценки максимального правдопо-
правдоподобия по этим классифицированным обучающим выборкам
fli = — 2*(Л <*2 = —2*12)- B2.8)
620
При этом можно сформулировать следующее правило класси-
классификации: наблюдение х относится к классу S2, если
и к классу Si в противном случае.
Статистика V представляет произведение коррелированных га-
уссовских случайных величин:
у=(й2-й1)/а, B2.10)
z={x-(ui + U2)/2]a. B2.11)
Среднее и дисперсия случайной величины у
B2.12)
B2.13)
а условные средние, дисперсии случайной величины z и коэффи-
коэффициент корреляции случайных величин у и z
m1{z|S2}=-m1{2|Sl} = (a2-a,)/B0), B2.14)
MA S2} = MA Si} = 1 + l/Dn,) + l/Dn2), B2.15)
11* • B2.16)
2
Заметим, что при П\=П2 случайные величины у и г незави-
независимы.
Условные средние значения статистики V:
ЕСЛИ П\=П2 = П, ТО
l} = (a2-a1J/Ba2), B2.19)
B2.20)
Из B2.17) и B2.18), а также из B2.1) при N=\ следует
2 \« П )
и при fli->oo, д2-^оо mi{1/| Sj} =mi{l/| SJ. Если п\ = п2 = п, то при
любом я mi{P|Si}=mi{V|Si}, /=1; 2! Далее \i2{V\ Sj} = (I
l/)M*№ + B//i) (l + l/2/i) и при д-^оо {^|S}{V|S
22.2.3. Многомерный случай (ковариационная матрица извест-
известна). Решим задачу о принадлежности наблюдаемой выборки х
одному из двух Af-мерных нормальных распределений с неизвест-
621
ными векторами средних и заданными ковариационными матри-
матрицами Ki = K2 = K. Пусть в результате обучения «с учителем» по-
получена классифицированная обучающая выборка: из первого
распределения х^1),... , х(])п , и из второго х^2\... , х<2)П2. Каждый
элемент указанных выборок представляет М-мерный вектор. В
качестве оценок неизвестных векторов средних принимаются
оценки максимального правдоподобия B2.5). Алгоритм класси-
классификации сводится к сравнению с порогом статистики [см. B2.7)]
~ (a2-a1). B2.21)
Обозначим
P=(n2—nl)[(n2 + ni)(n2 + ni + 4nln2)]-v2, B2.22)
k=(n2—nl)lDnln2). B2.23)
Тогда для рассматриваемого случая классифицирующая ста-
статистика B2.21) (см. [69])
Vi = — [(\+p)X2(Nf 2^>)-(l-p)x2(Af, 2Ь<'>)], B2.24a)
где %2(jV, 2A,i(i)), %2(N, 2К2^) —независимые случайные величины,
подчиняющиеся нецентральному ^-распределению с N степенями
свободы и параметрами нецентральности
+ п2 + 4/гх п2)-^]* d%, МО > 0, B2.246)
где d2N определяется согласно B2.3) и
. fl, xeSlf 22
12, x<eeS2.
Заметим, что параметр нецентральности зависит как от разме-
размеров обучающих выборок, так и от корреляционной матрицы К
(через «расстояние» d2N).
При п\-+оо и п2-^оо распределение статистики V приближа-
приближается к нормальному с параметрами d2N/2, d2N, если xgS2, и с па-
параметрами— d2N/2, d2N, если xeSi.
22.2.4. Многомерный случай (ковариационная матрица неиз-
неизвестна). Если неизвестны и векторы средних, и общая ковариа-
ковариационная матрица двух нормальных распределений, то необходи-
необходимо использовать классифицирующую статистику B2.7). В этом
случае следует ввести ограничение
2, B2.26)
так как в противном случае матрица К оказывается вырожден-
вырожденной и обратная1 матрица К не существует.
Можно показать (см., например, [70]), что при выполнении не-
622
равенства B2.26) классифицирующая статистика B2.7) пред-
ставима в виде
- kx tn-N+2 [( &{{) &(О - &|О)/(л - ЛГ + 2)]»/2}, B2.27)
где tn-N+2, %2n-N+\ — независимые случайные величины распреде-
распределенные соответственно по законам Стьюдента и центрального %2,
bWjk — элементы случайной матрицы, распределенные по нецент-
нецентральному закону Уишарта с N степенями свободы и параметрами
нецентральности:
B2.28а)
)nxln2]-w, B2.286)
к2=(п2-пх)/Bпхп2), B2.29)
параметр d2N определяется согласно B2.3) [см. также B2.25)].
Предположим, что векторы средних двух jV-мерных нормаль-
нормальных распределений классов Si и S2 известны и равны друг другу
&х = &2 = л- Корреляционные матрицы этих распределений Ki и Кг
неизвестны (К^Кг). Имея классифицированную обучающую
выборку XjA\ ... , х{Х)п1 из первого распределения и хB)ь ..., хB)Па
из второго, можно записать оценки максимального правдоподо-
правдоподобия неизвестных матриц:
Кх = — 2 (х<П-а)(хО>-а)', B2.30а)
Ка = — 2 (х<2) - а) (х<2) - а)'. B2.306)
п2 i=x
Для того чтобы классифицировать наблюдение х, можно вос-
воспользоваться оптимальным алгоритмом проверки гипотез о кор-
корреляционной матрице нормального распределения (см. задачу
13.4), заменив неизвестные корреляционные матрицы Ki, K2, Кг1,
Кг" их оценками. Тогда получаем следующий состоятельный
адаптивный алгоритм классификации: наблюдение х относится к
классу S2, если
(х - a)' (KV1 - Kf1) (x - а) > 2 In с + In (det K^det K2). B2.31)
Заменяя
Y = f7(x—а), \'= (уи ... , yN), где-матрица f определяется из со-
соотношения K2?=KifA, а Л — диагональная матрица, элементы
ii, -., kN которой являются корнями уравнения det(K2—ЯК1) =0,
можно неравенство B2.31) привести к виду
2 (l-—)y2l>2\nc+ 2 ШЯ,. B2.32)
623
Если векторы средних двух нормальных распределений равны
друг другу и неизвестны, то вместо величины а следует подста-
подставить в B2.31) ее оценку по обучающим выборкам:
а = (пг а\ + п2 а^/^ + п2), B2.33)
где аь а2 определяются согласно B2.5).
22.2.5. Алгоритм классификации с самообучением. Вернемся к
постановке задачи, изложенной в п. 22.2.2, но с условием, что
обучающая выборка хи ..., хп не классифицирована. Предполагая,
что появление любого из двух классов Sj и S2 в каждом наблюде-
наблюдении априори равновероятно, можно рассматривать каждый эле-
элемент обучающей выборки как принадлежащий общему бимо-
бимодальному распределению (смеси нормальных распределений)
— (ехр [-^^ILl + exp -
J /
B
w{x]ai9 а2) = ± (ехр [^
V ' * 2/ 2аУ2я I F[ 2а* ] Ч J
B2.34)
Среднее значение случайной величины, подчиняющейся рас-
распределению B2.34),
/2 B2.35)
неизвестно, так как неизвестны п\ и а2.
Выборочное среднее, полученное по неклассифицированной
обучающей выборке
а L j хг B2.36)
11 i=i
является несмещенной оценкой среднего значения а распределе-
распределения B2.34).
Используя B2.36) вместо неизвестного среднего, получаем
следующий адаптивный состоятельный алгоритм классификации:
наблюдение х относится к классу S2, если
х^а, B2.37)
и к классу Si в противном случае.
Алгоритм классификации с самообучением обобщается на
многомерный случай при сферической симметрии плотностей ве-
вероятности. Решается задача о принадлежности наблюдаемой век-
векторной выборки х одному из двух jV-мерных нормальных распре-
распределений с неизвестными векторами средних г.х и а2 и заданны-
заданными ковариационными матрицами Ki = K2 = a2I, где I — единичная
матрица. В этом случае общее многомерное распределение двух
классов представляется в виде следующей смеси многомерных
нормальных распределений:
(Х — ai)' (X — ai
+ ехр [ - (Х-а^о(аХ~аг) ] } B2.38)
624
или
ш(х|а, b) =
xexpf-(^l^:~^ich[^<^^ , B2 39)
где
a=(a1 + a2)/2> b=(a2—aO/2. B2.40)
Вектор а является вектором средних значений распределения
B2.39), а элементы ковариационной матрицы К этого распре-
распределения
оо оо
Кц= J ... $(xt -a;)iXj-aj)w(x\di, b)dx1...
—оо —оо
...dxN = bib]-\ ^sljy i, /=1, Л\ B2,41)
где dij — символ Кронекера; аг-— компоненты вектора а; Ъ\—•
компоненты вектора Ь.
Если векторы средних аь а2 известны, то оптимальное (по бай-
байесовскому критерию) разбиение выборочного пространства про-
проводит гиперплоскость, которая перпендикулярна линии, соеди-
соединяющей точки х = а! и х = а2, и делит эту линию пополам. Наблю-
Наблюдение х относится к тому или иному классу в зависимости от
знака величины Ь7(х—а).
Если же векторы средних для обоих классов неизвестны, для
синтеза адаптивного алгоритма классификации векторы аи b в
байесовском алгоритме следует заменить оценками. При самообу-
самообучении по неклассифицированной выборке Х|,... хп эти оценки по-
получаются из выборочного среднего и выборочной ковариационной
матрицы. Оценка вектора средних
а = — У
а оценки компонент вектора b можно найти из системы уравне-
уравнений [см. B1.41)] Rij = bibj + o28ij, где Rij — элемент выборочной
ковариационной матрицы
К-—2 (х,-а)(хг-а)'.
п г=1
22.3. АДАПТИВНЫЕ АЛГОРИТМЫ КЛАССИФИКАЦИИ
В УСЛОВИЯХ ПАРАМЕТРИЧЕСКОЙ АПРИОРНОЙ
НЕОПРЕДЕЛЕННОСТИ
22.3.1. Метод апостериорных вероятностей. Пусть в результа-
результате наблюдения получена векторная (информационная) выборка
х. Задача состоит в том, чтобы отнести наблюдение х к одному
21-87 E25
из классов Si,..., Sm. Предполагается, что распределения классов
характеризуются плотностями w(x\#k, S&), k=l,m, причем па-
параметры #i,... ,#т представляют независимые случайные векто-
векторы с априорными плотностями вероятностей w(ftk), k=l,m, ко-
которые отражают первоначальные знания о распределениях этих
параметров. Имеется набор обучающих классифицированных вы-
выборок хОб= (xi,..., xm), где вектор х^ принадлежит классу S/*.
Эту обучающую выборку можно использовать для корректировки
априорных знаний путем определения апостериорной плотности
W{*h\xh, Sfc) = .
r=w(#k)W(xk\*h, Sk) I Sw(#k)W(xh\#k9 SJdtf*. B2.42)
/ %
Используя формулу Байеса, определим апостериорную веро-
вероятность принадлежности классу S^ при данных хОб, х:
P{Sft|xo6, x) = PkW(xo6t x\Sh) I %phW(xo6, x\Sk), B2.43)
/ k=\
где Ph—априорная вероятность принадлежности классу S&. По
критерию максимальной апостериорной вероятности относим на-
наблюдение к классу Sfc, если
P{S*|xo6, х} = maxP{Sj|xo6, x}. B2.44)
Так как W(xo6, x| SA) = W(x|xo6, Sh)W(xo6), то из B2.43),
B2.44) следует
PhW(x\xo6, Sh)= max[PjW(x\xo6, S})]. B2.45)
Алгоритм классификации B2.45) предписывает вычисление
величин pjW(х|хОб, Sj), /=1, m, и отнесение вектора наблюдения
х к тому классу S&, которому соответствует максимальная из ука-
указанных величин. Если априорные вероятности pk одинаковы, го
классификация при заданном наборе хОб сводится к определению
того класса S&, для которого наблюдаемая выборка х максимизи-
максимизирует по индексу / функцию правдоподобия Щх|хОб, Sj). Послед-
Последние можно рассматривать как оценки неизвестных плотностей
распределений классов при заданном наборе обучающих вы-
ВЫборОК Хоб-
Функцию W(x\xo6, Sj) вычисляем, используя формулу полной
вероятности
W(x\xo6f Sj)=
ИЛИ
И7(х|хоб, S;)= p(x|^, SdWibjlx^SjWj, /=1, m, B2.46)
так как очевидно, что 1^(^|хОб, Sj) = U?(#j|xj, Sj), а функция
626
W(x\xO6y #j, Sj) вовсе не зависит от обучающих выборок. Второй
сомножитель з подынтегральной функции B2.46) определяется
согласно B2.42).
Заметим, что, когда параметры #ъ, априори известны и равны
в1*^, их условные плотности представляют дельта-функции
и из B2.46) следует
Г(х|хоб, S0 = ^(x|**ft, Sft). B2.46a)L
В этом случае алгоритм классификации совпадает с оптималь-
оптимальным байесовским алгоритмом проверки гипотез [см. B0.11)].
22.3.2. Теорема Бернштейна — Мизеса. Адаптивный алгоритм
классификации B2.45) зависит от априорных плотностей ш(Фа)
распределений параметров [см. B2.42), B2.45), B2.46)]. Про-
Проверить возможность использования этого алгоритма без какого-
либо определенного предположения об этих априорных плотнос-
плотностях можно с помощью теоремы, установленной С. Н. Бернштей-
ном и Р. Мизесом [71]. Сущность ее состоит в следующем. Пусть
Х\ — выборочное значение из распределения с неизвестным слу-
случайным параметром Ф. Апостериорное распределение этого пара-
параметра
W (Щхг) = w (*) W (хг\й) I ]w (#) W (х±\Щ d ft, B2.47)
где w (О) — априорная плотность вероятности параметра <К Если
извлекается следующее выборочное значение Х2, независимое от
Xi9 то IF^I^i) можно использовать в качестве нового априорного-
распределения для вычисления апостериорного
оо
S
—оо
]w (#) W (Xl\u) W <jcs|4>) d0. B2.48)
Аналогично, когда имеется независимая выборка xi9 ..., хп разме-
размером п, то
/wy<"*'*), B2.49)
где
Упомянутая теорема утверждает, что если априорная плот-
плотность w^) параметра ф непрерывна, то по мере возрастания объ-
21* 627
ема выборки апостериорное распределение W(/6i|a:i, ..., хп) пере-
перестает зависеть от априорного распределения. Таким образом, при
достаточно большом п безразлично, какую непрерывную функ-
функцию йу(д) подставить в формулу B2.49). Эта предельная теорема
послужила основой синтеза алгоритма классификации, предло-
предложенного Роббинсом [71].
22.3.3. Адаптивный алгоритм обнаружения случайного сигна-
сигнала на фоне аддитивной гауссовской помехи. В качестве иллюст-
иллюстрации метода синтеза адаптивного алгоритма классификации в
условиях параметрической априорной неопределенности рассмот-
рассмотрим следующую задачу. Имеется реализация х скалярной случай-
случайной величины, которую следует отнести к одному из двух клас-
классов: Si — помеха, представляющая гауссовскую случайную вели-
величину с нулевым средним и дисперсией а2, и S2 — аддитивная
смесь этой помехи и независимого от нее случайного сигнала,
среднее значение а которого — случайная величина, распределён-
распределённая по нормальному закону с параметрами (а0, а2о). Предпола-
Предполагается, что априорные вероятности принадлежности наблюдения
классам Si и S2 одинаковы.
Пусть х= (*i, ..., хп) —независимая классифицированная вы-
выборка аддитивной смеси сигнала с гауссовской помехой. По фор-
формул^ B2.42) находим апостериорную плотность распределения
сигнального параметра а [см. A4.119)]
W(u,~. Ss) = L_exp(-^^), B2.50)
апУ2п \ 2(j2 J
где
[^]-'[^Ь|] B2.81)
а2„ = |л2 {а | х} = а2/ (п + о2/а\). B2.52)
Если известно, что наблюдение х принадлежит классу S2, то
W(x\a, S2) = T—U=e*pf - (*~gJ ). B2.53)
Используя формулу B2.46), находим
W(x\x, S2) = J 1—-exp/_ (x"a)'}x
—00 а^/2д ^ za /
x l-=r exp I - (fl~a"J I da. B2.54)
Так как интеграл в B2.54) представляет свертку двух плотнос-
плотностей нормального распределения, то непосредственна находим
W (x|x, S2) = Л- ехР ( - (*Т?>21 * B2-55)
(
628
где о2х = в2 + о2пу а величины ап, а2п определяются согласно
B2.51) и B2.52).
Если наблюдение х — помеха, то [см. B2.46а)]
B2.55а)
Из B2.55) и B2.55а) получаем следующий адаптивный алго-
алгоритм обнаружения [см. B2.45)]: принимается решение, что на-
наблюдение х представляет смесь случайного сигнала с аддитивной
гауссовской помехой, если
_L expf - <?="й?) > JLехр j _ _*L ), B2.56)
и решение, что наблюдается помеха, в противном случае. После
элементарных преобразований алгоритм B2.56) приводится к
виду
?*?? + *(Л\ B2.57)
Здесь в левой части коэффициент ап зависит от обучающей вы-
выборки, а коэффициент о2п/Bа2)—от априори заданных диспер-
дисперсий а2, а20 и размера п обучающей выборки. Порог в правой ча-
части B2.57) зависит и от указанных значений дисперсий, и от
обучающей выборки.
Если размер обучающей выборки неограниченно возрастает,
то, как следует из B2.51) и B2.52), при п-^-оо
ап - — 2 хк = амп, оп ¦+ 0. B2.58)
n *=i
В этом случае квадратический член в левой части B2.57) стре-
стремится к нулю, алгоритм классификации становится линейным с
перестраиваемым порогом [ср. с B2.9)]
*4<W2 B2.59)
Si
и не зависит от начального априорного распределения сигнала.
Напротив, если а2»а2о, то ап~Яо, а2п~а20 и алгоритм B2.57)
преобразуется к виду
т. е. не зависит от обучающей выборки и полностью определяется
априорными данными.
Предположим теперь, что наблюдение х представляет вектор-
векторную (размером jV) случайную величину, которую следует отнес-
отнести к одному из двух классов: Si — гауссовская помеха с нулевым
вектором средних и ковариационной матрицей М и S2 — аддитив-
аддитивная смесь помехи и независимого от нее случайного сигнала,
629
вектор средних а которого случайный, подчинен много-
многомерному нормальному распределению с параметрами (а0, Мо).
Пусть xi, ..., хп — классифицированная выборка аддитивной
смеси сигнала и гауссовской помехи. По формуле B2.42) с уче-
учетом результатов, приведенных в п. 14.5.7 и 14.5.8, находим, что
апостериорная плотность сигнального параметра а подчиняется
многомерному нормальному распределению с параметрами
a^m^alXi,..., хп} =
B _*»?М. {22Щ
п ) \ п k=l п I
Mn=(I+MM0-7«)M/tt. B2.61)
Соотношения B2.60), B2.61) можно представить в рекуррентной
форме
Мп/М, B2.62)
n_i. B2.63)
Если известно, что наблюдение х приндалежит классу S2, то
Хехр{— (х—а)'М-1(х—а)/2}. B2.64)
Из B2.46) следует
W (х|хоб> S2) == I Bя)-^/2(det МГ1/2Х
А
X exp f —]- (х - а)' М-1 (х - а) ] Bя)~"/2 (det Mn)~1/2 x
X ехр { - -i-(а - апу М (а - an)} da. B2.65)
Так как интеграл в B2.65) представляет свертку двух плотнос-
плотностей А^-мерного нормального распределения, то непосредственна
находим
Щх|хоб, S2) = Bя)"^2 [det(M + Mn)]-i/2X
Xexp{-(x-an)/(M+Mn)-4x-an)/2}, B2.66)
где вектор ап и матрица Мп определены согласно B2.60), B2.61).
Если наблюдение х — помеха, то
Щх|а = 0, Si) = Bn)-^2(detM)-1/2exp[—х'М-*х/2]. B2.66а)
Из B2.66) и B2.66а) получаем следующий адаптивный алго-
алгоритм обнаружения: принимается решение, что наблюдаемый век-
вектор х представляет аддитивную смесь случайного сигнала и гаус-
гауссовской помехи, если
х'М-'х- (х—ап)' (М + Мп)-1 (х—ап) ^
>ln[det(M+Mn)/detJVl] B2.67)
и решение, что наблюдалась помеха, в противном случае.
630
Если размер обучающей выборки п-*оо, то
ап 2 xk = амп, Мп -> 0. B2.68)
В этом случае алгоритм классификации линейный с перестраи-
перестраиваемым порогом [ср. с B2.22) и с B2.59)
s2 -
х ^ ^мп. . B2.69)
St 2
22.3.4. Адаптивный метод преодоления априорной неопреде-
неопределенности мешающих параметров. Пусть в задаче проверки мно-
многоальтернативных гипотез (см. § 13.3) функция правдоподобия,
соответствующая /-й гипотезе, зависит от векторного мешающего
параметра fy, / = 0, га. Запишем выражение среднего риска как
функции мешающих параметров
$ i>j)dx. B2.70)
?=0 /=0 X
где
\1' X-*k' B2.70a)
0, XG Xfcf
Xk — область выборочного пространства X, соответствующая ре-
решению уи о принятии гипотезы #&, П^ — элементы матрицы по-
потерь, pj — априорная вероятность гипотезы Hj.
Если известны априорные распределения мешающих пара-
параметров, то эти параметры можно исключить из B2.70) путем
усреднения по этим параметрам, заменив функцию W{x\H^ ftj)
функцией
W(x\Hj)=j W(x\Hh *i)Wt»j)d*i9 B2.71)
©
где W($j)—априорная плотность распределения параметра
% / = 0, т.
В условиях параметрической априорной неопределенности,
когда функции W('6ij), / = 0, m, неизвестны, при помощи обучаю-
обучающих выборок можно определить оценки максимального правдо-
правдоподобия fl'jMn мешающих параметров и, как показано в [72], вос-
воспользуемся вместо B2.71) приближенным выражением
\ (det А,)-1/2,
где Nj — размерность вектора ftj, Aj — матрица с элементами
J,k=l,N, / = 0, m B2.72а)
предположении, что существуют указанные производные.
631
Приближение B2.72) допустимо при условии, что априорные
плотности распределения мешающих параметров «шире» апосте-
апостериорных, которые формируются по обучающим выборкам. При
этом функция W(#jMn) существенно слабее зависит от х, чем ос-
остальные множители в правой части B2.72), и поэтому ее, наряду
с величиной Bn)Nj/2, можно рассматривать как несущественный
сомножитель. Тогда адаптивный алгоритм проверки многоальтер-
многоальтернативных гипотез определяется минимизацией (путем определе-
определения соответствующих решающих функций Ф/*(х) величины
2 nAJOft(x)p;^;(x|tf,,*yMII)(detA,)-V2dx. B2.73)
' X
Для простой функции потерь
П;А=1—6jft, B2.74J
где 5jh — символ Кронекера, оптимальный адаптивный алгоритм
формулируется следующим образом: принимается гипотеза Н^
если для всех [ф\
_ : 75
Ире*^*- т ч i :^срес и ряд друг гх адаптивных алгор:, ^ 1з
провер] ;т г-'Ю^, рр^емотр^мшх в [73J
22. . Л,Г*,ЛПТ*^Т-Ь1Е ^JirOPFIMn-J КЛАССИФИКАЦИИ
г v,. -г ; ^х,11Аг^1гТ1-;г^;кой априорной
22.4Л, Метод потенциальных функций. Пусть наблюдение пред-
представлено ЛЧмерным вектором х. Решается задача классифика-
классификации — принадлежности этого наблюдения одному из двух классов
Si и S2. Если известны плотности w(x\S\) и w(x\S2), а также ап-
априорные вероятности р\ и р2 принадлежности первому и второму
классам, то оптимальной классифицирующей статистикой служит
отношение правдоподобия р2^(х\ S2)/[piw(x\ Si)], xgX. В усло-
условиях кепараметрической априорной неопределенности можно по-
попытаться аппроксимировать статистику /(х), используя некласси-
неклассифицированную независимую обучающую выборку уь ..., уп из про-
пространства X.
Представим неизвестную статистику отношения правдоподо-
правдоподобия в виде разложения по конечному ортонормированному ба-
базису
т
Если ввести потенциальную функцию
т
^(х> У)= 2 фй (х) фй (у), B2.77)
632
то, как показано в [74], подходящей аппроксимацией функции
D(x) является функция Dn(x1 yn), получаем согласно рекуррент-
рекуррентному алгоритму
Dn( х, yn)=Dn-1(x, yn_i)+rn_i/((x, yn), B2.78)
где {rk} — числовая последовательность, подчинения условию
сходимости Dn к D при п-^оо. Обозначая через а^п коэффициен-
коэффициенты разложения B2.76) на п-м шаге, получаем из B2.78) следу-
следующий рекуррентный алгоритм оценивания этих коэффициентов
по обучающей выборке:
. B2.79)
На первом шаге в качестве нулевого приближения пио> &=1, т,
можно выбрать произвольные константы.
Зависимые обучающие выборки рассмотрены в [75]. Рекур-
Рекуррентным адаптивным алгоритмом, основанным на использовании
классифицирующих статистик, посвящена монография [76] (см.
также [79]).
22.4.2. Метод оценки классифицирующей статистики. Пусть
XiBi) ... хп({п ) — последовательность независимых обучающих
векторных (jV-мерных) выборок, принадлежащих /j-му классу
ij=V, 2, /=1, ..., п). Каждый вектор Xj появляется с вероятностью
Pi, если ij=l, и с вероятностью рг, если ij = 2. Введем дискрет-
дискретную случайную величину v7-, принимающую два значения:
1, х<Л-) = х<-2),
; ' B2.80)
t), х)Ч> = х1,1).
Ясно, что
РЬ=1}=Р2, P{vi = 0}=pb Pi + p2 = A B2.81)
Обозначив
yJ = vixj0)+(l-Vj)xjB)> B2.82)
можно объединить обе обучающие последовательности в одну
У1Г1=(Уь ••• Уп) и использовать эту последовательность для аппрок-
аппроксимации классифицирующей статистики D(x) [см. B2.76)]. Так
как D(x)^0, можно воспользоваться методами оценки много-
многомерной плотности вероятности. Примем в качестве аппроксима-
аппроксимации D(x) функцию
Dn (х, у«) ^ S Bv,- 1) КЛх, у,), B2.83)
п /=i
где
Кг (х, У|) »= Д К \XjftT-\ I h> W> B2-83a>
L h W J/
ядро /С(«г) и константы йг-(я) удовлетворяют условиям A4.22а—в)
и A4.25а,б) [см., например, [80]].
633
Как показано в [77], последовательность
грп (у«) = J [Dn (х, у") - D (x)f dx B2.84)
X
сходится к нулю по вероятности, когда размер обучающей выбор-
выборки п неограниченно возрастает. При этом оценка вероятности
ошибки классификации при использовании классифицирующей
статистики Z)n(x, yin) сходится к вероятности ошибки классифи-
классификации, соответствующей оптимальному правилу при полной ап-
априорной информации.
22.4.3. Правило «ближайших соседей». Пусть функция W (х)
непрерывна в точке х и последовательность областей gi, ..., gn с
объемами vi, ..., vn удовлетворяет следующим условиям:
а) lim nvn = 00,
П-»оо
б) lim sup || x — у || = О,
в) число k статистически независимых выборок из распределе-
распределения с плотностью W(x), попадающих в область gn, таково, что
&-*-оо при п-+оо и
fr(x)=*/(m>») -^ W(x) ,
л-»оо
— состоятельная оценка плотности W (х) в точке х.
При соблюдении указанных условий формулируется следую-
следующее правило «ближайших соседей»: если имеется совокупность
п обучающих независимых выборок хь ..., хп, о каждой из кото-
которых известно, к какому из двух распределений принадлежит вы-
выборка, и если среди k обучающих выборок, ближайших к наблю-
наблюдаемой выборке х, ki принадлежит распределению с плотностью
Wi(x), a ko — к распределению с плотностью W0(x), то принима-
принимается решение, что наблюдаемая выборка х относится к классу с
плотностью U^i(x), если
B2.85)
и к W0(x) в противном случае. Адаптивное правило B2.85) не
требует построения оценок плотностей распределений и является
в известном смысле непараметрическим (см., например [78]).
22.5. АДАПТИВНЫЕ АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЕ
АЛГОРИТМЫ ОБНАРУЖЕНИЯ СИГНАЛОВ НА ФОНЕ ПОМЕХ
22.5.1. Принцип построения адаптивных асимптотических оп-
оптимальных алгоритмов. Общим критерием качества адаптивного
алгоритма, как отмечалось в § 22.1, является его состоятель-
состоятельность— сходимость по вероятности адаптивного алгоритма к оп-
оптимальному алгоритму при полной априорной информации, ког-
когда неограниченно увеличивается размер обучающей выборки.
634
Состоятельные адаптивные алгоритмы обнаружения получают-
получаются из оптимальных подстановкой вместо неизвестных функций
распределения или их параметров соответствующих оценок, вы-
вычисленных при помощи обучающих выборок. Однако критерий
состоятельности не определяет однозначно адаптивный алгоритм
обнаружения сигнала.
Для построения состоятельного адаптивного алгоритма можно
использовать приведенные в гл. 18 и 19 асимптотически опти-
оптимальные алгоритмы обнаружения сигналов. Хотя эти алгоритмы
обладают определенной структурной устойчивостью, для их при-
применения необходима априорная информация о распределении
помехи и способе ее взаимодействия с сигналом для того, чтобы
определить характеристику нелинейного преобразователя наблю-
наблюдений н вычислить порог. Если имеется обучающая выборка, то,
используя удачно выбранные оценки характеристики нелинейности
и порога, можно получить состоятельный адаптивный алгоритм
обнаружения. Такие алгоритмы сохраняют все положительные
свойства асимптотически оптимальных алгоритмов, приобретая
новое свойство — возможность их применения в условиях апри-
априорной неопределенности относительно вида помехи.
Вследствие асимптотической эквивалентности вероятностных
мер при сближающихся гипотезе и альтернативе (см. гл. 17),
оценивание характеристики нелинейного преобразователя по не-
неклассифицированной обучающей выборке столь же эффективно,
как при классифицированной, но с меньшей скоростью сходимос-
сходимости адаптивного асимптотически оптимального алгоритма.
22.5.2. Адаптивный асимптотически оптимальный алгоритм
обнаружения детерминированного сигнала на фоне ^-связной
марковской помехи. Пусть yiM= (yi, ..., Ум)—классифицирован-
Ум)—классифицированная выборка, принадлежащая распределению й-связной марков-
марковской помехи (Л1>&). При неизвестном распределении помехи на
основе этой выборки можно получить оценки следующих величин
в асимптотическом разложении A7.64), зависящих от неизвест-
неизвестного распределения
?j(*t-k) = gj(xt-k,yi'), B2.86)
hi = 7Г 2 Bi (*/_*. У?1) Bj (x[_*. yf)• B2.87)
Адаптивный асимптотически оптимальный алгоритм обнару-
обнаружения детерминированного сигнала на фоне ^-связной марков-
марковской помехи формулируется следующим образом: сигнал присут-
присутствует, если
-7= 2 *' И-*) *U - -т tr lQI^ > с> <22-88>
и сигнала нет в противном случае [ср. с A8.47)]. ,
635
22.5.3. Адаптивные асимптотически оптимальные алгоритмы
обнаружения детерминированного сигнала на фоне аддитивной
помехи с независимыми значениями. Предположим, что неизвест-
неизвестная плотность вероятности w(x) аддитивной помехи с независи-
независимыми значениями принадлежит параметрическому семейству
плотностей. Примерами таких семейств являются функции Пир-
Пирсона (см., например, [6, 16]), а также плотности, аппроксимиру-
аппроксимируемые конечными суммами ортогональных полиномов (см. § 2.5).
В этих случаях неизвестную логарифмическую производную
f(x) плотности помехи (характеристику нелинейного преобразова-
преобразователя наблюдаемой выборки) можно представить в виде отноше-
отношения
f(x)=P(x)/Q(x), B2.89)
где Р(х), Q(x)—полиномы конечных степеней, коэффициенты
которых выражаются через моменты тк, й=1, N, распределения
помехи. Заменяя эти априорные моменты выборочными
«;--^|y?.ft-PV. B2.90)
вычисленными по классифицированной независимой выборке по-
помехи, получаем оценку логарифмической производной
/ (*) = Р (х ; т\у ... , rnN)lQ (х ; ти ... , mN). B2.91)
Кроме подстройки характеристик f(x) входного нелинейного
безынерционного преобразователя, необходима также подстрой-
подстройка порога, который зависит от неизвестного значения I/ инфор-
информации по Фишеру [см. A8.5)]. При независимой обучающей вы-
выборке помехи yiM в соответствии с законом больших чисел
оценка
1 м „-
1/= — 2 РШ • B2.92)
Можно доказать, что оценки f(x) и I/ при М-^оо сходятся по
вероятности к f (x) и I/ соответственно.
Предположим теперь, что неизвестная плотность вероятности
w (х) аддитивной помехи с независимыми значениями принадле-
принадлежит непараметрическому семейству плотностей. Для построения
адаптивного асимптотически оптимального алгоритма обнаруже-
обнаружения сигнала в рассматриваемом случае необходима оценка не
самой плотности, а ее логарифмической производной. Используя
метод потенциальных функций (см. п. 22.4.1), находим оценку ха-
характеристики нелинейности f(x) по обучающей выборке yiM по-
помехи
636
Mm I M m
/(*)=- 2 2 Ф* (*) Фь (j/i) / 2 2 Фл (*) Ф* Ы. B2 93)
i=l Л=1 / i=l Л=1
где (pi(x), ..., фт(х) —ортонормированныи базис.
Другая оценка получается методом, аналогичным приведен-
приведенному в п. 22.4.2:
f (*)= s - ехр \-<?=*?] I 2 ехр [ - ^=^1 , B2.94)
где /г(М)->-0 при уИ-voo. При этом оценки B2.93) и B2.94) схо-
сходятся при М->-оо по вероятности к f(x).
ПРИЛОЖЕНИЕ 1. ДЕЛЬТА-ФУНКЦИЯ
По определению дельта-функция 8(t—/0) для любого действитель-
действительного параметра t0 равна нулю при t=?t0 и неограничена при t=t0
Интеграл от этой функции
ь ( l ' a<lQ<b,
I 6{t-to)dt= 1/2, to = a или t0 = Ъ, B)
а \ О , tQ<a, to>b.
Строго говоря, дельта-функция получается как предельная функция одно-
параметрического семейства непрерывных функций. Примеров таких семейств
очень много. Одним из них, как отмечалось в гл. 2, является семейство нор-
нормальных функций распределения при постоянном среднем значении а и при пе-
переменном среднеквадратическом а->0. Другим служит семейство функций <р(^,
%) =Я/[я(Я2/2+1)], из которого при Х->оо получаем дельта-функцию 6(t).
Рассмотрим совокупность s(t, т) прямоугольных импульсов единичной пло-
площади, длительность которых т, а высота 1/т:
s(i т)_ / V*. 'о<'<'о + т. ,3)
S(''T)- U , t<to,t>t.+ x. C)
Если устремить длительность импульса к нулю, то в результате такого предель-
предельного перехода получим дельта-функцию:
6 (^—to)= lim s(t, т). (За)
т->о
Дельта-функция возникает также и при следующем предельном переходе:
lim sinM/(jtf)=6(*). D)
Свертка дельта-функции с любой ограниченной и непрерывной в точке t0
функцией /-(/) обладает следующим свойством:
ь | f(*o), a<to<b,
j / (t) б (t - t0) dt= If (y/2, tQ = a или t0 = b, E)
I 0, /0 <at to>b.
Если функция '/@ в точке t=t0 имеет разрыв (первого рода), то
ъ
j f(Oe('-Wd*=[/(*o+)+/(M]/2, «<^о<Ь, Eа)
а
где f(^o+) и /(^о-) — значения /(/) справа и слева от точки разрыва.
Свойство, выраженное формулой E), может быть названо фильтрующим.
В самом деле, дельта-функция действует как фильтр; умножая произвольную
638
функцию f(t) на б (t—t0) и интегрируя по /, мы выделяем одно значение этой
функции f(to), т. е. значение, которое соответствует нулю аргумента б-функции
(t = to)\ Доказательство формулы E) получается, если под знак интеграла
вместо б(/—10) подставить любую аппроксимирующую ее функцию и затем
перейти к пределу.
Отметим, что дльта-функция 6(*—х0) имеет размерность \[х.
Найдем преобразование Фурье дельта-функции. Используя фильтрующее
свойство, получаем
j 6(/—*o)exp(—i0Od'=exp(—to'o). F)
— оо
Если tfo = O, то из iF) следует, что спектр 6(t) равномерный на всех час-
частотах, с интенсивностью, равной единице. В соответствии с F) спектр полу-
полусуммы двух дельта-функций [6(f+to)-\-d(t—4o)][2
i[exp (ico^o) -г ехр (—ico^o) ] /2=cos со/о. Fа)
Совершая теперь обратное преобразование Фурье, находим
1 ОО 1 ОО
— f ехр (Ш) Жо = — f cos со td со =6@, G)
2jl -оо Я 0
j OO 1 °°
— f exp (ico/) cos со /0 d со = — f cos со t cos со t0 d со =
2 -Ло * Q
= Y [в(/+У + ви-«1. Gа)
В силу симметрии интеграла Фурье переменные t и со в формулах F) и G)
могут меняться местами.
Производные от дельта-функции определяются как пределы соответствую-
соответствующих производных от аппроксимирующих функций. Например, если воспользо-
воспользоваться для такой аппроксимации нормальными функциями распределения при
а-И), то для n-й производной от дельта-функции получаем следующее опре-
определение:.
5(п> @ = lim Г—J — ехр ( - —) ] . (8)
Как и сама дельта-функция, ее производные равны нулю при 1Ф0. Пове-
Поведение производных при ?=0 сложное. Например, первая производная дельта-
функции
t I t2 \
б' (t) = j=r lim а-3 ехр — )
равна +оо при подходе к началу координат слева (?=0_) и —с» при -подходе
справа (/=0+). В окрестности t—О поведение 6'(t) сравнимо с поведением
функции 1//.
Фильтрующее свойство дельта-функции распространяется также и на ее
производные. Свертка производной п-то порядка дельта-функции с любой функ-
функцией, имеющей непрерывную производную п-го порядка в точке /0
639
j Ч<—<о)Л-(—I)*f"('o). (9)
—оо
Если производная f(n)(t) терпит разрыв (первого рода), в точке /0, то
У / @ 6(n) (t - /в) Л = у ( " О" 1/(п) Со+) + /(П) ('о-I. (9а)
Найдем спектр (преобразование Фурье) производной дельта-функции. Ис-
Используя (9), получаем
оо
j 6{n) (t - t0) ехр { — Ш) dt =
— 00
dn
= — exp ( - Ш) I = ( - ico)" exp ( - Шо) . A0)
dt1 °
Если ^о = О, то из A0) следует, что спектр 6(п>(?) равен (—ico)n.
Так как для корреляционной функции белого шума с единичной интенсив-
интенсивностью B(t, у)=б{!—у), то из D.58) следует, что все собственные числа оди-
одинаковы Xk = l ив соответствии с D.57)
оо
6 (/-*)= 2 флЮфлМ, (и)
где {фь(О) — любая система ортонормированных функций.
Заметим, что не только дельта-функция обладает фильтрующим свойством.
Подобное сц-шство присуще, например, функции (sin*)/.*:. Если tf(x) непрерыв-
непрерывно в точке х = а, то
7 , ,„, ?l \sinnb(x-a)-] /("> (a)
1" dx-L ^(*-a)JrfX- ^ ' П2)
причем
^rt Г sin тт. h(y— a\ ~l ^^„u,
exp ( — ico*) dx = \ A2a)
-oo dxn
640
ПРИЛОЖЕНИЕ 2. ПРЕОБРАЗОВАНИЕ ГИЛЬБЕРТА
И АНАЛИТИЧЕСКИЙ СИГНАЛ
Пусть s(t) — действительная функция, принадлежащая к классу
оо
"—оо, оо), т. е. J \s(t) | р<2/<со. Тогда при р>1 можно определить функ-
—оо
цию o(t), сопряженную s(/), при помощи следующего интегрального преобра-
преобразования Гильберта
1 °°r s (т)
а</)= - — J -^dx, A)
Я -оо Т-*
причем
./м_ ! 7 G(T) _,_
(при /=т берутся главные (в смысле Коши) значения интегралов).
Если Fa(co) — спектр (преобразование Фурье) функции s(t), то спектр
сопряженной функции
ОО 1 ОО оо / • J\
F0(co)= J о(/)ехр(—шО*= -— j s(x) i 6XP _ Ш
ОО ^ —ОО СЮ
Заменой / на т—и переменные интегрирования разделяются. Тогда
1 °? exp (icon) 2i *J? sin сом
Fff(a» = F,(a)— J u rf«=-F.«a)— f —— <f«
JX ^^ И JX q И
Так как
sin шг я
d
о
где sgn со означает знак переменной со, то
C)
*? sin шг я
du = — sgn со,
о " 2
Из C) следует, что \Fa(cu)\ = \Fa(a>)\, а argfa (<o) =argFs(co)±jt/2. Ha^
пример, при s(/) =a0 cos(coo^+9) сопряженная функция ¦cr(/)=aosin((DoH-<p).
Зададим на действительной оси t комплексную функцию Z(t) = s(t)-\-io(t).
Для того чтобы эта функция была пределом аналитической функции Z(t+\u)
при и-»-0, необходимо и достаточно выполнения любого из следующих двух ус-
условий: функции s(t) и o(t) — сопряженные; преобразование Фурье Fz((o) от
Z(t) тождественно равно нулю при ю<0. Выполнение одного условия влечет за
собой выполнение другого.
Комплексную функцию Z(t) действительного переменного tt удовлетворяю-
удовлетворяющую одному из указанных условий, называют аналитическим сигналом, соответ-
соответствующим s(t). Обозначим через a(t) и Ф(/) модуль и аргумент аналитического
сигнала:
D)
641
Тогда
s@ = ReZ@=a(Ocos<D@, E)
o(t) =Im Z(t) =a@sin Ф@, F)
откуда
,G)
(8)
Функции a(t) и Ф,@ называют огибающей и фазой s(t). Так как задаиной
функции s(t) соответствует однозначно аналитический сигнал Z(t) и, следова-
следовательно, огибающая a(t) = \Z(t)\ и фаза O@=arg^@> T0 представление функ-
функции s(t) в виде E) с учетом F)—~,{8) однозначно.
СПИСОК ЛИТЕРАТУРЫ
1. Левин Б. Р. Теоретические основы статистической радиотехники. Кн. 1-я.
М.: Сов. радио, 1974.— 552 с.
2. Келли Т. Л. Статистические таблицы. — М: ВЦ АН СССР, 1966. —
194 с.
3. Гантмахер Ф. Р. Теория матриц. — М.: Наука, 1968.— 576 с.
4. Таблицы распределения Рэлея —Раиса. — М.: ВЦ АН СССР, 1964. —
246 с.
5. Левин Б. Р. Теория случайных процессов и ее применение в радиотехни-
радиотехнике. — М.: Сов. радио, 1957.— 496 с.
6. Крамер Г. Математические методы статистики: Пер. с англ./Под ред.
А. Н. Колмогорова. — М.: Мир, 1976. — 632 с.
7. Каган А. М., Линник Ю. В., Рао С. Р. Характеризационные задачи мате-
математической статистики. — М.: Наука, 1972. — 656 с.
8. Лоев М. Теория вероятностей: Пер. с англ./Под ред. Ю. В. Прохорова.—
М.: ИЛ, 1962. — 720 с.
9. Возеикрафт Дж., Джекобе И. Теоретические основы техники связи: Пер.
с англ./Под ред. Р. Л. Добрушина. — М.: Мир, 1969. — 640 с.
10. Колмогоров А. Н. Основные понятия теории вероятностей. — М.: Наука,
1974.— 119 с.
11. Винер Н., Пэли Р. Преобразование Фурье в комплексной области: Пер.
с англ./Под ред. Ф. В. Широкова. — М.: Наука, 1964. — 267 с.
12. Хинчин А. Я. Теория корреляции стационарных случайных функций//Успе-
хи математических наук. — 1938. — Вып. 5. — С. 42—51.
13. Ибрагимов И. А., Линник Ю. В. Независимые и стационарно связанные
случайные величины. — М.: Наука, 1955. — 524 с.
14. Биллингсли П. Сходимость вероятностных мер: Пер. с англ./Под ред.
A. В. Прохорова. — М.: Наука, Ю77. — 351 с.
15. Боровков А. А. Теория вероятностей. — М.: Наука, 1976. — 352 с.
16. Левин Б. Р., Шварц В. Вероятностные модели и методы в системах связи
и управления. — М.: Радио и связь, 1985. — 312 с.
17. Гельфанд И. М., Виленкин Н. Я. Обобщенные функции. — М.: Физматгиз,
1961. — Вып. 4. — 472 с.
18. Левин Б. Р. Теоретические основы статистической радиотехники. Кн. 3-я. —
М.: Сов. радио, 1976. — 288 с.
19. Феллер В. Введение в теорию вероятностей и ее приложения. Т. 2: Пер.
с англ./Под ред. Ю. В. Прохорова. —- М.: Мир. 1984. — 752 с.
20. Линдсей В. Системы синхронизации в связи и управлений: Пер. с англ./
Под ред. Ю. Н. Бакаева и М. В. Капранова. — М.: Сов. радио, 11978.—
600 с.
21. Тихонов В. И., Миронов М. А. Марковские процессы. — М.: Сов. радио,
1977. —488 с.
22. Гихман И. И., Скороход А. В. Введение в теорию случайных процессов. —
М.: Наука, 1965. —656 с.
23. Корн Гм Корн Т. Справочник по математике для научных работников и
инженеров: Пер. с англ./Под ред. И. Г. Арамоновича. — М.: Наука, 1977.—
832 с.
24. Пупков К. А., Копалин В. И., Ющенко А. С. Функциональные ряды в тео-
теории нелинейных систем. — М.: Наука, 1976. — 448 с.
25. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигна-
сигналов: Пер. с англ./Под ред. Ю. Н. Александрова. — М.: Мир, 1978. —
848 с.
26. Директор С, Рорер Р. Введение в теорию систем: Пер. с англ./Под ред.
B. Н. Бусленко. — М.: Мир, 1974. — 644 с.
27. Гоулд Б., Рейдер Ч. Цифровая обработка сигналов: Пер. с англ./Под ред.
А. М. Трахтмана. — М.: Сов. радио, 1973. —- 368 с.
28. Хеннан Э. Многомерные временные ряды: Пер. с англ./Под ред. Ю. А. Ро-
Розанова. — М.: Мир, 1974. — 576 с.
643
29. Pawula R. F., Tsai A. Y. Theoretical and Experimental Results for the Dist-
Distribution of a Certain Nonlinear Functional//IEEE Trans., 1969.— Vol. IT-15,
№ 5. — P. 532—535.
30. Papulis A. Narrow-Band System and Gaussianity. — IEEE Trans., 1972. —
Vol. IT-18, № 1. —P. 20—26.
31. Малахов А. Н. Кумулянтный анализ случайных негауссовых процессов и
их преобразований. — М.: Сов. радио, 1978. — 376 с.
32. Baum R. F The Correlation Function of Noise Passed Throuth Nonlinear De-
Devices. — IEEE Trans., 1969. —Vol. IT-15, № 4. — P. 448—456.
33. Фомин Я. А. Теория выбросов случайных процессов. — М.: Связь, 1980. —
216 с.
34. Слепян Д. Флуктуации мощности случайного сигнала//Определение пара-
параметров случайных процессов: Пер. с англ./Под ред. В. И. Чайковского.—
Киев.: Гостехиздат УССР, Ю62. — С. 125—148.
35. Леман Е. Проверка статистических гипотез: Пер. с англ./Пер. Ю. В. Про-
Прохорова.— М.: Наука, 1971. — 375 с.
36. Вальд А. Статистические решающие функции/Щозиционные игры: Пер.
с англ./Под ред. Н. Н. Воробьева. — М.: Наука, 1967. — С. 300—522.
37. Миддлтон Д. Очерки теории связи: Пер. с англ./Под ред. Б. Р. Левина.—
М.: Сов. радио, 1966. — 160 с.
38. Вальд А. Последовательный анализ: Пер. с англ./Под ред. Б. А. Севастья-
Севастьянова. — М.: Физматгиз. 1960. — 328 с.
39. Ширяев А. Н. Статистический последовательный анализ. — М.: Наука,
1976. — 271 с.
40. Теория обнаружения сигналов/П. С. Акимов, П. А. Бакут, В. А. Богдано-
Богданович и др.; Под ред. П. А. Бакута. — М.: Радио и связь, 1984. —
440 с.
41. Линиик Ю. В. Статистические задачи с мешающими параметрами. — М.:
Наука, 1966. — 252 с.
42. Гаек Я., Шидак 3. Теория ранговых критериев: Пер. с англ./Под ред.
Л. Н. Болыпева. — М.: Наука, 1971. —375 с.
43. Уилкс С. Математическая статистика: Пер. с англ./Под ред. Ю. В. Линни-
ка. — М.: Наука, 1967. — 632 с.
44. Витерби А. Принципы когерентной связи: Пер. с англ./Под ред. Б. Р. Ле-
Левина. — М.: Сов. радио, 1970. — 392 с.
45. Дюге Д. Теоретическая и прикладная статистика: Пер. с франц./Под ред.
Ю. В. Линника. — М.: Наука, 1972. — 383 с.
46. Дуб Дж. Л. Вероятностные процессы: Пер. с англ./Под ред. А. М. Ягло-
ма. — М.: ИЛ, 1956. — 605 с.
47. Гренадер У. Случайные процессы и статистические выводы: Пер. с англ./
Под ред. А. М. Яглома. — М.: ИЛ, 1961. — 168 с.
48. Левин Б. Р., Архипов В. С. Сравнение дискретной и аналоговой обработ-
обработки сигналов//Известия вузов. Радиоэлектроника, 1972. — № 4. — С. 532—534.
49. Питерсон У., Бердсал Т., Фокс У. Теория обнаружения сигналов/Деория
информации и ее приложения: Пер. с англ./Под ред. А. А. Харкевича. —
М.: Физматгиз, 195Э. — 328 с.
50. Андерсон Т. Введение в многомерный статистический анализ: Пер. с англ./
Под ред. Б. В. Гнеденко. — М.: Физматгиз, 1963. — 500 с.
51. Kassam S. A., Thomas J. В. A Class of Nonparametric Detectors for Depen-
Dependent Input Data/ДЕЕЕ Trans., 1975. —Vol. IT-21, № 4. — P. 431—437.
52. Le Cam L. On the Asymptotic Theory of Estimation and Testing Hypothe-
Hypotheses. — Proc. Third Berkeley Simp. Math. Stat., 1956.—P. 129—156.
53. Pycac Дж. Контигуальность вероятностных мер: Пер. с англ./Под ред.
Д. М. Чибисова. — М.: Мир, 1975.— 254 с.
54. Кушнир А. Ф., Пинский А. И. Асимптотически оптимальные критерии для
проверки гипотез при зависимой выборке наблюдений//Теория вероятностей
и ее применения, 1971. — Вып. 2. — С. 280—291.
55. Ибрагимов И. А., Хасминский Р. 3. Асимптотическая теория оценивания. —
М.: Наука, 1979. — 527 с.
644
56. Кушнир А. Ф. Асимптотически оптимальные критерии для регрессионной
задачи проверки гипотез//Теория вероятностей и ее применения, 1968. —
Вып. 4. — С. 682—699.
57. Левин Б. Р., Розгон И. М. Асимптотически оптимальное обнаружение де-
детерминированных сигналов на фоне аддитивных помех по независимым
группам коррелированных выборок//Радиотехника и электроника, 1984. —
№ з. — С. 456—464.
58. Кендалл М. Дж.. Стьюарт А. Статистические выводы и связи: Пер. с англ./
Под ред. А. Н. Колмогорова. — М.: ИЛ, 1973. — 900 с.
59. Hajek J. Asymptotcally most powerful rank-order tests//Ann. Math. Statist.,
1962. —Vol. 33. —P. 1134—1147.
60. Левин Б. Р. Теоретические основы статистической радиотехники. Кн. 2-я. —
М.: Сов. радио, 1975.— 392 с.
61. Levin В. R., Shinakov Yu. S, Asymptotic propreties of Bayes estimates of
parameters of signal masked' by interference//IEEE Trans. —1972.— Vol.
IT-18, № 1. —P. 102—106.
62. Сейдж Э., Меле Дж. Теория оценивания и применение в связи и управ-
управлении: Пер. с англ./Под ред. Б. Р. Левина. — М.: Связь, 1976. —
496 с.
63. Колмогоров А. Н. Интерполирование и экстраполирование стационарных
случайных последовательностей//Известия АН СССР. Сер. мат. Ю41. —
№ 5. — С. 3—14.
64. Winer N. The interpolation, extrapolation and smoothing of stationary time
series. —N. Y.: J. Wiley, 1949.— 162 p.
65. Kalman R. E. A new approach to linear filtering and predication problems//
Trans. ASME Ser. D, I960. —Vol. 8. — P. 35—45.
66. Сейдж Э., Уайт Ч. Оптимальное управление ситемами: Пер. с англ./Под
ред. Б. Р. Левина. —М.: Радио и связь, 1982. — 392 с.
67. Стратонович Р. Л. Применение процессов Маркова для оптимальной фильт-
фильтрации сигналов//Радиотехника и электроника, 1960. — № 11. — С. 1751—
1763.
68. Тихонов В. И., Кульман Н. К. Нелинейная фильтрация и квазикогерентный
прием сигналов. — М.: Сов. радио, 1975. — 704 с.
69. John S. On some classification statistics//Indian J. of Statist., 1960. — Vol.
22, № 3. — P. 309.
70. Левин Б. Р., Троицкий Е. В. О накоплении признаков в задачах класси-
классификации наблюдений//Радиотехника и электроника. — 1970. — № 7. —
С. 1398—1405.
71. Нейман Дж. Два прорыва в теории выбора статистических решение/Мате-
решение/Математика. — 1964. — № 2.
72. Репин В. Г., Тартако^ский Г. П. Статистический синтез при априорной не-
неопределенности и адаптация информационных систем. — М.: Сов. радио,
1977.— 392 с.
73. Сосулин Ю. Г. Теория обнаружения и оценивания стохастических сигна-
сигналов. — М.: Сов. радио, 1978. — 320 с.
74. Айзерман М. И., Браверман Э. М., Розоноэр Л. М. Метод потенциальных
функций в теории обучения машин. — М.: Наука, 1970. — 384 с.
75. Cibi S. Stochastic processes with learning properties — Wien: Springer Ver-
lag, 1975.—151 p.
76. Цыпкин Я. 3. Основы теории обучающихся систем. — М.: Наука, 1970.—
252 с.
77. Wolverton С. Т., Wagner Т. J. Asymtotically optimal discriminant function for
pattern classification.—IEEE Trans., 1969. —Vol. IT-15, № 2. — P. 258—265.
78. Патрик Э. Основы теории распознавания образов: Пер. с англ./Под ред.
Б. Р. Левина. — М.: Сов. радио, 1980. — 408 с.
79. Невельсон М. Б., Хасминский Р. 3. Стохастическая аппроксихмлщ я ч рекур-
рекуррентное оценивание. — М.: Наука. 1972. — 304 с.
80. Надарая Э. Я. О непараметрических оценках плотности вероятности '/Тео-
'/Теория вероятностей и ее применения, 1965. — № 2. — С. 193—203.
81. Фомин Я. А., Тарловский Г. Р. Статистическая теория распознавания об-
образов. — М.: Радио и связь, 1986.— 264 с.
645
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Аксиомы теории вероятностей 9
Алгебра событий 8
Алгоритм:
адаптивный 618
аналоговый 377, 413, 436, 447, 568
асимптотически оптимальный, 492,
516, 540, 580, 634
байесовский 324, 337
Ван дер Вардена 377, 554
Вилкоксона 373, 554
дискретно-аналоговый 316, 344, 417,
445, 566
. знаковый 366, 370, 471
знаково-ранговый 372, 475, 553
многошаговый 313, 322
непараметрический 357, 382, 470
одношаговый 313, 322
оптимальный 316, 344, 355, 378, 414
ранговый 478, 488, 522, 553
РНМ 340
— несмещенный 340, 350
последетекторный 453
— амплитудный 454, 456
— фазовый 454, 458
сингулярный 466
состоятельный 346
фильтраци-и 598
— Калмана 608
цифровой 313, 543
Альтернатива 322, 349
Априорная неопределенность 309,
322, 340, 357, 381, 387
—* непараметрическая 322, 632
— параметрическая 322, 340, 625
Асимптотика:
Муавра—Лапласа 14
Пуассона 15
Белый шум ПО, 143, 192, 197, 293,
439, 451
В
Вариационный ряд 385
Величина случайная 18
векторная 26
гауссовская 33
дискретная 18, 20
646
непрерывная 21
Вероятность 9
апостериорная 11
априорная 11
ложной тревоги 418
ошибки первого рода 323
—¦ второго рода 323
правильного обнаружения 418
пропуска сигнала 418
условная 10
Выборка:
классифицированная 618
независимая 311, 419
обучающая 618
упорядоченная 385
Выбросы случайного процесса 123
Гипотеза:
простая 322, 349, 353
сложная 340, 349
Д
Детектор:
квадратичный 237, 248, 293
линейный 232, 247
логарифмический 273
Детерминированный процесс 128
Дискретизация:
мгновенная 426
фильтровая 426
Дисперсия 24
— выборочная 383
— нижняя граница 388
Дифференцируемый случайный про-
процесс 115
Задача:
анализа 5, 319
классификации 619
обнаружения сигнала 417
— детерминированного 418
— квазидетерминированного 442
—¦ стохастического 462, 482
оценивания параметров 310
различения сигналов 559
синтеза 5, 310, 316
Закон больших чисел 72
и
Импульсная характеристика 171, 174
Интеграл:
Ито 151
Лапласа 33
Интервал:
доверительный 392
квантования 223, 546
корреляции 100
между выбросами случайного про-
процесса 125
Информационная матрица 394, 499
Информация по Фишеру 389, 498,
517
Квантиль 26
Квантование 222, 540
Коварнация 29
Контигуальность 501
Корреляционная функция 87, 96
белого шума ПО, 143
взаимная 88, 100, 246
временная 83
импульсного случайного процесса
165
'косинуса фазы 280
мгновенной частоты 288
на выходе системы линейной 187
— нелинейной 214, 227, 229
огибающей 269
производной случайного процесса
116
телеграфного сигнала 164
узкополосного случайного процесса
109
фазы 274
шумов квантования 224
Коррелометр 422, 438, 483
Коэффициент:
асимметрии 25
асимптотической относительной эф-
эффективности (КАОЭ) 320, 359, 471,
495, 521, 544
корреляции 29
эксцесса 26
Критерий качества:
асимптотически оптимальный 493
байесовский 317, 324
максимального правдоподобия 318,
352
максимума апостериорной вероят-
вероятности 318, 329
— плотности вероятности 318
минимаксный 317, 328, 347
минимума среднего квадрата ошиб-
ошибки 316
Неймана — Пирсона 319, 330, 346,
418
последовательный Вальда ЧЯЯ 44ft
— байесовский 336
Кумулянт 63, 65
М
Математическое ожидание (см сред-
среднее значение)
Медиана 26
Метод вычисления корреляционной
функции:
контурных интегралов 218, 239
производных 219, 245
прямой 215, 227
Метрическая транзитивность 94
Мода распределения 21
Моменты распределения:
начальные 24
смешанные 28
центральные 24
Н
Независимость 11
Непрерывность случайного процесса;
Неравенство:
Буняковского — Шварца 29
Рао —Крамера 388
Чебышева 25
Чернова 81
О
Обнаружение сигнала:
детерминированного 418
«вазидетерминированного 442'
стохастического 462, 482
Обучение:
без учителя 618
с учителем 618
Описание системы:
косвенное 180
прямое 180
Ортогональное разложение:
'корреляционной функции 98'
.плотности вероятности 37
случайного процесса 119
— комплексного 121
Ортогональные полиномы:
Лагерра 39
Чебышева 40
эрмита 38
Отношение правдоподобия 326, 342;
343, 354
Оценка:
амплитуды сигнала 589
байесовская 317, 399, 409, 415, 596
'вектора средних 412
достаточная 387, 404
интервальная 392, 408
максимального правдоподобия 318,
395, 406, 585
647
максимальной апостериорной плот-
плотности 318, 398
минимаксная 317
несмещенная 321
— асимптотически 321
параметра 310, 387, 584
— векторного 393
— случайного 398
плотности вероятности 386
смещенная 384
состоятельная 282
эффективная 391
П
Плотность вероятности 21, 85
многомерная 28
нормальная 39
условная 31
Помеха:
аддитивная 418
гауссовская 418, 518, 562
коррелированная 423
лапласовская 518
марковская 527
— многосвязная 499, 525
независимая 419, 497
Т-зависимая 489, 528
Последовательность:
независимых испытаний 13
случайных величин 69
Правило:
сложения 10
умножения 10
Преобразование:
Гильберта 256, 640
Фурье 101, 103
Проверка статистических гипотез 310
322, 337, 343, 353, 357, 377
Пространство:
выборочное 311
параметров 311
решений 312
Процентная точка распределения 26
— нормального 345
— хп-квадрат 409
¦—¦ — нецентрального 535
— Стьюдента 351
Рабочая характеристика алгоритма
421
Различение сигналов 559
Распределение вероятностей 18, 84
биномиальное 20
Коши 77, 81
Лапласа 43
логарифмически нормальное 81
многомерное 26
нормальное 32
одномерное 19
648
Пуассона 21
рэлеевское 42, 58
— обобщенное 58
Стьюдента 351, 408
хи-квадрат 80, 409
экспоненциальное 42
Реализация случайного процесса 83
Ряд:
Вольтерра 170, 610
Грамма—Шарлье 38, 75
Лагерра 39
Чебышева 40
Эджворта 75, 201
Сигма-алгебра 9, 95
Система:
линейная 171, 174, 181, 186, 199,
204
математическая модель 168
нелинейная 170, 213, 220, 292
с дискретным временем 168
с непрерывным временем 168
физическая реализуемость 169
характеристика «вход—выход» 169.
171, 174, 176
Случайный процесс 82
впнеровский 140, 151
гауссовский 132, 199, 226, 249, 251,
263, 303
дифференцируемый 115
импульсный 152
квазидетерминированный 129
комплексный 89
координаты 119
марковский 131, 143
— векторный 145
— диффузионный 148
—• многосвязный 145
— однородный 145
непрерывный 114
нестационарный 106
нормализация 204
огибающая 256, 262, 266
— комплексная 258
производная 115
пуассоновский 140
с дискретным временем 83
— спектром 111
с непрерывным временем 83
с независимыми значениями 130
с независимыми приращениями 131,
138
с сильным перемешиванием 95
стационарный 89
—• в широком смысле 91
узкополосный 108, 257
фаза 257, 262, 274
эргодический 91
— в широком смысле 93
События:
достоверные 9
независимые 11
несовместимые 9
противоположные 9
эквивалентные 9
Спектральная плотность мощности
101
белого шума ПО
'импульсного случайного прот-т-з
154
мгновенной частоты 289
\ выходе системы линейной 183,
—- нелинейной 217, 230
производной 117
процесса с дискретным спектром
111
узкополосного 108
шумов квантования 252
Среднее значение:
длительности выбросов 125
интервалов между выбросами 125
линейной комбинации случайных
величин 50
произведения случайных величин 49
случайного процесса 87
случайной величины 24
суммы случайных величин 50
функции от случайных величин 48
Средний риск 314
Статистика:
достаточная 326, 343, 561
—¦ асимптотическая 497
знаковая 361
знаково-ранговая 365
порядковая 362
ранговая 363
Сходимость последовательности слу-
чальных величин:
в среднеквадратическом 70
по вероятности 70
по распределению 69
Теорема:
Колмогорова 85
Котельникова 122
Ле Кама 502
Хинициа—Винера 102, 216
Колмогорова обратное 148
— прямое 148
Колмогорова—Чепмена 145, 147
Фоккера—Планка 149
Ф
Факторизация 144
Фильтр:
идеальный 196
нерекурсивный 173
оптимальный 599
рекурсивный 173
согласованный 440
формирующий 191
Фильтрация:
линейная 598
нелинейная 609
Формула:
Байеса 13
биномиальная 13
Муавра—Лапласа 15
полной вероятности 12
Функционал отношения правдоподо-
правдоподобия 378, 413
— гауссовского процесса 430
—¦ логарифм 378
Функция:
Бесселя 57
гамма 16
— неполная 16
гппергеометрпческая 59
дельта 22, 638
единичного скачка 20
моментная 86
потерь 313, 323
— квадратичная 400
— простая 400
— прямоугольная 402
— равная модулю ошибки 401
— симметричная 402
правдоподобия 311, 340, 342
характеристическая 61, 85
— многомерная 64
ц
Центральная предельная теорема 73
—* для случайного процесса 137
Цепь Маркова 16
Эмпирическая функция распределения
385
Уравнение:
Ито 151
Якобиан преобразования 52
Ядро квадратичной формы 97
ОГЛАВЛЕНИЕ
Предисловие к третьему изданию 3
Введение 4
Часть L АНАЛИЗ 7
Глава 1. Случайные события 7
1.1. Определение вероятности 7
1.2. Основные правила теории вероятностей 10
1.3. Последовательность независимых испытаний 13
1.4. Простая цепь Маркова 16
Глава 2. Случайные величины 18
2.1. Распределения вероятностей случайных величин 18
2.2. Числовые характеристики случайной величины 23
2.3. Совокупность случайных величин 26
2А. Нормальное распределение вероятностей 32
2.5. Ортогональное разложение плотности вероятности .... 37
2.6. Задачи 42
Глава 3. Функции случайных величин 43
3.1. Распределения вероятностей функций случайных аргументов . 43
3.2. Распределение вероятностей модуля и фазы случайного вектора 55
3.3. Характеристическая функция 61
3.4. Предельные распределения сумм случайных величин .... 69
3.5. Задачи 77
Глава 4. Случайные процессы 82
4.1. Вероятностные характеристики случайных процессов .... 82
4.2. Классификация случайных процессов по их вероятностным ха-
характеристикам 89
4.3. Энергетические характеристики случайных процессов .... 96
4.4. Классификация стационарных в широком смысле процессов по
их спектральной плотности мощности 108
4.5. Локальные свойства случайных процессов 112
4.6. Вероятностные характеристики выбросов случайного процесса . 123
Глава 5. Основные модели случайных процессов 128
5.1. Классификация основных моделей 128
5.2. Гауссовские случайные процессы 132
5.3. Случайные процессы с независимыми приращениями . . . 138
5.4. Марковские случайные процессы 143
5.5. Импульсные случайные процессы 152
5.6. Задачи 162
Глава 6. Основные математические модели систем 168
6.1. Классификация и характеристики математических моделей систем 168
6.2. Линейные системы с дискретным временем (цифровые фильтры) 171
6.3. Линейные системы с непрерывным временем 174
6.4. Типовое звено радиотехнических устройств 178
6.5. Два способа описания систем под воздействием случайных
процессов 180
650 ,
Глава 7. Преобразования случайных процессов в линейных динамических
(инерционных) системах 131
7.1. Преобразования случайных последовательностей в линейных сис-
системах с дискретным временем 131
7.2. Преобразования случайных процессов в линейных системах с не-
непрерывным временем 136
7.3. Распределение вероятностей случайного процесса на выходе ли-
линейной системы 199
7.4. Преобразования случайных процессов в линейных системах со
случайными параметрами 204
7.5. Задачи 211
Глава 8. Преобразования случайных процессов в нелинейных статических
(безынерционных) системах 213
8.1. Энергетические характеристики процесса на выходе нелинейной
системы 213
8.2. Распределение вероятностей процесса на выходе статической
нелинейной системы 220
8.3. Квантование случайного процесса 222
8.4. Задачи 225
Глава 9. Преобразования гауссовских процессов в статических (безынер-
(безынерционных) нелинейных системах 226
9.1. Анализ энергетических характеристик прямым методом . . . 226
9.2. Анализ энергетических характеристик методом контурных инте-
интегралов 239
9.3. Анализ энергетических характеристик методом производных . . 245
9.4. Распределение вероятностей гауссовского процесса после его не-
нелинейного преобразования 249
9.5. Квантование гауссовского процесса 251
9.6. Задачи 253
Глава 10. Огибающая и фаза узкополосного случайного процесса . . 256
10.1. Вероятностные характеристики огибающей и фазы .... 256
10.2. Вероятностные характеристики огибающей гауссовскдго процесса 265
10.3. Нелинейные преобразования огибающей гауссовского процесса 271
10.4. Вероятностные характеристики фазы гауссовского процесса . . 274
10.5. Вероятностные характеристики косинуса фазы гауссовского про-
процесса . 280
10.6. Вероятностные характеристики производных от огибающей и фа-
фазы гауссовского процесса 283
10.7. Задачи 290
Глава 11. Преобразования гауссовского процесса в нелинейных инерцион-
инерционных системах 292
11.1. Постановка задач 292
11.2. Усилитель — квадратичный детектор — фильтр 293
11.3. Перемножитель-фильтр 301
11.4. Средняя мощность при конечном времени усреднения . . . 303
11.5. Задачи 306
Часть вторая. СИНТЕЗ 309
Глава 12. Формулировка задач статистического синтеза 309
12.1. Общие понятия математической статистики 309
12.2. Априорные данные 310
12.3. Критерии качества 314
12.4. Статистический синтез оптимальных алгоритмов 316
12.5. Вероятностный анализ алгоритмов принятия решения . . . 319
| 651
Глава 13. Проверка статистических гипотез 322
13.1. Одношаговые алгоритмы проверки простой гипотезы против прос-
простой альтернативы 322
13.2. Последовательные многошаговые алгоритмы проверки простой
гипотезы против простой альтернативы 332
13.3. Многоальтернативная задача проверки гипотез 337
13.4. Проверка гипотез в условиях параметрической априорной неопре-
неопределенности 340
13.5. Проверка гипотез о среднем значении гауссовской случайной ве-
величины 343
13.6. Проверка прбстой гипотезы о векторе средних многомерного нор-
нормального распределения против простой альтернативы . . . 353
13.7. Проверка гипотез в условиях непараметрической априорной не-
неопределенности 357
13.8. Статистики, используемые в непараметрических алгоритмах про-
проверки гипотез 361
13.9. Аналоговые алгоритмы проверки гипотез 377
13.10. Задачи 379
Глава 14. Оценивание неизвестных характеристик 381
14.1. Оценивание в условиях непараметрической априорной неопреде-
неопределенности 381
14.2. Оценивание в условиях параметрической априорной неопреде-
неопределенности 387
14.3. Оценки максимального правдоподобия 395
14.4. Оценивание случайного параметра 398
14.5. Оценивание параметров нормального распределения .... 404
14.6. Аналоговые алгоритмы оценивания параметров 413
14.7. Задачи 415
Глава 15. Обнаружение сигналов на фоне аддитивных гауссовских помех 417
15.1. Оптимальные дискретно-аналоговые алгоритмы обнаружения де-
детерминированных сигналов 417
15.2. Функционал отношения правдоподобия гауссовского процесса 430
15.3. Оптимальные аналоговые алгоритмы обнаружения детерминиро-
детерминированных сигналов 436
15.4. Оптимальные алгоритмы обнаружения квазидетерминированных
сигналов 442
15.5. Последетекторные оптимальные алгоритмы обнаружения сигна-
сигналов 453
15.6. Оптимальные алгоритмы обнаружения гауссовского сигнала на
фоне аддитивной гауссовской помехи 462
15.7. Задачи 467
Глава 16. Непараметрические алгоритмы обнаружения сигналов на фоне
помех 470
16.1. Непараметрические алгоритмы обнаружения детерминированных
сигналов на фоне аддитивных помех 470
16.2. Непараметрические алгоритмы обнаружения стохастических сиг-
сигналов на фоне аддитивных помех 482
16.3. Непараметрические алгоритмы обнаружения сигналов на фоне
помех по независимым группам коррелированных выборок . . 48J
,652
Глава 17. Синтез асимптотически оптимальных алгоритмов обнаружения
сигналов (математические основы) 4*92
17.1. Асимптотическая оптимальность 492
17.2. Вероятностные модели наблюдений 497
17.3. Контигуальность 501
17.4. Асимптотическое разложение логарифма отношения правдоподо-
правдоподобия 503
17.5. Предельные распределения относительно смещенных гипотез . 509
Глава 18. Асимптотически оптимальные дискретно-аналоговые алгоритмы
обнаружения сигналов на фоне аддитивных помех 516
18.1. Асимптотически оптимальный алгоритм обнаружения детерми-
детерминированного сигнала на фоне независимой помехи 516
18.2. Устойчивость асимптотически оптимального алгоритма обнару-
обнаружения детерминированного сигнала 522
18.3. Асимптотически оптимальный алгоритм обнаружения детерми-
детерминированного сигнала на фоне коррелированной помехи . . . 525
18.4. Асимптотически оптимальный алгоритм обнаружения квазидетер-
минированного сигнала на фоне независимой помехи . . . 530
18.5. Асимптотически оптимальный алгоритм обнаружения квазидетер-
минированного сигнала на фоне коррелированной помехи . . 536
Глава 19. Асимптотически оптимальные цифровые алгоритмы обнаружения
сигналов на фоне аддитивных помех 540
19.1. Асимптотически оптимальный цифровой алгоритм обнаружения
детерминированного сигнала на фоне независимой помехи . . 540
19.2. Асимптотические свойства ранговых статистик 548
19.3. Асимптотически оптимальные ранговые алгоритмы обнаружения
детерминированного сигнала на фоне независимой помехи . . 552
19.4. Устойчивость асимптотически оптимальных ранговых алгоритмов
обнаружения детерминированных сигналов 555
Глава 20. Различение сигналов на фоне помех 559
20.1. Оптимальные алгоритмы различения сигналов 559
20.2. Различение детерминированных сигналов на фоне аддитивной
гауссовской помехи 562
20.3. Различение квазидетерминированных узкополосных сигналов на
фоне аддитивной гауссовской помехи 571
20.4. Асимптотически оптимальные алгоритмы различения сигналов 580
Глава 21, Оценивание параметров и фильтрация сигналов на фоне помех 584
21.1. Оптимальные алгоритмы оценивания параметров детерминиро-
детерминированного сигнала на фоне аддитивной гауссовской помехи . . 584
21.2. Байесовские алгоритмы оценивания случайной амплитуды квази-
детерминированного сигнала на фоне аддитивной гауссовской
помехи 594
21.3. Оптимальная линейная фильтрация 598
21.4. Нелинейная фильтрация 609
21.5. Задачи 617
Глава 22. Адаптивные алгоритмы 618
22.1. Определение и критерий качества адаптивного алгоритма . . 618
22.2. Адаптивные алгоритмы классификации нормальных совокупно-
совокупностей 619
653
22.3. Адаптивные алгоритмы классификации в условиях параметричес-
параметрической априорной неопределенности 625
22.4. Адаптивные алгоритмы классификации в условиях непараметри-
непараметрической априорной неопределенности 632
22.5. Адаптивные асимптотически оптимальные алгоритмы обнаруже-
обнаружения сигналов на фоне помех 634
Приложение 1. Дельта-функция 633
Приложение 2. Преобразование Гильберта и аналитический сигнал . . 641
Список литературы 643
Предметный указатель 646
Научное издание
Левин Борис Рувимович
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ СТАТИСТИЧЕСКОЙ РАДИОТЕХНИКИ
Заведующий редакцией В. Н. Вяльцев
Редактор Э. М. Горелик
Художественный редактор А. С. Широков
Переплет художника В. Е. Карпова
Технический редактор 3. Н. Ратникова
Корректор Т. В. Дземидович
И Б № 1028
Сдано в набор 29.06.1988 Подписано в печать 11.07.1989 Т-23758
Формат 60x90Vi6 Бумага типогр. № 2 Гарнитура литературная
Печать высокая Усл. печ. л. 41,0 Усл. кр.-отт 41,0 Уч.-изд. л. 42,82
Тираж 11! 000 экз. Изд. № 21118 Зак. № 87 Цена 4 р.
Издательство «Радио и связь». 101000 Москва, Почтамт, а/я 693
Типография издательства «Радио и связь». 101000 Москва, ул. Кирова, д. 40