Текст
                    Г ВАН ТРИС
Теория обнаружения,
оценок
и модуляции
ТОМ ПЕРВЫЙ
ТЕОРИЯ ОБНАРУЖЕНИЯ, ОЦЕНОК
И ЛИНЕЙНОЙ МОДУЛЯЦИИ
Перевод с английского под редакцией
проф. В. И. ТИХОНОВА
МОСКВА „СОВЕТСКОЕ РАДИО" 1972


УДК 621.396:621.38 ВАН ТРИС. Г. ТЕОРИЯ ОБНАРУЖЕНИЯ, ОЦЕНОК И МОДУЛЯЦИИ. Том I. Теория обнаружения, оценок и линейной модуляции. Нью-Йорк, 1968. Пер, с англ., под ред. проф. В. И. Тихонова. М., «Советское радио», 1972, 744 с. Первый том четырехтомной монографии Ван Триса представляет собой серьезное учебное пособие по синтезу систем, предназначенных для оптимального радиоприема случайных сигналов при наличии помех. Книга содержит обстоятельное, методически хорошо отработанное изложение теории обнаружения и различения сигналов и оптимальной фильтрации сообщений. Применение теоретических положений проиллюстрировано на разнообразных практически важных примерах из области связи, радио- и гидролокации, а также других систем передачи информации. Указан ряд нерешенных перспективных проблем и сформулировано много новых интересных задач, часть из которых снабжена решениями. Многие примеры доведены до количественных результатов, представленных в виде многочисленных графиков. Книга представляет большой интерес для широкого круга научных работников, аспирантов и инженеров, соприкасающихся в своей деятельности с научно-прикладными статистическими задачами. Табл. 3, рис. 317, библ. 292 назв. Г. ВАН ТРИС ТЕОРИЯ ОБНАРУЖЕНИЯ, ОЦЕНОК И МОДУЛЯЦИИ ТОМ I Теория обнаружения, оценок и линейной модуляции Редактор К. И. Кучумова Художественный редактор 3. Е. Вендрова Художник Л. Г. Ларский Технический редактор А. А. Белоус Корректоры Е. П. Озерецкая, О. П. Трушкова Сдано в набор 7/1 — 72 г. Подписано в печать 6/Х—72 г. Формат 60x90/16 Бумага типографская № 2 Объем 46,5 усл. п. л. 50,546 уч.-изд. л. Тираж 9 500 экз. Зак. 693. Цена 3 р. 65 к. Издательство «Советское радио», Москва, Главпочтамт, п/я 693 Московская типография № 4 Главполиграфпрома Государственного комитета Совета Министров СССР по делам издательств, полиграфии и книжной торговли Б. Переяславская, 46 2-72
ОГЛАВЛЕНИЕ Предисловие к русскому переводу ·, 8 Предисловие к английскому изданию 10 Литература 13 Глава 1. ВВЕДЕНИЕ 14 1.1. Тематический план монографии 14 1.2. Возможные методы решения . . . . 24 1.3. Построение монографии 28 Глава 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ОБНАРУЖЕНИЯ И ОЦЕНОК 32 2.1. Введение 32 2.2. Проверка двух простых гипотез 35 2.2.1. Критерии принятия решения 36 2.2.2. Качество критерия обнаружения: рабочая характеристика приемника 49 2.3. Случай Μ гипотез 57 2.4. Теория оценок 62 2.4.1. Случайные параметры. Байесовская оценка .... 63 2.4.2. Оценка действительных (неслучайных) параметров 74 2.4.3. Оценка нескольких параметров 85 2.4.4. Краткие выводы по теории оценок 96 2.5. Сложные гипотезы .... - % . 96 2.6. Общая гауссова задача .* . 104 2.6.1. Равные ковариационные матрицы 107 2.6.2. Равные вектор-средние 115 2.6.3. Краткие итоги 123 2.7. Границы качества и приближенные выражения 124 2.8. Краткие итоги главы 2 138 2.9. Задачи 139 Литера ту ρ а 201 Глава 3. ПРЕДСТАВЛЕНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ 203 3.1. Введение · 203 3.2. Детерминированные функции: ортогональные представления 206 3.3. Задание случайных процессов 210 3.3.1. Обычные способы задания случайных процессов . . 210 3.3.2. Представление выборочных функций случайных процессов рядами «. ... 214 3.3.3. Гауссовы процессы 219 3.4. Однородные интегральные уравнения и собственные функции 223 3.4.1. Рациональные спектры 224 3.4.2. Спектры с ограниченной полосой 228 3.4.3. Нестационарные процессы 231 3.4.4. Процессы типа белого шума 233 3.4.5. Оптимальный линейный фильтр 235 3.4.6. Свойства собственных функций и собственных значений 241
3.5. Периодические процессы 246 3.6. Бесконечный интервал времени. Спектральное представление 249 3.6.1. Спектральное разложение 249 3.6.2. Применение спектрального разложения. Оценка параметров нормального процесса по максимуму апостериорной вероятности 255 3.7. Векторные случайные процессы 257 3.8. Краткие итоги 262 3.9. Задачи 263 Литература 284 Г л а в а 4. ОБНАРУЖЕНИЕ СИГНАЛОВ. ОЦЕНКА ПАРАМЕТРОВ СИГНАЛОВ ... 286 4.1. Введение 286 4.1.1. Модели 286 Организация материала главы 292 4.2. Обнаружение и оценка на фоне белого гауссова шума . . 293 4.2.1. Обнаружение сигналов в аддитивном белом гауссовом шуме : . _ 29S 4.2.2. Линейная оценка . . Г 314 4.2.3. Нелинейные оценки 317 4.2.4. Сводка основных результатов 328 4.3. Обнаружение и оценка на фоне небелого гауссова шума . . 329 4.3.1. Метод «выбеливания» 332 4.3.2. Непосредственный вывод на основе разложения Ка- рунена — Лоэва 340 4.3.3. Непосредственный вывод на основе достаточной статистики 342 4.3.4. Достоверность обнаружения 344 4.3.5. Отыскание оценок 350 4.3.6. Методы решения интегральных уравнений 353 4.3.7. Устойчивость результатов к отклонениям от принятой модели 370 4.3.8. Линейные каналы с известными параметрами .... 376 4.4. Сигналы с нежелательными параметрами: испытание сложных гипотез 378 4.4.1. Случайные фазовые углы 380 4.4.2. Случайные амплитуда и фаза * 393 4.5. Многоканальные системы 404 4.5.1. Формулировка задачи 405 4.5.2. Прикладные вопросы 407 4.6. Оценка нескольких параметров 409 4.6.1. Канал с аддитивным белым гауссовым шумом . . . 409 4.6.2. Обобщения результатов 413 4.7. Краткие итоги главы 4 и нерассмотренные вопросы .... 413 4.7.1. Краткие итоги главы 413 4.7.2. Нерассмотренные вопросы 416 4.8. Задачи 417 Литература 490 Г л а в а 5. ОЦЕНКА НЕПРЕРЫВНЫХ СИГНАЛОВ 495 5.1. Введение 495 5.2. Вывод уравнений оценки 498 5.2.1. Безынерционные системы модуляции 498 5.2.2. Системы модуляции с памятью 505 5.3. Нижняя граница среднеквадратической ошибки оценки . . 510 5.4. Оценка многомерных сигналов 519 5.4.1. Примеры многомерных задач 520 5.4.2. Формулировка задачи 523 5.4.3. Вывод уравнений оценки '. 524 5.4.4. Нижняя граница матрицы ошибок 527 6
5.4.5. Оценивание при наличии коррелированного (небелого) шума 528 5.5. Оценивание неслучайных сигналов 529 5.6. Краткие итоги 533 5.7. Задачи 534 Литература 541 Глава 6. ЛИНЕЙНЫЕ ОЦЕНКИ 542 6.1. Свойства оптимальных устройств обработки 543 6.2. Реализуемые линейные фильтры. Стационарные процессы с бесконечным прошлым. Винеровские фильтры 556 6.2.1. Решение уравнения Винера—Хопфа 557 6.2.2: Ошибки в оптимальных системах 568 6.2.3. Нереализуемые фильтры 571 6.2.4. Выражения для ошибки в замкнутой форме .... 574 6.2.5. Оптимальные системы с обратной связью 583 6.2.6. Примечания 585 6.3. Фильтры Кальмана — Бьюси 589 6.3.1. Представление линейных систем посредством дифференциальных уравнений и генерация случайных процессов 591 6.3.2. Вывод уравнений оценки 612 6.3.3. Приложение 620 6.3.4. Обобщения 637 6.4. Линейная модуляция в системах связи 647 6.4.1. ДБП — AM. Реализуемая демодуляция 647 6.4.2. ДБП — AM. Демодуляция с задержкой 650 6.4.3. Амплитудная модуляция. Обобщенное понятие несущей 651 6.4.4. Однополосная амплитудная модуляция с подавленной несущей 652 6.5. Фундаментальная роль оптимального линейного фильтра 655 6.6. Некоторые замечания 656 6.7. Задачи 657 Литература..' 713 Условные обозначения, сокращения, символы . . . . 716 Приложение. Некоторые нерассмотренные вопросы 728 Литература 730 Предметный указатель 734 Именной указатель 741
Предисловие к русскому переводу Одно из основных направлений развития радиотехники в течение последних 25 лет связано с широким применением методов математической статистики. Несмотря на то, что многие из этих методов были хорошо известны, научно-прикладные работы в этом направлении сыграли весьма прогрессивную роль, так как они вооружили конструкторов некоторыми общими руководящими принципами, позволили оценить предельные возможности решения конкретных задач при определенных условиях и существенно расширили радиотехническую проблематику. На возможности продуктивного использования статистических методов в радиотехнике, по-видимому, впервые непосредственно указали работы А. Н. Колмогорова (1941 г.) и Н. Винера (1942 г.) по синтезу оптимальных линейных фильтров. Первая фундаментальная работа, посвященная систематическому применению методов математической статистики для решения задач радиосвязи, принадлежит В. А. Котельникову (1946 г.). В ней был получен ряд практически важных результатов принципиального характера. К настоящему времени из широкого круга радиотехнических задач, решаемых методами математической статистики, можно выделить несколько направлений. Одно из них среди радиоспециалистов получило название «методы оптимального радиоприема». В этих задачах рассматриваются методы оптимального обнаружения и различения сигналов на фоне помех, методы оценки неизвестных параметров сигнала и разрешения нескольких сигналов, а также оптимальная фильтрация сообщений, содержащихся в принимаемых сигналах. Обстоятельному и методически хорошо отработанному изложению этого круга задач и посвящена четырехтомная монография известного американского ученого Г. Ван Триса. (К настоящему времени изданы только первые два тома.) По замыслу автора монография написана как серьезное учебное пособие по синтезу различных систем передачи информации, предназначенное для аспирантов и квалифицированных радиоинженеров. В данном первом томе, содержащем в оригинале 7 глав, подробно рассмотрены задачи обнаружения, различения и оценки параметров сигналов (гл. 2 и 4), а также задачи линейной фильтрации сообщений (гл. 5 и 6). Остальные три главы являются вспомогательными. Основным содержанием второго тома является обстоятельное рассмотрение теоретических и прикладных вопросов формирования и опти-
мального приема сигналов с нелинейными видами модуляции (частотной и фазовой). Предполагается, что в третьем томе будет изложена теория оптимального приема гауссовых сигналов в гауссовых шумах, а также будут подробно рассмотрены основные проблемы радио- и гидролокации. В четвертом томе планируется рассмотреть вопросы обработки пространственно-временных сигналов при помощи антенных решеток применительно к гидролокационным и сейсмическим системам. В основных главах первого тома, помимо необходимых теоретических сведений, содержится подробное рассмотрение большого числа разнообразных практически важных примеров возрастающей степени сложности из области радиосвязи, радио- и гидролокации, а также других систем передачи информации. Полученные решения подвергнуты всестороннему физическому обсуждению и во многих случаях доведены до количественных результатов, представленных в виде многочисленных графиков. В конце каждой главы приведены краткие выводы (в которых часто указываются нерешенные перспективные проблемы) и сформулировано большое число различных по сложности задач, предназначенных для самостоятельного решения. При переводе первого тома были внесены некоторые изменения. Поскольку предполагается русское издание второго тома, из небольшой по объему гл. 7 были исключены § 7.1, 7.2, где подведены итоги первого тома и дан проспект второго тома; сохранен, но вынесен в приложение § 7.3, содержащий библиографический обзор по важным теоретическим вопросам, которые лишь упомянуты в первом томе и не получают дальнейшего освещения во втором. Исключено также приложение, содержащее принятую автором программу лекционного курса. Наряду с этими сокращениями, дополнительно включены решения по некоторым наиболее сложным задачам. Эти решения заимствованы из методического пособия Г. Ван Триса и Д. Гольдфрейна, изданного литографским способом в виде отдельной небольшой книги (Solution Manual for Selected Problems, John Wiley, 1968). Следует отметить, что настоящая книга не претендует на исчерпывающую полноту освещения всех проблем по оптимальным методам радиоприема. В частности, в ней не отражен большой цикл отечественных работ по оптимальной нелинейной фильтрации сообщений. Однако обстоятельное изложение теоретических сведений и широкое обращение автора к рассмотрению разнообразных конкретных практических задач делают эту книгу весьма ценным дополнением к ряду книг и монографий, изданных в Советском Союзе по оптимальным методам радиоприема. Можно надеяться, что книга представит большой интерес для широкого круга научных работников, аспирантов и инженеров, соприкасающихся в своей деятельности с научно-прикладными статистическими задачами. Перевод книги выполнен В. В. Липьяйненом. Июнь 1972 г. В. ТИХОНОВ
Предисловие к английскому изданию Разделы теории обнаружения и оценок, которые мы будем изучать в данной книге, представляют сочетание классического метода статистического анализа и вероятностного подхода к работе систем связи, радиолокации, гидролокации и других современных систем обработки информации, основанного на рассмотрении сигналов как случайных процессов. Двумя основными разделами статистического анализа являются теория решений и теория оценок. В первом случае мы наблюдаем некоторую выходную величину, имеющую случайный характер, и решаем, какая из двух возможных причин ее обусловила. Задачи этого типа изучались в середине XVIII века Томасом Байесом [1]. В теории оценок выходная величина связана со значением некоторого наблюдаемого нами параметра, и мы пытаемся оценить величину этого параметра. Работы в указанной области были опубликованы Лежандром [2] и Гауссом [3] в начале XIX века. Значительный вклад в классическую теорию, которую мы используем в качестве исходной, был внесен Фишером [4], а также Нейманом и Пирсоном [5] более 30 лет назад. В 1941 г. Колмогоров [6] и в 1942 г. Винер [7] применили статистический метод к решению задачи оптимальной линейной фильтрации. С той поры применение статистических методов к решению задач синтеза и анализа систем всех типов развивалось весьма быстро. Применение указанных методов и вытекающие отсюда выводы являются предметом настоящей книги. Данный и последующий том («Теория обнаружения, оценок и нелинейной модуляции») основаны на заметках и конспектах, подготовленных для одноименного курса, читаемого в Массачусетсом технологическом институте (МТИ) аспирантам старшей группы. Первоначальный интерес к данной теме появился у меня в результате моей исследовательской деятельности в области теории аналоговой модуляции. Предварительный вариант материала, посвященного теории модуляции, использовался в качестве учебного пособия для летнего курса, прочитанного в МТИ в 1964 г. Оказалось, что наша точка зрения на теорию модуляции лучше воспринимается аудиторией, имеющей ясное понимание современной теории обнаружения и оценок. В тот период не имелось подходящего учебного пособия, которое охватывало бы весь интересующий материал и выделяло бы те моменты, которые казались мне наиболее существенными. Поэтому я приступил к написанию конспекта. Было совершенно ясно, что для того, чтобы приподне- сти этот материал аспирантам за ограниченное время, необходимо 10
выработать единый подход ко всем трем названным разделам — теории обнаружения, теории оценок и теории модуляции — и развить основные связывающие их идеи. По мере работы над книгой ее объем увеличивался, пока материал, который первоначально мыслился в качестве исходного для изложения теории модуляции, не занял все содержание первого тома. К изложению оригинального материала по теории модуляции мы приступаем лишь в начале второго тома. В совокупности оба тома дают единое изложение всех трех разделов и их применение к решению многих важных физических задач. В течение последних трех лет в своем курсе я последовательно использовал пересмотренные варианты текста. Аудитория обычно состоит из 40—50 аспирантов, закончивших аспирантский курс по теории случайных процессов, охватывающий большую часть книги Да- венпорта и Рута [8]. Как правило, они имеют хорошее понимание теории случайных процессов и достаточные навыки, необходимые для самостоятельного решения задач. Кроме того, многие из них сами непосредственно заинтересованы в проведении исследовательской (диссертационной) работы в этой общей или тесно с ней связанных областях. Эта заинтересованность создает сильный стимул, который я и использую, трубуя, чтобы аспиранты разрабатывали в порядке решения задач многие важные идеи. Именно для этой аудитории рассчитана в первую очередь данная книга. В приложении дается развернутая программа всего учебного курса. С другой стороны, многие уже работающие инженеры имеют дело с системами, которые проектировались или должны были проектироваться и анализироваться при помощи методов, развитых в· данной книге. Я попытался сделать книгу полезной и для них. Один из первых вариантов книги успешно использовался в качестве учебного пособия в системе теоретической подготовки дипломированных инженеров на предприятиях. С точки зрения специальной предварительной теоретической подготовки для работы с данной книгой необходим лишь весьма ограниченный материал, выходящий за рамки обычного курса. Предполагается, что слушатели знакомы с элементарной теорией вероятностей и вторыми моментами случайных процессов. Было бы полезным, хотя и совершенно не обязательным, некоторое знакомство с теорией матриц и линейной алгеброй. Уровень математической строгости книги невысок, хотя в большинстве разделов полученные результаты могут быть доказаны и строго, если мы будем просто более скрупулезны в наших выкладках. Мы намеренно приняли такой подход с тем, чтобы обилием деталей не обременять существенные идеи и сделать материал удобочитаемым для той инженерной аудитории, которая найдет его полезным. К счастью, почти во всех случаях мы можем удостовериться, что наши выводы являются интуитивно логичными. Следует заметить, что эта способность проверять выводы интуитивно была бы необходима, даже если бы выкладки были весьма строгими, поскольку наша конечная цель — получить ответ, который соответствует некоторой рассматриваемой физической системе. Не представляет труда найти физические задачи, в которых правдоподобная математическая модель и корректные 11
математические методы приводят к нереалистичному решению исходной задачи. Наш курс имеет ряд особенностей, которые, пожалуй, стоит упомянуть. Как правило, мы рассматриваем ту или иную задачу достаточно подробно. Зачастую она рассматривается нами под несколькими различными углами зрения с тем, чтобы достигнуть лучшего понимания смысла полученного результата. Обучение студентов ряду методов и приемов помогает им быть более гибкими в подходе к новым задачам. Вторая особенность заключается в том, что для полного понимания материала читателю совершенно необходимо самостоятельно решать задачи. При изложении курса и материала книги мы делаем упор на развитие способности ставить и разрешать задачи. В конце каждой главы приводятся задачи, по своей сложности и значимости варьирующиеся от довольно тривиальных до таких, которые существенно развивают материал основного текста. Во многих случаях подобные задачи равноценны издаваемым в наше время журнальным статьям. Только путем отработки достаточного их количества становится возможным оценить значение и общность полученных результатов. Решения к отдельным задачам представляются по просьбе, а в распоряжении преподавателей, ведущих данный курс, имеется разработка, содержащая решения примерно третьей части приведенных в книге задач. Мы постоянно занимаемся разработкой новых задач по ходу учебного процесса и будем высылать их всем, кто использует нашу книгу в качестве учебного пособия. Третьей особенностью книги является большое количество блок- схем, графиков и других иллюстраций. Графики включены нами потому, что большинству инженеров (включая и автора) они более привычны, чем соответствующие уравнения. Одной из всегда встречающихся трудностей является количество символов, необходимых для обозначения широкого класса понятий и величин. Мы стремились выбирать обозначения логически обоснованно и с таким расчетом, чтобы они по возможности были мнемоническими.' Все обозначения сведены в единый список, помещенный в конце книги. Мы стремились также дать возможно более полную библиографию и отдать должное вкладу других исследователей. В своей работе над книгой я пользовался многосторонней помощью ряда специалистов и считаю своим приятным долгом выразить здесь им свою признательность. Профессора Давенпорт и Зиберт оказывали мне постоянную поддержку и приняли участие в обсуждении различных глав. Профессора Говерстен и Снайдер — преподаватели МТИ, а также Коллинз, Баггерер и Остин — мои докторанты, внимательно прочли и критически обсудили различные главы книги. Их замечания и предложения заметно способствовали улучшению рукописи. Баг- гереру и Коллинзу, кроме того, принадлежит ряд задач в различных главах, и Баггерер разработал программы вычислений, необходимых для получения большинства графических результатов. Лейтенант Райт прочел и сделал замечания по второй главе. Фраско и Гольдфейн, два моих ассистента по кафедре, проработали все задачи, приведенные 12
в книге. Д-р Юдкин из Лаборатории Линкольна прочел всю рукопись и внес ряд важных критических замечаний. Помимо этого разные аспиранты, слушавшие данный курс, внесли предложения, учтенные мной в окончательной редакции рукописи, большую часть которой перепечатала г-жа Силз. Ее терпеливому отношению к бесчисленным изменениям и поправкам я искренне признателен. Несколько других секретарей, в том числе г-жи Хрбек, Бауэр и Торторичи, отпечатали разделы различных вариантов рукописи. Как указывалось выше, предлагаемые вниманию читателей книги явились результатом моих исследовательских интересов. Эти исследования представляют собой непрерывный процесс, и я буду счастлив обмениваться результатами нашей текущей работы со специалистами, работающими в данной области, на регулярной и взаимной основе. Мои ранние работы в области теории модуляции финансировались лабораторией Линкольна, где я сотрудничал в летние периоды и являлся консультантом в группах, руководимых Шерманом и Рейффеном. Мои исследования в МТИ частично финансировались Вооруженными силами и НАСА через Исследовательскую лабораторию электроники. Этой поддержке я весьма признателен. Кембридж, шт. Массачусетс, ГАРРИ Л. ВАН ТРИС октябрь 1967 г. Литература 1. В ayes Thomas. An Essay Towards Solving a Problem in the Doctrine of Chances. Phil. Trans., 1764, v. 53, p. 370—418. 2. L e g e η d r e A. M. Nouvelles Methodes pour La Determination ces Orbites des Cometes. Paris, 1806. 3. G a u s s K. F. Theory of Motion of the Heavenly Bodies Moving About the Sun in Conic Sections. Reprinted by Dover, New York, 1963. 4. F i s h e r R. A. Theory of Statistical Estimation. Proc. Cambridge Philos. Soc, 1925, v. 22, p. 700. 5. Neyman J., Pearson E. S. On the Problem of the Most- Efficient Tests of Statistical Hypotheses. Phil. Trans. Roy. Soc. London, 1933, v. A231, p. 289. "6. Колмогоров А. Н. Интерполирование и экстраполирование стационарных случайных последовательностей. «Известия АН СССР», сер. математическая, 1941, т. 5, № 1. 7. Wiener N. Extrapolation, Interpolation, and Smoothing of Stationary Time Series. Tech. Press of MIT and Wiley, New York, 1949 (первоначально опубликован в виде секретного отчета в 1942). 8. Давенпорт В. Б., Рут В. Л. Введение в теорию случайных сигналов и шумов. Пер. с англ., под ред. Р. Л. Добрушина. Изд-во иностранной литературы, 1960.
1. Введение В предлагаемой двухтомной монографии мы будем изучать три раздела статистической теории, именуемые соответственно теорией обнаружения, теорией оценок и теорией модуляции. Цель -данного курса — изложить указанные разделы на общей математической основе и показать, как полученными результатами можно пользоваться при решении широкого круга практических задач. В этой главе мы дадим краткий обзор содержания курса в тематическом, методологическом и хронологическом аспектах. При изложении тематического плана делается попытка дать качественную характеристику каждого из названных разделов путем рассмотрения некоторых типичных задач. Излагая методологический план курса, мы рассматриваем различные подходы к решению тех или иных задач. И, наконец, характеризуя курс в хронологическом плане, мы объясняем порядок расположения материала обоих томов. 1.1. Тематический план монографии Наиболее легкий путь для объяснения того, что понимается под теорией обнаружения, — это рассмотреть несколько физических ситуаций, которые приводят к задачам теории обнаружения. На рис. 1.1 изображена простейшая цифровая (дискретная) система связи. Источник сообщений каждые Τ секунд выдает двоичную цифру. Наша цель — передать эту последовательность цифр в какой- либо другой пункт. Каким каналом мы будем располагать для передачи этой последовательности, зависит от конкретных условий. Как правило, это может быть проводной, радио- или акустический канал. В качестве примера рассмотрим радиоканал. Чтобы передать информацию, нужно привести ее к виду, пригодному для распространения по заданному каналу. Наиболее простой и непосредственный метод решения этой задачи — построение устройства, генерирующего в течение Τ секунд синусоидальное колебание sx (t) = sin ωχ t, (1) если на предыдущем интервале времени источник выдал «единицу», или синусоидальное колебание другой частоты s0-(i) = sin<D0i, (2) если на предыдущем интервале времени источник выдал «нуль». Частоты ω4 и ω0 выбираются так, чтобы сигналы Si (/) и s0 (t) хорошо 14
йроходйли по данному конкрегному радиоканалу. Выходные сигналы устройства поступают в антенну и далее передаются по каналу. Типичные последовательности символов на выходе источника и элементов передаваемого сигнала показаны на рис. 1.2. В случае канала простейшего типа последовательность сигналов поступает на приемную антенну ослабленной, но по существу неискаженной. Источник Цифровая последовательность Передатчик Последо8атель-\ ность сигнала Канал гМ Рис. 1.1. Цифровая система связи. Для обработки принимаемого сигнала он пропускается через антенну и несколько каскадов усиления на принимаемой частоте, где к последовательности сообщения добавляется тепловой шум η (t). Таким образом, на любом интервале времени длительностью Τ секунд имеется колебание если был передан сигнал Si (ί), и r(t)=s0(t)+n(t)t 0<ί<7\ (3) (4) если был передан сигнал s 0 (t). Итак, мы подошли к ситуации, когда нам необходимо решить, какой из двух возможных сигналов был передан. Устройство, которое осуществляет эту процедуру, называется решающим устройством (схе- sin(oft $inu)0t sin^t $tna>;t Τ τ τ Выход источника Τ Τ Τ Τ Передаваемая последовательность Рис. 1.2. Типичные последовательности элементарных сигналов. мой). Оно наблюдает колебание r(t) и согласно некоторой системе правил пытается угадать, что было передано: Si (t) или s0 (t). Это эквивалентно процессу определения того, что было на выходе источника в течение соответствующего интервала времени. Построение и определение характеристик такого устройства мы относим к числу проблем теории обнаружения. В приведенном случае единственным источником ошибок при вынесении решения является аддитивный шум. Если бы он отсутствовал, то входной сигнал был бы полностью известным и мы 15
могли бы принимать решения безошибочно. Задача такого типа соответствует случаю известного сигнала на фоне шума и является простейшей среди интересующих нас проблем теории обнаружения. Примером более сложной задачи обнаружения может служить случай, изображенный на рис. 1.3. Генераторы, которые в предыдущем примере использовались для создания sA (/) и s0 (t)t имеют дрейф фазы. Рис. 1.3. Последовательность с фазовыми сдвигами. Поэтому на заданном Г-секундном интервале времени принимаемый сигнал, соответствующий «единице», можно записать в виде г (t) =sin((o1t + e1) + n(t)i О < t < Г, (5) а соответствующий «нулю» — в виде г (t) = sin (ω01 + θ0) + η (t), 0 < t < 7\ (6) где 9i и θ ο — неизвестные постоянные фазовые углы. Здесь даже в отсутствие шума входной сигнал оказывается известным неполностью. В практической системе в состав приемника может входить вспомогательное оборудование для измерения фазы генератора. Если фаза меняется достаточно медленно, то, как мы убедимся позднее, возможно ее практически точное измерение. Если указанное условие выполняется, то данная задача ничем не отличается от предыдущей. Однако, если измерение не вполне точно, то наша модель должна учитывать неопределенность сигнала. Аналогичная задача возникает в радиолокации и в гидроакустике. Обычная РЛС излучает на некоторой частоте сос прямоугольный импульс st(/)=sin<ucf, 0<*<7\ (7) При наличии цели импульс будет отражен. Но даже простейшая цель вызывает ослабление и сдвиг фазы зондирующего сигнала. Поэтому сигнал, поступающий на обработку в рассматриваемый интервал времени, при наличии цели имеет вид ί Vrsin[(oc(t-v)+Qr]+n(t), τ<ί<τ + 7\ r{t)~ \n(t), 0<*<τ, τ + Γ</<οο, а в отсутствие цели — r(t)=n(t), 0</<oo. (9) Даже в отсутствие шумов сигнал содержит три неизвестных величины: амплитуду Vr, фазу ΘΓ и время τ распространения сигнала до цели и обратно. 16
Два приведенных примера иллюстрируют задачи обнаружения второго уровня сложности, относимые нами к случаю сигнала с неизвестными параметрами на фоне шума. Задачи обнаружения третьего уровня сложности возникают в ряде областей. В системе пассивной гидролокации приемник прослушивает шумы, создаваемые судами противника. Машины, винты и другие элементы корабля порождают акустический шум, который, распространяясь в водной среде, достигает гидрофонов системы обнаружения. Этот сложный результирующий сигнал наилучшим образом может быть представлен как выборочная функция случайного процесса. Кроме того, гидрофон создает собственные шумы и улавливает шумы моря. Поэтому подходящей моделью для данной задачи обнаружения может быть сигнал r(t)=sQ(t)+n(t) (10) при наличии цели, и сигнал r(t)=n(t)y (11) если цели нет. При отсутствии шума сигнал представляет собой выборочную функцию случайного процесса (обозначаемого подстрочным индексом Ω). В большом числе систем связи используются каналы, которым присущ случайный характер изменения параметров. Типичными в этом смысле являются системы связи с тропосферным рассеянием, системы с использованием орбитальных отражающих поясов и системы создания пассивных радиопомех с использованием дипольных отражателей. Общепринятым методом является передача одного из двух разнесенных по частоте сигналов (эти частоты обозначим ωΑ и ω0). Результирующий принимаемый сигнал есть r(t)=sQi(t)+n(t) (12) при условии, что передавался sA (ί), и r(t)=sQo(t)+n(t), (13) если был передан s0 (t). Здесь sq1 (t) есть выборочная функция случайного процесса со средней частотой ω4, a sq0 (t)—выборочная функция случайного процесса со средней частотой ω0. Эти примеры характеризуются отсутствием каких-либо детерминированных компонент сигнала. Любое вырабатываемое нами правило решения должно основываться на различии статистических свойств двух случайных процессов, из которых берутся выборки sq0 (t) и sqi (/). Этот случай соответствует задаче обнаружения третьего уровня сложности, а именно, обнаружения случайного сигнала на фоне шума. Рассмотрев этот ряд характерных примеров, мы убедились, что задачи теории обнаружения характеризуются тем, что необходимо решать, какая из нескольких гипотез (альтернатив) является истинной. Во всех приведенных примерах имелось только две гипотезы. 17
Поэтому задачи такого типа называются бинарными. Позднее мы встретимся с задачами, в которых возможно Μ гипотез (многоальтернативные задачи обнаружения). Наша классификация проблем обнаружения приведена на рис. 1.4. Классы задач 1. Сигналы с известными параметрами на фоне шума 2. Сигналы с неизвест- | ными параметрами на фоне шума 3. Случайные сигналы на фоне шума Теория обнаружения 1. Цифровые синхронные системы связи 2. Задачи опознавания образов 1. Обычные импульсные радио- или гидролокационные станции обнаружения целей 2. Классификация целей (ориентация цели неизвестна) 3. Цифровые системы связи при неизвестной фазе (опорная фаза отсутствует) 4. Цифровые системы связи по каналам с медленными замираниями 1. Цифровые системы связи по каналам рассеяния [естественные и искусственные неоднородности, в том числе дипольные отражатели— орбитальные, дезориентирующие (радиопротиводействие)] 2. Пассивная гидролокация 3. Сейсмические системы обнаружения 4. Радиоастрономия (обнаружение источников шумов) Рис. 1.4. Классификация задач теории обнаружения. Аналогичный ряд проблем имеется и в области теории оценок. Простейший пример такой задачи иллюстрируется рис. 1.5, где источник выдает аналоговое сообщение a (t) (рис. 1.5, а). Чтобы передать сообщение, мы сначала берем его отсчеты (выборки) через каждые Τ секунд. Затем через каждые Τ секунд посылаем сигнал, который содержит некоторый параметр, однозначно связанный со значением отсчета на предшествующем интервале времени; Сигнал, изображенный на рис. 1.5,6, является синусоидой, амплитуда которой на данном интервале зависит от значения отсчета на предыдущем интервале. Так, если значение отсчета в момент пТ равно Ап, то сигнал на интервале [пТ> (п + \)Т) равен s(t, An)=Ansm^cty nT^t^(n + l)T. (14) Система такого типа называется системой амплитудно-импульсной модуляции (АИМ). 18
На рис. 1.5, в сигнал представлен синусоидой, частота которой на данном интервале отличается от опорной частоты сос на величину, пропорциональную значению предыдущего отсчета, s(f, An) =sin(<oet+Ant)f nT^t^(n+l)T. (15) Система такого типа называется системой частотно-импульсной модуляции (ЧИМ). Как и в ранее рассмотренных примерах, здесь имеет место аддитивный шум. Принятое колебание при условии, что значение отсчета было АПУ можно записать в виде r(t)=s(t,An)+n(t)9 лТ<*<(л + 1)7. (16) На каждом интервале времени приемник должен оценить величину Ап. Эти оценки мы обозначаем через Ап. Как показано на рис. 1.5, г, за некоторый период времени мы получим последовательность оценок, *1 А0 Аналогодый источник Передатчик ЛФ. a(t) Дискретизатор *s(t) Передатчик о.) *(*.Ап) ^ *Г*Л) А -А А<* Интербал повышенного изменения частоты ААЛЖ^ ί ϊ I ш S) Фильтр \ a(t) № Рис. 1.5. а — дискретизация аналогового источника; б — амплитудно-импульсная модуляция; β — частотно-импульсная модуляция; г — восстановление сигнала. подаваемую далее на устройство, выходная величина которого является оценкой исходного сообщения a (t). Если a (t) — сигнал с ограниченным спектром, то таким устройством является просто идеальный фильтр нижних частот. Для других случаев оно оказывается более сложным. 19
Если бы в данном примере параметры сигнала были известны, а шум отсутствовал, то принятый сигнал был бы известным полностью. Задачи этой категории мы относим к числу задач, связанных с оценкой известного сигнала на фоне шума. Если предположить, что существует преобразование, обратное преобразованию Ап в s (t> An) в передатчике, то нетрудно видеть, что при отсутствии шума величину А„ можно определить однозначно. (Ясно, что если бы проектирование передатчика было в наших руках, мы всегда выбирали бы операцию отображения, имеющую обратное преобразование.) Случай известного сигнала на фоне шума соответствует задаче первого уровня сложности в классификации задач теории оценок. а Спектр сигнала, $яа,А) А zL· Средняя частота Рис. 1.6. Спектр случайного сигнала. Обратимся вновь к радиолокации и рассмотрим несколько другую задачу. Допустим, что о присутствии цели нам известно, но ее дальность или скорость мы не знаем. В этом случае принятый сигнал можно записать в виде j Vrsm[((*>c + «>d)(t-T)+%]+n(t), τ<*<τ + 7\ \n(t)9 0<*<τ, τ + Γ<*<οο, где ωά — допплеровский сдвиг, обусловленный движением цели. Необходимо оценить τ и G)d. Теперь, даже при условии, что шум отсутствует, а τ и ωα известны, сигнал содержит неизвестные параметры Vr и ΘΓ. Это типичная задача второго уровня сложности в теории оценок. По аналогии с теорией обнаружения задачи этой категории называются задачами оценки сигнала с неизвестными параметрами на фоне шума. В задачах третьего уровня сложности сигнал является случайным процессом, статистические характеристики которого содержат параметры, подлежащие оценке. Принятый сигнал в этом случае запишется в виде r(t)=sQ(t9A)+n(f), (18) где sq (ty A) — выборочная функция случайного процесса. В простейшем случае это может быть стационарный процесс с узкополосным спектром, изображенным на рис. 1.6. Форма спектра этого процесса известна, а средняя частота — нет. Наблюдая г (t) и используя статистические свойства Sq (t, А) и η (t), приемник производит оценку значения А. Подобная ситуация возникает в радиоастрономии и в пассивной гидролокации. Общий класс задач, в которых сигнал, содержащий 20
искомые параметры, является выборочной функцией случайного процесса, характеризуется как задача оценки случайного сигнала на фоне шума. Иерархия (классификация) задач теории оценок представлена на рис. 1.7. Классы задач 1. Сигналы с известными параметрами на фоне шума 2. Сигналы с неизвестными параметрами на фоне шума 3. Случайные сигналы на фоне шума Теория оценок 1. Системы связи с АИМ, ЧИМ и ФИМ при наличии фазовой синхронизации 2. Неточности (погрешности) в инерциальных системах (например, измерение угла дрейфа) 1. Измерение дальности, скорости или угла в задачах радио- и гидролокации 2. Системы связи с дискретным временем и непрерывной амплитудой (с неизвестной амплитудой или фазой в канале) 1. Оценка параметров энергетического спектра 2. Оценка параметров дальности или доппле- ровского растягивания цели в задачах радио- и гидролокации 3. Измерение скорости в радиоастраномии 4. Оценка параметров цели в задачах пассивной гидролокации 5. РЛС картографирования местности Рис. 1.7. Классификация задач теории оценок. Нетрудно усмотреть значительное сходство между задачами теории обнаружения и теории оценок. В дальнейшем мы часто будем пользоваться этой аналогией в целях сокращения изложения, однако следует подчеркнуть и принципиальное различие. В случае бинарного обнаружения приемник выдает либо истинный, либо ложный результат. При оценке же непрерывного параметра приемник редко выдает точное значение параметра, но от него требуется, чтобы большую часть времени он был точным. Это различие найдет свое отражение в том, каким образом мы будем судить о рабочих характеристиках систем. Третью область наших интересов часто называют теорией модуляции. Мы вскоре убедимся, что этот термин слишком узок для реальных задач. Для пояснения существа дела полезно вновь обратиться к простому примеру. На рис. 1.8 изображен источник аналоговых сообщений, которыми, как правило, могут быть речь или музыка. Для передачи сообщения по каналу используется какой-либо метод модуляции, преобразующий сообщение к виду, пригодному для распространения в физической среде канала. Передаваемый сигнал представляет собой непрерывное колебание, которое является некоторой детерминированной 21
функцией сообщения- α (ή. На рис. 1.8,6 в качестве примера такого сигнала приведено амплитудно-модулированное колебание s[t, a(t)} = [1+ та(t))sin<oct. (19) (Это случай обычной двухполосной AM с индексом модуляции т). На рис. 1.8, в передаваемый сигнал представляет собой частотно- модулированное (ЧМ) колебание Ι ω€ί + ξ а (и) du . (20) s[t, a(/)]=sin (21) Аналоговый источник a(t) ■ssj Модулятор s[t,a(t)] При наличии шумов принятый сигнал имеет вид r(t)=s[t9a(t)]+n(t). Теперь приемник должен наблюдать г (/) и выдавать непрерывную оценку сообщения а (/), как показано на рис. 1.8, г. Данный пример соответствует задаче первого уровня сложности в теории модуляции, так как если бы шума п (t) не было, а сообщение a (t) было бы известно, то принятый сигнал был бы полностью известным. Поэтому мы и характеризуем этот случай как задачу определения известного сигнала на фоне шума. Другого типа физическая ситуация, в которой нужно оценить непрерывную функцию, иллюстри- о) *) rft) кДемодулятор a(t) г) руется рис. 1.9. Канал в данном случае является линейной системой с постоянными во времени параметрами, импульсная характеристика h (τ) которой неизвестна. Рис. 1.8. Пример из области теории модуляции: а—система передачи аналогового сообщения; б — амплитудно-модулированный сигнал; в—-частотно-модулированный сигнал; г—демодулятор. Для оценки импульсной характеристики мы передаем известный сигнал χ (t). Принятый сигнал имеет вид r(t)= I h(i)x(t—%)dT + n(t). (22) Приемник наблюдает колебание г (t) и пытается оценить h (τ). Наилучшим образом этот конкретный пример может быть описан как задача 22
Непрерывной оценки. Далее нам будут встречаться много других задач, в которых требуется получить оценку непрерывного сигнала. Ради удобства при описании задач этого типа мы будем пользоваться термином «теория модуляции», хотя термин «теория оценок непрерывного сигнала» был бы более точным и содержательным. \n(t) Приемник Линейный канал с постоянными $о времени параметрами Рис. 1.9. Измерение параметров канала. По аналогии можно без труда указать задачи теории модуляции других уровней сложности. В системе амплитудной модуляции, представленной на рис. 1.8, б, при приеме часто бывает неизвестной фаза несущей. В этом случае подходящей моделью является r(t) = [l+ma(t)]sin((oct + e) + n(t)y (23) где θ — неизвестный параметр. Это пример задачи из области теории модуляции, соответствующий случаю сигнала с неизвестными параметрами на фоне шума. • Простым примером задачи третьего уровня сложности {случайный сигнал на фоне шума) может служить передача частотно-модули- Классы задач I. Сигналы с известными параметрами на фоне шума 2. Сигналы с неизвестными параметрами на фоне шума 3. Случайные сигналы на фоне шума Теория модуляции (оценка непрерывных сигналов) 1. Обычные системы связи, например, с AM (ДБП-АМ, ОБП), ЧМ и ФМ при наличии фазовой синхронизации 2. Теория оптимальной фильтрации 3. Оптимальные системы с обратной связью 4. Измерения параметров канала 5. Оценка орбитальных параметров спутника 6. Оценка сигналов в сейсмических и гидроакустических системах классификации 7. Синхронизация в цифровых системах 1. Обычные системы связи при отсутствии фазовой синхронизации 2. Оценка характеристик канала при неизвестной фазе входного сигнала | 1. Аналоговые системы связи по каналам со случайными параметрами 2. Оценка статистики процессов с изменяющимися во времени параметрами 3. Оценка характеристик систем Рис. 1.10. Классификация задач теории модуляции. 23 x(t)^ л (Г) r(t)
рованного сигнала по радиоканалу, амплитудная и фазовая характеристики которого изменяются во времени. Нетрудно убедиться, что если по данному каналу передать сигнал вида (20), то принятое колебание можно записать в виде r(t)* V(/)sin coc*+ J a(u)du + e(t)\+n(t), (24) где V (t) и θ (ή — выборочные функции случайных процессов. Таким образом, даже если бы сообщение а (и) было известно, а шум η (t) отсутствовал, то принятый сигнал все равно был бы случайным процессом. Общая классификация интересующих нас задач теории модуляции приведена на рис. 1.10. Дополнительные примеры, включенные в таблицу с тем, чтобы характеризовать широту задач, охватываемых нашим тематическим планом, более подробно рассмотрены в основном тексте. Теперь, когда в общих чертах определены интересующие нас области статистической теории, целесообразно наметить возможные пути решения соответствующих им задач. 1.2. Возможные методы решения Из рассмотренных примеров следует, что характерной особенностью всех перечисленных выше задач является случайная природа источника, канала или помехи; часто все они имеют случайный характер. Поэтому и наш подход к их исследованию должен быть по существу статистическим. Но даже при условии, что мы используем статистическую модель, существует много различных путей подхода к решению той или иной проблемы. Все возможные методы можно подразделить на две категории, именуемые нами «структурными» и «неструктурными». Ряд приведенных простейших примеров поясняет, что понимается под структурным подходом. Пример 1. На вход линейной системы с изменяющимися во времени параметрами поступает смесь г (t) сигнала с шумом г {.№+·«>. o<t<T, { 0 при других /. Импульсная характеристика системы есть h (τ). Сигнал s (/) — известная функция с энергией Τ E8 = $s*(t)dt, (26) о a w (t) — выборочная функция случайного процесса с нулевым средним и ковариационной функцией Kw{i,u) = -±b{t-u). (27) 24
Нас интересует выходное напряжение системы в момент времени Т. Выходное напряжение, обусловленное сигналом, есть детерминированная величина s0(T)=$h(T)s(T —τ)άτ. о (28) Выходное напряжение, вызванное шумом, есть случайная величина η0(Τ)=$Η(τ)η(Τ—τ)άτ. о (29) Отношение сигнал/шум на выходе системы в момент времени Τ можно определить как S Л «о* (Г) N " Я [по· (Г)]' (30) где через Ε [·] обозначено математическое ожидание. Подставляя (28) и (29) в (30), получим N ] h(x)s(T—x)dr '[if* L о (τ) h (и) η (Τ— τ) η (Τ—и) άτ du (31) Вводя математическое ожидание под знак интеграла, используя (27) и выполняя интегрирование по переменной м, получим N J h (τ) s(T— τ)άτ %■]»&* (32) Интересующая нас задача заключается в выборе такой импульсной характеристики h (τ), чтобы отношение сигнал/шум было максимальным. Решение ее не представляет труда, однако для данного обсуждения оно не имеет значения (см. задачу 3.3.1). Приведенный пример иллюстрирует три существенные особенности структурного подхода к решению статистической задачи оптимизации. Структура. Требуется, чтобы устройство обработки было линейным фильтром с постоянными во времени параметрами. Нужно выбрать наилучшую систему в данном классе. Системы, не относящиеся к этому классу (например, нелинейные или с изменяющимися во времени параметрами), не допускаются. Критерий. В данном случае нужно максимизировать величину, именуемую нами отношением сигнал/шум. 25
Информация. Чтобы написать выражение для отношения сигнал/ шум, необходимо знать форму сигнала и ковариационную функцию шумового процесса. Если бы мы располагали большим объемом сведений о процессе (например, знали бы его одномерную плотность вероятности), то не смогли бы им воспользоваться, а если бы у нас данных было меньше, то данную задачу решить невозможно. Разумеется, если бы мы выбрали другой критерий, то могла бы потребоваться и другая информация. Например, чтобы максимизировать величину х= 5°4(Г) , (33) знания ковариационной функции шумового процесса было бы недостаточно. С другой стороны, если изменить структуру системы, то, возможно, потребовалась бы иная информация. Таким образом, все три понятия— структура,критерий и информация—тесно взаимосвязаны. Необходимо особо подчеркнуть, что при структурном подходе, как видно из приведенного ниже примера, предположение о линейности системы не является обязательным. Шг X ■ К8ад рати чное устройство 0-2 Нелинейное безынерционное устройство (звено) Рис. 1.11. Структурное нелинейное устройство. Пример 2. На вход нелинейного безынерционного устройства (устройства без памяти), изображенного на рис. 1.11, поступает смесь сигнала и шума r(t) = s(t) + n(t), — oo<*<oo. (34) Сигнал s (t) в любой момент времени t равен значению случайной величины s с известной плотностью вероятности ps (S). Аналогично, η (t) есть значение величины /г, статистически независимой от s, с известной плотностью вероятности ρη (Ν). На выходе устройства имеем y(t)=a0 + a1[r(t)] + a2[r(t)]*, (35) т. е. квадратичную безынерционную функцию г (t). [Прилагательное «безынерционная» подчеркивает то обстоятельство, что значение у (t0) зависит только от г (t0) ] Требуется выбрать коэффициенты а0, ах и а2 так, чтобы у (t) было оценкой s (t) с минимальной среднеквадратической ошибкой. Среднеквадра- тическая ошибка равна l(t)*E{[y(t)-s(t)]*}=E({a0 + a1[r(t)] + a2[r>(t)]-s(t)}*). (36) Коэффициенты а0, ах и а2 выбираются из условия минимизации ξ (t). Решение данной конкретной задачи дается в гл. 3. Метод решения структурных задач является по своей идее прямым методом. Варьируя структуру системы в рамках заданного класса, мы выбираем конкретную систему, которая максимизирует (или минимизирует) интересующий нас критерий. 26
очевидное преимущество структурного подхода заключается ётом, что для его применения обычно достаточно лишь частичного описания (задания) процессов. Это обстоятельство имеет большое значение, так как на практике требуемые параметры процесса приходится измерять или рассчитывать. Очевидный недостаток этого метода состоит в том, что часто бывает невозможно сказать, правильно ли выбрана структура. В том же примере 1 простая нелинейная система могла бы заведомо превосходить наилучшую линейную систему. Точно так же, в примере 2 некоторая другая нелинейная система могла бы оказаться гораздо лучше, чем квадратичная система. Но раз класс структуры избран, у нас иного выхода нет. Последствия выбора неправильной структуры"можно было бы проследить на ряде тривиальных примеров. С одним таким важным для практики примером мы встретимся при исследовании частотной модуляции в гл. 2 второго тома. На первый взгляд может показаться, что один из путей обойти проблему выбора надлежащей структуры — это принять, что искомая структура является произвольной нелинейной системой с изменяющимися во времени параметрами. Другими словами, класс структуры выбирается столь широким, что в него входят все возможные системы. Трудность здесь заключается в том, что нет удобного математического аппарата скажем, такого, каким является интеграл свертки (интеграл Дюамеля), для выражения выходного напряжения нелинейной системы через напряжение на ее входе. Это означает, что не существует приемлемого метода для исследования всех возможных систем, если опираться на структурный подход. Альтернативой структурного подхода служит неструктурный метод. В этом случае мы отказываемся делать какие-либо априорные предположения относительно структуры, которую должно иметь устройство обработки. Мы лишь задаемся критерием, решаем задачу и реализуем полученную процедуру обработки. Простой пример неструктурного подхода можно получить путем некоторого видоизменения примера 2. Вместо того чтобы приписывать устройству обработки какие-либо характеристики, обозначим оценку через у (t). Полагая l(t)=E[\y(t)-s(t)]*}, (37) выберем в качестве y(t) значение, получаемое из г (t) любым способом, минимизирующим величину ξ: Очевидным преимуществом этого метода является то, что если можно решить данную задачу, то мы заведомо знаем, что наше решение, т. е..найденное устройство обработки, является наилучшим (с точки зрения выбранного критерия) из всех возможных. Очевидный недостаток неструктурного подхода заключается в том, что в этом случае необходимо полностью характеризовать (задавать) все сигналы, каналы и помехи, относящиеся к рассматриваемой задаче. К счастью, оказывается, существует большое число практически важных задач, в которых такое полное задание возможно., На протяжении обоих томов мы будем делать упор на неструктурный подход. 27
До сих пор мы излагали тематический и методологический планы монографии. Рассмотрим теперь фактическую организацию материала. 1.3· Построение монографии Содержание обоих томов тематически можно разбить на пять разделов. В первый раздел, который можно было бы озаглавить как «Основные исходные сведения», входят гл. 2 и 3. В гл. 2 подробно излагаются вопросы, которые мы относим к классической теории обнаружения и оценок. Здесь мы имеем дело с задачами, где результаты наблюдения суть ряды случайных величин, а не случайные процессы. Теория, необходимая для решения задач этого типа, исследовалась статистиками многие годы. Назначение второй главы двоякое: во-первых, дать основные сведения из статистики, необходимые для изложения остальных глав, и, во-вторых, изложить общие положения теории обнаружения и оценок, которые можно распространить на различные области, не рассматриваемые нами подробно. Для достижения второй из указанных целей обсуждение ведется в возможно более общем виде. Мы подробно рассматриваем задачу проверки (испытания) двух и более (М) гипотез, задачу оценки случайных и неслучайных величин и задачу проверки сложных гипотез. В этой же главе рассмотрены два вопроса несколько более специального характера — общая гауссова задача и пределы точности оценок при бинарных испытаниях — необходимые как исходные для понимания конкретных задач, с которыми мы встретимся позднее. Следующий шаг имеет своей целью перекинуть мост между классическим случаем и задачами, связанными с непрерывными процессами, которые были намечены в § 1.1. Необходимый для этого аппарат развивается в гл. 3. Ключом к такому переходу служит соответствующий метод представления случайных процессов. В тех случаях, когда интервал наблюдения конечен, наиболее целесообразно представление случайного процесса рядом, являющимся обобщением обычного ряда Фурье. При бесконечном интервале наблюдения необходимо интегральное преобразование, являющееся обобщением обычного преобразования Фурье. По ходу изложения указанных представлений мы встречаемся с интегральными уравнениями, в связи с чем, несколько отклоняясь от основной темы, кратко рассмотрены методы их решения. Так же как и в гл. 2, изложение носит достаточно общий характер и дает основные исходные сведения, которые можно использовать в других областях. Указанных двух глав достаточно, чтобы разобраться с тем кругом задач, классификация которых намечена на рис. 1.4, 1.7 и 1.10. Второй раздел книги (гл. 4) можно назвать «Элементарная теория обнаружения и оценки сигналов». Здесь рассмотрены задачи первых двух уровней сложности, упомянутые в § 1.1, что соответствует верхним двум уровням на рис. 1.4 и 1.7. Изложение начинается с рассмот- 28
рения простейшей бинарной цифровой системы связи, блок-схема которой представлена на рис. 1.1, после чего делается переход к более сложным задачам в области связи, радиолокации и гидроакустики, охватывающим многопозиционные системы связи, каналы со случайной фазой, каналы со случайными амплитудой и фазой и случай «цветной» (небелой) помехи. Используя аналогию между задачами оценки и обнаружения, нетрудно получить оценки для случаев, указанных на рис. 1.5, а также и для других, более сложных систем. Распространение этих результатов на случай многоканальных систем (например, систем с частотным разнесением или систем с пространственным разнесением — решеток) и нескольких параметров (к примеру, дальность и допплеровский сдвиг) завершает изложение гл. 4. Результаты этой главы являются фундаментальными для понимания современных систем связи, радио- и гидролокации. К третьему разделу книги, который можно озаглавить как «Теория модуляции или теория оценок непрерывных сигналов4», относятся гл. 5 и 6 первого тома и гл. 2 второго тома. В гл. 5 формулируется качественная модель для первых двух уровней сложности задачи оценки непрерывных сигналов и выводится ряд интегральных уравнений, решения которых и есть оптимальные оценки сообщений. Здесь также выведены уравнения, устанавливающие пределы точности устройств оценки. Для изучения методов решений задача оценки подразделяется на два случая — линейных и нелинейных оценок. В гл. 6 подробно исследуются проблемы линейных оценок. В первом параграфе главы рассмотрены соотношения между различными критериями, характеристиками процессов и структурой устройства обработки. В следующем параграфе обсуждается специальный случай, когда процесс имеет стационарный характер при неограниченной длительности в прошлом. Этот случай — задача Винера — приводит к непосредственному методу решения. Оригинальная работа Винера получает здесь дальнейшее развитие с тем, чтобы найти в замкнутой форме некоторые важные выражения для вероятности ошибок. В третьем параграфе обсуждается случай, когда процессы можно характеризовать, используя метод переменных состояния. Данный случай — так называемая задача Кальмана — Бьюси — позволяет нам решать задачи для нестационарных процессов на ограниченном интервале и значительно глубже понять результаты предыдущего параграфа. Материал, охватываемый гл. 1—6, отличается двумя особенностями: во-первых, почти во всех случаях удается получить в явном виде точные решения сформулированных задач, и, во-вторых, большинство обсуждаемых вопросов представляет такой фундаментальный интерес, что с ними должны быть хорошо знакомы все, кто связан с применением статистических методов при разработке связных, радиолокационных и гидроакустических систем. Совсем по-иному обстоит дело, когда мы пытаемся решить задачу нелинейной оценки. В этом случае для того, чтобы получить полезные результаты, приходится прибегать к методам приближенных решений. Однако для того, чтобы решить, какие приближения являются 29
справедливыми, необходимо рассмотреть конкретные системы Нелинейной модуляции. Таким образом, точные количественные результаты применимы только к конкретной системе. Ввиду этого принципиального различия мы ненадолго прерываем логический ход нашего изложения и подытоживаем основные результаты первого тома в его заключительной, седьмой главе х). После краткого введения мы вновь обращаемся к проблеме нели- нейной модуляции в гл. 2 второго тома и весьма подробно рассматриваем системы угловой (частотной и фазовой) модуляции. После получения приближения к оптимальному устройству обработки производится теоретический и экспериментальный анализ его помехоустойчивости и возможные модификации схемы. Существенные результаты в этой главе достигнуты на основе^ современных методов теории марковских процессов и теории информации. В четвертом разделе мы вновь обращаемся к проблемам теории обнаружения, оценок и модуляции на третьем уровне той иерархии проблем, которая была намечена в § 1.1 первого тома. Взглянув на нижние графы рис. 1.4, 1.7 и 1.10, нетрудно убедиться, что речь идет о соответствующих задачах, относящихся к случайным сигналам на фоне шума. Эти задачи подробно исследуются в гл. 3 второго тома. Здесь мы убеждаемся, что линейные устройства обработки, полученные нами в гл. 6 первого тома, играют фундаментальную роль в решении проблемы случайных сигналов. Этот результат при совместном рассмотрении с соответствующим результатом гл. 2 второго тома подчеркивает фундаментальное значение результатов гл. 6 первого тома и убедительно, демонстрирует внутреннее единство различных проблем. В 3 гл. рассмотрены также конкретные вопросы, например задачи оценки параметров энергетического спектра и передачи аналогового сообщения по каналам с изменяющимися во времени параметрами. Пятый раздел носит название «Приложения теории» и включает в себя гл. 4 и 5 второго тома\ На протяжении обеих книг мы уделяем особое внимание вопросам приложения теории к моделям практических задач. В большинстве из них связь с реальной физической ситуацией может быть объяснена на одной — двух страницах. В пятом разделе рассматриваются такие физические ситуации, в которых разработка модели на основе физической ситуации является центральным вопросом. В гл. 4 второго тома·глубокому исследованию подвергается проблема радио-и гидролокации. В ней построен ряд моделей целей и каналов — начиная от медленно флюктуирующих точечных целей и кончая протяженными целями, которые флюктуируют с произвольными скоростями. Данные модели помогают нам при исследовании проблем построения сигналов для радио- и гидролокационных систем, проблемы разрешающей способности РЛС для картографирования местности, влияния реверберации на характери стики гидроакустической г) Гл. 7, за исключением § 7.3, вынесенного в Приложение, при переводе опущена (см. Предисловие к русскому переводу) — Прим. ред. 30
системы, оценки параметров дисперсных целей, осуществления связи по дисперсным каналам и других важных проблем. В гл. 5 второго тома исследуются различные многомерные задачи, например, многоканальные системы связи и задачи обработки при многих "переменных, встречающиеся в системах с непрерывными приемными апертурами и в оптических системах. Главное внимание в этой главе уделяется вопросам оптимальной пространственной обработки при помощи решеток в гидроакустических или сейсмических системах. Рассматриваются системы как активной, так и пассивной гидролокации, разработаны конкретные схемы устройств обработки и проведен анализ их характеристик. Наконец, в гл. 6 второго тома подытоживаются некоторые из наиболее существенных результатов, упоминаются вопросы, непосредственно связанные или примыкающие к рассмотренным, которые были по тем или иным причинам опущены, и намечаются области предстоящих исследований.
2. Классическая теория обнаружения и оценок 2.1. Введение В данной главе подробно излагаются основные идеи классической теории обнаружения и оценок. Прежде всего дадим определения различным терминам. Рис. 2.1 иллюстрирует основные компоненты простейшей задачи статистической теории решений. Первым элементом является источник, который создает некоторую выходную величину. В простейшем случае она представляет собой результат выбора из двух возможных значений. Назовем их гипотезами и в случае двух возможных гипотез обозначим через Я о и ЯА. В более общем случае выходная величина может принимать одно из Μ значений — гипотез, которые обозначим через Я0> Ни ···, Нм-\- Некоторые типичные механизмы источников перечислены ниже. 1. Цифровая система связи; передача информации в ней осуществляется посылкой единиц и нулей. Когда посылается «единица», мы ставим этому в соответствиие ЯА, а когда посылается «нуль» — Я0. (Пространство^ наблюдений Источник сообщений. "' » »о* Вероятностный 1 механизм перехода Прадило решения Решение Рис. 2.1. Элементы задачи теории обнаружения. 2. Радиолокационная система; мы производим наблюдение по определенному азимуту и на определенной дальности, пытаясь установить, присутствует ли цель; Я4 в этом случае соответствует наличию цели, а Я о — ее отсутствию. 3. Задача медицинского диагноза; при установлении диагноза по электрокардиограмме Я ι может соответствовать тому, что у пациента был сердечный приступ, а Я0 — тому, что такового не было. 4. Задача опознавания (классификации) говорящего; допустим мы знаем, что говорящий — немец, англичанин или американец и, кроме 32
того, либо мужчина, либо женщина. Таким образом, имеется шесть возможных гипотез. Во всех представляющих интерес случаях мы не знаем, какая именно гипотеза является истинной. Вторым элементом задачи теории решений является вероятностный механизм перехода и третьим — пространство наблюдений. Механизм перехода можно рассматривать как некое устройство, которое знает, η Источник сообщений Рп(") -1 I Φ -*>г Механизм Пространство перехода нао*/!юдений о) Л» 1/2 .'/♦ +1 Ргщ(Щ) Рг,нв("1»о) № if/* *1 νι/ζ -ζ -ι о Φ Рис. 2.2. Простая задача на принятие решения: а—модель; б —плотности вероятности. какая гипотеза является истинной. Основываясь на этом знании, оно генерирует некоторую точку в пространстве наблюдений в соответствии с некоторым вероятностным законом. Эти представления иллюстрируются простым примером, приведенным на рис. 2.2. Когда справедлива гипотеза Нъ источник генерирует + 1, когда верна гипотеза #0, источник генерирует — 1. К выходной величине источника добавляется независимая дискретная случайная величина я, плотность вероятности которой показана на рис. 2.2, б. Сумма выходной величины источника и величины η и есть наблюдаемая величина г. При двух гипотезах имеем Hi:r=rl+ny Я0:г=—1+п. (1) 2 Зак. 693 33
Распределения вероятностей величины г по двум упомянутым гипотезам представлены на рис. 2.2, б. Пространство наблюдений является одномерным, так как любое значение выходной величины можно представить точкой на прямой линии. п*>пг Источник сообщений —1 U lj •υ.·· il LI а) Рис. 2.3. Двумерная задача: а —модель; б —плотность вероятности. Весьма схожий пример показан на рис. 2.3, а, где источник генерирует последовательно два числа. Случайная величина η ι добавляется к первому числу, а независимая от нее случайная величина п2 — ко второму. Таким "образом, Нг:гг Н0:гг Совместное распределение вероятностей величин г ι и г2 при условии, что истинна гипотеза Hiy изображено на рис. 2.3, б. Пространство наблюдения является в этом случае двумерным и результат любого наблюдения может быть представлен некоторой точкой на плоскости. В данной главе мы ограничиваемся-рассмотрением задач, в которых пространство наблюдений имеет конечное число измерений. Другими словами, результаты наблюдений состоят из ряда N чисел и -1-1 ■φ- •г„г2 \+п1У 1+12. — 1-h/ii, (2) 34
могут был? представлены некоторой точкой N-мерного пространства. Задачи этого класса исследовались статистиками в течение многих лет. По этой причине мы называем их классическими задачами теории решений. Четвертым элементом задачи обнаружения является правило решения. После наблюдения исхода в пространстве наблюдений мы пытаемся установить, какая гипотеза была истинной, и для выполнения этой процедуры вводим правило решения, согласно которому каждая точка относится к одной из гипотез. Выбор разумных правил решения зависит от ряда факторов, которые будут подробно рассмотрены позднее. В процессе изучения курса мы покажем условия взаимного соответствия этих четырех элементов в рамках общей задачи теории решений (задачи испытания гипотез). Классическая задача оценок тесно связана с задачей обнаружения. Подробно о ней будет сказано позднее. Построение главы. Материал этой главы организован следующим образом. В § 2.2 излагается бинарная задача проверки гипотез. Затем в § 2.3 — результаты § 2.2 распространяются на случай Μ гипотез. В § 2.4 развивается классическая теория оценок. Задачи, с которыми мы встречаемся в § 2.2 и 2.3, характеризуются тем, что каждое значение выходной величины источника соответствует своей гипотезе. В § 2.5 исследуется задача проверки сложной гипотезы. В этом случае несколько значений выходной величины источника связаны между собой -так, что они соответствую^ одной гипотезе. Все построения § 2.5 сопряжены с произвольными вероятностными механизмами перехода. В § 2.6 подробно рассматривается специальный класс задач, которые будут полезны при последующем изложении. Эгот класс мы называем общим гауссовым. Во многих практических важных случаях можно вывести «оптимальное» правило решения в соответствии с некоторым критерием, но невозможно оценить, насколько хорошо будет работать данная схема испытания. В § 2.7 установлены границы (пределы) и выведены приближенные выражения для вероятности ошибок, которые понадобятся при изложении ряда последующих глав. Наконец, в § 2.8 подытожены полученные в гл. 2 езультаты и указаны некоторое нерассмотренные вопросы. 2.2. Проверка двух простых гипотез Начнем наше рассмотрение с задачи, связанной с принятием решения, в которой каждое из двух значений выходной величины источника соответствует одной из двух гипотез. Каждая гипотеза отображается точкой в пространстве наблюдений. Предполагается, что пространство наблюдений соответствует ряду из N результатов наблюдений: гь г2, 2* 35
r3, ..., гм* Поэтому каждый ряд можно себе представить как точку в N-мерном пространстве и обозначить вектором г: Вероятностный механизм перехода генерирует точки в пространстве наблюдений в соответствии с двумя известными условными плотностями вероятностей pr\Hx(R\Hi) и рг{Ио (R|#0). Наша цель заключается в том, чтобы использовать эту информацию для выработки соответствующего правила решения. Для этого необходимо рассмотреть различные критерии принятия решения. 2.2.1. Критерии принятия решения В задаче проверки двух гипотез нам известно, что верна либо гипотеза Я о, либо гипотеза Н±. Ограничим рассмотрение только правилами решения, необходимыми для того, чтобы сделать выбор. (Можно было бы принять и другую возможную процедуру, когда, по правилам решения допускаются три ответа: а) правильна Я0, б) правильна Нх и в) определенного ответа дать нельзя.) Таким образом, при каждом испытании возможен один из четырех исходов: 1) верна Я0, выбираем Η 0; 2) верна Я0, выбираем Ни 3) верна Ни выбираем Ни 4) верна Ни выбираем #0. Первый и третий исходы соответствуют правильным выборам^, а второй и четвертый — ошибочным. Смысл критерия решения состоит в том, что каждому из четырех возможных исходов (образов действия) придается некоторое относительное значение. Можно предположить, что метод обработки принимаемой информации (г) будет зависеть от выбранного нами критерия решения. В этом параграфе мы покажем, что для двух представляющих наибольший интерес критериев — Байе- са и Неймана — Пирсона — операции над г идентичны. Критерий Байеса. Байесовское испытание основывается на двух допущениях. Первое заключается в том, что оба значения выходной величины источника подчиняются некоторым распределениям вероятностей, которые обозначим соответственно через Ρ ι и Р0 и назовем априорными вероятностями. Эти вероятности отображают информацию, которой располагает наблюдатель до проведения эксперимента. Второе допущение состоит в том, что каждому из возможных образов действия приписывается некоторая стоимость. Обозначим стоимости четырех упомянутых образов действия через С00, Ci0, Сц и С οι соответственно. Первая цифра подстрочного индекса означает выбранную гипотезу, а вторая — гипотезу, которая была правильной. гД 36
Каждый опыт будет сопряжен с определенными потерями. Желательно, чтобы наше правило решения было построено таким образом, чтобы в среднем эти потери были как можно меньше. Для этого запишем сначала выражение для ожидаемой величины потерь. Легко видеть, что имеются две вероятности, по которым мы должны усреднить: априорная вероятность и вероятность того, что будет предпринят заданный образ действий. Обозначая ожидаемую величину потерь как риск Я, имеем ^=С00Р0Р(Я0|Я0) + С10Р0Р(Я1|Я0) + + С11Р1Р(Я1|Я1) + С01Р1Р(Я0|Я1). (4) Так как мы предполагали, что по правилу решения следует выбирать либо Ни либо Я о, его можно рассматривать как правило раз- Пространстбо наблюдений Ζ Источник сообщений Рис. 2.4. Области решений. биения пространства наблюдений Ζ на две части: Ζ0 и Zi (рис. 2.4). Если результат наблюдения оказывается в Z0, то принимается Я0, а если в Zi — то Ни Теперь можно написать выражение для риска через переходные вероятности и подпространства решений: Я = С00Р0 $ pr|H#(R|tfo)dR + C10Po$ Prii7/o(Ri//oMR + z. zx~- + Cn pi $ Pr\Ht (R IЯ1) dR+C01 Px $ pr|[//i (R |Hx)rfR. (5) zx z0 Для N-мерного пространства наблюдений интегралы (5) являются jV-кратными. На протяжении всей книги мы исходим из того, что стоимость ошибочно принятого решения выше, чем стоимость правильного решения. Другими словами, £ ю > С00, С01 > Сп. (6) Чтобы найти теперь результат байесовского испытания, нам необходимо выбрать подпространства решений Z0 и Ζ ι так, чтобы величина риска была сведена к минимуму. Требование обязательного приня- 37
тия решения означает, что каждая точка R пространства наблюдений Ζ должна быть поставлена в соответствие подпространству Ζ 0 или ΖΑ. Таким образом, Z = Z0 + Z1AZ0UZ1. (7) Переписав (5), получим ft = P*Cw I ргШл(К\Н0)аЦ + Р0С10 $ Рг1Яо(1*|Я0)<Щ + Ζ ο Ζ — Ζο + PiCoilpr]Hl(K\H1)dR + P1C11 $ pr|//i(R|^)dR. (8) Ζο Ζ—Ζ© Учитывая, что $Рпл„(к1яо)<т= $Pr,„,(R|tfiWR=i, (9) ζ ζ (8) можно свести к ^^oQo + PxCu-}- $ {^(Co.-C^p^^iRlH,)]- Z0 -[Po(C10-Coo) Pr{Ho (R| ВД dR. (10) Первые два члена в (10) соответствуют фиксированной стоимости. Интеграл представляет собой стоимость, определяемую теми точками R, которые относятся к Z0. Сделанное в (6) допущение предполагает, что разности, заключенные в круглых скобках, являются положительными .\П_ тому все значения R, когда второй член больше, чем первый, следует включить в Z0, так как ими вносится в интеграл отршатель^ая величина. Аналогично, все значения R, когда второй член бол инк, первого, следует исключить из Z0 (отнести к ZA), поскольку ими вносится в интеграл положительная величина^Значения R, соответствующие равенству двух членов, на стоимость не влияют, и поэтому их можно распределять произвольно. Допустим, что эти точки относятся к Я ι,- и не будем учитывать их в наших последующих рассуждениях. Таким образом, области решений определяются следующим условием: если PiPn-Cap^WHJ^P^Cu-Coap^RlHo), (11) то относим R к Ζ ι и, следовательно, утверждаем, что истинна Яь в противном случае приписываем R к Ζ0 и утверждаем, что истинна Я0. Формулу (11) можно записать в виде •Ρτ\ηΑ*\ηι) ΰ± Po(Ci0-C00) Pr|//0Wo) яГ Pi(Coi-Ctl) (12) Величину в левой части неравенства (12) называют отношением правдоподобия и обозначают через A(R): А(|°С'^»|'яГ (13) 38
Так как оно представляет собой отношение двух функций случайной величины, то и само является случайной величиной. Нетрудно видеть, что независимо от размерности R величина Л (R) является одномерной. Величина в правой части (12) является порогом испытания и обозначается через η: ~ д Л) (Сю—Соо) /MCoi-Cu)' (14) Таким образом, критерий Байеса приводит нас к критерию отношения правдоподобия (КОП) Л (R) %_ η. (15) Отсюда видно, что вся процедура обработки данных сводится к вычислению Л (R) и распределение априорных вероятностей или стоимостей на нее влияния не оказывает. Указанная инвариантность процедуры обработки информации имеет большое практическое значение. Часто стоимости и априорные вероятности являются просто квалифицированными предположениями на основе предыдущего опыта (интуиции). Условие (15) позволяет построить все устройство обработки, рассматривая η как переменный порог, учитывающий изменения в наших оценках априорных .вероятностей и стоимостей. Так как натуральный логарифм — функция монотонная, а обе части неравенства (15) — величины положительные, то эквивалентной формой записи критерия отношения правдоподобия будет Устройство обработки, данных /П*)э а) Устройство обработка данных In Л (Л) Порогобое устройство Л(П)Ъп Пороговое устройство ΙηΔ{&)%Ιηη Решение Решение S) Рис. 2.5. Устройства обработки по критерию' отношения правдоподобия. In Л (R) % In η. (16) Две соответствующие формы устройства обработки, реализующего процедуру проверки отношения правдоподобия, изображены на рис. 2.5. Прежде чем перейти к рассмотрению других критериев, разберэ три простых примера. Пример 1. Пусть по гипотезе Нг выходной величиной источника является постоянное напряжение т, а по гипотезе Н0 — напряжение, равное нулю. Наблюдение выходного напряжения производится на фоне аддитивного шума. Мы берем отсчеты результирующего выходного напряжения через каждую секунду и получаем N отсчетов. Каждый отсчет шума есть гауссова случайная 39
величина п с нулевым средним и дисперсией σ2. Отсчеты шума в различные моменты времени являются независимыми случайными величинами и, кроме того, они не зависят от выходного напряжения источника. Из рис. 2.6 видно, что результаты наблюдений по гипотезам Нг и Н0 есть H1:rb=m + ni, ί=1,2 Ν, Я0:а= nit /=1,2 Ν и • - 1 / Χ2 \ ^(X)=71^exp("^J· так как отсчеты шума являются гауссовыми. (17) (18) Источник смещений knft) Η дискрет (отсчетов) М— {+ 'r(t) ' Устройство дискретизации fits Т5 ч Устройство обработки т. 1 тезе: Рис. 2.6. Модель задачи к примеру 1. Нетрудно записать плотности вероятности величины η по каждой гипо- (Rt-m)> (19) (20) Поскольку яг· — статистиче.ски независимы, совместная плотность вероятности величин τι (или вектора г, что эквивалентно) равна просто произведению отдельных плотностей вероятностей. Таким образом, м..«"*>-П?к->(-и,5а1) ,21) ί=1 N (22) i=l 40
Подставляя (21) и (22) в (13), имеем N 1 / (Rj-m)2 Π Y2Saexp(- 2σ2 Λ (11) = -*-^ * (23. П-р=гехр (-^ После приведения подобных членов и взятия логарифма получим Итак, критерий отношения правдоподобия запишется в виде т ъгу _ Nm2 и\ у2«-- σ2 ^ * 2σ2 я0 In η (25) или в эквивалентной форме Нетрудно видеть, что устройство обработки просто суммирует результаты наблюдений и сравнивает с порогом. В этом примере наблюдаемые данные входят в отношение правдоподобия только в виде суммы. Это пример достаточной статистики1), которую мы обозначим через / (R) (или просто /, когда аргумент очевиден). Достаточная статистика есть просто функция принятой информации, обладающая тем свойством, что Л (R) можно записать как функцию /. Другими словами, при вынесении решения знание величины достаточной статистики точно так же исчерпывающе, йак и знание величины R. В приведенном примере / является л-инейной функцией Rt. Случай, когда это несправедливо, иллюстрируется примером 2. Пример 2. К интересующей нас в этом примере математической модели приводят несколько различных физических ситуаций. Результаты наблюдений представляют ряд из N величин: rlt r2, r3, ..., rN. По обеим гипотезам г% — независимые, одинаково распределенные нормальные случайные величины с нулевыми средними. По гипотезе Нг каждая из величин τχ имеет дисперсию σχ2, а по гипотезе Н0 — дисперсию σ02. Так как указанные случайные величины являются независимыми, совместная плотность вероятности равна просто произведению отдельных плотностей. Следовательно, ^.(«|ад-Пт^^(-ёт) (27 /=1 *) С определением и характеристиками достаточных статистик можно познакомиться в литературе [39*, 40*]. — Прим. ред. 41
Рг,^1^) = Пу^ехр(-^)· (28) ^0 1=1 Подставляя (27) и (28) в (13) и беря логарифм, получаем В данном случае достаточная статистика есть сумма квадратов результатов наблюдений: [N /(R)= Σ#<2 (3°) i=l и эквивалентный критерий для σχ2 > σ02 записывается в виде Их 2θα2αΛ2 ( ση \ l{R)i-^[lari-Nlnt)-y- ί(31) При σχ2 < σ02 смысл этого неравенства меняется на противоположный: #о 2σ02σι2 / Γσ0 \ '™%τ^(ΝίαΕ-ΐΏΨγ'· (σι2<σ°2)* (32) В приведенных двух примерах мы имели дело с нормальными величинами. В следующем примере будет рассмотрен другой тип распределения. Пример 3. Пуассоновское распределение событий часто используется в ка чёстве модели дробового шума и других явлений (см. [1] или [2]). При каждом Проведении эксперимента происходит некоторое число событий, которое и является результатом наблюдения; оно изменяется в пределах от 0 до оо и подчиняется распределению Пуассона согласно обеим гипотезам, т. е. Ρ (η событий) = -^y-e""m', я = 0, 1, 2,...; / = 0, 1( (33) где т% — параметр, характеризующий среднее число событий £(n) = mf. (34) Именно по этому параметру т% различаются распределения по двум гипотезам. Переписав (33) так, чтобы подчеркнуть это обстоятельство, получим следующие два распределения Пуассона: Нг:Р(п событий) = -^^--е""т\ л = 0, 1, 2,...; (35) п\ Н0 :Р{п событий) ==-^е"т°, п = 0, 1, 2... (36) Тогда критерий отношения правдоподобия можно записать в виде -Ч ехр[ —(пи—nto)]^ η (37) 42
или в эквивалентной ему форме н* 1η η -\-ηι1—ηι0 f если ηιχ > т0 -, н0 \птг — lnm0 η ^ * если m0 > тг. нг lnm1 — lnm0 Данный пример служит иллюстрацией того, как критерий отношения правдоподобия, который мы первоначально записали через плотности вероятности, можно легко привести к виду, удобному для случая, когда результаты наблюдений являются дискретными случайными величинами. Вернемся теперь к нашему общему обсуждению критериев Байеса. Существует несколько специальных видов критериев Байеса, которые часто используются и поэтому заслуживают отдельного рассмотрения. Если принять С00 = Сц = 0, а С01 = С10 = 1, то выражение для риска (8) приводится к виду Я = Ро\ Pr|„.(R|#o)tfR + M Pr\Ht (Н1#1)<«· (39) Ζχ Ζ0 Нетрудно усмотреть, что (39) есть просто полная вероятность допустить ошибку. Следовательно, для данного распределения стоимости критерий Байеса минимизирует полную вероятность ошибки. При этом критерий можно записать в виде lnA(R)% ln-^ = lnP0—ln(l-P0). (40) Но Pl Когда две гипотезы одинаково правдоподобны (равновероятны), порог равен нулю. Это допущение обычно справедливо применительно к цифровым системам связи. Такие устройства обработки называются приемниками с минимальной вероятностью ошибки. Второй частный случай соответствует ситуации, когда априорные вероятности неизвестны. Для исследования этого случая снова обратимся к (8). Из этого выражения видно, что коль скоро области решений Ζ 0 и Ζι выбраны, значения интегралов становятся определенными. Обозначим эти значения следующим образом: pr= S PriH.<RI#oMR. Pd- $ Pn^iRltfiMR, Ζχ рм= I Pr^iRlHJdR^l-Po. (41) Легко видеть, что эти значения являются условными вероятностями. Подстрочные индексы имеют мнемонический характер и заимство- 43
ваны из радиолокационной задачи, где гипотеза #ι соответствует наличию цели, а гипотеза Я0 — ее отсутствию. PF есть вероятность ложной тревоги, т. е. мы утверждаем, что цель присутствует, когда на самом деле ее нет. Ρ о есть вероятность обнаружения, т. е. мы говорим, что цель присутствует, когда она действительно имеется. Рм есть вероятность пропуска, т. е. утверждаем, что цель отсутствует, когда она чю Рис. 2.7. Функции риска: I *Н 'Р1 г). а—фиксированная величина риска и типичная байесовская функция риска; б, в, г —максимальное значение ^и»при Я1 = 0; P1=s 1; 0 < Рх < 1 соответственно. на самом деле присутствует. Хотя класс интересующих нас задач гораздо шире, чем это предполагается данными обозначениями, мы все же будем ради удобства ими пользоваться. ^ При любом выборе областей решений выражение для риска Щ можно написать в обозначениях (41): Я = Р0С1{у+РгСп + Рг (С01-Сп) Рм-Рв(С10-С00) (1 —Pi). (42) Поскольку Ро=1-Л. (43) (42) приобретает вид $(P1)^C00(l-PFy+C10PF + P1[(C11-C00) + + (С01-СЦ) рм-(С10-С0(>) PF]. (44) Если' все стоимости и априорные вероятности известны, можно воспользоваться критерием Байеса. На рис. 2.7 зависимость байесовского риска Яв(Рд от Pi представлена графически. Отметим, что по йере изменения Ρ ι изменяются также и области решений для байесов- 44
ского критерия, а следовательно, и вероятности PF и Рм> Рассмотрим теперь такую ситуацию, в которой задаются некоторым значением вероятности Pi (скажем, Pi = Pi*) и применяют соответствующий байесовский критерий. Зафиксируем теперь порог и предположим, что Рг может изменяться. Обозначим величину риска для этого испытания с фиксированным порогом как Mf (Pi*, Pi). Так как порог зафиксирован, то Pf и Рм также фиксированы и выражение (44) представляется просто прямой линией.- Поскольку это байесовский критерий для Pi = Pi*, то прямая касается кривой Яв(Рι) именно в этой точке. Рассматривая (14), видим, что порог изменяется от Ρ\ непрерывно. Следовательно, при любой вероятности Ρι Φ Ρ ι* порог байесовского критерия будет другим, так как байесовский критерий минимизирует величину риска, JIf(Pi\PU>Mb(Pi). (45) Если Л — непрерывная случайная величина со строго монотонной функцией распределения вероятностей, то изменение η всегда вызывает изменение риска. Кривая Яв(Р \) обращена вогнутостью строго вниз. При этом неравенство (45) выполняется всегда. Этот случай, относящийся к числу тех, что представляют для нас особый интерес, иллюстрируется рис. 2.7, а. Мы видим, что линия J%f(Pi*\ Pi) касатель- на к кривой Я в (Pi) в точке Pi = Pi*. Эти кривые показывают влияние недостоверного знания априорных вероятностей. Интересная задача возникает, если предположить, что априорные вероятности выбираются с таким расчетом, чтобы качество обнаружения было как можно хуже. Другими словами, величина Ρ ι выбирается такой, чтобы риск JHf (Pi*, Pi) был максимальным. Три возможных примера приведены на рис. 2.7, б, β и г. На рис. 2.7, б максимум ^β(Ρι) имеет место при Ρ ι = 0. Для минимизации максимального риска использован байесовский критерий, рассчитанный в предположении, что Pi = 0. На рис. 2.7, β максимум Яв{Р\) имеет место при Pi — 1. Чтобы свести максимальный риск к минимуму, используется байесовский критерий, построенный в предположении, что Р4 = 1. На рис. 2.7, г максимум имеет место внутри интервала [0,1 ], и мы выбираем зависимость J?f(Pi) в виде горизонтальной линии. При этом коэффициент при Pi в (44) должен равняться нулю: (Сгг-CJ +(С01-Сп) РМ-(С10-С00) PF = 0. (46) Критерий Байеса, рассчитанный на минимизацию максимально возможного риска, называется минимаксным критерием. Уравнение (46), называемое минимаксным, справедливо во всех случаях, когда максимум Я в (Pi) лежит внутри рассматриваемого интервала. Особым случаем распределения стоимости, который часто бывает логически оправданным, является Соо = Си = 0. (47) Это распределение гарантирует, что максимум будет внутренним; 45
Обозначая С οι = См, С10 = С/?, (48) напишем выражение для риска Яр = CFPF + Рг (См PM-CFPF)= P0 CF PF + Рг См Рм (49) и минимаксное уравнение CmPm~CfPf. (50) Прежде чем продолжить наше обсуждение критериев отношения правдоподобия, рассмотрим второй критерий и покажем, что он также ведет к критерию отношения правдоподобия. Испытания по критерию Неймана — Пирсона. Во многих физических ситуациях бывает затрудительно предсказать достаточно реалистичные стоимости и априорные вероятности. Эту трудность можно довольно просто обойти, если иметь дело с условными вероятностями PF и PD. Вообще говоря, нам хотелось бы сделать PF как можно меньше, a Pd как можно больше. В большинстве задач, имеющих практическое значение, эти цели являются противоречащими друг другу. Очевидный критерий заключается в том, чтобы ограничить одну из вероятностей и максимизировать (или минимизировать) другую. Точная формулировка этого критерия приводится нижет Критерий Неймана — Пирсона. Ограничим PF = α' ^ α и построим критерий, максимизирующий Pd (или минимизирующий Рм) при указанном ограничении. Решение этой задачи легко получить, используя метод множителей Лагранжа. Построим функцию F: F = PM + K[PF-a'] (51) или F=l Prif/.iRlWR + bfJ Рг\н.(*\но)**-*']· (52) Очевидно, что при PF = a' минимизация F ведет к минимизации Рм' F = K(l-a') + j iPr|//l(R|^i) —^r|^0(Rl//o)]^R· (53) Заметим, что при любом положительном значении λ критерий отношения правдоподобия минимизирует функцию F. (Отрицательное значение λ приводит к критерию отношения правдоподобия с неравенствами противоположного смысла.) Это обстоятельство следует из (53) непосредственно, так как для минимизации F мы относим точку R к области Ζ0 только тогда, когда 46
член в квадратных скобках отрицателен. Это эквивалентно критерию: если Рг\Н.(ЫНо) то относим точку к области Ζ0 или высказываем гипотезу Я^. Величина, стоящая в левой части неравенства (54), есть не что иное, как отношение правдоподобия. Таким образом, функция F минимизируется по критерию отношения правдоподобия Α(Κ)%λ. (55) Для того чтобы удовлетворить указанному ограничению, выберем λ такое, что Pf = α'. Если обозначить плотность вероятности величины Л при условии, что верна гипотеза Я0, через рл|я0 (Л| Я0), то этот выбор равносилен требованию, чтобы оо ро= $'Рл,я0(Л1#оМЛ=а'. (56) λ Решая (56) относительно λ, получим величину порога. Значение λ, определяемое из (56), будет неотрицательным, поскольку Рл|я0(Л| Я 0) =0 при отрицательных значениях λ. Заметим, что уменьшение λ эквивалентно увеличению Ζι-области, где мы утверждаем, что истинна гипотеза Я ι. Следовательно, Ρ о возрастает по мере уменьшения λ. Поэтому мы уменьшаем λ до тех пор, пока не получим максимально возможное α'^α. В большинстве интересующих нас случаев Рр представляет собой непрерывную функцию λ и мы имеем Рр = а. Во всех наших последующих рассуждениях указанная непрерывность будет предполагаться. При этом допущении критерий Неймана — Пирсона ведет к критерию отношения правдоподобия. В примере 2 § 2.2.2 мы увидим, к чему приводит несправедливость предположения о непрерывности функции. Заключение. В этом параграфе были изложены две идеи, имеющие фундаментальное значение в статистической теории решений. Первый результат сводится к тому, что для критериев Байеса и Неймана — Пирсона оптимальная процедура испытаний состоит в обработке результатов наблюдения R с целью отыскания отношения правдоподобия A(R) и в сравнении его с порогом для того, чтобы принять решение. Таким образом, независимо от числа измерений пространства наблюдения пространство решений является одномерным. Вторая идея —это представление о достаточной статистике / (R). Понятие достаточной статистики было введено нами, когда мы строили отношение правдоподобия и выяснили, что в явном виде оно зависит только от / (R). Если мы действительно построим A(R), а затем определим /4(R), то понятие достаточной статистики, по-видимому, будет иметь второстепенное значение. 47
Более важен случай, когда можно определить / (R) непосредственно. Простой способ решения этой задачи — рассмотреть геометрическую интерпретацию понятия достаточной статистики. Мы рассматривали результаты наблюдений rlf r2, ..., rN как координаты точки г в W-мерном пространстве, и один из способов определения этой точки заключается в использовании указанных координат. Когда мы выбираем достаточную статистику, мы просто задаем точку в системе координат, что является более удобным при рассмотрении задач статистической теории решений. Обозначим первую координату в данной системе через достаточную статистику U, & остальные (N — 1) координат, которые не будут влиять на наше решение, — через (N — 1)-мерный вектор у. Таким образом, A{R)=AAL,Y)=P'-y^l\Hl) <57> Теперь выражение, стоящее в правой части, можно переписать в виде А(L| Y) = РпиЛЦН^^^н,) Р/|я.<М^Ру,/Ря.<тЛо> V ' Если / есть достаточная статистика, то A(R) должно сводиться к A(L). Это означает, что вторые члены в числителе и знаменателе должны быть равны. Другими словами, ^|/.я.(У1^Яо)=Ру|/,я,(У1^-Я1)> (59) так как плотность вероятности величины у не может зависеть от того, какая из гипотез является верной. Видим, что выбор достаточной статистики сводится просто к выбору системы координат, в которой одна координата содержит всю информацию, необходимую для принятия решения. Остальные координаты не содержат никакой информации, и с точки зрения вынесения решения их можно не принимать во внимание. В примере 1 новую координатную систему можно было получить просто путем поворота. Например, когда N = 2 1 -(Κι+Я.). Y=-^(Ri-Rd- (60) ]/2 ]/2 В примере 2 новая система координат явилась результатом преобразования в полярные координаты. Так, для N = 2 L = R±* + R2\ r = arctg^. (61) Αϊ Заметим, что вектор у может быть выбран с таким расчетом, чтобы наглядность условия (59) достигалась возможно более простым спо-, собом. Единственное требование сводится к тому, что пара (/, у) должна 48
описывать любую точку пространства наблюдений. Следует также отметить, что условие PyvtV№=PyVi.W\nj (62> никак не влечет за собой (59), если / и у независимы при гипотезах #ι и #0. Мы будем часто выбирать у так, чтобы обеспечить эту независимость и затем использовать (62) для проверки того, что I является достаточной статистикой. 2.2.2. Качество критерия обнаружения: рабочая характеристика приемника Чтобы завершить наше обсуждение простой бинарной задачи обнаружения, необходимо оценить качество критерия отношения правдоподобия. Качество критерия Неймана — Пирсона полностью определяется величинами Рр и PD. Нетрудно заметить, что байесов риск Я в можно найти непосредственно из (42), если известны Рр и PD» Таким образом задача состоит в вычислении PF и PD. Начнем с рассмотрения примера 1, обсуждавшегося в § 2.2. К Пример 1. Из (25) следует, что эквивалентный критерий можно записать в виде Чтобы нормировать последующие вычисления, здесь произведено умножение (25) на olY~N т. При гипотезе Н0 критерий / находят путем сложения N независимых нормальных случайных величин, имеющих нулевые средние и дисперсии? σ2, и последующего деления на ~\/Νσ. Следовательно, / есть N (0, 1). При гипотезе Нг критерий / есть Ν (ΫΝηιΙσ, 1). Плотности вероятности при этих гипотезах представлены графически на рис. 2.8,а. Там же отмечен порог. Очевидно, что PF есть просто площадь под кривой рцН (L \Н0) вправо от линии порога, т. е. оо р"= 1 тк-ехр{-тЬ· (64> <1ηη)/</ +Γ<//2- где^А"|/Ж tn/σ — расстояние между средними значениями двух распределений. Интеграл (64) табулирован и приводится во многих книгах (например [3 или 4])1)- Обычно пользуются сокращенным обозначением: Л (65) х) См. также [41]. — Прим. ред. 49
oo где erf^ — сокращение от error function—функция ошибок1*, a. erfc*—дополнительная функция ошибок. В этих обозначениях PF = erfc^ In η + т\ (66) (67) Аналогично, PD численно равна площади под кривой рцН (Ц Ях) вправо от линии порога, как показано на рис. 2.8, б: Pd = σο ί (1ηη)/</ +rf/2 V2n exp - (x-d)* dx = ί 7s>4-i)"^>(^-i\ (68) (In r\)fd-d/<2 На рис. 2.9, α представлена зависимость ΡD от Рр при различных значе- ях d, причем g взято в качестве изменяющегося параметра. При η=0 In η = — оо и устройство обработки всегда выбирает гипотезу Нг. Следовательно, PwJWo) Рщ(Щ) п^ б , ^ viW77 InTid *~L Рис. 2.8. Вероятности ошибок: α-—вычисление Рр; б-—вычисление Pq. Рр— 1 и PD = 1. По мере увеличения η вероятности PF и PD уменьшаются. Когда η= оо, устройство обработки всегда выбирает гипотезу Н0 и P/?=PjD=0 Как и следовало ожидать из рис. 2.8, достоверность возрастает монотонно с увеличением d. На рис. 2.9, б эта зависимость представлена в другом *> Обычно табулируют функцию erf (X) = "ρ/2/π jexp (—y2)dy, которая о связана с (65) очевидным образом. 50
виде; в качестве аргумента взято d, а параметром является Рр. Для заданного d можно получить любую точку на кривой путем соответствующего выбора ц < Изображенную на рис. 2 9, α зависимость называют рабочей характеристикой приемника (РХП). Она полностью описывает достоверность испытания (качество критерия) в функции интересующего нас параметра. ι,ο 0,6 0,2 L /а-г,о 1 /f Iff/ \Шг ' \Г¥ s ψ/ и* Ms ¥ I ^"V<^ ^^ЛГ / У^ У^ s <o/ / /0,5 / f / / / / ι -j ι 1 0,2 0,4» 0,6 o,6 PF Рис. 2.9. Рабочая характеристика приемника: α-случай гауссовых случайных величин с неодинаковыми средними значениями; б-завйси- " у ' мость вероятности обнаружения от d. Частным случаем, который будет иметь большое зачение при рассмотрении систем связи, является случай, когда мы стремимся свести к минимуму полную вероятность ошибки P(e)AP0/V +РгРМ. (69а> Порог для этого критерия определяется выражением (40). Для частного случая, когда Р0 = Ръ П°Р0Г η = 1 и (69б> (70) Pto = Y (pf+Pm). Подставив (67) и (68) в (69), имеем d/2 Из (70) виДно, что выражение для Ρ (ε) можно также получить, используя РХП Однако, если интерес представляет только установка порога, то, вообще говоря, Ρ (ε) проще вычислить непосредственно. Прежде чем рассчитать достоверность обнаружения для остальных двух примеров, стоит указать две простые границы дополнитель- 51
to 0,5 0,3 0,1 &Q1 1001 ' \\ ~erfcj*)\ IWxY 1 ί 1 ΫΖΛΧ νϊ> r— fX>/2 x3/z \ \ I ной функции ошибок erf с* (X). Они дадут нам возможность рассматривать ее примерное поведение в аналитической форме. Для Х>0 <erlc'w<FsTMp (71) Эту границу можно получить путем интегрирования по частям (см. задачу 2.2.15 или в [30]). Второй границей служит erf<UX)<4-exp(-^)> *>0, (72) Рис. 2.10. Графики функции erfc* (X) и других связанных с ней функций. которую также весьма просто вывести (см. задачу 2.2.16). Четыре соответствующие кривые представлены на рис. 2.10. Легко видеть, что erfc* (X) спадает экспоненциально. Рабочие характеристики приемника для двух других примеров также представляют интерес. Пример 2. В этом случае критерий записывается в виде ^ β χ 2σ02σι? / σ0 \ l^-lRi2^^=^(l^-Nlatrb (σι>σο)· (73) Расчет качества критерия для произвольного N несколько утомителен, поэтому мы отложим его до § 2.6. Особенно простой и часто встречающийся в практике случай соответствует N = 2. По гипотезе Н0 координаты г$ — независимые нормальные случайные величины с нулевыми средними и с дисперсиями, равными σ02: PF= Ρ (Ι > V I Ho) = P (ггЧ-г22 > У I H0). (74) Для оценки выражения, стоящего в правой части (74), перейдем к полярным координатам: *= V г г* + г22 > r1 = 2cos]9, z- r2 = 2sin9, 9 = arctg r2 (75) Тогда Ρ (г2 > ν I 2π οο H0)=§dQ j* ο Yy 1 2яай* exp Ζ2 2σ02 dZ. (76 52
Интегрируя по переменной Θ, получим оо Я,- Jz-L«p(-JL)«. (77, Замечаем, что / —достаточная статистика, равная ζ2. Заменяя переменные, получим ''4^Ч-^Ь=ехр(-1^)' (78) (Отметим, что плотность вероятности достаточной статистики — функция экспоненциальная). Аналогично р- = ехр(-^)· (79) )жно объединить (' PD=(PFy*la*\ (80) Для построения РХП можно объединить (78) и (79), чтобы исключить порог у. Это дает В логарифмической форме InP0=-^lnPF. (81) Как и ожидалось, достоверность обнаружения улучшается монотонно по мере увеличения отношения σ 2/σ02. Более подробно мы исследуем этот случай и его обобщения в § 2.6. Два пуассоновских распределения составляют третий пример. Пример 3. Из (38) критерий отношения правдоподобия (КОП) имеет вид η ^ -TJ \ -=У (Щ > т0). (82) Но lnmx — lnm0 Ввиду того,что η принимает только целочисленные значения, удобнее переписать (82) в виде Иг п^Уг, Vi = 0, 1, 2, ..., (83) Но где γχ принимает только целочисленные значения. Используя (35), имеем я = 0 а из (36) Υι-1 3D = l-e-^2~f\' Yi = 0,l,2,..., (84) (m0)n я = 0 53 />F-l-e — 2^' Υι = 0, 1, 2, .... (85)
Результирующая РХП для некоторых значений пц и ηΐχ представлена на рис. 2.11, а. Видим, что она состоит из ряда точек и что при изменении порога от 0 до Ι Ρ ρ изменяется от I до 1 — е~т°. Допустим теперь, что нужно получить промежуточное значение Рр, скажем I — -о-е °. Для достижения заданной до- рр Цв φ 0* V 1 ° 1 о 5 7 °в ' оЗ "о* α h ог / / / / * / / / / * Ι* ι 2 J й α . и D-^i VN /1 V / / / / от0*2,т^Ч ит0~Ч,т1-ю\ 1 1_._ I 0,2 ол 0,6 а) 0,8 PF о т0*2, тг~Ь ат0 = 4у т1 =/0 0t4 0,6 *) 0,3 Рис. 2.11. Рабочая характеристика приемника: а —задача Пуассона; б—при рандомизированном правиле решения. стоверности обнаружения поступим следующим образом. Обозначив КОП с уг = 0 как КОП № 0, а КОП с уг = I как КОП № I, получим следующую таблицу: КОП № 1 ° 1 Vi 0 1 Pf 1 1— e""*o Pd 1 1—е—»*ι Для получения требуемой величины PF используем КОП № 0 с вероят-' ностью 0,5 и КОП № 1 с вероятностью 0,5. Алгоритм испытания состоит в следующем: если η = 0, то утверждаем Нг с вероятностью 0,5, Н0 с вероятностью 0,5, если η > I, то утверждаем Нг. Подобная процедура, в которой некоторым вероятностным образом объединяются два критерия отношения правдоподобия, носит название рандомизированного правила решения. Результирующая вероятность PD представляет собой просто взвешенную комбинацию вероятностей обнаружения для двух испытаний: PD = 0,5(1)+0,5(l— e~mi)=l— 0,5e~mi. (86) Мы видим, что РХП для рандомизированных испытаний представляет собой прямые линии, которые соединяют точки рис. 2.11, а, как показано на рис. 2.11, б. Причиной того, что мы встречаемся с рандомизированным критерием, является то обстоятельство, что наблюдаемые случайные величины дискретны. Поэтому Л (R) есть дискретная случайная величина, и если использовать обычный критерий отношения правдоподобия, то возможны лишь определенные значения PF. 54
Рассматривая выражения для PF в уравнений (56) и заменяя пороговую величину на η, получаем оо Рг(1\)=\рмнЛХ\И*)аХ. (87) η Если величина Ρρ(η) является непрерывной функцией η, мы можем получить заданную величину в пределах от 0 до 1 путем соответствующего выбора η, и поэтому рандомизированные испытания никогда не потребуются. Этот пример является единственным интересующим нас в дальнейшем результатом (см. задачу 2.2.12). -Используя результаты данных примеров.как исходные, установим теперь несколько общих свойств рабочих характеристик приемника. Ограничимся рассмотрением случая непрерывных критериев отношения правдоподобия. Два свойства любых РХП вытекают непосредственно из приведенного примера. Свойство 1. Все непрерывные критерии отношения правдоподобия имеют РХП, которые обращены вогнутостью вниз. Если бы это было не так, то рандомизированный критерий был бы лучше. Но это противоречило бы нашему утверждению, что критерий отношения правдоподобия оптимален (см. задачу 2.2.12). Свойство 2. Все непрерывные критерии отношения правдоподобия имеют РХП, которые проходят выше линии PD = PF. Это всего лишь частный случай свойства 1, так как точки (PF = О, Ρ о = 0) и (Pf = 1, Pd = 1) имеются на всех РХП. Свойство 3. Тангенс угла наклона РХП в некоторой точке равен значению порога η, необходимому для достижения PD и PF в этой точке. Доказательство: оо f оо Pd = J Ра\н, (Л|ЯХ) dA, Pf = $ Рл ι я0 (Л IH0) dA. (88) η η Дифференцируя оба выражения по η и записывая результаты в виде отношения, имеем D _ / /fn п /νι I И\ Α Ό (89) (90) dPD/dr] — рЛ, Ηι (η 1 Ях) dPp/dri -рл , Яо (η Ι Но) теперь, что Ра и/, (η Ι^ι) _ dPD dPF Рл ι я. (ι ι #о) Пусть Ω(η)Α{Κ|Λ(Κ)>η}=[Κ|Α^|^ >ч (91) 55
Тогда Ро(ч)ЬР{А(Ъ)>х]\Н1}= $ Pr)MR|tfi)<m = Ω (η) = ξ A(R)pr|tf.(R|tf0)tfR, Ω (η) (92) где последнее равенство вытекает из определения отношения правдоподобия. Используя определение Ω (η), последний интеграл можно переписать в виде оо Pd (η) = J Л (R) pr, //. (RIЯ0) rfR = $ Хрл ι я0 (XIЯ0) d*. (93) Ω (η) η Дифференцируя (93) по η, получаем dPD(r\) dx\ = — ηρΛ|//#0ΐΙ#ο). (94) Приравнивая выражение для dPDldv\ в числителе (89) к правой части (94), получаем требуемый результат. *Мы видим, что этот результат не противоречит примеру 1. Тангенс угла наклона кривых рис. 2.9, а при d, отличном от нуля, равен нулю в точке PF = PD = 1 (η = 0) и бесконечности в точке Pf = Pd = 0 (η = <*>)· Свойство 4. Если максимальное значение баейсова риска принадлежит к интервалу (0, 1) на оси Р1у то минимаксная рабочая точка есть точка пересечения 4прямой (Сц-Соо) + (Coi-Сгг) (l-PD)- -(C10-C00)PF = 0 (95) и соответствующей РХП [см. (46)]. На рис. 2.12 показан частный случай, определяемый уравнением (50), CfPf = CmPm=Cm(1-Pd), (96) график которого нанесен на РХП примера 1. Мы видим, что он начинается в точке PF = 0, PD = 1 и пересекает линию Р/?= 1 в точке, где Pd = 1_-£l. (97) Этим завершается рассмотрение задачи испытания двух гипотез* В заключение еще раз выделим несколько основных положений. 1. Какой бы критерий мы не использовали — Байеса или Неймана — Пирсона — оптимальным испытанием является проверка от- 56
ношения правдоподобия. Следовательно, независимо от мерности пространства наблюдений испытание сводится к сравнению скалярной величины Л (R) с порогом. (Мы полагаем Рр (η) непрерывной). 2. Во многих случаях структуру алгоритма проверки отношения правдоподобия можно упростить, если можно установить достаточную статистику. Геометрически эта статистика есть та координата в соответствующей координатной системе, описывающей пространство наблюдений, которая содержит всю необходимую для принятия решения информацию. 3. Полное описание качества критерия отношения правдоподобия было получено путем построения зависимостей условных вероятностей Pd и PF от порога η. Результирующей РХП можно пользоваться для вычисления байесова риска при любом наборе стоимостей. Во многих случаях интерес представляет только одно значение порога и знания всей РХП не обязательно. Ряд интересных бинарных испытаний рассмотрен в задачах. 23. Случае Μ ттты Следующим случаем, представляющим для нас интерес, является ситуация, когда необходимо выбрать одну из Μ гипотез. В простом испытании двух гипотез имелись две выходные величины источника, каждая из которых соответствовала одной гипотезе. В простом испытании Μ гипотез имеется Μ выходных величин источника, каждая из которых соответствует одной из Μ гипотез. Как и ранее, предполагается, что принятие решения обязательно. Таким образом, имеется М2 альтернатив, которые могут иметь место всякий раз, когда проводится эксперимент. Согласно критерию Байеса каждой из этих альтернатив приписывают некоторую стоимость и, полагая, что задана система априорных вероятностей Р0, Piy ..., Рм-\, минимизируют риск. Обобщение критерия Неймана — Пирсона на случай Μ гипотез также возможно. Ввиду того,что им на практике пользуются не столь широко, в последующем изложении мы рассмотрим только критерий Байеса. Критерий Байеса. Для отыскания байесовского критерия обозначим стоимость каждого образа действия через Ctj. Первый символ подстрочного индекса означает, что выбрана ί'-я гипотеза. Второй символ означает, что истинной является /-я гипотеза. Обозначим область пространства наблюдений, в которой мы выбираем Hit через Ziy априорные вероятности — через Pt. Модель изображена на рис. 2.13. Выражение для риска записывается η виде м-\ м— ι #= Σ Σ PjCu] prlHMH3)dR. (98) Чтобы найти оптимальный критерий Байеса, будем просто изменять Ζι с целью минимизации Я, что является непосредственным раз- 57
Источник сообщений. «1 bwjwo Пространстве наблюдений Ζ М-1 Рис. 2.13. Задача с Μ гипотезами. витием метода, используемого в бинарном случае. Ради простоты обозначений в основном тексте рассмотрим только случай Μ — 3. Замечая, что Ζ0 = Ζ — Zt — Z2, так как эти области являются непересекающимися, получаем <Я = Р0С00 $ Pr\HAK\Ho)dR + P0C10l Pr{Ho(R\H0)dR + ί*—Zj—Zg Zj + P0C20$/7r|„0(R|tf0)tfR-fP1C11 \ Pr\H1(R\H1)dR + Z2 Ζ—-Z0— Z2 + Pi Coi S Pr ι я, (R | H,) dR + Рг C21 ξ pr | Hi\R | Я2) tfR + Z0 Z2 + P*C„ l рг\нАЯ\Нг)аП+РгС0^рг^нЛ^\Н,)аК + Ζ— Zq — Ζχ Z0 +^c125pr,„s(R|W2)rfR. (99) Это выражение сводится к Я=^Р0С00 + Р1С11+Р2С22+ ξ [Р2(С02-С22)рг,я2 (Р|Я2) + + ^i (С01 -Сп) рг, я, (R | Ях)] tfR + $ [Р0 (С10-С00) рг, я0 (R | Н0) +ч + ^2 (С12-С22) /?г, я, (RI^2)1 rfR + I IPo (Qo-Coo) Рг ι я. (RIН0) + ζ2 + Pi (Qi-Qi) Рг ι я, (RI #i)l <*R. (100) Как и ранее, первые три члена представляют фиксированную стоимость, а интегралы — переменную стоимость, которая зависит от выбора Ζ 0, Zi и Z2. Вполне понятно, что каждое R мы ставим в соответствие той области пространства, в которой значение подынтегральной функции является наименьшим. Обозначая указанные подын- 58
тегральные функции через 10 (R), /i (R) и /2 (R), получаем следующее правило: если 10 (R) < /4 (R) и /2 (R), то выбираем Я0, если Ii (R) < /0 (R) и /2 (R), то выбираем Ни (101) если /2(R)</0(R) и /i (R), то выбираем #2. Можно записать отношения правдоподобия, определив *»<*>* ?""'«!??· Ам^": '"·'«! «Ι ■ (102) Используя (102) в (100) и (101), имеем Нг ИЛИ #2 ^(C^-CuJMR) 3= ^(Cio-C^ + P.iCn-CcJA.iR), (103) Я0 ИЛИ #2 ->\г я2 или яг Р* (Со2-С22) Л2 (R) ^ Л (Qo-Coo) + Pi (C21-C01) Лх (R), (104) Я0 или Ht Я2 или Я0 P2(C12-C22)A2(R) 5= PoiCso-CxoRPiiC^-CuJMR). (105) Я1 или Я0 Видно, что правила решения соответствуют трем линиям в пло- скостиЛь Л2. Нетрудно показать, что эти линии пересекаются в одной общей точке, и, следовательно, однозначно определяют три области решений, как показано на рис. 2.14. Для трехальтернативной задачи пространство решений является двумерным. Легко убедиться, что Μ гипотез всегда приводят к пространству решений, имеющему не более чем (М -— 1) измерений. Несколько частных случаев будут полезны при последующем изложении. Первый случай соответствует условию M*W uw "о Н2 \аоз) ■ у/фЯ- "/ ^00 — ^11 — ^22 ~ ^, С„=1, ίφΐ. (106) Рис. 2.14. Пространство решений. Эти равенства означают, что любая ошибка имеет равную значимость. Из (98) следует, что это соответствует условию минимизации полной вероятности ошибки. Подставляя (106) в (103) — (105), получаем Нх или Я2 Я2 или Ht Р1ЫЮ 55 Λ» ^A,(R) 5= P„ H0 или Я2 Я0 или Ht Я2 или Н0 P2A2(R) =£ РгААК). Нх или Я0 (107) 59
Области решений в плоскости (Ль Л2) показаны на рис. 2.15, а. В этом частном случае можно непосредственно перейти к плоскости (In Л1э In Л2) (рис. 2.15, б). Соответствующие уравнения имеют вид InA^R) Нх или Н2 η г0 In Ht или Я, η lnA2(R) ^ ln-^, ?2 H% или Ht lnA2(R) " 2s ΊηΑ^ΙΟ + Ιη ^-· Я. или Я, ^4 (108) Выражения (107) и (108) адекватны, однако они не позволяют уяснить одну существенную интерпретацию устройства обработки. Для выяснения этого необходимо произвести незначительное преобразование. lnA2(R)k Лг(Щ)> ро/рг »г Н0 / / »1 Po/Pt а) Л, (Я) "о нг ψρο/ρι *) -InAffR) Рис. 2.15. Пространства решений. Подставляя (102) в (103) — (105) и умножая обе части всех неравенств на рГ|я0 (R|#0i, получаем Я, или Нг #о или Ht Нг или Нх РгРг\нЛЪ\Нг) 3£ P0pr|H.(R|H0), Нщ или Нх Н2 или tf# РгРгЦнАЪт 2£ РгРг^нЛЩ^). Нх или #© (109) Из (109) видно, что эквивалентный критерий заключается в вычислении апостериорных вероятностей Ρ (Н0 | R), Ρ (Нх | R) и Ρ (Η2 | R) и выборе наибольшей из них. Это достигается просто путем деления обеих частей каждого неравенства на pr (R) и исследования полученного критерия. По этой причине устройство обработки, реализующее критерий минимальной вероятности ошибки, часто называют вычислителем максимальной апостериорной вероятности. Обобщение на случай Μ гипотез является очевидным. 60
В следующих двух случаях мы имеем дело с вырожденными критериями. Результаты обоих случаев будут использоваться позднее в различных прикладных вопросах. Представляет интерес вырожденный случай, когда мы объединяем Я ι и Я2. Тогда Ради простоты положим С οι = wo = С20 ^02 (ПО) (П1) (112) (113) Л,Щ Тогда (103) и (104) сводятся к #1 или Нг ^iA1(R) + P2A2(R) S Р0, я0 а (105) превращается в тождество. Области решений изображены на рис. 2.16. Поскольку мы совсем исключили стоимостный эффект принятия решения (выбора между Hi и Я2), то задача сведена нами к бинарной. Рассмотрим далее метод фиктивной гипотезы. Сущность метода иллюстрируется простым примером. Реальная задача имеет две гипотезы Hi и Я2, но иногда мы можем упростить вычисления введением фиктивной гипотезы Я0> вероятность реализации которой равна нулю. Положим Ро = 0, Р4 + Р2= 1 и (114) С 12 = С о2> v>2i =_Οοΐ· Если подставить эти значения в (103) — (105), то из (103) и (104) следует, что мы всегда выбираем либо Я4, либо Я2, и критерий сводится к <*,«> Ptfc 2.16. Пространство решений. н* Ра(С12-С22) A2(R) ^ PxiC^-C^MR). (115) Нг Обращаясь к (12) и вспоминая определение At (R) и Л2 (R), мы убеждаемся, что полученный результат является точно таким, какой и следовало ожидать. Достаточно только поделить обе части (12) на Рт\нй (R | Я0). На первый взгляд этот метод кажется абсурдным, однако он оказывается полезным, когда отношением Pr,//2(R|tf2) Pn^iRltfi) 61
пользоваться затруднительно, а отношения Л4 (R) и Л2 (R) можно упростить соответствующим выбором /?г|я0 (R|#0). В данном параграфе изложены основные результаты, необходимые для решения многоальтернативных задач. Мы не рассматривали каких-либо конкретных примеров, поскольку подробности, связанные с построением отношений правдоподобия, в этом случае не отличаются от деталей бинарной ситуации. Типичные примеры приводятся в качестве задач вне основного текста. Следует подчеркнуть ряд важных моментов. 1. Минимальная размерность пространства решений не превышает (М — 1). Границами областей решений являются гиперплоскости в пространстве (Ль ..., Ам-ι). 2. Оптимальный критерий отыскивается простым и непосредственным способом. Однако при рассмотрении конкретных примеров мы убедимся, что вычислить вероятности ошибок часто бывает довольно трудно. 3. Особый интерес представляет критерий минимальной полной вероятности ошибок. В этом случае мы вычисляем апостериорную вероятность каждой гипотезы Ρ (Ht | R) и выбираем ту гипотезу, для которой эта вероятность наибольшая. Нам представится возможность оценить эти выводы более полно при рассмотрении различных приложений·: Двумя изложенными параграфами завершается наше обсуждение задачи испытаний простых гипотез. Заслуживающим внимания случаем, который нами еще не рассмотрен, является ситуация, когда несколько выходных величин источника комбинируются так, что даюТ основание для единой гипотезы. Для изучения этой задачи обнаружения нам понадобятся некоторые идеи теории оценок. Поэтому мы прервем изложение задачи испытания сложной гипотезы до § 2.5 и займемся рассмотрением задачи отыскания оценок. 2.4. Теория оценок В последних двух параграфах мы рассмотрели задачу, в которой реализуется одна из нескольких гипотез. Как результат реализации какой-либо гипотезы наблюдается векторная случайная величина г. Основываясь на результатах наблюдений, мы пытаемся выбрать правильную гипотезу. В данном параграфе мы обсудим задачу оценки параметра. Прежде чем формулировать общую задачу, рассмотрим простой пример. Пример 1. Нужно измерить напряжение а в некоторый, причем единственный, момент времени. Из физических соображений известно, что значение напряжения заключено в пределах от —V до + V вольт. Измерению сопутствует помеха, которую можно представить как независимую аддитивную нормальную случайную величину η с нулевым средним. Наблюдаемой величиной является г. Таким образом, г = а + п. (116) 62
Плотность вероятности, описывающая процесс наблюдения, — pr, (R\A)~ В данном случае 1 / (R-A)* Задача заключается в наблюдении г и оценке величины а. (117) Правило оценки Рис. 2.17. Модель процедуры оценки. Приведенный пример иллюстрирует основные моменты задачи отыскания оценки. Модель общей задачи оценки изображена на рис. 2.17. Эта модель содержит следующие четыре элемента. 1. Пространство параметров. Выходная величина источника есть некоторый параметр (или переменная величина). Мы рассматриваем, ее как точку в пространстве параметров. В случае одного параметра, который мы рассматриваем первым, это соответствует отрезку на прямой — со < А < со. В примере, приведенном выше, таким отрезком был ( — У, V). 2. Вероятностное отображение из пространства параметров в пространство наблюдений. Это вероятностный закон, описывающий влияние а на результаты наблюдений. 3. Пространство наблюдения. В классической задаче это пространство с конечным числом измерений. Точка в этом пространстве обозначается вектором R. 4. Правило оценки. После наблюдения R может возникнуть необходимость оценить значение а. Эту оценку мы обозначаем как a (R). Процедура отображения пространства наблюдений в оценку называется правилом оценки. Данный параграф посвящен исследованию различных правил оценки и их реализаций. Второй и третий этапы общей задачи оценки известны из задачи обнаружения. Новыми моментами здесь являются пространство параметров и правило оценки. При попытке описать пространство параметров мы различаем два случая. В первом случае параметр является случайной величиной, поведение которой описывается плотностью вероятности. Во втором — параметр является неизвестной, но не случайной величиной. Эти два случая аналогичны моделям источника, встречавшимся нам при рассмотрении задачи испытания гипотез. Для каждой из указанных моделей пространства параметров мы выработаем соответствующие правила оценок. Рассмотрим сначала случай, когда параметр является случайной величиной. 2.4.1. Случайные параметры. Байесовская оценка В байесовской задаче обнаружения двумя величинами, которыми необходимо было задаваться, являлись система стоимостей Съ$ и система априорных вероятностей Рь. Стоимости всех возможных образов 63
действия определялись стоимостной матрицей1). Поскольку у нас имелось Μ гипотез и Μ возможных решений, то было Λί2 стоимостей. В задаче оценки а и a (R) являются непрерывными величинами.* Следовательно, мы должны приписать некоторую стоимость всем парам [a,a(R)l во всей интересующей нас области изменения. Указанная стоимость является функцией двух переменных, которую обозначим через С (а, а). Во мггогих случаях, представляющих интерес, можно ША£) Шас) 1 6) Рис. 2.18. Типичные функции стоимости (потерь): «—средний квадрат ошибки; 6 —абсолютная ошибка; β—равномерная функция потерь. вполне реалистично предполагать, что стоимость зависит только от погрешности (ошибки) оценки. Обозначим эту ошибку как a8(R)£a(R)-a. (118) Функция стоимости или лотерь С (αε) есть функция одной переменной. Некоторые типичные функции стоимости показаны на рис. 2.18. Функция стоимости ри^. 2.18, а есть просто квадрат ошибки С(ае) „2 (119) Эту функцию обычно называют квадратичной функцией стоимости (потерь). Нетрудно заметить, что она подчеркивает значимость больших ошибок. Функция стоимости рис. 2.18, б является абсолютной величиной ошибки С (ае) == | аъ | (120) На рис. 2.18, β всем ошибкам меньше ±Δ/2 приписывается нулевая стоимость. Другими словами, ошибка величиной не более Δ/2 по стоимости оценивается наравне с отсутствием ошибки. Если же αε>Δ/2, то ошибке приписывается единичная стоимость: C(at)=0, К1< |αβ|> 2 2 (121) В любой конкретной задаче мы выбираем функцию стоимости из двух соображений. Во-первых, желательно, чтобы функция стоимости х) Или матрицей потерь. — Прим. перев. 64
служила адекватной мерой степени удовлетворения потребителя. Зачастую бывает затруднительно указать аналитическую меру тому, что принципиально может являться качеством субъективным. Наша цель заключается в отыскании оценки, которая минимизирует ожидаемую величину стоимости. Поэтому второе соображение при выборе функции стоимости заключается в том, чтобы задаться такой функцией стоимости, которая приводила бы к разрешимой задаче. На практике функции стоимости обычно выбираются как компромисс между этими двумя требованиями. Следует заметить, что во многих представляющих интерес задачах одна и та же оценка может быть оптимальной для широкого класса функций стоимости. Подобно априорным вероятностям в задаче обнаружения в задаче оценки случайного параметра предполагается известной априорная плотность вероятности ра(А). Если же ра (А) неизвестна, то можно использовать процедуру, аналогичную минимаксному испытанию (правилу минимакса). Если функция стоимости и априорная вероятность заданы, то можно написать выражение для риска: оо оо ^A£{C[a,a(R)]}= j dA j C[A, a(R)]pa,y (A, R)dR. (122) — oo — oo Математическое ожидание в (122) берется по случайной величине а и наблюдаемым величинам г. Для стоимостей, являющихся функциями только одной переменной, (122) можно записать в виде оо оо Я= \ dA j С [A—ct(R)\pa,t(A,R)dR. (123) ι— оо — оо Байесовская оценка — это оценка, минимизирующая, риск. Байесовские оценки для функций-стоимости, приведенных на рис. 2.18, мо>кно найти простым и непосредственным способом. Для функции стоимости рис. 2.18, а риск соответствует средцеквадратической ошибке. Обозначим риск для критерия среднеквадратической ошибки через Лтъ. Подставляя (119) в (123), получаем ' оо оо ^ms= j dA j dR[A— a(R)]2pa,t(A, R). (124) — oo —oo Выражение для совместной плотности вероятности можно переписать в виде ~" Ра.г(А,Ю = рг(К)ра\г(А\К). (125) Используя (125) в (124), имеем оо оо Лт5 = j dRpr(R) § dA[A-a(R)\2Pau(A\R). (126) 3 Зак. 693 65
Внутренний интеграл и pr (R) в (125) неотрицательны. Следовательно, J#ms можно минимизировать путем минимизации внутреннего интеграла. Обозначим эту оценку как dms (R). Для ее отыскания продифференцируем внутренний интеграл по a (R): * j dA[A-a(R))2 раИ(А\К) = -2 ] Ара1 г (А \ R)dA + аа — оо —-оо оо + 2^(R) J Pa]r(A\R)dA. (127) — оо Приравнивая результат нулю и замечая, что второй интеграл равен единице, получаем оо fln.8(R)= J A4i4/>e|r(i4|R). (128) — оо Этот минимум является единственным, так как вторая производная равна постоянной величине, равной 2. Член в правой части (128) известен как среднее значение апостериорной плотности (или условное среднее). Из (126) видно, что если a (R) — условное среднее, то внутренний интеграл есть просто апостериорная дисперсия (или условная дисперсия). Поэтому минимальное значение J?ms есть просто среднее условной дисперсии по всем наблюдениям R. Чтобы найти байесовскую оценку для критерия абсолютной величины ошибки (рис. 2.18, б), напишем выражение для риска: оо оо ч .#.bs== J dRpr(R) j dA[\A-a\R)\]pa]r(A\R). (129) — оо —оо Для минимизации внутреннего интеграла разобьем его на два: а(К) /(R)= $ dA[a(R)—A]paAr(A\R) + — ОО оо + j dA[A-a(R)]palr(A\R). (130) 3(R) Дифференцируя по a (R) и приравнивая результат нулю, получим aabs *R) oo J A4pe,r(i4|R)= j dApair(A\R). (131) Это просто математическая запись определения медианы апостериорной плотности. 66
Третьим критерием служит равномерная функция стоимости рис. 2.18, в. Выражение для риска в этом случае имеет вид ■#unf= J rfRpr(R) 2unf(R)+A/2 1- I Pa\r{A\ 3unf(R)-A/2 R)dA (132) rM№ Для минимизации риска необходимо максимизировать внутренний интеграл. Особый интерес представляет случай, когда Δ является сколь угодно малым, но отличным от нуля числом. Типичная апостериорная плотность вероятности изображена на рис. 2.19. Нетрудно заметить, что для малых Δ наилучшим выбором для a (R) является такое значение Л, при котором апостериорная плотность имеет максимум. Обозначим Оценку | Максимум для указанного частного случая как amap(R) — максимальную апостериорную оценку. В последующем amap (R) используется без дополнительного упоминания единичной функции стоимости. Для отыскания атар нам необходимо знать положение максимума Pa\r (A\R). Так как логарифм — функция монотонная, то расположение максимума можно одинаково успешно отыскать по функции In pa\r {А | R). Как было показано в задаче обнаружения, такой прием часто бывает более удобным. Если максимум лежит внутри допустимой области изменения Л и In pair (А | R) имеет непрерывную первую производную, то необходимое, но недостаточное условие отыскания максимума можно получить путем дифференцирования In pa\r (A | R) по А и приравнивания результата нулю: Рис. 2.19. Апостериорная плотность. d\npa,r(A\R) дЛ = 0. (133) А~а (R) Уравнение (133) мы называем уравнением максимальной апостериорной вероятности. В каждом случае необходимо убедиться, является ли решение абсолютным максимумом. ■ Выражение для ра\х (А | R) можно переписать с тем, чтобы разделить роли наблюдаемого вектора R и априорных сведений: Pa\r(A\R) = ΡΓΐα4(«Μ)Ρα(Λ> Pr (R) (134) Прологарифмировав, получим 1пра|г(Л|К) = 1прг|в(К|Л) + 1прв(Л) —ln^(R). (135) 3* 67
Для оценки по максимуму апостериорной вероятности нам необходимо только найти такое значение Л, при котором левая часть (135) максимальна. Так как последний член правой части от А не зависит, то достаточно рассмотреть только функцию l(A)b\npr{a(R\A)4+lnpa(A). (136) Первое слагаемое дает вероятностную зависимость R от Л, а второе слагаемое характеризует априорные сведения· Уравнение максимальной апостериорной вероятности можно записать в виде Ы (Л) дЛ _d\nprla(R\A) A = a(R) дЛ, + 'д\пра(А) дЛ = 0. (137) А=а(Ю При дальнейшем изложении оценкам по минимуму среднеквад- ратической ошибки и по максимуму апостериорной вероятности будет уделяться основное внимание. Для изучения вопросов применения двух указанных процедур оценки рассмотрим примеры 2—4. Пример 2. Пусть г. = а + пи ΐ=1, 2, ..., N. (138) Предполагается, что а — нормальная величина, N (0, σα), a «j — независимые нормальные величины, N (0, ап). Тогда 1 / Л2 \ (139) Для отыскания ams (R) необходимо знать ра\г (Л | R). Один из способов — это найти рг (R) и. подставить найденное значение в (134). Однако такой путь связан с утомительными алгебраическими преобразованиями. Более простой вариант — принять во внимание, что pa\r(A | R) есть плотность вероятности а для любого R. Таким образом, pr (R). учитывается постоянной величиной, необходимой для нормировки, j pa{r(A\R)dA=\. (140) (Другими словами, pr (R) есть просто постоянный нормирующий множитель). Следовательно, Г / N PeirWlR) = X ехр 1 V2n σα MR) Г Ν /=1 Χ + Л2 (Ш) 68
Произведя перегруппировку членов под знаком экспоненты выполнив действие возведения в квадрат и выделив члены, зависящие только от Rf, в постоянный коэффициент, получим pe,rM|R) = A(R)exp|—^-, 2σρ- Л σα* + ση*/Ν где ν*(^ N \- 2 ) Νσα* + οη* (143) — апостериорная дисперсия. Видим, что ра,г (Л | R) есть просто плотность нормального распределения. Оценка же ams (R) есть просто условное среднее 0а« ( 1 ^ \ · ^^'-^τ^ϊΝψ^η· (144) Поскольку апостериорная дисперсия не зависит от R, среднеквадратичен ский риск равен апостериорной дисперсии (см. (126)). В связи с изложенным полезно сделать два замечания. 1. Ri входят в выражение для апостериорной плотности только в виде суммы. Поэтому, N ./'(R)=2 Ri (145> является достаточной статистикой. Это понятие идентично понятию достаточной статистики в задаче обнаружения. 2. При реализации правила оценки имеющаяся информация используется следующим образом. Если σα2 < οη2/Ν, то объем априорных сведений гораздо больше объема данных, полученных в результате наблюдений, и оценка весьма близка к априорному среднему (в этом случае априорное среднее равно нулю). С другой стороны, если σα2 > οη2/Ν, то априорная информация незначительна и при оценке используется в основном принятая информация. В пределе ams есть просто арифметическое среднее Rf. 1 N Hm Sms(R) = — У Rt. (146) σ 2 Ν ***. Να* Оценку по максимуму апостериорной вероятности для этого случая получить несложно. Из (142) следует, что, поскольку распределение вероятностей нормально, максимальное значение ра,г (Л | R) имеет место при условном среднем. Таким образом, amap(R)=Sms(R). (147) Ввиду того, что условная медиана нормального распределения имеет место при условном среднем, получаем aabs(R) = Sms(R). (H8) Итак, мы убедились, что для данного конкретного примера все три функции стоимости рис. 2.18 приводят к одинаковой оценке. Указанная инвариантность по отношению к выбору функции стоимости является, по-видимому, полезной особенностью ввиду субъективности 69
тех соображений, которые часто кладутся в основу выбора С (αε). Некоторые условия, при которых эта инвариантность соблюдается, развиты в следующих двух свойствах функции стоимости1). Свойство 1. Предположим, что данная функция стоимости С (αε) есть симметричная выпуклая функция, обращенная вогнутостью вверх, и что апостериорная плотность pa\r (A | R) симметрична относительно условного среднего, т. е. С(ае) = С(—αε) (симметричность), (149) С(Ьхг + (1—Ь)х2)<ЬС(хх) + (1 — Ь)С(х2) (выпуклость) (150) при любом Ъ внутри области изменения (0,1) и при всех х{ и х2. Уравнение (150) просто утверждает, что все хорды лежат выше кривой функции стоимости, либо на ней. kc(ae) *) */L ^АР Ю Рис. 2.20. Симметричные выпуклые функции стоимости (потерь): а — выпуклая; б—строго выпуклая. Это условие иллюстрирует рис. 2.20, а. Если неравенство (150) при Χί·φχ2 всегда является строгим, то мы говорим, что данная функция стоимости является строго выпуклой (обращенной вогнутостью вверх). Введем величину ζΔ α—ams = a—£[a|R]. (151) Исходя из симметрии апостериорной плотности, можно написать p2lr(Z|R)=p2|r(-Z|R). (152) Оценка а, которая минимизирует какую угодно функцию стоимости в этом классе, идентична ams (т. ё. условному среднему). ' Доказательство. Как и ранее, можно минимизировать условный риск [см. (126)], который запишем в виде Яв&\ R) Δ Еа [С(а-а) | r] =Ea [C(a-a) | R], (153) г) Эти свойства установил Шерман [20]. Наш вывод аналогичен выводу Витерби [36] 70
где второе равенство вытекает из (149). Запишем теперь четыре эквивалентных выражения для JRB (a\ R): оо Яв{а\*) = j C(a-^ffiS-Z)pz,r(Z|R)rfZ= (154) — оо {использовано (151) в (153)] оо = J C(a-ams + Z) Pz\r(Z\R)dZ= (155) — оо [это равенство следует из (152)1 оо = J C(ams-a-Z)pzlr(Z\R)dZ = (156) — оо [это равенство следует из (149)3 оо = j C(ams-a + Z)Pz\r(Z\R)dZ (157) — оо [это равенство следует из (152)1. Используем теперь условие выпуклости (150) вместе с (155) и (157): ^B(aiR)=-i-£({c[z+(ami-a)]+c[z-(ami-a)]}|R)> >£ {c[-i- (Z+ (ams-a)) + -L (Z — (ams—a))j | R} - ^ [C(Z) | R]. (158) Равенство в (158) будет достигнуто, если ams = а. Этим и завершается требуемое доказательство. Если функция С (αε) строго выпуклая, то мы получим дополнительный результат, а именно, что минимизирующая оценка а является единственной и равна ams. Чтобы охватить функции стоимости типа единичных функций стоимости, которые не являются выпуклыми, необходимо установить второе свойство. Свойство 2. Предположим, что функция стоимости есть симметричная неубывающая функция и что апостериорная плотность ра\г (A\f()—симметричная (относительно условного среднего) унимодальная функция, удовлетворяющая условию limC(x)pa\v(x\R) = 0. лг->оо Оценка а, которая минимизирует любую функцию стоимости этого класса, идентична ams. Доказательство этого свойства аналогично приведенному выше [36]. Значения двух указанных свойств не следует недооценивать. На протяжении книги мы рассматриваем только оценки по минимуму среднеквадратической ошибки и по максимуму апостериорной вероят- 71
ности. Свойства 1 и 2 гарантируют, что если апостериорные плотности удовлетворяют указанным выше предположениям, то получаемые нами оценки будут оптимальными для широкого класса функций стоимости. Очевидно, если апостериорная плотность является гауссовой, то(7она удовлетворйет сделанным выше допущениям. Рассмотрим теперь два примера другого типа. Пример 3.41еременная а входит в сигнал в виде нелинейной зависимости. Обозначим эту зависимость через s (Л). Результат каждого наблюдения г$ есть сумма s (Л) и нормальной случайной величины пг·, N (0, ση). Все л/ статистически независимы друг от друга и от а. Таким образом, rt = s{A)+ni. (159) Поэтому N 2 IRi-s(A)]* 1 /Ξι , Л2 pe,r(4|R) = *(R)expl - ^ (160) Это выражение не допускает дальнейшего упрощения, если s (Л) не задано в явном виде. Уравнение максимальной апостериорной вероятности получается подстановкой (160) в (137): «map(R) = ^4y lRt-s(A)\ ds(A) дЛ (161) H=amap(R) Для решения его в явном виде необходимо задать s (Л). Будет показано, что аналитическое решение вообще невозможно, если s (Л) является нелинейной функцией Л. Другой тип часто встречающихся задач связан с оценкой параметра распределения вероятностей. Пример 4 Число событий в эксперименте подчиняется пуассоновскому закону распределения со средним значением а. Таким образом, дп Р(п событий \а = А) = —-ехр(— Л), л = 0, 1, ... · (162) Мы хотим наблюдать число событий и оценить параметр а пуассоновского распределения. Будем полагать, что а является случайной величиной с экспоненциальной плотностью *аМ)-{ Хехр(— λЛ), Л>0, 0 во всех остальных случаях. (163) Апостериорная плотность а равна Р(п = N\a = A)pa(A) 72
Подставляя (162) и (163) в (164), имеем ра , п (А | N) = к (Ν) [ ΛΝ ехр (- А (1 + λ))], А > О, (165) где ,w_.ii±>£±L. „ее, с тем, чтобы интеграл от плотности вероятности равнялся единице. (К^к уже отмечалось, постоянный множитель не имеет значения для оценки по максимуму апостериорной вероятности, но необходим в том случае, если мы отыскиваем среднеквадратическую оценку путем интегрирования условной плотности). Среднеквадратическая оценка есть условное среднее: оо <*ms (N)= -^±^ j Л*+1 ехр[-Л (1 +λ)] dA = 1 о =7ΓΤ^ <"+1>=(ττγ)<"+1)· (Ι67) Для отыскания <imap прологарифмируем (165): In pa]n (A\N) = N In A— A (1 +λ) + Ink (N). (168) Дифференцируя по А} приравнивая результат нулю и решая, получим <W*> = —JV (169) I -f- А Заметим, что отар не равна amS. Другие примеры приводятся в задачах вне основного текста. Наиболее важные результаты данного параграфа сводятся к следующему. 1. Оценка по минимуму среднеквадратической ошибки всегда есть среднее апостериорной плотности (условное среднее). . 2. Оценка по максимуму апостериорной вероятности равна значению величины А> при котором апостериорная плотность имеет мак- мимум. 3. Для широкого класса функций стоимости оптимальная оценка есть условное среднее, если апостериорная плотность является унимодальной функцией, симметричной относительно условного среднего. Эти выводы служат основой для большей части наших дальнейших исследований по теории оценок. Единственным затруднением, с которым мы встретимся при изучении более сложных задач, являются вопросы фактической оценки условного среднего и максимума. Во многих случаях, представляющих интерес, оценки по минимуму среднеквадратической ошибки и по максимуму апостериорной вероятности оказываются одинаковыми. Обратимся теперь ко второму классу задач оценки, упомянутому в введении. 73
2.4.2. Оценка действительных (неслучайных) параметров1) Во многих случаях бывает нереалистичным рассматривать неизвестный параметр как случайную величину. Формулировка этой задачи, приведенная в § 2.4, все еще остается приемлемой. Однако теперь параметр предполагается неслучайным, и нам необходимо построить процедуру оценки, оптимальную в некотором смысле. Самым первым логичным шагом было бы попытаться видоизменить байесовскую процедуру, описанную в § 2.4.1, с тем чтобы исключить среднее пора (А). В качестве примера рассмотрим критерий среднего квадрата ошибки оо Я{А)± j [a(R)-A}2prla(R\A)dR, (170) — оо где математическое ожидание берется только по R, поскольку это единственная случайная величина в нашей модели. Минимизируя Л (Л), получим ams.(R)-A (171) Полученный ответ правилен, однако не имеет никакой практической ценности, поскольку А является неизвестной величиной, которую мы пытаемся определить. Таким образом, такой прямой подход к решению задачи оказывается неплодотворным. Более полезный метод в ситуации с неслучайным параметром — это исследовать другие возможные меры качества процедур оценки, а затем посмотреть, нельзя ли найти оценки, которые являются оптимальными с точки зрения указанных критериев. Первой такой мерой качества, которую нам предстоит рассмотреть, служит математическое ожидание оценки оо E[a(R)]A j a(R)prla(R\A)dR. (172) — оо Возможные значения математического ожидания можно сгруппировать в три различных класса: 1. Если Ε [a(R)l = А при всех значениях Л, то мы говорим, что оценка является несмещенной. Это утверждение означает, что среднее значение оценок равно величине, которую мы пытаемся оценить. 2. Если Ε [a (R)] = А + В, где В не зависит от Л, то мы говорим, что оценка имеет известное смещение. Мы всегда можем получить несмещенную оценку путем вычитания β из a (R). 3. Если Ε [a (R)] = А -\~ В (Л), мы говорим, что оценка имеет неизвестное смещение. Так как смещение зависит от неизвестного параметра, мы не можем просто вычесть его из оценки. *) Первые исследования в области классической теории оценок принадлежат Фишеру [5, б, 7, 8]. Изложение основных идей теперь можно найти во многих работах (например, Крамера [9], Уилкса [10] или Кендалла и Стюарта [II]). 74
Совершенно ясно, что даже несмещенная оценка может дать плохой результат в конкретном испытании. Простой пример иллюстрируется рис. 2.21. Плотность вероятности оценки центрируется около Л, однако дисперсия этой плотности настолько велика, что возможны большие ошибки. Второй меряй качества является дисперсия оценки c*[a(R)-A]=E{[a(R)-A]2}-B*(A). (173) ^Affi) Рис. 2.21. Плотность вероятностей оценки. для Она дает меру рассеяния ошибки. Вообще говоря, мы можем попытаться найти несмещенные оценки с малыми дисперсиями. Простой процедуры минимизации, которая приводила бы к 4*йпм^(И)М) несмещенной оценке с ми- I а*Н)!А нимальной дисперсией, не существует. Поэтому мы вынуждены испытывать процедуру оценки, чтобы убедиться, насколько она оптимальна. Оценка по максимуму π равдоподобия. Существует несколько путей для обоснования процедуры оценки, которую мы будем использовать. Рассмотрим простейшую задачу оценки, намеченную в примере 1. Напомним, что г = А + п, (174) pr\a(R\A)={V^on)-^xp[-^(R-A)^. (175) Выберем в качестве нашей оценки такое значение Л, которое с наибольшей вероятностью обусловило то, что имело место именно данное значение R. В этом простом аддитивном случае мы видим, ч*то такой выбор равносилен выбору наиболее вероятного значения шума (N = 0) и вычитанию его из R. Назовем значение Л, полученное при помощи этой процедуры, оценкой по максимуму правдоподобия Omi(*)=*· (176) В общем случае функцию pr\a (R | А), рассматриваемую как функцию величины Л, называют функцией правдоподобия. Часто приходится иметь дело с логарифмом этой функции In pr\a (R\A), именуемой логарифмической функцией правдоподобия. Оценка по максимальному правдоподобию ат\ (R) — это такое значение величины Л, при котором функция правдоподобия максимальна. Если максимум лежит внутри области изменения величины Л, а функция In pT\a (R| Л) имеет непрерывную первую производную, то необходимое условие, налагаемое 75
на dni (R), получают посредством дифференцирования In pr\ a (R| A) no А и приравнивания результата нулю: — '* ~ =°· (177> д4 И = «т1 (R> Это уравнение называется уравнением правдоподобия. Из сравнения (137) и (177) следует, что оценка по максимуму правдоподобия математически соответствует предельному случаю оценки по . максимуму апостериорной вероятности, когда количество априорной информации стремится к нулю. Для того чтобы проверить, насколько эффективна процедура оценки по максимуму правдоподобия, можно вычислить смещение и дисперсию оценки. Это часто бывает затруднительно сделать. Поэтому вместо прямого подхода к решению задачи мы сначала выведем выражение для нижней границы дисперсии любой несмещенной оценки. Затем произведем сравнение дисперсии йт\ (R) с ее нижней границей. Неравенство Крамера — Рао. Неслучайные параметры. Нам необходимо рассмотреть дисперсию любой оценки a (R) действительной переменной Л. Докажем следующее утверждение. . Теорема а) Если a (R) есть любая несмещенная оценка величины Л, то Р<«-4>(*{р4^П) 2ΐ\ — 1 или, что эквивалентно, б) [i«-4>{-*P*i£^-]} > (178) (179) где предполагается, что удовлетворяются следующие условия: в) производные dpr]a{R\A) и d2pr|ra(RM) дЛ дА2 существуют и абсолютно интегрируемы. Указанные неравенства впервые были сформулированы Фишером [6] и доказаны Дюгуа [31 ]. Они были также выведены Крамером [9] и Рао [12] и обычно называются границей Крамера — Рао. Любая оценка, удовлетворяющая указанной границе со знаком равенства, называется эффективной оценкой. Доказательство этого положения проводится простым использованием неравенства Буняковского —Шварца: Так как оценка a (R) является несмещенной, то оо E[a(R)~A]^ j Pr|a(R|a)[a(R)—^]dR = 0. (180) 76
Дифференцируя обе части по Л, имеем d °° й J pr\a(R\A)[a(R)*-A) dR = — оо = ί ^\Pr\a(R\A)[a{R)-A]}dR = Oy (181) — оо где условие (в) позволяет нам выполнить дифференцирование под знаком интеграла. Тогда оо оо — | Pr\a(R\A)dR + j dp,, (RH) ^(R)_^dR = a (182) — oo —oo °A Первый интеграл равен просто+ 1. Заметим теперь, что Та ~ Та Ρ<>α(κ\Α>· (183) Подставляя (183) в (182), получим J "nP7,(RM) pr,a(R\A)[a(R)-A]dR=L (184) — оо Переписав (184), имеем 1Г'пРгЛ(КМ) ^^'«(RH)][i/pr,a(RH)[a(R)-^JdR=i (185) и, используя неравенство Буняковского — Шварца, получим Χ Μ [a(ty-A]2pr\a(R\A)dR >1. (186) Было/учтено, что в соотношении Буняковского — Шварца равенство выполняется тогда и только тогда, когда '"У -li(W-4»W (187) для всех R и Л. Мы видим, что два члена левой части (186) суть математические ожидания в утверждении (а) (178). Таким образом, В{Ц(М,-Л]1>{в[""'^Л>\у. (188, 77
Для доказательства утверждения (б) заметим, что оо j pt\a(R\A)dR=L — оо Дифференцируя по А, имеем In η . (ff\A\ Рг ία (RI -4) dR = 0. ς dpr]a(R\A) ^ r d_lnpr{a(R\A) 9A - Jx dA Вновь дифференцируя по Л и применяя (183), получим ~· d4npr|e(RM) (189) (190) ί дА* Pr\a(R\A)dR + + l(dlnP<lflA))2pria(R\A)dR = 0 (191) ИЛИ d4npr]a(R\A) дА* }--'[ ainpr|fl(R |i4) дА (192) что совместно с (188) дает условие (б). Относительно этого результата следует сделать ряд важных замечаний. 1. Он показывает, что любая несмещенная оценка должна иметь дисперсию больше, чем некоторое число. 2. Если (187) удовлетворяется, то оценка ат\ (R) будет удовлетворять границе со знаком равенства. Покажем это путем совместного использования (187) и (177). Левое равенство является уравнением правдоподобия. Правое равенство есть не что иное, как (187): 0 = д\пргЫ(К\А) дА А = а ml (R) = (i(R)-A)k(A)\A_ZmxW. (193) Чтобы правая часть была равна нулю, необходимо либо a(R)=^mi(R). либо k{aml)=0. (194) (195) Так как мы ищем решение, которое зависит от результатов наблюдения, то исключаем (195) и требуем выполнения (194). Итак, если эффективная оценка существует, то это и есть ат\ (R) и ее можно получить как единственное решение уравнения правдоподобия. 3. Если эффективной оценки не существует [т. е. д In pr]a (R\A)/dA нельзя привести к виду (187)], то мы не знаем, насколько оптимальной 78
является оценка dmi(R). Кроме того, мы не знаем, насколько близко дисперсия любой оценки будет приближаться к границе. 4. Чтобы использовать границу, нужно убедиться, что рассматриваемая оценка является несмещенной. Аналогичные границы могут быть просто получены для смещенных оценок (задача 2.4.17). Применение процедуры оценки по максимуму правдоподобия и неравенства Крамера — Рао можно проиллюстрировать на примерах 2, 3 и 4. Модель наблюдения является идентичной. Теперь, однако, предполагается, что параметры, подлежащие оценке, суть неслучайные величины. Пример 2. Из (138) имеем П = А + пи /=1, 2, .... N. (196) Логарифмируя (139) и дифференцируя результат по Л, получим Э1прг|в(ЩЛ) Ν ( ι " \ Та -ЩТ!*-*)· (197) Таким образом, 1 N £ml(R) = "дГ2 **· (198) Для отыскания смещения вычислим математическое ожидание от обеих частей (198): 1 Ν 1 Ν E[aml(R)] = — 2 E(Rt)] = —^ Λ = Λ> (199) ί=1 ί=1 так что dml (R) — оценка несмещенная. Поскольку выражение (197) имеет вид, требуемый уравнением (187), то мы знаем, что aml (R) есть эффективная оценка. Чтобы оценить дисперсию, продифференцируем (197): h = —5?· (20°) Используя (179) и тот факт, что рассматриваемая оценка эффективная имеем o2[am(R)-A] = -^. (201) Пропустим пока пример 3 и сразу перейдем к примеру 4. Пример 4. Дифференцируя логарифм (162), получим ,31„Ρ(«-ΛΜΛ) =^-(ΝΙηΑ_Α_1ηΝ,)=±_ι=±.{Ν_Α). {202) дА дЛ А А Оценка по максимуму правдоподобия равна aml(N) = N. (203) 79
Она, очевидно, является несмещенной и эффективной. Для получения диспер сии продифференцируем (202): d2\nP(n = N\A) N Таким образом, W А* ' (204> аЧ2га1(Л^)^Л]=-^=^ =Л. (205) В примерах 2 и 4 мы видим, что оценки по максимуму правдоподобия можно было бы получить из оценок по максимуму апостериорной вероятности [положив σα-> оо в (144) и вспомнив, что ams(R) — = anap (R), а также положив λ->0 в (169)]. Вернемся теперь к примеру 3. Пример 3. Из первого члена экспоненты (160) имеем d\nprla(R\A) 1 " ds(A) Та = 7^2 l*i-'W-br· (206) Вообще говоря, правую часть невозможно записать в виде, требуемом уравнением (187), и, следовательно, несмещенной эффективной оценки не существует. Уравнение правдоподобия имеет вид [^^]т2«.-м) = 0. (207) N Если область изменения величины s (А) включает (l/N)S#z» т0 существует /=1 решение 1 N *[2ΏΙ(Κ)1 = —2 Ri- (208) г= ι Если (208) может быть удовлетворено, то SmiW^s-1 1^2 Ri)· (209) [Заметим, что (209) косвенно предполагает, что s""1 (·) существует. Если s"1 не существует, то тогда даже в отсутствие помехи мы не сможем определить А однозначно. Если бы мы проектировали систему, то всегда бы выбирали s(-)> позволяющее найти А однозначно в отсутствие помех.] Когда область изменения N величины s (а) не включает (1/W)2#z> максимум находится на граничной точке г=1 области. Мы видим, что оценка по максимуму правдоподобия коммутативна относительно нелинейных операций. (Это несправедливо для оценок по минимуму среднего квадрата ошибки и по максимуму апостериорной вероятности.) Если оценка является несмещенной, то находим границу дисперсии посредством дифференцирования (206): Й5 -νέ/Λ|-·Μ),^-^ΐΜ J· (210) 80
Замечая, что Е[гг-8(А)] = Е(т) = 0, (211> получим следующую границу для любой несмещенной оценки: оЧа(*)-А]> N[ds°(;)/dAV ■ (212) Эта граница точно такая же, как и в примере 2, за исключением коэффициента Ids (Л)/дЛ]2. Интуитивное обоснование необходимости этого коэффициент уя*Мк *-S(A) А*АА *~А Фактическое значение А Рис. '2.22. Поведение дисперсии ошибки при малых ошибках. та, а также некоторое представление об условиях, при которых указанная граница будет полезной, можно получить путем исследования типичной функции,, изображенной на рис. 2.22. Обозначим Тогда Y = 8(A). rt = Y + nt. (213> (214) Дисперсия оценки Υ равна просто οη2/Ν. Однако, если уе — ошибка при оценке Υ — настолько мала, что крутизна постоянна, то Υη (215) ds(A) дА А = а (R) σ \аг) = [ds (А)/дА]2 — N[ds(A)/dA]2 σ 2 η (216) Заметим, что если уг ьелико, то простого линейного соотношения между уг и аг не будет. Это позволяет судить об условиях, при которых граница Крамера — Рао дает точный ответ, если параметр входит в условия задачи нелинейным образом. В частности, если ошибка оценки мала по сравнению с Ad2s (А)/дА2> то следует ожидать, что фактическая дисперсия будет близка к границе дисперсии, определяемой неравенством Крамера — Рао. Свойства оценки по максимуму правдоподобия, справедливые при малой ошибке, обычно называют асимптотическими. Одна из процедур для их формального получения заключается в исследовании поведения оценки, когда число независимых наблюдений стремится 81
к бесконечности. При довольно общих условиях можно доказать следующие положения (см., например, Крамер [9]): 1. Решение уравнения правдоподобия (177) сходится по вероятности к точному значению А при N —>- оо. Любая оценка с этим свойством называется состоятельной. Таким образом, оценка по максимуму правдоподобия является состоятельной. 2. Оценка по максимуму правдоподобия является асимптотически эффективной, т. е. ι·~ a2[am](R)-A] =J a«inprle(RM) h-1 3. Оценка по максимуму правдоподобия является асимптотически гауссовой (нормальной), т. е. N (Л, σαε). Все указанные свойства связаны с поведением оценки по максимуму правдоподобия при больших N. Они дают некоторое обоснование для использования оценки по максимуму правдоподобия даже тогда, когда эффективной оценки не существует. Здесь уместно поставить логичный вопрос: существуют ли процедуры оценки более оптимальные, чем процедура оценки по максимуму правдоподобия? Разумеется, если не существует эффективной оценки, то возможны несмещенные оценки с меньшими дисперсиями. Трудность заключается в том, что нет общего правила для их отыскания. В конкретной ситуации можно попытаться улучшить оценку по максимуму правдоподобия. Почти во всех случаях, однако, получающееся правило оценки оказывается более сложным, и поэтому в нашей работе с действительными величинами мы придаем особое значение методу максимального правдоподобия. Второй естественный вопрос состоит в том, что не существуют ли более точные нижние границы, чем неравенство Крамера — Рао? Одной из таких границ является граница Баттачари, однако прямо ведущая к цели процедура ее отыскания сопряжена с утомительной вычислительной работой. Граница Крамера — Рао использует д2рг |a(R| А)/дА2. Если эффективной оценки не существует, то можно получить более точную нижнюю границу, которая связана с частными производными более высокого порядка. Простые выводы этой границы приведены в [13 и 14], а также в задачах 2.4.23 — 2.4.24. В представляющих для нас интерес случаях практическое использование этой границы сопряжено с большим объемом вычислений. Второй границей является граница Баранкина (например, [151). Два ее основных преимущества состоят в том, что она не требует условия дифференцируемости плотности вероятности и дает точную нижнюю границу. К числу ее недостатков относится то, что для получения границы необходима максимизация по функции, а процедура отыскания этого максимума обычно является весьма сложной. Несколько простых примеров дано в задачах 2.4.18 — 2.4.19. В большей части наших рассуждений используется граница Крамера — Рао. N^oo 82
Получим аналогичную границу для среднего квадрата ошибки, когда параметр является случайным. Нижняя граница наименьшего среднего квадрата ошибки при оценке случайного параметра. В этом параграфе мы докажем следующую теорему. Теорема. Пусть α — случайная величина, а г — вектор, представляющий результат наблюдения. Средний крадрат ошибки любой оценки a (R) удовлетворяет йеравенству \д\прг,а(К,А) V\\~l d4nprta(R,A) = -£ дА2 (217) Отметим, что плотность вероятности здесь является совместной плотностью и что математическое ожидание берется по α и г. Предполагается, что выполняются следующие условия: дрг a(R,A) · 1) —'- абсолютно интегрируема по R и Л; д2рг a(R,A) 2) : абсолютно интегрируема по R и А\ 3) условное математическое ожидание ошибки при заданном А равно оо В(А)= j [a(R) — A]pr]a(R\A)dR. (218) — оо Мы предполагаем, что ИтВ(А)ра(А) = 0, (219) А->оо lim B(A)pa(A) = 0. (220) А-+ — оо Доказательство теоремы сводится к простой модификации доказательства, приведенного на стр. 77. Умножим обе части (218) на ра (Л), а затем продифференцируем по А: -[χΐΡα(Α)Β(Α)]=— j pr.0(R, A)dR + — оо + ]_*ь£2-1ИК>-Л]<Л, (22!) Теперь проинтегрируем по А: оо оо оо ра(А)В(А) | =-1+ J j Pt-a^'A) [a(R)-A]dAdR. (222) — оо —оо —оо ^Л 83
Согласно допущению 3 левая часть (222) должна быть равна нулю. Остальные этапы доказательства совершенно идентичны. Окончательно получим (223) £|[a(R)-«]V{g[(a'nP-(R'7 или, что эквивалентно, £{[a(R)-a]2}>|-£ d»lnPrl0(RM) дА* ,—Е д*\пра(А)1)-1 дЛ2 Г' (224) причем знак равенства имеет место тогда и только тогда, когда ""·■£·«-kiim^M (225) при всех R и Л. (В случае детерминированной переменной величины мы использовали неравенство Буняковского — Шварца применительно к интегралу по R, так что постоянный множитель k (А) мог быть функцией величины Л. Теперь интегрирование осуществляется по R и Л, так что k не может быть функцией А.) Повторное дифференцирование приводит к эквивалентному условию г'а ; = — k. (226) дА* v ; Заметим, что (226) можно выразить через апостериорную плотность дЧпР/а]г(А\Ъ) дА* —к. (227) Дважды интегрируя (227) и подставляя результат в экспоненту получим ра:1г(Л|Р)=ехр(-М2 + С1Л+С2) (228) при всех R и А. Из (228) следует, что апостериорная плотнрсть вероятности величины а должна быть распределена нормально при всех R для того, чтобы существовала эффективная оценка. (Заметим, что Ci и С2 — функции R.) Рассуждая, как и при выводе (193) — (195), убеждаемся, что если {226) удовлетворяется, то оценка по максимуму апостериорной вероятности будет эффективной. Поскольку оценка по минимуму среднего квадрата ошибки не может иметь большей ошибки, то это свидетель- ствует о том, что ams (R) = атар (R) всегда, когда существует эффективная оценка. С точки зрения техники, когда эффективная оценка заведомо существует, как правило, решение уравнения максимума .апостериорной вероятности сопряжено с меньшим объемом вычислений, чем отыскание условного среднего. Когда же эффективной оценки заведомо не существует, то какую бы оценку мы ни использовали — 84
^ms (R) или dmap (R) — нам неизвестно, насколько близко подходит •средний квадрат ошибки к своей нижней границе. Можно вывести асимптотические выражения, аналогичные асимтотическим результатам для действительных переменных. 2.4.3. Оценка нескольких параметров Во многих интересующих нас задачах возникает необходимость оценки более чем одного параметра. Известным примером может служить радиолокационная задача, в которой требуется оценить дальность и скорость цели. Большинство понятий и методов можно непосредственно распространить на этот случай. Модель задачи показана К-мерная оценка наблюдений Рис. 2.23. Модель процедуры оценки нескольких параметров. на рис. 2.23. Если имеется К параметров аи о>ъ ···> ак> то их описывают параметрическим вектором а в Камерном пространстве. Остальные элементы модели такие же, как и ранее. Мы рассмотрим как случай, когда а является случайным параметрическим вектором, так и случай, когда а является действительным или неслучайным параметрическим вектором. Три вопроса представляют интерес. В каждом из них результатом является вектор, аналогичный результату в скалярном случае. 1. Процедуры оценки. 2. Меры ошибки. 3. Границы ошибки при оценке. Процедура оценки. Для случайных величин можно рассмотреть общий случай байесовской оценки, когда минимизируется риск для некоторой произвольной скалярной функции стоимости С (а, а). Однако 85
для наших целей достаточно рассмотреть только функции стоимости которые зависят от ошибки. Вектор ошибки определяется как а£ (R) "MR) —«ν a2(R) — a2 LaK(R) — aKA a(R)—a. (229) Для критерия среднего квадрата ошибки функция стоимости равна к C(ae(R))^H aL(R)=ai(R)ae(R), (230> /= ι т. е. сумме квадратов ошибок. Риск равен оо ^ms = \ ξ С (a. (R)) рг, a (R, A) dR d\ (231) ИЛИ σο σο ^ms= J Pr(R)rfR J 2 (МЮ-л,)1 /= 1 palr(A|R)dA. (232) Как и ранее, мы можем минимизировать внутренний интеграл для каждого R. Поскольку все члены суммы положительны, минимизируем их раздельно. Это дает или amSi(R)= J ^pa|r(A|R)dA — σο σο am»(R)= J" Apa,r(A|R)dA. (233) (234) Нетрудно показать, что процедура среднеквадратической оценки коммутативна относительно линейных преобразований. Так, если b-Da, (235) где D есть матрица L X К, а нам необходимо минимизировать £[b;(R)be(R)]=£f 2 ft|z(R)l. (236) то результат будет bms(R) = Dams(R). (237) (Для доказательства (237) см. задачу 2.4.20). Для оценки по максимуму апостериорной вероятности необходимо найти то значение А, которое максимизирует pa\r (A | R). Если этот максимум является внутренним и в точке максимума производная din pair (A|R)|di4| существует, то необходимое условие получается 86
из уравнений максимальной апостериорной вероятности. По аналогии с (137) возьмем логарифм от ра{г (А | R), продифференцируем по каждому параметру At> i = 1, 2, ..., К, и приравняем результат нулю. Это дает систему К уравнений: ainpa[r(A| R) dAi *map (R) -0, ί = 1, 2,...,/С. (238) Если ввести матричный оператор частных производных VaA д дАг д дА2 дА, (239) то (238) можно записать более компактно. Этот оператор применим только к матрицам вида If χ т. Например, VaG = ~ dG1 дА1 dG2 дАх ' ... dGm- " дАг dGm дАк_ (240) Несколько полезных свойств оператора ν а были развиты в связи с задачами 2.4.27 — 2.4.28. В нашем случае (238) превращается в одно- векторное уравнение: (241) VA[lnp.|r(A|R)]| =0. \Ά ~~amap {К) Аналогично для оценок по максимальному правдоподобию необходимо отыскивать то значение А, которое максимизирует pr)a (R | Л). Если максимум является внутренним и в точке максимума производная д lnprja (R|A)/d;4f существует, то необходимое условие получается из уравнений правдоподобия VAUnpr,.(R|A]| =0. (242) lA-aml (R) В обоих случаях необходимо убедиться, что максимум является абсолютным. Меры ошибки. Для неслучайных величин первой интересующей нас мерой является смещение. Теперь, однако, смещение является вектором: B(A)A£[a£(R)]=£[a(R)]-A. (243) 87
Если каждая компонента вектора смещения равна нулю для.всех значений А, то говорят, что оценка является несмещенной. В случае одного параметра грубой мерой рассеяния ошибок служила дисперсия оценки. В частном случае, когда аг (R) имела нормальное распределение, это обеспечивало полное описание M^-Ts^i-ir)· (244> ' «ε аг Для векторной случайной величины величина, аналогичная дисперсии, есть ковариационная матрица £[(a8-ae)(a8T-aI)]AAe, (245) где а8А£(а8) = В(А). (246) Лучший способ определить, каким образом ковариационная матрица обеспечивает меру рассеяния ошибок, — это рассмотреть частный случай, когда αεί· имеют совместное нормальное распределение. Ради простоты алгебраических выкладок положим Ε (ае) = 0. Совместная плотность вероятности для системы /( величин с совместно нормальным распределением равна Ра8(Ае) = (|2д|^/2|А8Г/2)-1ехр(—^-AUe-'Ae) (247) (например, стр. 179 у Давенпорта и Рута [1]). Плотность вероятности для /С = 2 показана на рис. 2.24, а. На рис. 2.24, б, в показаны контуры равной вероятности для двух типичных распределений. Из (247) следует, что равновысотные контуры определяются соотношением AUe"1Ae = C2, (248) которое при /С = 2 представляет собой уравнение эллипса. Эллипсы раздвигаются монотонно с увеличением С. Они также обладают тем интересным свойством, что вероятность нахождения внутри эллипса является функцией только С*. Свойство. Для К = 2 вероятность того, что вектор ошибки лежит внутри эллипса, уравнение которого AUe~1A8 = C2, (249) сть Р = 1-ехр(—у). (250) Доказательство. Площадь, заключенная внутри эллипса, определяемого уравнением (249), равна Л = \Ае\1/2пС2. (251) 88
Дифференциальная площадь, заключенная между эллипсами, которые соответствуют С и С -f- dC> равна (LA = \Ae\l'22stCdC. (252) Высота плотности вероятности в этой дифференциальной площади равна (2я|Л8|1/2)-1ехр(-^). (253) Мы можем вычислить вероятность нахождения точки вне эллипса путем умножения (252) на (253) и интегрирования в пределах от С до оо: 1 -Р = JXехр (-^) dX = ехр (—§-)· (254) что и требовалось доказать. По этой причине эллипсы, описываемые уравнением (248), называются эллипсами концентрации (эллипсами рассеяния), так как они служат мерой концентрации плотности. PaJA€)b Рис. 2.24. Нормальные распределения: о—двумерное распределение; б —равновысотные эллипсы, коррелированные величины; в— равновысотные эллипсы, некоррелированные величины. Аналогичный результат справедлив и для произвольного /С. В этом случае, однако, (248) описывает эллипсоид. Здесь дифференциальный объем1) в /("-мерном пространстве равен πΚ/2 dv- 1/2 Г (/С/2 + 1) КСк-ЫС. (255)" 1)_См. например, Крамер [9] или Зоммерфельд [32]. 89
Значение плотности вероятности на эллипсоиде равно [(2n)K'*\As\l/*]-lexp (— — Y (256) Следовательно, 1-Ρ=(2)κ/2Γ^/2 + 1] J^-'e-^X, (257) что и требовалось доказать. Эти эллипсоиды называются эллипсоидами концентрации (эллипсоидами рассеяния). Когда плотность вероятности ошибки не является гауссовой,эллипсоид рассеяния не задает однозначную вероятность. Это находится в прямой аналогии с одномерным случаем, когда дисперсия негауссовой случайной величины, имеющей нулевое среднее, не определяет собой плотность вероятности. Тем не менее можно интерпретировать эллипсоид рассеяния как грубую меру разброса ошибок. Когда эллипсоиды рассеяния данной плотности лежат целиком вне эллипсоидов рассеяния другой плотности, говорят, что последняя является более концентрированной, чем первая. Имея это в виду, выведем некоторые свойства и границы, имеющие отношение к эллипсоидам рассеяния. Границы ошибок оценки. Неслучайные величины. В этом параграфе мы установим две границы. Первая связана с дисперсией отдельной ошибки, вторая — с эллипсоидом рассеяния. Свойство 1. Рассмотрим любую несмещенную оценку At. Тогда ^a*[|az(R)-^]>J", (258) где Ju является а-м элементом квадратной (К X /С)-матрицы J"1. Элементы матрицы J суть Л p|"ainpr|a(RlA)ainpr|a(RlA)1 Jii-L[ dAi dAj J~ _ FpMnpr|a(R|A) I (25g) ИЛИ '" L ' dAidAj J JA£({VA[lnprla(R|A)]}{VA[lnpr,a(R|A)]n = = -E [Va ({Va [In pr ι a (R | A)]}7)]. (260) Матрица J обычно называется информационной матрицей Фишера. Знак равенства в (258) соблюдается тогда и только тогда, когда * ainpr|a(R|A) ai(W-At= 2 *<J(A) jz (261) при всех значениях At и R. Другими словами, ошибка оценки может быть выражена как взвешенная сумма частных производных функций In /?rja (R | А) по различным параметрам. 90
Доказательство. Так как at (R) является несмещенной, то J [St/ (R) — ^f] pr | а (R | A) dR = 0 (262) или (263) ί a,(R)/>r|.(R|A)dR = i4t. —оо Дифференцируя обе части по Ah имеем дА< дА, (264) Докажем свойство 1 для ί=1. Определим (/C-fl)-мерный вектор как χ = MR) —Л ainpr|a (R[A) d1npr|'a(R|4) ал„ (265) Ковариационная матрица имеет вид £ [х хТ] = ет 1 1 Jn о ·: 0 JKi 0 Jl2 0 0 ... J1k Jkk (266) [Единицы и нули в данной матрице следуют из (264).] Поскольку это ковариационная матрица, она является неотрицательно определенной, откуда следует, что определитель полной матрицы больше или равен нулю. (Это условие является только необходимым, но недостаточным, так как матрица неотрицательно определенная.) Оценивая определитель при помощи разложения на алгебраические дополнения, получим <|J|-|Jii|>0, (267) где | Ju | — алгебраическое дополнение элемента Уп определителя матрицы |J |. Если предположить, что матрица является несингулярной, то l^-=Ji\ (268) < |J| что и требовалось доказать. Модификации для случая, когда матрица J является сингулярной, нетрудно получить для любой конкретной задачи. 91
Чтобы определитель был равен нулю, член Лх (R) — Аг должен выражаться посредством линейной комбинации других членов. Эта есть условие, описываемое соотношением (261). Вторая строка (259) выводится из первой совершенно аналогично доказательству (189) — (192). Доказательство для случая 1ф\ есть очевидная модификация приведенного. Свойство 2. Рассмотрим какую-угодно несмещенную оценку А. Эллипс концентрации Ае^Ле-1Ае = С2 (269) лежит либо вне, либо на граничном эллипсе, определяемом уравнением A/JAe=C2. (270) Доказательство. Разберем подробнее случай К = 2. По аналогии с предыдущим доказательством построим ковариационную матрицу соответствующего вектора: 'ai(R) — A a2(R) — A2 dlnpr|a(R|A) х = дЛ1 ainpr|a(R|A) дЛ2 (271) Тогда Ε [χ χ7] л = σίε (ftoie C^ie <%> 1 • ° ~"5гТ) θ2ε 0 1 1 0 " 0 1 J11 J12 J 21 >» 22 ГЛ. | I -i tit · (272) Второе уравнение определяет разбиение матрицы 4 χ 4 на четыре матрицы 2x2. Будучи ковариационной матрицей, эта матрица является неотрицательно определенной. Используя формулу для определителя разделенной матрицы1), имеем Ι Αε J —1|>0 (273) или, полагая, что Λε — несингулярная матрица, и применяя правило произведения для определителей, |Ae||J—Λε-ΐ|>0. (274) Отсюда следует, что |J—Ae-'I^O . (275) х) См. [16]. Q2
Теперь рассмотрим два эллипса. Координаты точек пересечения с осью Аг1 действительного и граничного эллипсов рассеяния соответственно равны ^eU2e=o = ^i^-, (276) ΑΪε\Αη=0--=σ-±-. (277) Мы хотим показать, что координата точки пересечения действительного эллипса больше или равна координате граничного эллипса- Для этого необходимо Λι|Λε|^σ22. (278) Это неравенство выполняется потому, что определитель матрицы 3 χ 3 в верхнем левом углу (272) больше или равен нулю. В противном случае полная матрица не является неотрицательно определенной (см. [16] или [18]). Точно таким же образом, координата действительного пересечения на оси А9Я больше или равна координате граничного пересечения. Поэтому действительный эллипс либо всегда находится вне граничного эллипса или на нем, либо оба эллипса пересекаются. . Если они пересекаются, то, как видно из (269) и (270), должно быть решение А8 уравнения Α/Λε-Άε = Α/Με (279) или A/ [J—Λε-1 ] Αε Δ A/ D Αε = 0. (280) В скалярной записи A2leDn + 2AlsA2eD12+AleD22=0 (281) или, что эквивалентно, ljfjDu + 2 №) D12 +D22 = 0. (282) Решая относительно Л18Л42Е, мы получили бы действительные корни только в том случае, если бы определитель был больше или равен нулю, а для этого требуется, чтобы |J—Λβ-ΐ|<0. (283) Но неравенство (283) противоречит (275). Единственной возможностью является | J — Л7!-( = 0, но это справедливо только тогда, когда эллипсы совпадают. В этом случае все оценки являются эффективными. Для произвольного К можно показать, что матрица J — AjT1 есть неотрицательно определенная. Рассуждения относительно эллипсоидов рассеяния остаются такими же, как и для случая /С = 2. 93
Часто требуется оценить функции К базисных параметров, а не сами параметры. Обозначим искомые оценки как <*ι =£<г,(А), d2 =^.(A). ИЛИ d = gd(A). Число оценок Μ не связано с К вообще. Функции могут быть нелинейными. Ошибка оценки равна 2i—gtW*dBi. (285) Если мы предположим, что оценки являются несмещенными, и обозначим ковариационную матрицу ошибок через Λε, то при помощи методов, идентичных тем, которые использовались выше, можно доказать следующие свойства. Свойство 3. Матрица Ae-{VA W№Y*~l {VA[gdr(A)]} (286) является неотрицательно определенной. Отсюда вытекает следующее свойство (для этого достаточно развернуть вторую матрицу и вспомнить, что все диагональные элементы неотрицательно определенной матрицы неотрицательны). Свойство 4: ^,>>Ц^«^. (287, В частном случае, когда требуемые функции являются линейными, результат (287) можно записать в более простой форме. Свойство 5. Допустим, что gd(A)AGdA, (288) где Gd — матрица Μ χ К. Если оценки несмещенные, то матрица Λε — GcJ^G/ является неотрицательно определенной. Свойство 6. Эффективность оценок сохраняется при линейных преобразованиях и не сохраняется при нелинейных преобразованиях. Другими словами, если а — оценка эффективная, то g а (А) будет эффективной тогда и только тогда, когда ga (А) есть преобразование линейное. Границы оценок. Случайные параметры. Точно так же, как и в случае одного параметра, границу для случайных параметров получают простой модификацией вывода для случая детерминированных 94
параметров. Информационная матрица в этом случае состоит из двух частей: 3t^3d + 3p' (289) Матрица JD есть информационная матрица, определяемая (260): она отображает собой информацию, полученную из результатов наблюдений. Матрица Jp представляет априорную информацию. Ее элементами являются rainPa(A) ainPa(A)r гачпМАм , JpiJ-E[—dA-i дЛ~Г ~Е[ dAtdAj \ <290> Корреляционная матрица ошибок имеет вид R£A£(a£a/). (291) Ее диагональные элементы представляют среднеквадратические ошибки, а недиагональные — взаимнокорреляционные функции ошибок. Три свойства непосредственно вытекают из изложенного. Свойство 1: Ε [α2ε.] > J}?. (292) Другими словами, диагональные элементы в матрице, обратной полной информационной матрице, суть нижние границы соответствующих средних квадратов ошибок. Свойство 2. Матрица является неотрицательно определенной. Это свойство имеет такую же физическую интерпретацию, как и в задаче с неслучайным параметром. Свойство 3. Если 3Т = R71, то все оценки являются эффектив- ными. Необходимое и достаточное условие справедливости этого утверждения заключается в нормальности распределения pa(r (A | R) для всех R, а это выполняется при условии, что J—величина постоянная. [Достаточно видоизменить (261), (228).] Представляет интерес частный случай, когда априорная плотность является нормальной плотностью /С-го порядка. В этом случае Jp^Aa"1, (293) где Аа — ковариационная матрица случайных параметров. Еще более простой случай имеет место, когда случайные величины являются независимыми и нормальными. Тогда Jptj = ^^' (294> ai При указанных условиях априорная информация оказывает влияние только на диагональные элементы Jr. Результаты, аналогичные свойствам 3—6 для неслучайных параметров, могут быть получены и для случайных параметров. 95
2.4.4 Краткие выводы по теории оценок В этом параграфе мы излагали результаты теории оценок, которые понадобятся при рассмотрении интересующих нас проблем. Наше изложение было начато с байесовской процедуры оценки случайных лараметров. Основными величинами, необходимыми в этой модели, являются априорная плотность вероятности ра (Л), вероятностное отображение в пространство наблюдений /?Г|а (R | Л) и функция стоимости С (Αε). Указанные величины позволяют найти функцию риска. Оценка, минимизирующая функцию риска, была названа байесовской оценкой, а результирующий риск—байесовским риском. Были выделены два типа байесовских оценок — оценка по минимуму среднего квадрата ошибки (которая совпадает со средним значением апостериорной плотности) и оценка по максимуму; апостериорной вероятности (мода апостериорной плотности). Из свойств 1 и 2 (стр. 70—71) следует, что условное среднее есть байесовская оценка для широкого класса функций потерь, если удовлетворяются некоторые условия, налагаемые на функцию потерь и апостериорную плотность. Перейдя к оценке неслучайного параметра, мы ввели понятия смещения и дисперсии как двух самостоятельных характеристик ошибки. Неравенство Крамера — Рао обеспечивает границу дисперсии любой несмещенной оценки. Если эффективная оценка существует, то ее можно получить путем оценивания по максимуму правдоподобия. Это свойство оценки максимального правдоподобия в сочетании с асимптотическими свойствами объясняет наше особое внимание к оценкам максимального правдоподобия. Переход к оценке нескольких параметров сопряжен с введением новых понятий. Большая часть установленных свойств по существу представляет лишь распространение соответствующих скалярных результатов на многомерный случай. Следует подчеркнуть тесную связь между теориями обнаружения и оценок. Обе теории основываются на функции правдоподобия или отношении правдоподобия, которые, в свою очередь, выводятся из вероятностного механизма перехода. По мере ознакомления с более сложными задачами мы убедимся, что большая часть^нашей работы сводится к манипуляции этим механизмом перехода. Во многих случаях указанный механизм не" зависит от того, относится ли данная задача к области обнаружения или к области оценки. Таким образом, наиболее трудная часть задачи приложима к любой из этих областей. Эта тесная связь задач обнаружения и оценки будет становиться все более очевидной по мере нашего дальнейшего изложения. Вернемся теперь к задаче теории обнаружения и рассмотрим модель более общего характера. 2.5. Сложные гипотезы В § 2.2 и 2.3 мы ограничились рассмотрением задачи обнаружения, в которой гипотезы были простыми. Теперь перейдем к рассмотрению случая, когда гипотезы являются сложными. Термин «сложная» легко пояснить простым примером. 96
Пример 1. По гипотезе 0 наблюдаемая величина г является нормальной случайной величиной с нулевым средним и дисперсией σ2. По гипотезе 1 наблюдаемая величина г есть случайная величина со средним, равным т, и дисперсией σ2. Значение т может быть в интервале [Af0, AiJ. Итак, «'■■ρ,, и. №J".)= -γ=^- «ρ (-·£-). Μ0 < Μ < Λ*!· Мы называем ^ сложной гипотезой ввиду того, что характеризующий эту гипотезу параметр Μ принимает множество значений. Модель этой задачи на принятие решения показана на рис. 2.25, а. На выходе источника имеется Источник "■«■■«ς" Решение Рис. 2.25. Задача на испытание сложной гипотезы: а—случай оценки одного параметра; б —общий случай. значение параметра М, которое мы рассматриваем как точку в пространства параметра χ. Далее определяем гипотезы как подпространства χ В этом случае #0 соответствует точке Μ = 0, а Нг — интервалу [М0, Мг\. Мы предполагаем, что плотность вероятности pr\m{R\M), согласно которой осуществляется отображение из пространства параметров в пространство наблюдений, известна для всех значений Μ в пространстве χ. Последним элементом модели является правило решения, которое делит пространство наблюдений на две части, соответствующие двум возможным решениям. Следует заметить, что мы интересуемся исключительно принятием решения и действительное значение Μ для нас никакого интереса не представляет. По этой причине параметр Μ часто называют «нежелательным». Распространение этих представлений на общую задачу испытания сложной гипотезы не встречает затруднений. Соответствующая модель изображена на рис. 2.25, б. Выход источника соответствует системе параметров. Мы считаем его точкой в пространстве параметров и обозначаем вектором Θ. Гипотезы представляют собой подпространства χ. 4 Зак. 693 97
(На рис. 2.25, б для удобства изображены неперекрывающиеся подпространства.) Плотность вероятности, согласно которой осуществляется отображение из пространства параметров в пространство наблюдений, обозначим через pr|9 (R | в); она предполагается известной для всех значений θ в пространстве χ. Как и ранее, последним элементом модели является правило решения. Для того чтобы закончить формулировку задачи, мы должны охарактеризовать параметр Θ. Точно так же, как и в случае оценки параметра, параметр θ может быть неслучайной или случайной величиной. Если θ величина случайная с известной плотностью вероятности, то процедура является прямой. Обозначая плотность вероятности θ по двум гипотезам как pQ{Ho (Ь\Н0) и pQ{Hl (Q\Hi), отношение правдоподобия запишем в виде = ? . (296) iprle(Rie,#o)pe|Ho(e|#0)de Простота этой процедуры объясняется тем, что известная плотность вероятности θ позволяет нам свести задачу к испытанию простой гипотезы путем интегрирования по параметру Θ. Проиллюстрируем эту процедуру для модели примера 1. Пример 1. (продолжение). Предполагается, что плотность распределения вероятности параметра т по гипотезе Нг равна 1 / М2 \ P^tf.W^^^exp^-—), -оо <*<«,. (297) Тогда (296) принимает вид сю ί 1 / (R-M)* \ I ( Μ* \ л„ ,— ехр — ,,— ехр — — dM Υ2πο ν\ 2σ* ) У 2лот v\ 2om* / —00 "1 MR)= ; ;—stt * η· J /ЯМ я. Υ 2η σ Μ 2σ2 / (298) Интегрируя и беря логарифм от обеих частей, получим Этот результат эквивалентен примеру 2 на стр. 41—42, так как плотность, используемая в (297), делает обе задачи идентичными. Как и следовало ожидать, в испытании используется только величина /?, поскольку среднее т имеет симметричное распределение. Для общего случая, определяемого (296), фактические вычисления могут быть более сложными, однако требуемая процедура является вполне определенной.
Когда θ — случайная величина с неизвестной плотностью, наилучшая процедура испытания не является явно определенной. Одним из возможных методов испытания является правило минимакса с неизвестной плотностью. Другой метод заключается в испытании нескольких распределений, базирующихся на любых частичных сведениях о Θ, какие только доступны. Во многих случаях структура испытания будет нечувствительна к тонкой структуре распределения вероятности. Если θ—неслучайна, то следует обратиться к критерию Неймана—Пирсона. Рассмотрим границу качества идеального измерения. Пример 2. В этом случае 6 = М. Из (295) (М0< Μ < Mt) Я0:рг1т(^|М) = -р^ехр(-^-), (300) где Μ — неизвестный неслучайный параметр. Совершенно ясно, что любой разработанный нами критерий (алгоритм испытания) никогда не может быть лучше гипотетического критерия, согласно которому приемник сначала идеально измеряет величину Μ (или она ему сообщается), а затем синтезирует оптимальный критерий отношения правдоподобия. 0,99 0,98 0,99 0,98 * 0β § OJ % 0.5 I 0,3 * ^ V ^ $, -? & 10 -3 10 - \\\ \ X -коп с A >N I 1 _ \ /A $//\ /n\ / ллкопв ///\К0ПА . 1 I 1 -* -2 0 +Z м/<$ *k Рис. 2.26. Функция мощности для критерия идеального наблюдателя. Рис. 2.27. Функция мощности для различных критериев отношения правдоподобия (КОП). Таким образом, рабочую характеристику любого критерия мы можем ограничить рабочей характеристикой этого фиктивного критерия идеального измерения (критерия идеального наблюдателя). Для данного примера можно было бы использовать РХП рис. 2.9, а, положив d2 = Μ2/σ2. Однако поскольку нас интересует поведение РХП в зависимости от М, более удобным является способ представления, принятый на рис. 2.9, б. Это иллюстрируется рис. 2.26. Подобная зависимость (и соответствующая ей кривая) носит название функции мощности. Это просто графическая зависимость вероятности обнаружения ΡD для всех значений Μ (в более общем случае — для 0) при различных значениях вероятности ложной тревоги PF. Поскольку Я0 — Ηλ при Μ = 0, то Рр = 4* 99
= PF. Кривые рис. 2.26 представляют предел качества испытания по любому критерию. Теперь необходимо оценить, насколько близко подходит качество реального критерия к этому пределу. Оценить максимально достижимое качество реального критерия можно посредством приравнивания кривых реального критерия граничной кривой для всех Μ ζ %· Такие критерии называются равномерно наиболее мощными критериями (РНМК). Другими словами, для данной ΡF PHMK дает PD, большую, чем любой другой критерий для всех Μ ζ χ. Условия существования РНМК можно установить из рис. 2.27. Сначала построим границу идеального измерения. Затем рассмотрим другие возможные критерии и их качество. Критерий А есть обычный критерий максимального правдоподобия, синтезированный в предположении Μ = I. Первый вывод, который можно сделать, состоит в том, что мощность этого критерия равна границе при Μ = I; этот вывод вытекает из того, как мы построили границу. Для других значений Μ мощность критерия А может не равняться границе. Аналогично, критерий В есть критерий отношения правдоподобия, построенный в предположении, что Μ = 2, а критерий С есть критерий отношения правдоподобия, построенный в предположении, что Μ = —1. В каждом случае их мощность равна границе в соответствующих расчетных точках. (Функции мощности на рис. 2 27 вычерчены с целью подчеркнуть это обстоятельство и при отклонении от расчетной точки не являются количественно точными. Количественно точные кривые изображены на рис. 2.29.) Они могут также равняться границе и в других точках. Условия существования РНМК становятся очевидными. Мы должны быть в состоянии синтезировать полный критерий отношения правдопедобия (включая порог) для всех Μ ζ χ, не зная Μ. Не представляет труда получить аналогичный результат для общего случая. Вполне очевидно, что в общем случае границы можно достичь для любого заданного θ просто синтезом обычного критерия отношения правдоподобия именно для этого Θ. Теперь РНМК должен быть не хуже любого другого критерия для всех Θ. Это дает нам необходимое и достаточное условие его существования. Свойство. РНМК существует тогда и только тогда, когда критерий отношения правдоподобия для каждого θ£χ может быть полностью определен (включая порог) без знания Θ. Первая часть условия очевидна. Вторая часть условия непосредственно вытекает из нашего рассуждения в предыдущем параграфе. Если существует некоторое θ ζ χ, для которого мы не можем отыскать критерий отношения правдоподобия без знания Θ, то необходимо использовать какой-нибудь другой критерий, раз мы не знаем 0. Этот критерий для данного 0 будет обязательно уступать критерию отношения правдоподобия, рассчитанному для этого Θ, и, следовательно, он не является равномерно наиболее мощным. Возвращаясь к нашему примеру и используя результаты рис. 2.8, мы знаем, что критерий отношения правдоподобия равен Rmy+ (301) И Рр= ]lrkv^{-^)dR· еслиМ>0· <302> 100
(Надстрочный индекс «+» подчеркивает то обстоятельство, что критерий исходи^предположения, что Μί > 0. Значение γ+ может быть и отрицательным). ЭТ° Тн^оТич^^ля 'случая, когда Μ < 0, критерий отношения правдоподобия равен (303) Но Нг где Υ I У 2πσ ■ ехр (-£)««. м<о- (304) Это показано на рис. 2.28, б. Мы видим, что в этом случае порог есть просто взятый с противоположным знаком порог для Μ > 0. Указанное изменение знака делается для того, чтобы получить наибольшую часть рг]Н% (Κ\Ηι) внутри области #х (и, следовательно, максимизировать PD). Prto,(*W (для типичного положительного М) R Рис. 2.28. Влияние знака величины М: а —порог при Μ > 0; б —порог при Μ < 0. Итак, в связи с примером I можно сделать следующие выводы: 1 Если Μ может принимать только неотрицательные значения (т. е. М0 > > 0) то равномерно наиболее мощный критерий существует [следует из (301)J. 2 Если Μ может принимать только неположительные значения (т. е. Щ < < 0) то равномерно наиболее мощный критерий существует [следует из (όΌό)\. 3 Если Μ может принимать как отрицательные, так и положительные значения (т. е. М0<0(аМ1> 0), то равномерно наиболее мощного критерия не существует На рис 2 29 показана функция мощности для критерия отношения правдоподобия построенного в предположении, что Μ было положительным. Для отрицательных значений Μ вероятность PD меньше, чем PFt так как порог находится на неправильной стороне. Во всех случаях, когда равномерно наиболее мощный критерий существует, мы его используем, при этом его качество таково, как если бы мы знали Θ. Более трудная задача возникает, когда равномерно наиболее мощного критерия не существует. Следующим нашим шагом 101
будет рассмотрение Других возможных критериев для случая, когда равномерно наиболее мощного критерия не существует. Другие критерии можно найти в различных курсах математической статистики (например, [17]), однако они представляются менее подходящими для физических задач, которые нас будут позднее интересовать. Граница идеального измерения предполагает, что логическая процедура заключается в оценке Θ, считая правильной гипотезу Яь затем в оценке О, считая правильной гипотезу Я0, и использовании этих. оценок для проверки по критерию отношения правдоподобия, как если бы они были правильными. Если используются оценки 0,99 0,98 ^—^ '5?«* £ £ 0,7 § 0,5 I 0,3 $ * 0,1 5S а* * -9 %10 * -J to - - - I /l // Л /А Я/ /А /г/\ 1 I L—J О *ч Рис. 2.29. Качество критерия отношения правдоподобия при Μ > 0. максимального правдоподобия, рассмотренные на стр. 75, то результат называется обобщенным критерием отношения правдоподобия и записывается в виде A.(R) = maxpr|eo(R|e0) Ц* (305) где θι пробегает все возможные значения θ по гипотезе Ни & θ о — все возможные значения Θ по гипотезе #0· Другими словами, мы делаем оценку Θ4 по критерию максимального правдоподобия, исходя из предположения, что гипотеза Н\ верна. Затем мы оцениваем Pri6i(R|ei) при 64 = Θχ и используем это значение в числителе. Аналогичным образом получается знаменатель. Простой пример на обобщенный критерий отношения правдоподобия можно получить, если использовать несколько видоизмененный вариант примера 1. Пример 2. Основные вероятности остаются такими же, как и в примере 1. По-прежнему 6 = М. Однако, вместо одного, здесь N независимых результатов наблюдений, которые обозначим вектором R. Плотности вероятности равны N г = 1 Ν *!■..».« Ι*. Я0)= П ~у=^ exp (-gr)· ί=1 Г Ч ' (306) 102
В этом примере Нг является сложной гипотезой, а #0 — простой. Из (198) (307) Тогда A,(R) = ν Π г=1 Υ2πα ехр — [Ν 12 Λί —(1/Α0 2 Я* ] 2σ2 w n-pirexp(-i?,,/aa,) Hi ■г; (308) Приводя подобные члены и логарифмируя, получим / N ^2 InA^(R) i^(2*'J *> (309) Левая часть (309) всегда больше или равна нулю. Поэтому величину у можно выбрать больше или равной единице. Следовательно, эквивалентный критерий можно записать в виде 1 ^ \2я, где yi > О, или в эквивалентной форме 1*1* N #1/2 2 *г' г=1 я, я/ Τι· (310) (311) Функция мощности этого критерия получается без особого труда. Случайная величина г имеет дисперсию, равную σ2. По гипотезе Н0 ее среднее равно нулю, а по гипотезеНг — равно Μ.ΥΝ. Соответствующие плотности показаны на рис. 2.30: —Vi ехр Z2 2σ2 оо )dZ+ j* 1 Vi >/"2πσ Χ PD№ + J V2nc — оо xexp(-^)dz=2erfc*(i") T_L_ l· (2-м/F)2 1 — oo f ι Γ (z-MVF)* 1 ,^i- exp — - -^ — dZ= J y^iia K [ 2σ2 J (312) =еЦ*Ж]+ег1с^ ^M 1/"A^ (313) 103
Результирующая функция мощности изображена на рис·. 2.31; здесь же для сравнения показана граница идеального измерения. Как и следовало ожидать из нашего обсуждения оценок максимального правдоподобия, разность стремится к нулю при YW Mlo-*- oo. Точно так же, как и в случае, когда оценки максимального правдоподобия дают плохие результаты, имеются ситуации, в которых Рис. 2.30. Распределение вероятностей Рис. 2.31. Функция мощности для ошибок при обобщенном критерии отно- обобщенного критерия отношения шения правдоподобия: правдоподобия, α— вычисление Рр; б —вычисление Ρ£>. обобщенный критерий отношения правдоподобия может привести к низкой достоверности. В этих случаях необходимо выбирать другие процедуры испытания. Дело облегчается тем, что в большинстве интересующих нас физических проблем либо существует равномерно наиболее мощный критерий, либо обобщенный критерий отношения правдоподобия дает вполне удовлетворительные результаты. 2.6. Общая гауссова задача До сих пор во всех рассуждениях мы имели дело с произвольными законами распределения. В случае бинарного обнаружения никаких ограничений на форму рг\нх (R|#i) и prlHo (R|#o) не вводилось. Точно так же не вводилось никаких ограничений на вид распределения Prja (R | А) в задаче оценки. В классическом случае подобные ограничения не являются особенно необходимыми. Когда мы начнем рассмотрение проблемы выбора формы сигналов, то убедимся, что в основном нам приходится иметь дело с задачами, в которых плотность вероятности величины г является гауссовской. ,Этот класс задач будет подробно рассмотрен в настоящем параграфе. Материал этого пара- 104
графа и связанные с ним задачи образуют фундамент, на котором в последующем основывается большинство из получаемых результатов. Начнем с определения нормального (гауссова) случайного вектора и общей задачи Гаусса. Определение. Ряд случайных величин ги г2, ..., гм считается совместно нормальным, если любые их линейные комбинации являются нормальными случайными величинами. Определение. Вектор г является нормальным случайным вектором, если его составляющие ги г2, ..., г χ являются совместно нормальными случайными величинами. Другими словами, если N г=У< gtri^GTr /=ι (314) есть нормальная случайная величина для всех конечных GT, то г есть нормальный вектор. Если положить Е(г) = т (315) и g2(r)=£[(r-m)(rr-mr)]A_A, (316) то из (314) следует, что характеристическая функция вектора г равна Mr(/v)A£[e/v7V ] =ехр ( +j\Tm— -vTAv) (317) а при условии, что вероятности вектора матрица Л является несингулярной, г равна плотность Рг(К) = [(2я)^/2|Л|1/2]-1ехрГ-1(^-т^)Л-ЧР-т)1 (318) Доказательство не вызывает затруднений (см., например, задачу 2.6.20). Определение. Задача испытания гипотез называется общей гауссовой, если pv\m (R | Ht) является нормальной плотностью при всех гипотезах. Задача оценки называется общей гауссовой, если pr\a (R | А) имеет нормальную плотность при всех А. Мы рассмотрим бинарный вариант общей гауссовой задачи испытания гипотез подробно в основном тексте. Задачи испытания и оценки для случая Μ гипотез излагаются вне основного текста — в задачах к гл. 2. Основная модель для бинарной задачи обнаружения выводится весьма просто. Мы предполагаем, что пространство наблюдений является jV-мерным. Точки в этом пространстве соответствуют Л/-мерному вектору (или матрице-столбцу) г: г = Гч (319) rN 105
Согласно первой гипотезе Μι полагаем, что г — нормальный случайный вектор, который полностью определяется своим средним вектором и ковариационной матрицей. Обозначим эти величины соответственно через £[r|#i] = £(/Ί|#ι) £M#i)J m12 mlN J Дт1в (320) К1Д£[(г-т1)(г^-т/)|Я1] = Λΐ 1^12 ΐΚΊ3 ··· iKlN 1Κ2Ι 1Κ22 Li^Ovi iKnn J Введем матрицу Qlf обратную матрице Κι: QxKi^KxQi-I, (321) (322) (323) где I — единичная матрица (единицы по диагонали и нули на всех прочих местах). Используя (320), (321), (322) и (318), можно записать плотность вероятности вектора г по гипотезе Я4 в виде Рпя,(Н|Я1) = [(2я)^|К1|,/2]-'Х X exp [_i(Rr_mir) Ql (R_mi)]. (324) Сформулировав аналогичный ряд определений для гипотезы Н0, получим плотность вероятности Рг|н0(Р|Я0) = [(2я)^2|К0|1/2]-,Х X ехр [-1 (RT-m/) Q0 (R-m,)] . (325) Используя определение (13), нетрудно получить критерий отношения правдоподобия л ^ Л Рг | Я, (* Ι Ηύ ' К" ' 1/2 6ХР [~ ¥*Т—Л * <« ~ ""> ] * ■Рг|Я.(К1^о) |K1|>/»exp[--j(Rr-m,I)Q,(R-m,)J я· (326) 106
Прологарифмировав, имеем i(r-mS)Q0(R-m0) _1 (Rr_mir)Ql(R_mi)4 1ηη + + 1^11^1-|ΐη|Κβ|Δγ·. (327) Видно, что испытание состоит в отыскании разности между двумя квадратичными формами. Результат (327) является фундаментальным для многих наших последующих построений. По этой причине рассмотрим различные случаи общей гауссовой задачи несколько подробнее. Начнем с простейшей. 2.6.1. Равные ковариационные матрицы Первый интересующий нас случай соответствует ситуации, когда ковариационные матрицы по обеим гипотезам равны Κι = К0 Δ К, (328) но средние значения не равны. Обозначим обратную матрицу через Q=K-!. (329) Подставляя (328) и (329) в (327), перемножая матрицы, приводя подобные члены и используя симметрию Q, имеем (т/—ιη/)<№^Ιηη +i-KQmi-m/Qm0) Δγ#'. (330) Это выражение можно упростить, если ввести вектор, соответствующий разности средних значений векторов по двум гипотезам: AmAim—m0. (331) Тогда (327) обращается в /(RjAAmrQR&v/ (332) #0 или, что эквивалентно, l(R)bRTQAm^ky*'. (333) и. Величина, стоящая в левой части, является скалярной нормальной случайной величиной, так как она была получена в результате линейного преобразования совместно нормальных случайных величин. Следовательно, как было показано в примере 1 на стр. 49— 51, качество критерия можно полностью характеризовать величиной d2, которая определялась как квадрат расстояния между средними 107
значениями по двум гипотезам, когда дисперсия нормировалась так, чтобы она была равна единице. Тождественным определением является №At£('l#i)-£(/IW Ш4^ * ~ °2(t\H0) в 1 ; Подставляя (320) в определение /, имеем E(l\H1)=kmTQm1 (335) и E(l\H0) = AmTQm0. (336) Используя (332), (333) и (336), получаем σ2 [I \Н0] = Е {[Am** Q (R-m0)] [(R^-iV) Q Am]}. (337) Используя (321) для оценки математического ожидания, а затем (323), имеем a2[l\H0] = AmTQAm. (338) Подставляя (335), (336) и (338) в (334), получаем d2 = AmTQAm. (339) Итак, качество критерия для случая равных ковариационных матриц в гауссовой задаче полностью определяется квадратичной формой (339). Попытаемся интерпретировать это для нескольких представляющих интерес случаев. Случай 1. Независимые компоненты с равными дисперсиями. Все г% имеют одинаковые дисперсии σ2 и статистически независимы. Таким образом, Κ=σ2Ι (340) и Q=-ri. (341) σ2 Подставляя (341) в (339), получаем d* = AmT J_iAm = — AmTAm = — |Am|2 (342) или d = I^!ui (343) Видим, что d соответствует расстоянию между двумя векторами-средними, деленному на среднеквадратическое отклонение величины/?/. Это показано на рис. 2.32. Из (332) явствует, что l==±kmTR. (344) σ2 108
Таким образом, достаточная статистика есть просто скалярное произведение наблюдаемого вектора R и средней разности векторов Am. Рис. 2.32. Векторы средних значений. Случай 2. Независимые компоненты с неравными дисперсиями. Здесь г % — статистически независимы, но имеют разные дисперсии. Таким образом, К = <V О оЪ (345) Q ■_ι_ σ2ζ σΝ* (346) Подставив (346) в (339) и выполнив умножение, получим *=2 (Дтг)2 Ш of (347) Теперь различные разностные компоненты участвуют в формировании d2 со своими весами, которые обратно пропорциональны дисперсиям по соответствующим координатным осям. Этот результат можно 109
также истолковать как расстояние в новой системе координат. Пусть Ат' = Amx σι — Am2 σ2 —Лт# (348) *,' = —*ι· (349) Это преобразование изменяет масштаб по каждой оси так, что все дисперсии становятся равными единице. Мы видим, что d точно соответствует вектору-разности в этой преобразованной системе координат. Достаточная статистика равна N *(R)~2 Am/ Rt (350) /=ι °ϊΔ В преобразованной координатной системе она равна скалярному произведению двух векторов: l(R') = km'T R'. (351) Случай 3. Это общий случай. Удовлетворительный ответ для I и, d дают (332) и (339): l(R)=\mTQR (352) и d2 = &mTQAm. (353) Смысл наиболее существенных моментов данной задачи раскрывается весьма наглядно, если подойти к ней с несколько иной точки зрения. Упрощения случаев 1 и 2 можно достигнуть при помощи диагональной ковариационной матрицы. Этим самым предполагается, что мы пытаемся представить R в новой системе координат, в которой компоненты вектора являются статистически независимыми случайными величинами. На рис. 2.33, а показаны результаты наблюдения в исходной системе координат. На рис. 2.33, б изображена новая система координатных осей, обозначенных ортами Фь Ф2, ..., Φν, Φ/Φ7=δί7. (354) Обозначим результат наблюдения в новой координатной системе через г'. Требуетсжйыбрать ориентацию новой системы координат так, чтобы компоненты г'г и r'j были некоррелированными (а следовательно, и ПО
статистически независимыми, так как они являются нормальными) при всех ιφ\. Другими словами, £ [(/ϊ-m,') (г/-т/)] = λ,β„, (355) где т/А£(г/) (356) и о*[гП±К (357) л) ^ Рис. 2.33. Системы координат: а—исходная система координат; б— новая система координат. Теперь компоненты вектора г' можно выразить весьма просто в виде скалярного произведения исходного вектора г и всевозможных ортов: г/=гТф. = ф.тг. (358) Используя (358) в (355), получаем Ε [Φ? (r-m) (rT-nf) φ7] =: λ, 6U. (359) Математическое ожидание от случайной части есть просто К [см. (321)]. Поэтому (359) приобретает вид ^б;У = Ф^КФ7·. (360) Это уравнение удовлетворяется тогда и только тогда, когда λ;Φ7=ΚΦ, при /=1,2, ...,ЛЛ (361) Для проверки необходимости условия (361) подставим его в (360): λ,δ,^Φ,'λ,Φ^λ,δ,,, (362) где правая часть равенства вытекает из (354). Условие достаточности легко доказывается от противного. Теперь (361) можно записать, опустив подстрочный индекс /: λΦ = ΚΦ. (363) Мы видим, что вопрос отыскания соответствующей системы координат сводится к вопросу, сможем ли мы найти N решений уравнения (363), которые удовлетворяли бы (354). 111
Целесообразно выписать (363) подробно. Каждое Φ есть вектор, имеющий N компонентов: Ф = "Φι' ф2 Фз Φν (364) Подставляя (364) в (363), получаем ΚηΦ1+Κί2Φ2+...+ΚΐΝΦΝ = λΦ1, Κ2ι Φι + К22 Ф2 + · · · + Κ2Ν Φν = λΦ2, Κν\Φι + Κλ/2Φ2 +... + ΚννΦν^^Φν . (365) Мы видим, что (365) соответствует системе из N однородных уравнений. Нетривиальное решение этой системы существует тогда и только тогда, когда детерминант матрицы коэффициентов равен нулю. Другими словами, если и только если |Κ-λΙ| = К11 λ к 21 χ 31 Кг !*» ! К 22' К 32 К, 23 Κνν—λ = 0. (366) Это есть полином Ν-το порядка относительно λ. Ν корней, обозначаемых через λи λ2, ..., λ#, называются собственными значениями ковариационной матрицы К. Можно показать, что справедливы следующие свойства (см., например, [16] или [18]): 1. Так как матрица К симметрична, то собственные значения вещественны. 2. Поскольку матрица К является ковариационной, собственные значения неотрицательны. (В противном случае мы имели бы случайные величины с отрицательными дисперсиями.) Для каждого λ/ мы можем найти решение <Df уравнения (363). Поскольку с каждым решением (363) связана соответствующая произвольная постоянная, то <Df можно выбрать так, чтобы его модуль был равен единице, т. е. Ф7ГФ, = 1. (367) Эти решения называются нормированными собственными векторами матрицы К. Для симметричных матриц можно также указать два других свойства. 112
3. Если корни λ^ различны, то соответствующие собственные векторы ортогональны. 4. Если какой-либо корень λ7· имеет кратность Λί, то Μ соответствующих собственных векторов линейно независимы. Их можно выбирать так, чтобы они были ортонормированными. Итак, мы описали координатную систему, в которой наблюдения являются статистически независимыми. Среднеразностный вектор можно выразить как Ami =ΦιΓΔπι, Дт2' = Ф2гАт, (368) ΔιηΝ' = Фл/7,Дт или в векторном представлении Am' = Ф*т _ Am Δ W Am. '(369) Результирующая достаточная статистика в новой координатной системе равна N 1(Ю ф = = N V г=1 (Δ/и \ %Ύ_% (370) (371) ί = 1 Выкладки, приведшие нас к (371), были довольно сложными, но данный результат имеет фундаментальное значение, так как он показывает, что всегда существует координатная система, в которой случайные величины некоррелированны, и что новая система связана с исходной линейным преобразованием. Для иллюстрации этого метода рассмотрим один простой пример. Пример. Ради простоты положим N = 2 и т0 = 0. Пусть °"=Г"1· Для отыскания собственных значений решим уравнение 1—λ ρ 1-λ = 0 (372) (373) (374) 113
или (1_λ)*—р* = 0. Решая (375), находим, λι=1 + Ρ, λ2=1—р. Чтобы найти Фь подставим λχ в (365): [1 Р]ГФц] Г(1+Р)Фц] |_Р iJLOiaJ Ь + Р)Фи]в Решая (377), получим Φιι = Φι наблюдение (375) (376) (377) (378) Рис. 2.34. Поворот коорди- натных осей. После нормировки имеем Φι = Аналогично, + V2 + V2 (379) Ф* = + 1 V2 1 (380) Старая и новая системы координат показаны на рис. 2.34. Преобразование можно записать в виде 1 { 1 τ W = + V2 "Τ"" L^ V~2 + + Λ/2 V2J Ri - γ2 ' Ш11 = V2 ' «.' = /?!—/?: (381) (382) Υ2 ' mi2" /2 " 114
Достаточную статистику определим, используя (382) в (370): ,,„,, 1 (fii + fii)(«ii + «i») , 1 (Κι—Κι)(«ιι-«ιι) /(R)=TT^ 2 ^7=^ i и (383) ,, («ц + m»)» , (mu-тц)» (отцТ |(ι»ιι')' ,ш, d- 2(l + p) + 2(l-p) - 1+p + 1-p· (384) Для иллюстрации типичного случая применения, когда подобное преобразование приобретает большое значение, рассмотрим одну простую задачу оптимизации. Модуль вектор-среднего ограничен |ш1|2 = 1. (385) Требуется выбрать Шц и т12, чтобы максимизировать d2. Так как наше преобразование сводится-к повороту, то модули векторов при этом сохраняют свои величины: |ш1/|2=1. (386) Решение уравнения (384) получим путем проверки: если ρ > 0, то выбираем т'п = 0 и ш'12 = 1; если ρ < 0, то выбираем /n'u «= 1 и т'12 = 0; если ρ = 0, то все векторы, удовлетворяющие (385), дают одинаковое d2, Легко усмотреть, что это соответствует выбору вектор-среднего, равного собственному вектору с наименьшим собственным значением. Этот результат нетрудно распространить на случай N измерений. Результат данного примера характерен для широкого класса задач оптимизации, в которых решение соответствует собственному вектору (или аналогичному ему сигналу). В изложенном параграфе было показано, что когда ковариационные матрицы по обеим гипотезам равны, то достаточная статистика I (R) есть нормальная случайная величина, получаемая путем линейного преобразования R. Качество критерия при любой установке порога определяется значением d2, получаемым из уравнения (339) на рабочей характеристике приемника рис. 2.9. Ввиду того что качество улучшается монотонно с возрастанием d2, для максимизации d2 можно пользоваться неограниченной свободой при выборе параметров, не рассматривая рабочей характеристики приемника детально. 2.6.2. Равные вектор-средние Во втором интересующем нас частном случае вектор-средние по обеим гипотезам равны, т. е. nii=m0Am. (387) Подставляя (387) в (327), имеем ^-(Rr_m7)(Q0_Q1)(R_ni)§ln4+-l-ln Ко = γ*. (388) Так как вектор-средние не содержат никакой информации, которая говорила бы нам, какая из гипотез является истинной, то при 115
испытании по критерию отношения правдоподобия они вычитаются из принятого вектора. Поэтому, не теряя общности, мы можем принять m = 0. Обозначим разность обратных матриц через AQAQ0—Qx. (389) Алгоритм испытания по критерию отношения правдоподобия можно записать в виде I (R) Δ RT AQR J 2γ* Δ γ'. (390) Но Заметим, что 1 (R) есть скалярное произведение двух нормальных векторов R7 и AQR. Поэтому I (R) не является нормальной случайной величиной. Рассмотрим теперь поведение этого критерия в некоторых интересующих нас частных случаях. Случай 1. Диагональная ковариационная матрица по гипотезе Н0: равные дисперсии. Здесь Rt по #0 являются статистически независимыми величинами с одинаковыми дисперсиями: Κ0 = ση4. (391) Мы увидим позднее, что (391) соответствует такой физической ситуации, когда «шум» имеется только по гипотезе Η 0. Удобно ввести следующее обозначение: г, = л„ Я0; (392) гх по гипотезе Нг содержит ту же самую величину, что и по гипотезе Я0, плюс дополнительные компоненты сигнала, которые могут быть коррелированными: r^Si + n^ Н19 Κι = Κβ + σηΜ, (393) где матрица Ks представляет ковариационную матрицу компонентов сигнала. Тогда Qa = —I (394) Формулу (395) удобно записать в виде Q1==-L[I-HL (396) откуда следует, что Η = К*1 + К,)-1 Ks = К5 Κ* Ι + К.)-' = ση* (Q0-Qi) = ση2 AQ. (397) 116
Матрица Н имеет важный смысл, который мы раскроем позднее. Первое выражение из (397) мы возьмем в качестве ее определения. Подставляя (397) в, (389), а результат — в (390), получаем l(R) = ±RTHR^yf. (398) Рассмотренный случай, в свою очередь, включает в себя три подслучая. Случай 1А. Некоррелированные, одинаково распределенные компоненты сигнала. В этом случае компоненты сигнала s7· являются независимыми величинами с одинаковыми дисперсиями: Поэтому или Κβ=σθ4. (399) Η = (ση4 + σβ4)-'σβ4 (400) Н=—^—I * (401) 2 1 /г 2 N <Уп2<*п2 + <*з2 <Уп2<Уп2 + <*82 Ad /=1 Постоянную величину можно учесть величиной порога. При этом N Их /(R)A Σ Rf^y". (403) Вычислим теперь качество критерия. По обеим гипотезам I (R) представляет собой сумму квадратов нормальных величин. Различие гипотез заключается в дисперсии нормальных величин. Ради простоты предположим, что N есть четное целое. #Для отыскания pi\H0(L\H0) заметим, что характеристическая функция каждого Rt2 равна оо MRi4H.(jv)± Г е!°**ш-±- е-^2/2а2-^=(1-2роп2)-1/2. (404) Ввиду независимости указанных величин Мцн. (jv) можно записать в виде произведения. Следовательно, Мцн. (М = (1-2W-^. (405) Произведя обратное преобразование, получим распределение pЦнΛЦH0) = ^2N^cnNΓ(N/2), " ' (406) I 0, L<0, 117
известное как распределение χ2 (хи-квадрат) с N степенями свободы. Это распределение табулировано в нескольких пособиях (см., например, [19], [3]). Для N = 2 легко проверить, что оно является просто экспоненциальным распределением (стр. 53). Аналогично, [ i"/2-i e-*-/2*' L>0 рцНгЩНг)^] 2Ν'2σ1ΝΤ(Ν/2) ' ^ ' (407) I 0, L<0, где σι2Λσ52 + σΛ2. Выражения для PD и PF имеют вид оо Pd = J VN/2 θ!Ν Γ (Ν/2)]~ι LN'2-1 e-UWdL (408) ΡF = j [2W/2 σ„" Γ (iV/2)]-1 LN'2-1 e-Lm* dL. (409; v" Построение рабочей характеристики приемника требует оценки обоих приведенных интегралов. Нетрудно заметить, что для случая N = 2 имеем такую же задачу, что и на стр. 53, и (408) и (409) сводятся к виду 2? (410) И PF=(PD)0+V/<V). (411) Для общего случая существует несколько методов вычислений. Прежде всего, положим Μ = Ν/2 — 1 и γ'" = γ"/2σ2Λ. Тогда можно написать ν'" о Данный интеграл, именуемый неполной гамма-функцией, был табулирован Пирсоном [21]. В [21]1) приведены таблицы для функций иУЩл ж. /г (и, Λί)Δ Ж6_Д;С?Л; (41?) х) См. также [42]—Прим. ред. 118
и Pp = l-hl Μ (414) Наиболее полезными являются таблицы для Pf^> Ю~6 и Μ ^ 50. При втором методе вычисления производится Λί-кратное интегрирование по частям, результатом чего является м Pf = exp(~Y'")2 (γ"Τ *=о fe! (415) Для малых Pfзначение у'" велико и ряд можно аппроксимировать несколькими последними членами: ,_(ГУ μ e-v» М\ [.+ у'" М(М — 1) (ΥΎ Кроме того, можно аппроксимировать выражение в скобках посредством (1 — Μ/γ'")""1. Это дает Pf^ (ГУ м e-V"] (416) квадратных (417) М1(1—М/у'") Аналогичное соотношение получается и для PD, если γ"' заменить на yivAy,f/2Gi2. Приближенное выражение (417) пригодно для вычислений вручную. На практике используют (415) и вычисляют рабочую характеристику приемника численными методами. На рис. 2.35, а приведена рабочая характеристика приемника для нескольких репрезентативных значений N и o2Jo2n. Особенно интересными являются две кривые, соответствующие N = 8, σ28/σ2η = 1 и N = 2, o2Ja2n = 4. В обоих случаях произведение Νσ28/σ2η = 8. Мы видим, что, когда требуемая Pf > 0,3, Pd получается выше, если имеющаяся в нашем распоряжении «сила сигнала» подразделяется на большее число компонентов. Из этого следует, что для каждого значения PF и произведения Νσ25/σ2η должно существовать оптимальное N. В гл. 4 мы убедимся, что эта задача соответствует задаче оптимального разнесения в системах связи, а также задаче оптимальной энергии в импульсе в радиолокации. На рис. 2.35, б, в Рм представлена как функция N для Рр = Ю-2 и Ю-4 соответственно, а также для различных значений произведения Na2Ja2n. Физический смысл указанных результатов будет обсужден в гл. 4. Случай 1Б. Независимые компоненты сигнала: неодинаковые дисперсии. В этом случае компоненты сигнала st являются независимыми величинами с дисперсиями ol KS = -< s2 0 JsN (418) 119
Поэтому Η Г Л <£+<U Js2 <*+< SN olW sN_ (419) 0,2 0,1 0,06 0,0b 0,02 0,01 \ t4· к V ^!kl/\ Pf-ίΟ'2 \|!й λ . I,—1—1 1 1 1 1 1 * 6 в 12 20 «ON 6) ' 2 * β 8 12 20 40 14 Рис. 2.35. a — рабочая характеристика приемника: случай гауссовых величин с одинаковыми средними значениями и неравными дисперсиями по двум гипотезам; б — зависимость PmotN(Pf = Ю-2); в — зависимость ΡΜοτ N (PF = 10"~4). 120
(420) Характеристическая функция I (R) получается просто, однако вычисление Рр и PD вызывает затруднение. В § 2.7 мы выведем приближенные выражения для качества критерия, которые приводят к более простым формулам. Случай 1В. Произвольные компоненты сигнала. Этот случай, несомненно, является общим. Мы вновь обратились к нему просто для того, чтобы указать, что его всегда можно свести к случаю 1Б посредством ортогонального преобразования (см. рассуждения на стр. 110—114). Случай 2. Симметричные гипотезы, некоррелированный "шум. Случай 1 был несимметричным, поскольку имелась гипотеза о наличии одного шума. В данном случае имеем следующие гипотезы: Ht:rt= HQ:r(= Si + rii, i = l,..., Ν, η„ i=JV + l,..., 2N, nit i = l,... , Ν, st + nt, i = N + l,..., 2N, (421) где nt — независимые величины с дисперсиями σ2η, a st имеют ковариационную матрицу Ks· Поэтому [ση»Ι + Κ. О 1 (422) к. 4е·'1 L 0 σ»·Ι О +KS (423) где мы подразделили (2N χ 2М)-матрицы на (Ν χ М)-субматрицы. Следовательно, AQ = h' · 1 _ 0 (an4 + Ks)~\ — -(σ„·Ι + Κ,)- 0 Используя (397), имеем AQ-Li" VI, σ„2|_ ° —HJ где согласно (397) матрица Η равна н^кч- +-К Л-'К.. σ«2 Ι 71 J (424) (425) (426) 121
Если разбить R на две (Ν χ 1)-матрицы: Ri R = lRu ТО Z(R) = ^R11,HRl-R/HR,ev/ (427) (428) Частные случаи, аналогичные 1А и 1Б, вывести не представляет труда. Случай 2А. Некоррелированные, одинаково распределенные компоненты сигнала. Пусть (429) тогда Ν 2Ν Нх /(R)= S Λι·— Σ Rt2 г=1 i=N+\ (430) Если гипотезы равновероятны, а критерием является минимум Ρ(ε), то порог η при испытании по критерию отношения правдоподобия равен единице (см. 69). Из (388) и (390) видно, что это получается при yv = 0. Этот случай встречается довольно часто и приводит к простому вычислению ошибки. Критерий в этом случае приобретает вид N Нг 2N MR)*Stff255 Σ #^/o(R). * - я0/=лЧ-1 ;=ι (431) Вероятность ошибки при условии, что истинна гипотеза #ь есть вероятность того, что /0 (R) > U (R). Так как критерий симметричен по отношению к обеим гипотезам , то Р(е)=±Р(в\Н1)+±РШ0)=Р(г\Н1). (432а) Таким образом, оо оо Ρ (ε) = ξ dLj. pu | я, {Li | Hi) J pu | я, (L01Η J dL0. (4326) 0 Lt Подставляя (406) и (407) в (4326), вспоминая, что N четно, и оценивая внутренний интеграл, получим р<Н^ N/ 2-1 -Ы*** X Г (N/2) N/2-1 X ^V^^^^ldLt. (432b) *22
Полагая α: <t +οϊ и интегрируя, сведем (432в) к виду N N12-1 /JJL_J_/_r Р(г)=ам/2 2 2 ' 1(1—«)/. (433) (434) Этот результат принадлежит Пирсу [22]. Это выражение имеет замкнутую форму, но пользоваться им утомительно. Отложим построение графика выражения (434) до § 2.7, где для сравнения будет выведено приближенное соотношение. Случай 2Б. Некоррелированные компоненты сигнала: неодинаковые дисперсии. В этом случае т2 Ks = s2 о "sN (435) Легко показать, что N 1 '(R) = -4 2N tf σ«-Κ «ι (436) Как и в случае 1Б, вычисление качества встречает затруднение. Приближенные выражения, полученные в §2.7, в этом случае также оказываются полезными. 2.6.3. Краткие итоги Мы подробно обсудили общую гауссову задачу и установили, что достаточная статистика является разностью между двумя квадратичными формами: J(R)=-^(R^-m0^)Q0(R-m0) —^-(R^-m/) (MR-mJ. (437) Особенно простым частным случаем является случай, когда ковариационные матрицы по обеим гипотезам равны. Тогда /(R) = — Am^QR (438) и качество критерия полностью характеризуется величиной d2: d2 = AmrQAm. (439) 123
Когда ковариационные матрицы не равны, применение критерия отношения правдоподобия по-прежнему не встречает затруднений, однако вычисление качества критерия .затруднительно (напомним, что d2 уже не применимо, так как I (R) не является гауссовой). В простейшем случае диагональных ковариационных матриц с одинаковыми элементами были выведены точные выражения для ошибок. В общем случае точные выражения возможны, но они слишком громоздки, чтобы ими можно было пользоваться. Указанная невозможность получить удобные выражения для качества побуждает нас в следующем параграфе рассмотреть границы качества и приближенные выражения. Прежде чем закончить с общей гауссовой задачей, следует отметить, что аналогичные результаты можно получить для случая Μ гипотез и для задачи оценки. Некоторые из этих результатов выводятся в задачах вне основного текста. 2.7. Границы качества и приближенные выражения До сих пор мы имели дело преимущественно с задачами, в которых можно синтезировать структуру оптимального приемника и получить сравнительно простые выражения для рабочей характеристики приемника или для вероятности ошибки. Во многих представляющих для нас интерес случаях оптимальный критерий может быть установлен, однако произвести точное вычисление качества невозможно. В этих случаях приходится прибегать к граничным или приближенным выражениям для вероятности ошибки. В данном параграфе будут выведены некоторые простые граничные и приближенные выражения, которые используются во многих задачах, представляющих практический интерес. Основные результаты, принадлежащие Чернову [28], были развиты первоначально Шенноном [23]. Они получили дальнейшее развитие в работах Фэно [24], Шеннона, Галлагера и Берлекэмпа [25], а также Галлагера [26] и были применены к решению интересующих нас задач Джекобсом [27]. Наш подход основывается на двух последних работах. Поскольку последняя часть изложения по своему характеру является эвристической, то с более тщательными выводами интересующийся читатель может познакомиться в указанных источниках. Что касается использования полученных результатов в последующих параграфах, то мы не будем применять их вплоть до гл. 3 второго тома (указанные результаты также понадобятся нам при решении задач в гл. 4). Интересующая нас проблема является общей бинарной задачей испытания гипотез, намеченной в § 2.2. Из результатов этого параграфа известно, что она сводится к испытанию по критерию отношения правдоподобия. С этого момента мы и начнем наше обсуждение. Критерий отношения правдоподобия имеет вид /(R)MnA(R) = ln Г|Я1 ' ^V- (440) L Рг\н0№\но)] н0 124
Величина / (R) есть случайная величина, плотность вероятности которой зависит от того, какая из гипотез является истинной. На рис. 2.36 показаны типичные распределения рцн1 (L\Hi) и /?д#0 (L\H0). Если обе плотности вероятности известны, то Pf и Pd определяются формулами PD = lpi\HAL\HJdL, (441) PF = lpi\H.(I<WdL. (442) Трудность заключается в том, что найти pi\Ht (Ц Ht) бывает весьма сложно и даже если ее и можно отыскать, то выражения оказываются очень громоздкими. Типичным с точки зрения этой сложности может служить случай 1А на стр. 117, где имелось N гауссовых величин с одинаковыми дисперсиями, образующих сигнал. Для анализа данной системы ошибки можно оценивать численными методами. С другой стороны, если нам требуется синтезировать систему, то неэффективно (а, может быть, и невозможно) перебирать все системы и оценивать каждую из них численными методами. Поэтому нам следует найти несколько более простых приближенных выражений для вероятностей ошибок. В этом параграфе мы выведем ряд простых выражений, которые будем использовать в последующем. Сначала сосредоточим внимание на случаях, когда / (R) является суммой независимых случайных величин. Из этого следует, что может быть полезной характе- Τ ^Рш Мно) ристическая функция, так /N. ° как она будет произведением / N. ^χ^Τ^ν/ty// (LlHi) индивидуальных характери- '' χ ν^ι \ ι стических функцийRt. Точно так же производящая функция моментов будет произведением отдельных производящих функций моментов. Следовательно, приближенные выражения, основанные на одной из этих функций, можно сравнительно просто оценивать. В первой части нашего обсуждения устанавливаются границы вероятностей ошибок в терминах производящей функции моментов I (R). Во второй части рассматривается случай, когда I (R) является суммой большого числа независимых случайных величин. Путем использования центральной предельной теоремы мы улучшаем результаты, полученные в первой части. Начнем с вывода простой верхней границы вероятности ложной тревоги PFy выражаемой через производящую функцию моментов. Рис. 2.36. Типичные плотности. 125
Производящая функция моментов I (R) по гипотезе Н0 имеет вид оо Ф,,я.(^£(е"|Яо) = ^рцнЛЦНо)^, (443) —оо где s есть действительная переменная (область изменения s соответствует тем значениям, для которых интеграл существует). Мы вскоре увидим, что более целесообразно записать Ф/1я0(5)^ехрИ5)], (444) так что оо μ(ί) = Ιη $^pnH,(L\H0)dL. (445) —оо Можно также выразить μ (s) при помощи рг \ нх (R | Нг) и рг ι я0 (R | #о)· Так как I есть просто функция г, (443) можно записать в виде оо Φι !».(.)= Jes'(R)Pr|Wo(R^0)dR. (446) —оо Тогда оо μ(ί) = Ιη jV<R>pr|//o(R|tf0)<fR. (447) —оо Используя (440), получим ^S)=ln ?(!Г'Я,!р|я!У^'я.(Я|Я,)^ (448) ИЛИ оо μ (s) = In j [ρ 11 я, (RI Нг)]* lpr | fl. (R | Я0)] '-* dR. (449) —oo Функция μ (s) играет в дальнейшем центральную роль. Теперь удобно переписать выражение для ошибок через новую случайную величину, среднее значение которой лежит в окрестности порога. Это объясняется тем, что во второй части нашего обсуждения мы собираемся использовать центральную предельную теорему. Она наиболее эффективна вблизи среднего значения рассматриваемой случайной величины. Рассмотрим простую плотность вероятности, показанную на рис. 2.37, а. Чтобы получить новое семейство распределений, изображенное на рис. 2.37, б, в> г, умножим рх(Х) на esX для различных значений s (и нормируем для получения единичной площади). Видно, что для s > 0 среднее значение сдвигается вправо. Будем на некоторое время считать s параметром. При увеличении s распределение становится все более неравномерным. 126
Обозначая эту новую переменную через xs> имеем РхЛХ)^ esXPl]Ho(X\H0) __ esXPl] Ho (X | Η0) J esLpnHo(L\HQ)dL *μ (s) (450) Заметим, что величина xs определена посредством ее распределения, которое нас интересует. Уравнение (450) является общим определением. Для распределения, показан- р ^» ного на рис. 2.37, пределами служат (—Л, А). Найдем теперь среднее и дисперсию величины xs: £(*,)= J XpXs(X)dX = —оо JxesXpnHt(X\H0)dX J esLpnH^L\H0)dL (451) Сравнивая (451) и (445), видим, что (452) as Аналогично находим σ2(**)=μ(5). • *-■ * г Ά -А -А JL Я \2А -У *(χ)-Ρχ(Χ) при s=0 1 У А X порог чх) L^-^Ί s°>0 У А X Ι ι \Щ 7 > в) U»y* ί χ VS1>S0>0 (453) Υ A г) (Отметим, что из (453) вытекает, что ^J^^H^^" функция μ (s) является выпуклой.) Перепишем теперь выражение для PF через переменную xs: оо оо Рр = § Pi\H.(L\H0)dL=$eH*)-*XpX9(X)dX = У У оо = βμ(5) je-^p^(X)dX. (454) Υ Теперь можно найти простую верхнюю границу PF. Для значений s> 0 (455) (456) e-sX<e~sv при Χ>γ. Таким образом, /V < е* <*> -sv j ρΧβ (X) dX, s > 0. 127
Очевидно, данный интеграл меньше единицы. Следовательно, PF<e^<s)-sv, s^>0. (457) Для отыскания наилучшей границы минимизируем правую часть уравнения (457) относительно s. Дифференцируя экспоненциальную функцию и приравнивая результат дифференцирования нулю, получим μ(*)=Υ· (458) Так как μ (s) неотрицательно, решение будет существовать, если μ(0)<γ<μ(οο). (459) Поскольку μ(0)=Ε(1\Η0), (460) то из левого неравенства вытекает, что порог должен быть правее среднего значения I по гипотезе #0. Полагая, что (459) справедливо, получаем требуемый результат: PF < ехр [ μ (s) — s\x (s)] , s > 0, (461) где s удовлетворяет уравнению (458). (Мы предположили, что для требуемого s существует μ (s)). Уравнение (461) обычно называют границей Чернова [28]. Заметим, что s выбирается так, чтобы среднее значение величины xs было равно порогу. Следующий наш шаг — найти границу вероятности промаха: ν Рм=\ PnHt(X\H1)dX, (462) —оо которую мы хотим выразить через преобразованную величину х8· Применяя доказательства, идентичные использованным в (88) — (94), видим, что РцнЛХ\Н1)=ехРцнЛХ\Но). (463) Подставляя (463) в правую часть (450), имеем Pi \Нг(Х\ Нг) = е» <*>+<■-> *pXs (X). (464) Подстановкой в (462) получим У рм =е»(*) J e< 1-5) х Ρχ$ (χ) αχ. (465) —оо Для s ^ 1 e<i-s)x^;e<i-s)Y при Χ<γ. (466) 128
Следовательно, γ P*<ei*<«>+<i-s>Y при s< 1. И на этот раз граница минимизируется при (467) (468) γ = μ(δ), если решение существует для s< 1. Замечая, что μ(1)=£(/|#ι), (469) приходим к выводу, что порог должен быть левее среднего значения I по гипотезе #х. Комбинируя (461) и (467),у имеем Ρ*<βχρ[μ(*)-5μ(5)], г,ч · ι 0 < s < 1, (470) ΡΛί<βχρ[μ(5) + (1-5)μ(5)] ^ /*(*,)+(7-,у,)уй(5,) (показатель стелена, б быражении для границы ошибки Рм) γ = μ(5) есть порог, который лежит между средними значениями / по двум гипотезам. Ограничение s пределами [0,1] не является чрезмерно жестким, так как если порог не лежит между средними значениями /, то вероятность ошибки будет большой по одной гипотезе Л (больше 1/2, если медиана совпадает со средним). При моделировании некоторой физической системы это обычно соответствует неприемлемой достоверности и вызывает необходимость изменения системы. Как указывается в [25], экспоненты (470) имеют простую графическую интерпретацию. Типичный вид μ(5) показан на рис. 2.38. Касательная проведена в точке, где μ (s) = γ. Эта касательная пересекает вертикальные линии s = 0 и s= 1. Ордината точки пересечения при s = 0 равна показателю в выражении для границы Pfy а ордината точки пересечения при s = 1 равна показателю в выражении для границы Рм- Для частного случая, когда обе гипотезы равновероятны и стоимости ошибок одинаковы, мы знаем, что γ = 0. Поэтому для минимизации границы выбираем значение s, где μ (s) = 0. (показатель степени 6 быражении для границы oiuuuku PF) Рис. 2.38. Показатели экспоненциальных функций, определяющих границы вероятности пропуска и ложной тревоги. 5 Зак. 693 129
Вероятность ошибки равна P{s)=-LPF + -LPM. (471) Подставляя (456) и (467) в (471) и обозначая значение s, при котором μ (s) = 0, через sm, получим оо О P(e)<-i-e^sm)^Pxs{X)dX + ±e^sm) j Px$(X)dX (472) или Р(е)<уецМ. (473) До сих пор мы рассматривали произвольные испытания двух гипотез. Границы (470) и (473) всегда справедливы, если существует μ (s). Во многих случаях, представляющих интерес, I (R) состоит из суммы большого числа независимых случайных величин, и мы можем получить простые приближенные выражения для Рр и РМу которые обеспечивают гораздо более точную оценку их действительного значения, чем приведенные выше границы. Экспонента в этих выражениях будет такой же; но коэффициент часто будет значительно меньше единицы. Начнем вывод этого выражения с формулы (454) для Рр- Основываясь на нашем результате (458), полученном при выводе границы, выбираем s так, чтобы μ 00= γ. Тогда (454) приобретает вид оо PF=e»(s) ( e-*xpx(X)dX. (474) Это можно записать иначе: оо pF = eMs).-sMs) j e+e№<«>-*! ρ,β(X)dX. (475) fi(s) Коэффициент за знаком интеграла есть просто граница (461). Для оценки этого интеграла используем теперь доказательство центральной предельной теоремы. Сначала зададимся нормированной величиной д rxs—E(xs) __ *s—μ($) ^ (476) ~ (σ2 Μ)1/2 Y^{s) ' Подставляя (476) в (475), имеем оо рр ==6μ (s)-s.ii (s) \z-sVJVs)Ypy(y)dY. (477) 0 130
Во многих случаях распределение величины г таково, что у стремится к гауссовой случайной величине при N (числе компонентов г), стремящемся к бесконечности1 >. Простой случай, когда это справедливо, соответствует условию, если гк—независимые одинаково распределенные случайные величины с конечными средними и дисперсиями. В таких случаях у стремится к гауссовой случайной величине с нуле- -s\ffls)Y Рис. 2.39. Поведение экспоненциальных функций, определяющих границы. вым средним и единичной дисперсией и интеграл (477) может быть оценен путем подстановки предельной плотности Fe_s ViLTs) γ __Lе-(У»/2) dY = es*'»<s>/2 erfc* (s Vji(s)). (478) ο /~2π Тогда [μ(5)-βμμ)+-ί-μ(5)]}βΓίέ, [sΚμ(s)]. (479) Приближенность вытекает из того, что у только приближенно гауссова при конечных N. Для значений s|/"ji (s) > 3 функцию erf с* (-) можно приближенно заменить верхней границей (71). Используя эту аппроксимацию, имеем PF~— ехр ^(s)-sfi(s)], s>0. (480) \i2ns^ (s) Легко убедиться, что приближенное выражение (480) можно получить также, если положить ρ,αθ~ρ„(0)~-|=. (481) У 2я Из рис. 2.39 видно, что это справедливо тогда, когда экспоненциальная функция убывает до малой величины при У< 1. х) Превосходное изложение этого'вопроса можно найти в [33]. 131
Точно таким же образом получаем Рм « |ехр Γμ (s) +(1 —s)|i(s) + При (1—s)V"ja(s)>3 (482) сводится к Рл» . * exp [μ(5)+(1-5)μ(5)], s<l. (483) V 2π(1-s)«ii(s) Заметим, что экспоненты в (480) и (483) тождественны экспонентам, получаемым путем использования границы Чернова. Доказательство центральной предельной теоремы дало нам коэффициент, который будет иметь большое значение во многих интересующих нас приложениях. Для случая, когда критерием является Ρ (ε), а гипотезы равновероятны, имеем Р(г)=±РР + ±Рм.= -i-exp^isj+^iiisjjerfc, [sm • ffcj] + + -i-exp ^(sj + ll^^^sjjerfc, [(l-sjl/J^]> (484) где sw определяется из условия, сформулированного перед (472) (т. е. |i(sTO) = 0=v). Когда sm/jli(sj>3 и (l—sm)V\k(sJ>39 соотношение (484) сводится к i2(2^(sm))1/2sm(l-sm)] Рассмотрим теперь несколько примеров, иллюстрирующих приложение изложенных выше идей. В качестве первого разберем случай, когда точная достоверность известна. Чтобы проиллюстрировать соответствующую технику, произведем на этом примере разбор граничных и приближенных выражений. Пример 1. Рассмотрим простую гауссову задачу, впервые упомянутую на стр. 39: N ' " (Ri-my Рпл, <Κΐ"ι) = Π γ~^σ е*р[ 2σ2 (486) Ν (487) ι/ ·ζπ. σ \ *^σώ у /=1 Рг,я„(К|Яо)=П1~ехр(-^). 132
Тогда, используя (449), получим оо оо N i(s)=ln 5 ... ξ Π 1 У 2πσ exp Ввиду того что все интегралы идентичны, (Rt-mfs + RfQ-s) 2σ2 ]dRt. (488а) μ(5) -Μη J 1 У 2πσ exp [-^-^'У^-')]^. (4886) 0 OJ Q.2 0,3 С,Ч 0,5 0,8 0.7 0,8 0,9 s Рис. 2.40. μ (s) для гауссовых величин с неодинаковыми средними. Выполнив интегрирование, будем иметь т2 s(s — \)d2 μ(5) = ^(5-1)—Δ—L_2_, (489) где d2 было определено в формулировке, приведенной после (64). Кривая μ (s) показана на рис. 2.40: . (28-1) <Р μ<*) = g · Используя граничные выражения (470), получим -s2d2 (490) PF <ехр[^ - ), Г (1—s)2d2l 0 < s < 1. (491) Поскольку / (R) есть сумма гауссовых случайных величин, выражения (479) и (482) являются точными. Вычисляя μ ($), получаем ji(s) = d2. Подставляя (492) в (479) и (482), имеем PF = erfc* [s У μ (s) j = erf с* (sd) PM = erfc* [(1-s) УJJs)j =eric* [(l-s) d]. 133 (492) (493) (494)
Эти выражения тождественны (64) и (68) (достаточно положить s = =(1п х\)/(Р + у)· Еще более простой случай имеет место, когда критерием является полная вероятность ошибки. Тогда выбираем sm так, чтобы μ (sm) = 0. Из рис. 2.40 можно видеть, что sm = -9-. Используя (484) и (485), получаем P(e)=er4l94^U2exp(_ir). (495) Это приближение является очень хорошим при d > 6. Данный пример является частным случаем бинарной симметричной задачи испытания гипотез, в которой μ (s) симметрично относительно s = -9 · Когда это условие справедливо и критерием служит минимум полной вероятности ошибки Ρ (ε), то μ (-) становится существенной величиной: μ(τ)=1Π i^l^(R|Wi)]1/2[pr|^(R|W0)]i/2dR. (496) Взятая с противоположным знаком эта величина часто называется расстоянием Баттачари (см., например, [29]). Отметим, что эта величина имеет смысл только для sm = V2· В виде примера рассмотрим более интересный случай. Пример 2. Этот пример является случаем 1А общей гауссовой задачи, описанной на стр. 117: N Рг,я,(К|«х)=(П17=5Гехр(-1^-)> N "г,я.(К|Я.)-П1-7^Г«р(-^). (497) Подстановка (497) в (499) дает или r2\S//T2\l-s N μ(«)= —in βσ*+(1_β)σ* (499) Случай, который будет представлять интерес в последующем, соответствует условиям *12 = *»?' + *Л σ02 = ση2. (500) 134
Подстановкой (500) в (499) получим ^-{"-"■(■^НН-»^]}· ,501> Эта функция показана на рис. 2.41. μω=τ^-ι„(ι + —j^1+(1_s)CsWj (502) .. NT Qs2/Qn2 1 μ('} 2 U + 0-s)(as2/an2)J (503) Путем подстановки (501), (502) и (503) в (479) и (482) можно получить приближенную рабочую характеристику приемника. Для оценки точности приближения построенную характеристику можно сравнить с точной рабочей характеристикой, изображенной на рис. 2.35, а. Р2> 0,3 0,8 0,7\ 0,6 0,5 ЦЧ 0,3 0,2 0,1 / Точно / H*k / / 'Линии рабных f порогов / / / «/я2-/ / / / 0,Ь 0,6 0,8 Рис. 2.41. μ (s) для гауссовых величин с неравными дисперсиями. / / / / , / V. I L 0,1 0,г 0,3 ОМ 0,5 0,6 0,7 0,8 0,3 Рр Рис. 2.42. Приближенные рабочие характеристики приемника. На рис. 2.42 такое сравнение произведено для N = 4 и 8 и σ82/ση2= 1. Прямыми линиями соединены точки равных порогов. Видно, что приближение является достаточно точным. При больших N точные и приближенные рабочие характеристики можно считать идентичными для всех практических целей. Пример 3. В этом примере мы рассмотрим сначала упрощенный вариант симметричной ситуации проверки гипотез, описанной в случае 2А (стр. 122) при N = 2: Pr 1 я, (R I ft) = ,9ιτΛ2 αΛ ηΛ exp ( - 2(Ji2 ~ 2(Jq2 j . (504) (2π)2σι2σ02 135
где Тогда Pr| *.<*!".) = (2ji)2oi2<vexp^- — σι*=σ,·+σΛ»; ,2+/?4* \ 2σχ j' (505) (506) μ(5) = ί1ηση2 + (ΐ_5)ιπ(ση2 + σθ2)_1π((Τιι2 + σ825) + + (1—8)1πσΛ·4 β1η(ση» + σ,») —1η[ση»+σ,»(1—β)] = Функция μ(δ) представлена графически на рис. 2.43, а. Минимум функции имеет место при s—-^. Это и есть интересующая нас точка, где минимальная вероятность Р(е) является критерием. /*(s) -г ^w//#--/^ 1 N. 5 У \ \ W \ Г ^^J!!!L*y I—1 1—L...1 1_1.. 1 I 1 ,„„ О 0,2 0Л 0,6 0,8 S а) Рис. 2.43. а — μ(ε) для бинарной симметричной задачи на испытание гипотез; б — граница вероятности ошибки Ρ (ε). Таким образом, из (473) границей вероятности ошибки будет 1 (l+QsVon2) Ρ (ε)< 2 (1+σβ·/2σην ' (508) Граничное выражение (508) представлено графически на рис. 2.43, б. Пример ЗА. Интересным развитием примера 3 является задача, когда σι2 0 Ks = (509) JN/2—\ JN/2 J 136
Величины /*j независимы, и их дисперсии попарно равны. Это специальный вариант случая 2Б (стр. 123) Позднее будет установлено, что он соответствует физической ситуации, представляющей значительный интерес. Ввиду независимости величин μ^) является просто суммой μ(δ) для отдельных пар, ко каждая пара соответствует задаче в примере 3 Поэтому Ν/2 μ(5) = 2 Ιη ί=Ι 1 + s l + (l-s) 4 Тогдз Ν/2 Γ *2+*4 <+(i-»°*t Ν/2 ii(») = 2 + ■ /Τι Ι («2+*й)2 Κ+ο-*κ2(·] (510) (511) (512) Для критерия минимальной вероятности ошибки, как это очевидно из (511), sm=l/2. Используя (485), будем иметь Ρ (в) я ' /V/2 -2 = ' (σ« + Τσ. ■»·Υ Si J -1/2 Χ xexp Ν/2 Σ* /=1 Ν/2 ί'= 1 2σ* (513) Ρ (β): .V/2 π VI — 2^ (σ» + 4- +τσ« -1/2 JV/2 Π 1 + -'s/ ί=1 L ι—ι \ Для частного случая, когда дисперсии одинаковы, т. е. (514) сводится к Ρ (β) 4 ι2' 1 + Г7 2of σ?, = σ? /Τ (ΐ+σ»/σ»)^« K/°u)0 + <W) 2\W—1 (514) (515) (516) Можно пойти другим путем и использовать приближенное выражение (484). В данном случае оно приобретает вид Ρ (ε): г i + gsW γ/2- L(i+osv2on^J exp VMi* X erfc» Ν ,1/2 νά) \- I 8 V 1 + σθ2/2ση* - σ82/ση2 + σδ2/2ση3 (517) 137
На рис. 2.44 приближенное (517) и точное (434) выражения для вероятности ошибки Р(г) представлены графически. Видно, что степень приближения является очень высокой. Главными, принципиальными результатами данного параграфа являются граничные выражения (470) и (473) для вероятностей ложной тревоги PF и пропуска Рм соответственно, а также приближенные выражения для вероятности ошибки (479), (480), (482), (483), (484) и (485). Эти выражения позволят нам находить оценки достоверности в ряде физически интересных случаев. Результаты для некоторых других случаев можно найти Рис. 2.44. Точные и приближенные выражения для ошибки в бинарной симметричной задаче на испытание ν-υνΌ / ~~~То m гипотез. в [34] и [35], а также в задачах вне основного текста. В гл. 3 второго тома мы будем исследовать проблему обнаружения гауссовых сигналов на фоне гауссова шума. При этом для оценки достоверности оптимальных устройств обработки будут использоваться соответствующие модификации приведенных граничных и приближенных выражений. 2.8. Краткие итоги главы 2 В данной главе изложены наиболее существенные результаты теории обнаружения и оценок, которые дают нам основу для всего последующего изложения. Мы начали обсуждение с того, что рассмотрели простую бинарную задачу проверки гипотез. Используя критерии Байеса или Неймана _ Пирсона, пришли к критерию отношения правдоподобия," качество которого описывается рабочей характеристикой приемника. Аналогично, многоальтернативная задача привела нас к построению системы отношений правдоподобия. Это инвариантное относительно критерия сведение наблюдения к единственному числу в бинарном случае или к (Λί—1) числам в случае Μ гипотез является основным инструментом при решении задачи обнаружения, когда наблюдение является колебанием, представленным во времени. Изложение необходимых результатов теории оценок шло параллельно. Здесь фундаментальной величиной является функция правдоподобия. Как было указано в § 2.4, ее структура тесно связана со Hie) 0.01 138
структурой отношения правдоподобия, и это сходство позволит нам решить многие параллельные задачи теории оценок путем простого рассмотрения вида выражения. Задача на проверку сложной гипотезы еще более проливает свет на связь соответствующих задач теории обнаружения и теории оценок. Наше изложение, начиная с § 2.5, намеренно велось в общем виде и поэтому дает широкую основу для получения конкретных результатов во многих других областях помимо тех, на которые обращено внимание в остальной части книги. В § 2.6 наше внимание было переключено на общую гауссову задачу, ограничения которой позволили получить более конкретные результаты, чем те, которые дает общий случай. Задача с сигналом, представляющим функцию времени, аналогична общей гауссовой задачи и играет центральную роль в большей части всего последующего изложения. Результаты, полученные в рамках общей гауссовой задачи, свидетельствуют о том, что мы всегда можем найти оптимальное устройство обработки, однако точное вычисление его достоверности может встретить серьезные трудности. Этим объясняется то, что в § 2.7 мы занялись установлением граничных и приближенных выражений для вероятности ошибки. Эти выражения приведут нас к полезным результатам в ряде областей этой проблемы, имеющих практическое значение. 2.9. Задачи Все задачи подразделены на разделы, соответствующие основным параграфам главы. В тех разделах, где это представлялось целесообразным, задачи подразделены тематически на еще более мелкие группы. В заключение данного параграфа даны решения некоторых задач. Отметим, что такого же порядка мы будем придерживаться и в последующих главах. В параграфах 2.9, 3.9, 4.8, 5.7 и 6.7 рисунки и формулы нумеруются в пределах задачи. Номера рисунков и формул, в отличие от приведенных в основном тексте, помечены знаком*. Задачи к § 2.2. Испытания двух гипотез Простые бинарные испытания Задача 2.2 1 Рассмотрим следующую бинарную задачу на испытание гипотез: Нг :r = s + n, Н0 :г = п, где sun — независимые случайные величины, ps(i) 1 о s<o, "»w-(0 , yv<o. 139
1. Доказать, что критерий отношения правдоподобия сводится к виду Rmy. Но 2. Найти у для оптимального критерия Байеса как функцию стоимостей и априорных вероятностей. 3. Найти γ как функцию PF в случае критерия Неймана—Пирсона, прячем ΡF Δ Р{Нг I Я0) (т. е. вероятности утверждения гипотезы #ь если гипотеза Н0 — истинна). Задача 2.2.2. Двумя гипотезами являются H1:pr(R) = Yexp(-\R\), 1 / 1 //e:prW=7kexp(-Ti?i) 1. Найти отношение правдоподобия Л (R). 2. Полагая, что критерий соответствует Нг вычислить области решения для различных значений η. Задача 2.2.3. Случайная величина χ имеет нормальное распределение N(0, σ). Она претерпевает одно из двух нелинейных преобразований: Н^.у^х2, Н0:у = х*. Найти отношение правдоподобия. Задача 2.2.4. Случайная величина χ имеет нормальное распределение Ν(Ο,σ). Она претерпевает одно из двух нелинейных преобразований: H1:y = zxy Н0:у = х2. Ц,айти отношение правдоподобия. w Задача 2.2.5. Рассмотрим следующую задачу на проверку гипотез. Имеется Кх независимых наблюдений: Нг : г является гауссовой, N(0, Oj), i = 1,2, ..., /С, Я0 : г% является гауссовой* #(0, σ0), i= 1, 2, ..., /С, где σ0 < αν Ι. Вычислить отношение правдоподобия. 2. Полагая, что порог есть η и, следовательно, Нг A(R) уть Н0 К показать, что достаточная статистика равнз /(R) = 2 ^*2· Вычислить порог i = l V для критерия Нг Но выразив его через η, σ0, σ1β 140
3. Считая, что PF есть вероятность выбора Нх при условии, что истинна гипотеза Я0, а Р м— вероятность выбора Я0 при условии, что истинна гипотеза Hlt т. е. PP=P(Ht\H0), РМ=РШН{), найти выражения для PF и Рм. 4. Построить рабочую характеристику приемника для К = Ι, σχ2 = 2, σ02 = 1. 5. Каков порог для минимаксного критерия, когда См = CF и С00 = Си = = О? Задача 2.2.6. Результат наблюдения г определяется следующим образом: bnti + n · Hlt ( Ьтг-\-п · Hlt где Ь и η — независимые гауссовы величины с нулевыми средними и дисперсиями °"ь2 и °п2 соответственно. 1. Найти отношение правдоподобия и построить блок-схему оптимального устройства обработки. 2. Построить рабочую характеристику приемника. 3. Полагая, что обе гипотезы равновероятны и используя критерий минимальной вероятности ошибки, определить Р(г). Задача 2.2.7. Один из двух возможных источников вводит в простой канал вязи информацию, как показано на рисунке Источник 1 алиО 0,7 0,6 Канал Источники выдают либо I, либо 0. Числа на соответствующих линиях чертежа — вероятности перехода в канале, т. е. Р(а на выходе — I на входе) = 0,7. Источники характеризуются априорными вероятностями: источник 1: Р(\) = 0,5, Р(0) = 0,5; источник 2: Р(\) = 0,6, Р(0) = 0,4. Чтобы перевести задачу на известный нам язык, будем считать, что: а) ложная тревога — утверждается, что передает источник 2, когда на самом деле передает источник I; б) обнаружение — утверждается, что передает источник 2, когда и на самом деле передает источник 2. I. Вычислить рабочую характеристику приемника для критерия, максимизирующего ΡD при условии, что PF = а. 2. Описать процедуру испытания подробно для а = 0,25. Задача 2.2.8. Плотность вероятностей по обеим гипотезам равна ''■ν^-,μ + ^-α,).]' -"<*<~ :*l.'-<U. где а0 = 0 и ах = 1. 1. Найти отношение правдоподобия. 2. Построить рабочую характеристику приемника. 141
Задача 2.2.9. Рассмотрим простую задачу на бросание монеты: #! : сверху герб, PlHy] _д Ръ Я0 : сверху решетка, Р[Я0]_д Р0 < Рг. Производится N независимых бросаний монеты. Показать, что число наблюдаемых случаев выпадения «герба» Ντ есть достаточная статистика для принятия решения выбора между двумя гипотезами. Задача 2.2.10. Выборочная функция простого пауссоновского процесса счета N(t) наблюдается на интервале Т: гипотеза Нг\ средняя частота событий kx : Р(Н1) = -2, гипотеза Я0: средняя частота событий k0 : Р(Н0)=-к. 1. Доказать, что число событий на интервале Τ есть «достаточная статистика» для выбора между гипотезами Я0 или Ях. 2. Предполагая одинаковые стоимости для возможных ошибок, вывести соответствующий критерий отношения правдоподобия и порог. 3. Найти выражение для вероятности ошибки. Задача 2.2.11. Пусть η у= 2 **> / = 0 где Xi — статистически независимые случайные величины с нормальным распределением W(0, σ). Число величин, входящих в сумму, есть случайная величина с пауссоновским распределением: P(n=k)=— e-\ fc = 0, 1, ... kl Требуется произвести выбор между двумя гипотезами: #ι : η < 1, Н0 : п> 1. Записать выражение для отношения правдоподобия. « ч Задача 2.2.12. Рандомизированные критерии. Наша основная модель задачи на принятие решения в основном тексте (стр. 37) не допускает применения рандомизированных правил решения. Их можно включить в нашу модель путем допущения, что для каждой точки R в пространстве Ζ мы высказываем гипотезу Нг с вероятностью <D(R), а Я0 — с вероятностью 1 — O(R). Модель, развитая в основном тексте, эквивалентна заданию <D(R) = 1 для всех R в 1Х и 0>(R) = 0 для всех R в Z0. 1. Рассмотреть сначала критерий Байеса. Записать выражение*риска для указанной выше модели решения. 2. Доказать, что критерий отношения правдоподобия минимизирует риск и в рандомизированном критерии никогда нет необходимости. 3. Доказать, что риск постоянен внутри любого прямолинейного отрезка рабочей характеристики приемника. Так как прямолинейные участки порождаются рандомизированными испытаниями, это является другим доказательством результата п. 2. 4. Рассмотреть критерий Неймана — Пирсона. Доказать, что оптимальный критерий всегда состоит либо из: 1) обычного критерия отношения правдоподобия с PF = ее либо 2) вероятностной смеси двух обычных критериев отношения правдоподо- Н\ бия, построенных следующим образом: критерий 1 : A(R) ^>r\ дает Pf= α+, критерий 2 : A(R) > η дает PF = α—, где [α~, α+] — наименьший интервал, содержащий α. <D(R) равна 0 или 1, за исключением тех точек, гдеJSl·(R) = η. Найти <D(R) для этого множества.) ^>. 142
Математические свойства Задача 2.2.13. Случайная величина A(R) определяется уравнением (13) и имеет различные плотности вероятностей по Нг и Я0. Доказать, что: 1)£(Л"|Я1) = £(Л"+'|Я0), 2) £(Л|Я0) = 1, 3) Е(\\Н1)-Е(А\Н0)=с*(А\Н0). Задача 2.2.14. Рассмотрим случайную величину Л. В (94) было показано, что ΡΛ|^(ΧΙ^) = χΡΛ|Η„(Χ|^ο). 1. Подтвердить это соотношение непосредственным вычислением р^щ (.) и рЛ,я (.) для плотностей, указанных в примере I [стр. 40, (19) и (20)]. 2. На стр. 50 мы видели, что качество критерия в примере I целиком определялось величиной d2. Показать, что 42 = 1η[1+σ2(Λ|#0)]. Задача 2.2.15. Функция erfc^X) определяется выражением (66). 1. Интегрированием по частям установить границы 7=3r(l-ii)exp(-f)<erfc,W<7=Yexp(-f)> X > 0. 2. Обобщить пункт I с тем, чтобы получить асимптотический ряд erfc* <*> = уш е"Х72 χ [1+ Σ (~i] m Ь3"^"1) +*» ]· m=l Остаток должен быть меньше абсолютной величины (п + 1)-го члена и иметь тот же знак. Указание. Показать, что остаток равен «.-[«-.г*- '•,^?,+|)]б.гМ -f «-'(■+£)—"'«<■■ 0 3. Пусть X = 3. Вычислить простую границу, выраженную в процентах ошибки, если егкДЗ) аппроксимировать первыми η членами асимптотического ряда. Оценить указанную ошибку для η = 2, 3, 4 и сравнить результаты. Повторить всю процедуру для X = 5. Задача 2.2.16. 1. Доказать, что 1 / Х2\ erfc* (X) < — ехр ( - — J , X > 0. Указание, Показать, что [erfc* (X)]2 = Ρ (χ > Χ, ι/ > Χ) < Ρ (*2 + у2 > 2Χ2), где я и у — независимые гауссовы величины с нулевыми средними и единичными дисперсиями. 2. Для каких значений X эта граница будет точнее, чем (71)? 143
Области решений более высокой размерности Простое бинарное испытание всегда можно свести к одномерной области решения. Во многих случаях полученные результаты легче интерпретировать в двух или трех измерениях. Некоторые типичные примеры приведены в настоящем параграфе. 9. Задача 2.2.17. +ехр1-££~*5)]· -~<*ь*,<-, Н° : Рхг. X, I Я. (*Ь *2 I Но) = ^^ X Χ6ΧΡ(-£-^)· -~<*ь*<~- 1. Найти отношение правдоподобия. 2. Написать точные выражения для ΡD и Pp. Найти верхнюю и нижнюю границы Ρ D и Ρ ρ путем преобразования области интегрирования в точном выражении. Задача 2.2.18. Совместные плотности вероятностей случайных величин Xi(i = I, 2, ..., Μ) по гипотезам Нг и Н0 равны Μ Δ 1фк Ν где Λί Λί — ^о < Xf < оо. i. Найти отношение правдоподобия. 2. Вычертить области решений для различных значений η в плоскости Хъ Х2 Для частного случая, когда Μ = 2 и рх = р2 = 1/2. 3. Найти верхнюю и нижнюю границы PF и PD путем преобразования областей интегрирования. Задача 2.2.19. Плотность вероятности величины г% по двум гипотезам равна !πσ& Χβχρ[-^?^], ί-1.2....,* * = 0,1. Наблюдения можно считать независимыми. 144
I. Найти отношение правдоподобия. Выразить его через следующие величины: Ν Ν 2. Вычертить области решений в плоскости /α, ίο для случая, когда 2т0 — т1 > 0, 2σ1 = σ0. Задача 2.2.20. (продолжение). 1. Рассмотрим частный случай: Начертить области решений и вычислить рабочую характеристику приемника. 2. Рассмотрим частный случай: Начертить области решений. vf. Задача 2.2.21. Снаряд выстреливается по одной из двух целей: по гипотезе Нг точка прицеливания имеет координаты xlt ylt гг\ по гипотезе Я0 ее координаты х0, у0, z0. Расстояние фактической точки падения снаряда от точки прицеливания есть нормальная величина W(0, σ) с нулевым средним по каждой координате. Все эти величины независимы. Мы желаем отметить точку падения и оценить, какая гипотеза является истинной. 1. Сформулировать ситуацию как задачу на проверку гипотез и вычислить отношение правдоподобия. Какова простейшая достаточная статистика? Применима ли рабочая характеристика приемника, изображенная на рис. 2.9, а? Если да, то какую величину d2 мы используем? 2. Теперь учтем влияние времени. По гипотезе Н^ требуемое время до момента взрыва равно^ t^ (k = I, 2). Распределение фактического времени имеет вид Найти критерий отношения правдоподобия и вычислить рабочую характеристику приемника. Задачи к § 2.3. Испытание Μ гипотез Задача 2.3.1. 1. Убедиться, что критерий Байеса для Μ гипотез всегда приводит к пространству решений, размерность которого не превышает Μ — I. 2. Полагая, что координаты пространства решений суть ~ Рг\Н0(Ъ\Но) убедиться, что границами пространства являются гиперплоскости. Задача 2.3.2. Формулировка многоальтернативной задачи, приведенная в основном тексте, приводит к эффективному пространству решений, но сопряжена с некоторой потерей симметрии. L Взяв за исходное (98), доказать, что эквивалентной формой критерия Байеса является следующий критерий: вычислить Λί-1 βζ·Δ 2 CtjPiHj]*), ;=о, ι, ..., Λί-ι, и выбрать наименьшее значение. 145
1 / (R—mk)2 \ 2. Рассмотрим частный случай распределения стоимостей: Сц = 0, ι = 0, 1, 2, ..., М-1, С0 = С, ί=£/, *, / = 0, 1, 2, .... М-1. Показать, что эквивалентный критерий заключается в следующем: вычислить PWtlR), t = 0, 1, 2, ..., Μ-1, и выбрать наибольшее значение. Задача 2.3.3. Наблюдаемая случайная величина является нормальной по каждой из пяти гипотез J _/ (R—mk)2 \ —oo<R<oo,' k=l, 2, ..., 5, где m1=—2m; m2=—m; m3 = 0; тЛ = т; m5 = 2m. Все гипотезы равновероятны, а критерием является минимальная вероятность ошибки Р(г). I. Начертить области решений на оси R. I. Вычислить вероятность ошибки. Задача 2.3.4. Наблюдаемая случайная величина г имеет нормальную плотность по трем гипотезам где значения параметров по трем гипотезам равны: Я2 : т2 = т, σ2 = σα (m > 0), Я3:т3 = 0, σ3 = σβ (σβ > σα). Все три гипотезы равновероятны, а критерием служит минимум Р(г). 1. Найти оптимальный критерий Байеса. 2. Начертить области решений на оси R для частного случая, когда σβ=2σα> aa=m· 3. Вычислить Ρ(ε) для указанного частного случая. Задача 2.3.5. Плотность вероятности величины г по трем гипотезам равна Prv г21 Hh (Rv к« I нн) = (2πση σ«)~' x L 2 Uu <4/J *=■!. 2. 3, где σ21==σ21=σ2. σ22 = σ2 + σ2( σ22 = σ«·> σ23 = σ! + ση· Матрица стоимостей имеет вид гО 1 1 10а L 1 а 0 J где 0 < а < 1 и Р(Нг) = Р(Н3) = р. Зададимся k = Ri2 и 1% = #22· 146
/ι, /,ν лов). 1. Найти оптимальный критерий и указать области решений в плоскости 2. Напирать выражения для вероятностей ошибки (не вычисляя интегра- 3. Убедиться, что для α = О эта задача сводится к задаче 2.2.17. Задача 2.3.6. По гипотезе Н^ результат наблюдения является значением пуассоновской случайной величины P(r = n)=—-e m, т=1, 2, ..., М, минимум Ρ(ε). где кт = mk. Гипотезы равновероятны, критерий 1. Найти оптимальный критерий. 2. Вывести простое выражение для границ областей решений и указать, как можно было бы вычислить Р(г). Задача 2.3.7. Допустим, что принятый вектор по каждой из трех гипотез есть #0 : r = m0 + n, #ι · r = m1 + n, #2 : r=m2 + n, где L/-3 [mi ι г «ι "ι miz J L nz J nif — известные векторы, а компоненты вектора η — статистически независимые нормальные случайные величины с нулевыми средними и дисперсиями σ2. 1. Используя формулы основного текста, выразить критерий Байеса посредством двух достаточных статистик з з Найти явные выражения для с% и di. Является ли решение единственным? 2. Начертить области решений в плоскости /lf /2 для заданного распределения стоимостей: Cqq = Сц = С 22 = 0, C12 = C2i = Coi = C10= — С()2 = "Г" ^20 > 0. Задачи κ § 2.4. Оценки Байесовские оценки Задача 2.4.1. Пусть г — аЬ + п, где a, b и η — независимые нормальные случайные величины с нулевыми средними и дисперсиями σα2, σ&2 и ση2. 1. Какова amap? 2. Эквивалентно ли это одновременному отысканию amap> &map? 3. Теперь рассмотрим случай, когда k г = а+ 2 bi + ny /=1 147
где bi — независимые нормальные случайные величины с нулевыми средними и дисперсиями σ^. а) Какова аШар? б) Эквивалентно ли это одновременному отысканию атар, Ь% тар? в) Дайте интуитивное объяснение, почему ответы по пунктам 2 и 36 различны. Задача 2.4.2. Наблюдаемая случайная величина есть х. Требуется оценить параметр λ Плотность вероятности х, записанная как функция λ, имеет вид /VI 1ч ί λβ_λΧ· Χ>°· λ>0; ρ,|λ(*Ιλ)=| ο, χ<ο. Априорная плотность λ зависит от двух параметров — п# и /*: [ 1** e-^λ"*-1, λ>0, Pirn*, *(λΚ>'*)Δ ГК) (о, λ < о. 1. Найти Е(к) и σ2(λ) до того, как произведены какие-либо наблюдения. 2. Полагая, что сделано одно наблюдение, найти Ρχ/χ(λ\Χ)- Каким интересным свойством обладает это распределение? Найти ^ms и £[$ms — λ)2]. 3. Полагая, что сделано η независимых наблюдений, и обозначая их через вектор х, убедиться, что Ρλ1χ(λ|Χ)Δ _0Т_ %ГХп'-1 λ 0 Г(п') 0, λ < 0, где /' = / + /„ я'=п+я* 1= Σ Xi- i= 1 Найти %ms и Ε [(£ms—λ)2]. 4. Совпадают ли £map и hms? Примечание. Воспроизводящие плотности. Причина того, что предыдущая задача оказалась простой, заключается в том, что априорная и апостериорная плотности имеют одинаковую функциональную форму. Изменены только параметры. Вообще, p^a(R\A)pa(A) *<"(Л|*)=—щ-)—· и мы говорим, что ра(Л) есть воспроизводящая плотность или сопряженная априорная плотность [по отношению к переходной плотности рг.а (R \ А], если апостериорная плотность имеет такую же форму, как и ра{А). Поскольку выбор априорной плотности часто бывает довольно произвольным, то во многих случаях удобно выбирать воспроизводящую плотность. Другие воспроизводящие плотности, представляющие для нас интерес, иллюстрируются помещаемыми ниже двумя задачами. Задача 2.4.3. Пусть г = а + п, 148
«где п есть УУ(0, ση). Тогда ^■«"•-ткгЧ-^]· 1. Убедиться, что сопряженная априорная плотность для α есть N\m0, -γ)* атоказав, что pa\r(A\R) = N{m1,o1)t тде ml= ι , , о И σΐ результат на случай // н Palr(A\*)=N\mN, oN)t 2. Распространить этот результат на случай N независимых наблюдений, •проверив, что •где m0k02 + Nl 2 /я а, = ; σ^ = Ы+к0* ' N N + k0* 1 Заметим, что априорный параметр k02 можно интерпретировать как эквивалентное число наблюдений (допустимы дробные числа наблюдений). Задача 2.4.4. Рассмотрим процесс наблюдения Рн'(*|Л)=^ехр[-1(*-т4 •где т — известно, А — интересующий нас параметр (это величина, обратная дисперсии}. Мы предполагаем, что в нашем распоряжении имеется N независимых наблюдений. 1. Проверить, что Ч-1 ( 1 \ Pa (A I *i, k2) = cA 2 ехр ( — — Akx k2 , Α > О, klt k2 > О, •житель) есть сопряженная ап pa|rH|R)=pa(,4|V> V), ic — нормирующий множитель) есть сопряженная априорная плотность, показав, что где ι N Заметим, что klf k2 — просто параметры априорной плотности, которые выбраны на основании наших априорных сведений. 2. Найти ams. 149
Задача 2.4.5. Производится К наблюдений: Rlt ..., RK, где n = a-\-rii. Случайная величина а имеет нормальную плотность //(0, σα), щ — независимые нормальные величины, Ν(0,ση). 1. Найти оценку ams по минимуму среднеквадратической ошибки. 2. Найти оценку Ътар по максимуму апостериорной вероятности 3 Вычислить среднеквадратическую ошибку. 4. Рассмотреть альтернативную процедуру, используя те же гг·. а) Оценить а после каждого наблюдения, используя критерий минимальной среднеквадратической ошибки. Это дает последовательность оценок ах (R\)> a%(Ru R*) ..· "j(Ri, ·..» Rf) ... aK(Rv .... RK). Обозначим соответствующие дисперсии через σχ2, σ22, ..., σ^ . б) Выразить а. как функцию α» ρ σ?{ и #.. в) Показать, что 1 σ,» 1 σ«* + 1 ση4' Задача 2.4.6. [36]. В этой задаче излагается доказательство свойства 2 (стр. 71). Исходные допущения следующие: а) Функция потерь есть симметричная неубывающая функция, τ е. С(Х) = С(-Х), С(Х1)>С(Х2) при Х1>Х9>0, (1*) откуда следует, что dC (X) dX > О при X > 0. (2*) б) Апостериорная плотность вероятности, симметричная относительно своего условного среднего, — величина невозрастающая. в) UmC(X)px\r(X\R) = 0. (3*) Используем те же обозначения, что и в свойстве 1 на стр. 70. Проверить следующие положения: 1. Условный риск при использовании оценки α равен Л (а | R)= J С (Ζ) ρζ , r (Ζ + a-dms | R) dZ. (4*) —oo 2. Разность между условными рисками равна A& = &{a\R)—&{ams\ R) = = f С (Ζ) [ρ, ir (Z + a-ams | R) p,, r (Z — a + ams | R)_2p, ,r (Ζ | R)] dZ. (5*) о 3. ПриЪ > ams интеграл от выражения в квадратных скобках, взятый по Ζ в пределах от 0 до Ζ0, равен f [Pel r (Z0 + Y\R)-P2 , r (Zo-Y\ R)]dY bg(Zo). (6*) о 150
4. Проинтегрировать (5*) по частям с целью получения оо оо I CdC(Z) Л b& = C(Z)g(Z) -\ -^Lg(Z)dZt α> ams. (7*) о о 5. Показать, что из сделанных в начале задачи допущений следует, что первый член равен нулю, а второй член — неотрицателен. 6. Повторить операции пунктов 3—5 с соответствующими изменениями для " < <W 7. Заметим, что указанные положения доказывают, что ams минимизирует байесов риск при сделанных выше допущениях. При каких условиях байесова оценка будет единственной? '. Оценка неслучайного параметра Задача 2.4.7. Производится η статистически независимых наблюдений: ri> ^2» /'з> ···» гп> имеющих среднее т и дисперсию σ2. Будем определять дисперсию выборки как '4|№Г Является ли в данном случае оценка несмещенной для действительной дисперсии? Задача 2.4.8. Требуется оценить а в биномиальном распределении, используя η наблюдений: Ρ (г событий|а)=( П ] ar (l—a)n-r, r = 0, lt 2,..., п. 1. Найти оценку величины а по максимуму правдоподобия и вычислить ее дисперсию. 2. Является ли она эффективной оценкой? Задача 2.4.9. 1. Существует ли эффективная оценка среднеквадратического отклонения σ нормального распределения, имеющего нулевое среднее? 2. Существует ли эффективная оценка дисперсии σ2 нормального распределения, имеющего нулевое среднее? Задача 2.4.10. (продолжение). Результаты задачи 2.4.9 наводят на общий вопрос. Рассмотрим задачу оценки некоторой функции параметра Л, скажем fi(A). Наблюдаемая величина есть R, a pr\a(R\ Л) — известна. Допустим, что Л является неслучайной величиной. 1. Каковы условия существования эффективной оценки Ji(A)? 2. Какова нижняя граница дисперсии ошибки любой несмещенной оценки Ш)? 3. Допустим, что эффективная оценка /х(Л) существует. Когда может существовать эффективная оценка какой-либо другой функции /2Й)? Задача 2.4.11. Плотность вероятности величины г при заданных Αχ и А2 равна Рг|а,.а8 («Μι· Аъ) = (2пА2)~~ехр [-(R~^], т. е. Аг — среднее, а Л2 — дисперсия. 1. Найти совместные оценки Аг и Л2 по максимуму правдоподобия, используя η независимых наблюдений. 2 Являются ли они смещенными? 151
3. Являются ли они связанными? 4. Найти ковариационную матрицу ошибок. Задача 2.4.12. Требуется передать два параметра Аг и А2. При простой попытке реализовать надежную систему связи мы конструируем два сигнала, которые передаются по двум отдельным каналам связи s1 = x11A1+x12A2, s2=x2lA1+x22A2, где Xij, ί, / = 1,2 — известны. Принятые величины суть r1 = s1-j-n1, r2=s2 + n2. В обоих каналах аддитивные шумы являюгся независимыми одинаково распределенными нормальными случайными величинами с нулевыми средними, W(0, ση). Параметры А{ и А2 — неслучайные величины. 1. Являются ли оценки аг и а2 по максимуму правдоподобия несмещенными? 2 Вычислить дисперсию оценок % и а2 по максимуму правдоподобия. 3. Являются ли оценки по максимуму правдоподобия эффективными? Другими словами, удовлетворяют ли они границе Крамера — Рао со знаком равенства? Задача 2.4.13. Пусть N / = 1 где Xi — независимые нормальные случайные величины с нулевыми средними* и дисперсиями σ^2. Мы наблюдаем у. В пп. 1—4 считать N непрерывной величиной. 1. Найти оценку N по максимуму правдоподобия. 2. Является ли nmi несмещенной? 3. Какова дисперсия пт{> 4. Эффективна ли пт{> 5. Произвести качественный анализ того, как следует видоизменить оценку в п. 1, чтобы учесть, что N — дискретно. Задача 2.4.14. Наблюдается значение дискретной случайной величины г Р(х=1\А) = -^-е-л, / = 0, 1, 2,..., где А — неслучайный параметр. 1. Какова нижняя граница дисперсии любой несмещенной оценки а(х)> 2. Допустим, что мы располагаем η независимыми наблюдениями. Найти такую а(х), которая эффективна. Задача 2.4.15. Рассмотрим распределение Коши рх]а(Х\А)={п[\ + (Х-А)*]}-1. Предположим, что мы сделали η независимых наблюдений для того, чтобы оценить А. 1. Использовать неравенство Крамера — Рао для того, чтобы показать, что дисперсия любой несмещенной оценки параметра А превосходит 2/п. 2. Является ли среднее выборки состоятельной оценкой? 3. Можно показать, что медиана выборки является асимптотически нормальной, Ν(Α, п/у4п) (см. [9]). Что представляет собой асимптотическая эффективность медианы выборки как оценки? Задача 2.4.16. Допустим, что /d d . ч 1 ί (RS-ZpRiRt+W)) 152
Требуется оценить коэффициент корреляции р, используя η независимых наблюдений величин (Rlf R2). 1. Найти уравнение для оценки ρ по максимуму правдоподобия? 2. Найти нижнюю границу дисперсии любой несмещенной оценки р. Математические свойства Задача 2.4.17. Рассмотрим смещенную оценку a(R) неслучайного параметра А: E(7i(R)) = A+B(A). Показать, что (\ + dB(A)/dA)* E[(a(R)-A)*]> dlnpr]a(R\A) дА }Г Это неравенство Крамера — Рао для смещенных оценок. Заметим, что оно является границей среднеквадратической ошибки. I Задача 2.4.18. Пусть pr|Q(R|A) — плотность вероятности г при заданном А. Пусть также h—произвольная случайная величина, не зависящая от г и определенная так, что А + h охватывает все возможные значения А. Допустим, что ph (Я) и ph (Я) — две произвольных плотности вероятности для К. Предполагая, что a(R) — оценка несмещенная, получаем $ra(R)-(A+H)]prla(R\A + H)dR = 0. у множая на phi{H) и интегрируя по Я, имеем J dHphi (Η) J [α (R)-(A + H)] pr , a (R | A + H) dR = 0. 1. Показать, что [£i(/i)-£2Wl2 u*[a(R) — А]> Π Pr\a(* h+^IJkw^,№]<| dR Pr\a(*\A) для любых ph (Я) и ph (Я). Заметим, что так как это справедливо для всех ph (Я) и ph (Я), то можно записать o2[a(R)— А] ]> sup (правая часть приведенного выше соотношения). Примечание. Заметим, что эта граница не требует каких-либо условий регулярности. Баранкин [15] показал, что это точная нижняя граница. Задача 2.4.19. (продолжение). Рассмотрим теперь два частных случая: 1. Положим ph (Я) = Ь(Н). Какова результирующая граница? 2. Положим ph (Я) = 6(Н — Я0), где Я0 Φ 0. Показать, что "[aw-A]>\t\utt РГ1а(«м) dHl) · Точная нижняя граница при всех Н0 φ 0 такова, что из pria(R I A) = 0 следует: pr|e (R\A + H0) = 0. 3. Показать, что граница, определенная в п. 2, всегда совпадает с неравенствам Крамера — Рао, когда последнее применимо. 153
Задача 2.4.20. Пусть a = Lb, где L — невырожденная матрица, а и b — векторные случайные величины. Доказать, что amap = »*"map и ams== Lbms. Задача 2.4.21. Другой вывод неравенства Крамера—Рао сделаем в этой задаче. Сначала построим вектор ζ: a(R)-A dlnpr7a~(RW дА } 1. Проверить, что для несмещенных оценок E(z) = 0. 2. Полагая, что Е{г) = 0, ковариационную матрицу запишем в виде Az=E(zzT). Используя то обстоятельство, что Λζ — неотрицательно определенная величина, вывести неравенство Крамера — Рао. Если соблюдается равенство, то что из этого следует применительно к | Λζ |? Задача 2.4.22. Повторить задачу 2.4.21 для случая, когда а — случайная величина. Ввести a (R)—а ~д\прг Q(R~, A) дА и далее рассуждать так же, как и ранее. Задача 2.4.23. Граница Баттачария. Если эффективной оценки не существует, то неравенство Крамера — Рао можно улучшить. В настоящей задаче мы выведем простое по своей идее, но алгебраически сложное граничное выражение для несмещенных оценок неслучайных величин. 1. Зададимся (N + 1)-мерным вектором: a(R)-A ζΔ Pt Р<\ 1 |β(*Μ) 1 дРг д*Рг ,«М) дА |д(КИ) дА* • 1 э"Рг |a(RM) LPr.|a(RH) дА1 Проверить, что .Λ;Δ£(ΖΖ7) = °е2 1 I 0 154
Написать элементы матрицы J. Является ли матрица Л2 неотрицательно определенной? Допустим, что J — положительно определенная. Когда Λζ не является положительно определенной? 2. Проверить, что из результатов п. 1 следует с\ > 7". Это и есть граница Баттачарии. При каких условиях выполняется равенство? 3. Убедиться, что для N ==■ 1 граница Баттачария сводится к неравенству Крамера—Рао. 4. Всегда ли улучшается граница Баттачария при возрастании Ν? Примечание. В п. 2 условием равенства является V» 1 #pr{a(R\A) i=\ Это условие можно было бы назвать эффективностью N-ro порядка, но во многих представляющих интерес задачах оно не выполняется. 5. Часто бывает проще работать с #\nprla(R\A) дА1 Переписать элементы матрицы J\j через математические ожидания комбинаций указанных величин для N = 1 и 2. Задача 2.4.24. (продолжение) Пусть в предыдущей задаче N = 2. 1. Убедиться, что Pr|e(RM) дА1 9 1 72 + 12 J\x(JuJz -7U) '11 "11 Vll "22 " 12; Второй член представляет собой улучшение границы. 2. Рассмотрим случай, когда г состоит из Μ независимых наблюдений с одинаковыми плотностями и конечными условными средними и дисперсиями. Обозначим элементы матрицы J для Μ наблюдений через Jij(M). Показать, что 7ц(М) = мТц(\) Вывести аналогичные соотношения для 712(М) и /22(М). Показать, что °1> 1 :0) МУи(1) 2М27{,(1) >+оШ- Задача 2.4.25. [11]. Обобщить результат задачи 2.4.23 на случай, когда производится оценка функции Л, скажем f(A). Допустим, что оценка является несмещенной. Зададимся вектором a(R)-f(A) *1 к Рг "г| 1 1«№И) 1 ,№М) дрг д*рг |в(«М) дА |в<*М) дА* • 1 ^Prla(RM) _ Pr|e(RM) 155 дА N
Пусть Ν y=la(R)-/M)]-2*, /=ι Prie(RM) *4|α(*Μ) &4< 1. Найти выражение для ξν ==■ Ely2]. Минимизировать %у путем надлежащего выбора kf. 2. Используя эти значения k\, найти границу дисперсии cPla(R) — f(A)]. 3. Убедиться, что результат задачи 2.4.23 получается, если в п. 2 положить №) = л. Задача 2.4.26. 1. Обобщить результат задачи 2.4.23 с тем, чтобы установить границу сред- неквадратической ошибки при оценке случайной величины. 2. Убедиться, что соответствующая матрица имеет вид Л = ~Е31 1 о ι ι Написать элементы матрицы Jr. 3 Найти Λζ для частного случая, когда а имеет нормальное распределение yV(0, σα). Случай нескольких параметров Задача 2.4.27. В (239) матрица частных производных была определена как Vx^ ""— Ί дхг д дх2 д дхп_\ Убедиться в следующих свойствах. 1. Матрицы А и В имеют размерность (η χ I). Тогда Vx (Аг В) = (Vx Аг) В + (Vx Вг) А. 2. Если матрица В размерностью (η χ 1) не является функцией х, то показать, что Vx(Brx) = B. 3. Пусть С — постоянная матрица размерностью (η Χ т), тогда Vx(xrC) = C. 4. Vx(xr) = I. Задача 2.4.28. Часто встречается задача, связанная с дифференцированием квадратичной формы Q = Ar(x)AA(x), 156
где А(х) — матрица размерностью (т X 1), элементы которой являются функцией х, а Л — симметричная неотрицательно определенная матрица размерностью· (т X т). Напомним, что на основании этого можно записать Л = Л1/2Л1/г. 1. Доказать, что VxQ=2(VxA7,(x))AA(x). 2. Для частного случая А(х) = Вх доказать, что VxQ = 2BrABx. 3. Для частного случая Q = x7Ax доказать, что VxQ = 2Ax. Задача 2.4.29. Рассмотреть подробно доказательство на стр. 94 для случая произвольного К- Задача 2.4.30. Как указывалось в связи с (284), мы часто оцениваем d*gd(A). Допустим, что оценки несмещенные. Вывести (286). Задача 2.4.31. Функция стоимости (потерь) есть скалярная функция С(а^ вектора а£. Допустим, что она симметрична и выпукла, т. е. 1) С(ав) = С(-ав), 2) C(bx1 + (\-b)x2)<bC(x1) + (l—b)C(x2)t 0< 6 < 1. Предположим, что апостериорное распределение симметрично относительно условного среднего. Доказать, что условное среднее а минимизирует байесов риск. Задача 2.4.32. Допустим, что нам требуется оценить К неслучайных параметров Аъ А2, Л3, .... Л^, обозначаемых через А. Плотность вероятности prja(R | А) известна. Рассмотрим смещенные оценки'a(R), у которых В (α,) Δ J [a. (RJ-Л,] pr , a (R | А) <Щ . 1. Вывести граничное выражение для среднеквадратической ошибки оценки At. 2. Корреляционная матрица ошибок имеет вид Ι*εΔ£ [(a (R)-A) (яТ(R)-\T)). Найти матрицу J^, такую, чтобы матрица IB — R^"1 была неотрицательно определенной. Задачи смешанного типа Задача 2.4.33. Другой метод оценки неслучайных параметров называется методом моментов (Пирсон [37]). Если требуется оценить k параметров, то первые k выборочных моментов приравниваются действительным моментам (которые являются функциями интересующих нас параметров). Решение указанных k 157
уравнений дает желаемые оценки. Для иллюстрации этой процедуры рассмотрим следующий пример. Пусть 10, Х<0, где λ — положительный параметр. Мы располагаем η независимыми наблюде ниями величины х. 1. Найти нижнюю границу дисперсии любой несмещенной оценки. 2. Обозначим оценки по методу моментов через £mm. Показать, что 1 п п /±i и вычислить Е(%тт) и а2(Ятт). Примечание. В [9] вычислена эффективность \тт. Она меньше единицы и стремится к нулю при η -> оо. Задача 2.4.34. Допустим, что мы располагаем η независимыми наблюдениями из нормального распределения N(m, с). Убедиться, что оценки т и σ, полученные по методу моментов, совпадают с оценками по максимуму правдоподобия. Задана к § 2.5. Сложные гипотезы Задача 2.5.1. Рассмотрим следующую задачу на испытание сложной гипотезы: где σ0 известна, Но : Pr (R) = г-^ ехр ( - ., Ϋ2π σ0 V 2σ02 J 1 ί R2 \ Ϋ2π σι V 2σ!2 / где о1 > σ0. Предположим, что мы требуем, чтобы PF = 10~2. 1. Построить верхнюю границу функции мощности, предполагая идеальный метод измерения по критерию отношения правдоподобия. 2. Существует ли равномерно наиболее мощный критерий? 3. Если ответ ко второму вопросу отрицателен, написать функцию мощности обобщенного критерия отношения правдоподобия. Задача 2.5.2. Рассмотрим следующую задачу испытания сложной гипотезы. Имеются два статистически независимых результата наблюдения. Обозначим их через Rx и R2. Их распределения по обеим гипотезам имеют вид H0:prARi) = —^- ехр (-££), * = 1, 2, 1 Υ2ηση \ 2<V/ где σ0 — известна, и где oL > σ0. Предположим требуется, чтобы Рр = а. 1. Построить верхнюю границу функции мощности, исходя из метода идеального измерения по критерию отношения правдоподобия. 2. Существует ли равномерно наиболее мощный критерий? 3. Если ответ на второй вопрос отрицательный, то построить функцию мощности обобщенного критерия отношения правдоподобия. 158
Задача 2.5.3. Результаты наблюдения представляют ряд значений случайных величин гъ г2, ..., гм , ri=Si + пи i = 1, 2, ..., Μ, Hll rt = пи ί = 1,2, ..., Λί, Я0; Si и яг· — независимые одинаково распределенные случайные величины с плотностями N(0, о$) и N(0, оп) соответственно, где ση известно, а σ$ неизвестно. 1. Существует ли равномерно наиболее мощный критерий? 2. Если ответ на первый вопрос отрицательный, то найти обобщенный критерий отношения правдоподобия. Задача 2.5.4. Наблюдение состоит из ряда значений случайных величин Γι, ^2» гз» ···» гм> которые мы обозначим вектором г. По гипотезе Н0 гг·—статистически независимые величины с распределениями I г β.2 \ ΡΓ.(#ί) = —=гехр --^ , 1 У2пХьо \ %М° J где λ^° — известны. По гипотезе Н1 г ι — статистически независимые величины с распределениями 1 / R-2 \ PrARi) = —==exp( -5П . 1 /2πλ|χ \ 2V/ где λζΛ > ki° для всех ί. Решить задачу 2.5.3 повторно. Задача 2.5.5. Рассмотрим следующую задачу на испытание гипотез. Приняты два статистически независимые наблюдения. Обозначим эти наблюдения через Ri и R2. Плотности вероятностей по обеим гипотезам равны ffi:p,<*«>--^exp(-£g!a!). « = 1,2, 1 |/2πσ V 2σ2 J где т может быть любым числом, отличным от нуля. Предположим, что нам тре~ буется, чтобы ΡF = α. 1. Построить верхнюю границу функции мощности, считая, что производится идеальное измерение по критерию отношения правдоподобия. 2. Существует ли равномерно наиболее мощный критерий? 3. Если ответ на вопрос п. 2 отрицателен, то построить функцию мощности обобщенного крит.ерия отношения правдоподобия. Задача 2.5.6. Рассмотрим следующую задачу на испытание гипотез: /77 η —-Θ-Γ-Θ- н.0 *ίΧ) -^4-+-J *~r По гипотезе Нх передается неслучайная величина θ(—оо < θ < оо). Она умножается на случайную величину т. К результату умножения добавляется шум п, образуя величину г. По гипотезе Я0 ничего не передается, и выходом является просто п. Таким образом, Н1:г = тЪ + п1 Н0 :г = п. 159
Случайные величины тип независимы, 1 / W2 \ Рт(М)=-^6(М-1)+-±-6(М+\). 1. Существует ли равномерно наиболее мощный критерий? Если да, то опишите его и дайте выражение для его функции мощности. Если нет, то укажите почему. 2. Сделать одно из следующих действий: а) Если равномерно наиболее мощный критерий для данного примера существует, то вывести необходимое и достаточное условие, налагаемое на рш(М)> чтобы этот критерий существовал. (В остальном модель остается неизменной.) б) Если равномерно наиболее мощного критерия не существует, то вывести обобщенный критерий отношения правдоподобия и выражение для его функции мощности. Задача 2.5.7. (Приемники с постоянной частостью ложной тревоги.) Мы имеем N независимых результатов наблюдений величины х. Плотность вероятности по гипотезе Н^ равна 1 с _(У. т\Л%\ ι = 1,2,...,Ν, p**l"ft(*lffft)~7^expl ^ )' -°°<Xi-<00' £j,*-0,1. Дисперсия σ2 неизвестна. Введем Ν Ν /= 1 ί = 1 а) Рассмотрим критерий /ι2 ^ α/2. Но Убедиться, что PF этого критерия не зависит от σ2. (Указание. Использовать формулу, полученную в задаче 2.4.6.) б) Найти α как функцию от Pp. в) Является ли этот критерий равномерно наиболее мощным критерием? г) Рассмотреть частный случай, когда N = 2 и тг= т. Найти PD как функцию PF и т/о. Сравнить полученный результат с рис 2.9, б и проверить, насколько ухудшилось качество системы из-за отсутствия данных относительно дисперсии σ2. Примечание. Приемники этого типа в литературе по радиогидролокации называются приемниками с постоянной частостью ложной тревоги. Задача 2.5.8 (продолжение). Другим, альтернативным подходом к решению предыдущей задачи может быть использование обобщенного критерия отношения правдоподобия. 1. Найти обобщенный критерий отношения правдоподобия и записать выражение для его качества при N = 2 и тг = т. 2. Как бы Вы решили, какой критерий использовать? Задача 2.5.9. По гипотезе Н0 величина χ имеет пуассоновское распределение с известной интенсивностью k0: k n Р(х==я)=-1-е"*·, /1 = 0, 1,2,... hi По гипотезе Нг величина χ имеет пуассоновское распределение с неизвестной интенсивностью kit где kx > k0. 160
1. Существует ли равномерно наиболее мощный критерий? 2. Если равномерно наиболее мощного критерия не существует, то, предположив, что доступно Μ независимых результатов наблюдений величины х, построить обобщенный критерий отношения правдоподобия. Задача 2.5.10. Как изменятся результаты задачи 2.5.2, если σ0 < ос и ог > > ас, где ас — известно. Однако ни σ0, ни σχ не известны. Если равномерно наиболее мощного критерия не существует, то какая процедура испытания (кроме испытания по обобщенному критерию отношения правдоподобия), будет логичной? Задачи к § 2.6. Общая гауссова задача Обнаружение Задача 2.6.1. Многоальтернативная общая гауссова задача записывается в виде PrjHA*\"i)=№)N/2\Ki\l/2r{x ХехрГ — — (Rr — mi7)Qf (R—nif) , ί=1,2,...,Μ. 1. Использовать результаты задачи 2.3.2 для отыскания байесовского критерия для данной задачи. 2. Для частного случая, когда стоимость правильного решения равна нулю, а стоимости любых ошибочных решений одинаковы, показать, что этот критерий сводится к следующему: вычислить /|(R)=lnPf—^-InlKil—^-(ΐ^-ηι,ΟΟι (R-mf) и выбрать наибольшее. Задача 2.6.2 (продолжение). Рассмотрим частный случай, когда все Kj — = ση21 и гипотезы равновероятны. Используем такое же распределение стоимостей, что и в п. 2 задачи 2.6 1. 1. Чем определяется размерность пространства решений? Изобразить графически некоторые типичные пространства решений для иллюстрации различных альтернативных гипотез. 2. Интерпретировать алгоритм обработки как решающее правило по минимальному расстоянию. Задача 2.6.3. Рассмотрим частный случай, когда mj = 0, i = 1, 9, Μ, а гипотезы равновероятны. Используем такое же распределение стоимостей, что и в п. 2 задачи 2.6.1. 1. Показать, что критерий сводится к следующему: вычислить MR) = R7QiR + ln|Kil и выбрать наименьшее. 2. Написать выражение для вероятности ошибки Ρ (ε) в терминах 1Δ 6 Зак. 693 161 Г/ι \_lM
Задача 2.6.4. Пусть qb Δ хтВх, где χ — гауссов вектор N(0, I), а В — симметричная матрица. 1. Убедиться, что характеристическая функция qB(Q) равна Mq (jv)AE(e>'»o*)= Π (1-2ΜΒ.)-1/2, где λΒ — собственные значения матрицы В. i 2. Какова pqz(Q), когда собственные значения равны? 3. Какую форму имеет pQ^(Q)t когда N — четно, а собственные значения попарно равны, но взятые в других сочетаниях—различны, т. е. ^2i-i = λ2ί, i = 1, 2,..., —- , λ2ί Φ λ27·, все i Φ /. Задача 2.6.5. 1. Преобразовать результат предыдущей задачи так, чтобы он включал случай, когда χ — гауссов вектор N(0, Лх ), где Λχ — положительно определена. 2. Какова Μ Л _j (/и)? Имеет ли этот результат какие-либо интересные особенности? Задача 2.6.6. Рассмотрим многоальтернативную задачу проверки гипотез. Каждый результат наблюдения отображается трехмерным вектором: Я0:г = т0 + п, Я1:г = т1 + п, //2*Г = ГП2-|-П , Я3*г = т3 + п, т0=+А, О, β, /т=о,+л, б, тя=—-4, О, В, т3 = 0,— Л, В. Компоненты вектора шума—независимые, одинаково распределенные нормальные случайные величины, N(0, о). Имеется К независимых результатов наблюдения. Исходя из критерия минимальной вероятности ошибки и равновероятности гипотез, изобразить графически область решений и вычислить Р(г). Задача 2.6.7. Рассмотрим следующую задачу обнаружения. По любой из гипотез результат наблюдения представляется двумерным вектором г. По гипотезе Нх - L r2 J [χ2\ [п2\ Г-[г%][у%\ l_>4J У = х + п. L ^2 J L %2 J L ^2 J По гипотезе Нь Сигнальные векторы χ и у известны Модуль сигнального вектора по обеим гипотезам равен ~|/£, т. е. 162
Помехи представляются коррелированными нормальными случайными величинами: ^.i..(^^)=2w»(l-P»)l/aeXP(" 2σ2(1-ρ2) j 1. Найти достаточную статистику для проверки по критерию отношения правдоподобия. Обозначим ее через /(R). Уже было показано, что величина [Е(1\Н±)-Е(1\Н0)}2 d2=- *2(/|Яо) характеризует качество критерия монотонным образом. 2. Выбрать χ и у так, чтобы максимизировать d2. Зависит ли ответ от р? 3. Обозначим d2, полученное путем использования наилучших χ и у, через <i02. Вычислить do2 для ρ = —1, 0 и построить ориентировочный график зависимости do2 от ρ при изменении ρ в пределах от —1 до 1. 4. Объясните, почему ход кривой качества критерия в п. 3 интуитивно представляется правильным. Процедура оценки Задача 2.6.8. Результат наблюдения представляется W-мерным вектором г = а-|-п, где а есть N(0, Ка), песть N(0, Kn), причемаип — статистически независимы. 1. Найти атар. Указание. Использовать свойства, выведенные в задачах 2.4.27 и 2.4.28. 2. Убедиться, что атар эффективна. 3. Вычислить корреляционную матрицу ошибок Λε Δ£ [(ams—a) (ams—a)7]. Примечание. Этот тип вектора наблюдения часто получают путем дискретизации случайного процесса r(t), как показано на рисунке. Обозначим N выборок через вектор г. Используя вектор г, мы оцениваем выборки a(t), которые обозначаются через а%. Интересующая нас ошибка является суммой квадратов ошибок при оценке величин af тогда h 1Д£^|Га.-а)2]=£(_|«е2г) = £(а1ае) = Тг(Ле). Задача 2.6.9. (продолжение). Рассмотрим частный случай, когда Κ„ = ση2Ι. 1. Убедиться, что ams = (a„2I + Ka)-lKaR. 163
2. Теперь вспомним задачу обнаружения, описанную в случае 1 на стр. 116. Проверить, что /(R) = -^Rrams. Начертить блок-схему устройства обработки. Заметим, что это идентично случаю «неодинаковых дисперсий при равных средних», за исключением того, что среднее m было заменено среднеквадратической оценкой среднего— ams. 3. Чему равен средний квадрат ошибки ξχ оценивания. Задача 2.6.10. Рассмотрим другой метод решения задачи 2.6.8: г = а + п, где а — случайная величина с распределением jV(0, Ka), an — случайная величина с распределением N(0, σ^Ι). Пропустим г через матричную операцию W, которая определяется (369). Собственные векторы совпадают с собственными векторами Ка. г'д Wr = х+ п', 1. Убедиться, что WWr = I. 2. Каковы статистики величин χ и п'? 3. Найти х. Убедиться, что - __λ£_ , 1 К + Оп2 где λ$ — собственные значения Ка. 4. Выразить а в терминах линейного преобразования величины х. Начертить блок-схему полного устройства оценки. 5. Доказать, что Задача 2.6.11. Нелинейная оценка. В общей гауссовой задаче нелинейной оценки r = s(A) + n, где s(A) — нелинейная функция А. Шум η не зависит от а и является нормальной величиной с распределением jV(0, Kn)· 1. Проверить, что Pri.c^WsiAW^tito^lKj1/2]-^ X ехр [- -γ (R^-s7, (A)) Qn (R-s (A))] . 2. Допустим, что а — нормальный вектор с распределением W(0, Ka)· Найти выражение для pffa(R, A). 3. Используя свойства матрицы производных да, полученные в задачах 2.4.27 и 2.4.28, найти уравнение оценки по максимуму апостериорной вероятности. Задача 2.6.12. Оптимальный дискретный линейный фильтр. Предположим, что мы имеем последовательность скалярных результатов наблюдения rlt r2, г9, .... rk, где π = ai+ nit причем Е(а1) = Е(щ) = 0, E(rrT)=\ (NX N), Е(т)=Аг (Νχ\). Η 164
Требуется оценить а^, используя реализуемый дискретный линейный фильтр. Таким образом, К Определим среднеквадратическую ошибку точечной оценки как |pA£{[aK(Ri)-aK]2). 1. Использовать у для отыскания дискретного линейного фильтра, минимизирующего |р. 2. Найти ξρ для оптимального фильтра. 3. Рассмотреть частный случай, когда а и η статистически независимы. Найти b и ξρ. 4. Как a^(R) п. 3 связана с атар задачи 2.6.8? Замечание. Допущение относительно нормальности распределения не использовалось. Последовательная оценка Задача 2.6.13. Часто результаты наблюдения получаются в виде временной последовательности гь г2, г3, .... rN. Мы хотим оценить /г-мерный параметр а последовательным образом. Результат ι-го наблюдения есть Г| = Са + в/|, /=1, 2,..., N9 где С — известная матрица (1 X k). Помехи Wf — независимые одинаково распределенные нормальные случайные величины с распределением Af(0, ση). Априорно известно, что а — нормальная величина с распределением W(m0, Ла). 1. Найти ра|Г1(А|^). 2. Найти оценку по минимуму среднеквадратической ошибки ах и корреляционную матрицу ошибок Λ8ι. Дать ответ в форме Ра | гх (А Ι *ι) = с ехР [- γ (A-ai)7 Л"1 (A-a^J , где и ai = m0 + —; Λε, С7 (Rx—Cm0). 3. Построить блок-схему оптимального устройства обработки. 4. Теперь перейдем ко второму наблюдению R2- Какова априорная плотность для этого результата наблюдения? Написать уравнение для pa)r г (А| гь г2), Л"1 и а2 в той же форме, что и выше. 5. Построить блок-схему устройства последовательной оценки и указать точно, что должно запоминаться к моменту окончания каждой оценки. Задача 2.6.14. Задачу 2.6.13 можно обобщить, если допустить, что результат каждого наблюдения является m-мерным вектором. Результат ι-го наблюдения есть n = Ca + Wj, 165
где С — известная матрица т X к. бекторы помех w* — независимые одинаково распределенные нормальные векторы с распределением jV(0, Aw), где Aw — положительно-определенная матрица. Повторить задачу 2.6.13 для этой модели. Убедиться, что i«=Vi +\сТа*1 (Ri-cVi) и л?=а1+СГа'с' Построить блок-схему оптимального устройства обработки. Задача 2.6.15. Дискретный фильтр Кальмана. Рассмотрим теперь случай, когда параметр а изменяется в соответствии с уравнением аА;+1=ФаА + Гий, k= 1,2,3,..., где ах есть N(m0, Р0); Φ — матрица η Χ η (известна); Г — матрица η Χ ρ (известна); щ есть jV(0, Q) и не зависит от и* при / ф k. Процесс наблюдения записывается в виде rft = Cafe+wft, /г=1, 2, 3,..., где С — матрица т X п\ wh — jV(0, Aw) — независимые друг от друга и от и,- величины. Часть 1. Сначала оценим аь используя критерий среднеквадратической ошибки. 1. Записать ра11 Γι (Αχ | Ri). 2. Использовать оператор yEl для получения ах. 3. Убедиться, что at—эффективная оценка. 4. Использовать yai {[v3l (In pfli j Γι.(Α! | Ri))]7} для отыскания ковариационной матрицы ошибок Plf где P|A£[(ai + ai)(a|-ai)r]f /=1,2,... Проверка: a^mo+Pi^A-^R —Cm0] Часть II. Теперь оценим а2 1. Убедиться, что p-^p-i+^A^C. Pr2|a2(R2|A2)pag|ri(A2|R1) Pa2|ri.r2(A2lRi,R2)- рГ1|Г1(К1|^) 2. Проверить, что pajj, Γι (Α2 | Rx) есть Ν (Φ i , Μ2), где IΛt^ΦP1Φτ+ΓQΓτ. 3. Найти а2 и Р2. Проверка: а2 = Фа1 + РаСгЛ-1 ^г-СФах), 166
4. Написать Р2 = М2-В и убедиться, что В должно равняться B = M2Cr(CM2C7 + Aw)"1 CM2. 5. Проверить, что ответ по п. 3 можно записать в виде а2 = Фа1 + ЩСт(ст2Ст + А^)-1 (R2- C4>ai). Сравнить две формы записи с точки зрения легкости вычисления. Какова размерность матрицы, подлежащей обращению? Часть III. 1. Использовать результаты частей I и II, чтобы выразить &k и Pk через &k—\ и Mft. Получающиеся при этом уравнения носят название уравнений фильтра Кальмана для дискретных систем [38]. 2. Построить блок-схему оптимального устройства обработки. Часть IV. Убедиться, что фильтр Кальмана сводится к результату задачи 2.6.13, когда Φ = I, и Q = 0. Специальные приложения Большое число задач в области распознавания образов, обучающихся систем и стабилизации систем математически эквивалентны общей гауссовой задаче. Мы рассмотрим в этом параграфе три простых задачи (сформулированные Остином). Другие примеры — более сложные в деталях', но не по существу — можно найти в различных источниках. Задача 2.6.16. Распознавание образов. Систему распознавания образов мы предполагаем применить для классификации содержащих шум выборок, взятых из множества Μ образов. Каждый образ можно представить множеством параметров, в котором пг-п образ характеризуется вектором sm. Вообще говоря, векторы sm неизвестны. Подлежащие классификации выборки имеют форму x = sm+n, где smсчитаются независимыми нормальными случайными величинами со средними smH ковариацией Лт, а п считается нормальной величиной с нулевым средним и ковариацией Лп, независимой от выборки к выборке, а также независимой от sm. 1. Для классификации образов системе распознавания необходимо знать характеристики образов. Мы снабдим ее «обучающей» выборкой причем система знает, что в ней присутствует m-й образ. Показать, что если имеется / обучающих выборок х^ , xffi , ..., \^ вида x^=sw-|-n^ для каждого т=1,...,М, то система распознавания образов должна хранить в памяти только величины 1 J ι _ * γ χ(/) J /=1 для использования при классификации дополнительных выборок, содержащих шумы. Другими словами, требуется показать, что /m, m = Ι, ..., Μ образуют множество достаточных статистик, извлеченных из MJ обучающих выборок. 2. Какова оценка sm по максимуму апостериорной вероятности? Какова ковариация этой оценки как функция числа J обучающих выборок? 3. Для частного случая двух образов (М = 2), характеризуемых неизвестными скалярами sx и s2, которые имеют априорные плотности N(slt о) и N(s2, σ) 167
соответственно, найти оптимальное правило решения для равновероятных образов. Заметим, что при возрастании числа / обучающих выборок оно асимптотически приближается к решающему правилу классификатора «известных образов». Задача 2.6.17. Межсимвольная интерференция. Выборки данных предполагается передавать по известному дисперсному каналу с импульсной характеристикой h(t) при наличии белого гауссова шума. Принимаемое колебание К r(t)= Σ lhh{t-kT) + n(t) может пропускаться через фильтр, согласованный с импульсной характеристикой канала, с целью получения ряда чисел aj= §r(t)h(t — ]T)dt для / = 0, ±1, ±2, ..., ±К, которые образуют ряд достаточных статистик при оценке %h по максимуму апостериорной вероятности. (Это доказывается в гл. 4). Обозначим автокорреляционную функцию выбранного канала через b'j=$h(t)h(t-jT)dt, а шум на выходе согласованного фильтра — как tij= ^n(t)h\t — jT)dt. Тогда указанная задача сводится к оценке |fe при заданном ряде соотношений К £=— К Используя очевидную форму записи, указанные соотношения можно записать в виде a = Bg + n. 1. Показать, что если n(t) имеет симметричный двухсторонний спектр с плотностью N0/2, то вектор шума η имеет ковариационную матрицу Лп = —Ν0Β. 2. Если £fe — нормальные случайные величины с нулевыми средними и ковариационной матрицей А», то показать, что оценка ξ по максимуму апосте- риорной вероятности имеет форму ξ = Ga и, следовательно, что ξ0 = g а. Найти g. Заметим, что оценку ξ0 можно получить путем пропускания достаточных статистик через линию задержки с отводами, имеющими коэффициенты усиления, равные элементам g. Такое каскадное включение согласованного фильтра, за которым следует квантизатор и трансверсальный фильтр, является хорошо известным методом коррекции, применяемым для подавления межсимвольной интерференции в системах передачи дискретных сообщений через дисперсную среду распространения сигналов. Задача 2.6.18. Определить оценку ξ0 (задача 2.6.17) по максимуму апостериорной вероятности. Предположим далее, что £fe — независимые и известные величины (скажем, в результате процесса безошибочной оценки или обучения «с учителем») для k < 0. Показать, что взвешивание достаточных статистик имеет форму lo=2 gjaj— 2 fjlj, />0 /<о и найти gj и fj. Этот приемник можно истолковать как устройство, пропускающее стробированное выходное напряжение согласованного фильтра через трансверсальный фильтр, коэффициенты усиления в отводах которого равны gj, и вычитающее из выходного напряжения последнего выходное напряжение второго 168
трансверсального фильтра, на вход которого подается последовательность величин |fe, оценки которых были произведены. Разумеется, подобный приемник был бы самообучающимся за счет использования в качестве уточненных оценок в приведенном выше уравнении своих предыдущих оценок. Задача 2.6.19. Пусть z = Grr, и допустим, что ζ имеет параметры распределения N(mz, σ2) для всех конечных G. 1. Какова Mz(jv)? Выразить результат через mz и σζ. 2. Переписать результат п. 1 в терминах G, m и Аг (для определений см. (316), (317)). 3. Обратить внимание, что Mz(ju)AE[eiuz]=EyuGTr] и Mf(jv)^E[eivTr] и, следовательно, Щ (ju) = Мг (/ν), если Gu = ν. Использовать эти замечания для проверки (317). Задача 2.6.20. (продолжение). а) Допустим, что Аг, определенная в (316), есть положительно определенная матрица. Убедиться, что выражение для pr(R) в (318) является правильным. (Указание, Использовать диагонализирующее преобразование W, определяемое (368)). б) Как необходимо видоизменить (318), если Аг — матрица сингулярная? Что влечет за собой сингулярность матрицы по отношению4 к компонентам вектора г? Задачи к § 2.7. Границы качества и приближенные выражения Задача 2.7.1. Рассмотрим бинарное испытание с N независимыми результатами наблюдения г/, где Pri\Hk = N(mktGk) /е = 0, 1, / = 1, 2,..., N. Найти μφ. Задача 2.7.2 (продолжение). Рассмотрим частный случай задачи 2.7.1, когда т0 = 0, σ02=σΛ2 и σ!2 = σδ2+σΛ2. 1. Найти μ (s), ft(s) h[x(s). 2. Полагая, что гипотезы равновероятны, найти верхнюю границу минимальной вероятности ошибки Ρ(ε). 3. При допущении п. 2 вывести приближенное выражение для вероятности ошибки Ρ(ε), справедливое при больших N. Задача 2.7.3. Частный случай бинарной гауссовой задачи с W результатами наблюдений соответствует ^1Н^1^-(2я),/2|Кй|1,2^(--^^)- * = 0.1. 1. Найти μ(δ). 2. Выразить μ (s) через собственные значения соответствующих матриц. 169
Задача 2.7.4 (продолжение). Рассмотрим частный случай, когда и Ki = Ks+Ko. Найти μφ, μ(δ) и ^(s). Задача 2.7.5 (другой вариант продолжения 2.7.3). Рассмотрим частный случай, когда Κι и К0 разбиваются на четыре матрицы вида Ν Χ Ν, определяемые (422) и (423). 1. Найти μ(ε). 2. Полагая гипотезы равновероятными и критерий минимальной Ρ(ε), найти границу вероятности ошибки Ρ(ε). 3. Найти приближенное выражение для Р(г). Задача 2.7.6. Общая бинарная гауссова задача для N результатов наблюдений соответствует р,,„»<«ι«ri-aw^i- [- {*T-ml) T (R"mt)] · *-·'· Найти μ(β). Задача 2.7.7. Рассмотрим пример ЗА на стр. 136. Граничное выражение для вероятности ошибки имеет вид _.. 1 Г 1+σ,*/ση*-[ Ρ(ε)< 2 [(l+oa*/20M 1. Ограничимся Νσ82/ση2 = χ. Найти величину Ν, которая минимизирует границу. 2. Оценить приближенное выражение (516) для этого значения N. Задача 2.7.8. Граница Чернова в (461) была выведена путем использования неравномерных распределений. Этот подход подготовил нас -к доказательству центральной предельной теоремы во второй части нашего обсуждения. Если нас интересует только (461), то возможен гораздо более простой вывод. I. Рассмотрим функцию случайной величины х, которую обозначим как /(#). Допустим, что Доказать, что 2. Теперь пусть f (χ) > 0 при всех х, /(*)> Р[х> /<*) = /(*«)> 0 при* = е$х, s> 0, Х0 = у. >Хо- Использовать результат пункта (I) для вывода (457). Какие ограничения необходимо наложить на γ, чтобы получить (461)? Задача 2.7.9. Причиной использования неравномерных распределений и границ Чернова является то, что прямое применение центральной предельной теоремы дает ошибочные результаты, когда интересующая нас область находится на «хвосте» распределения. Тривиальный пример, заимствованный из [4—18], хорошо иллюстрирует этот факт. 170
Рассмотрим ряд статистически независимых случайных величин х-г, которые принимают значения 0 и 1 с равной вероятностью. Нас интересует вероятность 1 N *P[An]. г=1 а) Введем стандартизированную (нормированную) величину А Ум-Ум г д Использовать доказательство центральной предельной теоремы для оценки P[AN]. Обозначим эту оценку через P[AN]. б) Вычислить P[AN] точно. в) Убедиться, что для относительной ошибки справедливо соотношение P[An] осе0·19" Ρ [An] oce Заметим, что относительная ошибка растет экспоненциально с N. г) Оценить P[AN], используя границу Чернова из задачи 2.7.8. Обозначим ρο[ΛΝ] эту оценку через РС1АМ]. Вычислить р, Δ—г. Решение некоторых задач к гл. 2 Решение задачи 2.2.1 1. Из (13) критерий отношения правдоподобия можно записать в виде A{R)= p (R\H) ^η· (2Л*} Ρν ι я<Лк'ηο) н0 По гипотезе Hi поэтому можно произвести операцию свертки ps(R) и pn(R) для отыскания pr(R): Pr(R) = Ps(R)®Pn(R). Для заданных конкретных плотностей проще перемножить характеристические функции Мг\н1№) = М8Ф)Мпф), оо M,(JO) = E(el°s)= {a^vse-asds= - J —/ο+α где Mn(iv) = -jv+b 171
Тогда Μ ab ab Г 1 1 1 r\HxW- (_iO + a)( — iO + b) ~~ b — a \-jv + a "" — jv + b J' a* [е-«-е-«], *>0, Рг, я, (*)=*"« " ' <2·2*> 10, tf<0. Согласно гипотезе tf0 r = n, так что (2.3*) Подставив (2.2*) и (2.3*) в (2.1*), получим A(R) = -T—[e{b-a)R-l]^r\t R>0. (2.4*) δ— α я0 Заметим, что # принимает только неотрицательные значения по обеим гипотезам, поэтому для R < 0 в критерии Л(#) нет необходимости. Прежде всего предположим, что Ь > а. я0 а или Я4 Α^γ, (2.5*) я0 где 1 / г ь—а Легко убедиться, что (2.5*) справедливо также для а > Ь. При а = b можно либо использовать предельный переход, либо вернуться к выражению для Мг|Я1(/и), приведенному выше (2.2*). В результате имеем и а Я0 2. Согласно (2.14) основного текста Ρ о (Сю—С0о) η~ MCoi-Ch) ' Y=_j_lnir(^)^(c10-c00)i J Ύ 6-a U flPi(C0i-Cu) _Г У α 3. Для критерия Неймана —Пирсона порог находят путем вычисления PF; PF=P[R>y\H0] = ] Pr\Ho(R\H0)dRt PF=]be-bRdR=e~bv у у или \nPF = — by. 172
Таким образом, порог равен InP, Примечание. Как и в примерах 1—3 (стр.39—42), мы сначала свели критерий отношения правдоподобия к простейшей форме (2.5*). Все вычисления ошибок производятся при помощи этой формулы, арЛ|Я1(Л|#!) вычислять никогда не приходится. Решение задачи 2.2.2. 1. Отношение правдоподобия равно 4w_.-*i*«I*>- ^ИН*" iPrlko(R\H0) = l/f exp( 1 У 2л exp -τ* -ΙΚ|+γ*2 2. Дифференцируя логарифм A(R), получим jl,„a(S),^(_,«0+xr!)w{ ; -1 + /?, R>0, + «, . Л <0. (2.1*) (2.2*) Таким образом, Л(#) — убывающая функция величины | R | при | R | < 1 и возрастающая функция | R | при | R \ > 1. График Л(#) дан на рисунке. Из рисунка видно, что имеется три возможные конфигурации областей решений. Л (к) * я а) Если η > "о" то области решений имеют вид //„ ■ β _ Υ/. вид б) Если 1/ — ехр( — 0,5) < η < 1/ —, то области решений имеют -J L_4 L_E Яр £ .-. в) Если η <l/!Lexp(—0,5), то оптимальный критерий всегда сводится к выбору Нх. 173
Заметим, что, вероятно, можно реализовать этот критерий либо при | R \ ввиду симметрии, либо при (R2 — 2| R |) во избежание двойного порога в случае б). Ясно, что критерий отношения правдоподобия всегда является однопороговым критерием, однако эквивалентное испытание достаточной статистики может потребовать нескольких порогов, как в случае б). Решение задачи 2.2.5. #х : /*£ — гауссова величина, МО, aj, i => 1,2, ..., /С, Hq : ri — также гауссова, МО, σ0], ί = 1, 2, ..., /С, где σι>σ0. 1. Допустим, что К наблюдений являются статистически независимыми: / :1 W2 ί 1 L· \ / ι W2 ί ι Д 1 'm*.«i*.>-(w) Η" **",?, *Т PrlHt^f^i) / σχ\-Κ ί 1 / 1 1 \ * 1 ""- ,„„>ι*.> -U) "'|lfc-v)2«4 <"·> Λ . 2. Из (2.1*) К A(R) = A[/(R)]f где l(R) = ^Rt\ Следовательно, /(R) есть достаточная статистика. Обозначим ее значения через L. Допустим, что порог равен η: Нх Я, Л (L) S: η или, что эквивалентно, In Л (L);S In η. Нь Но Используя результаты, полученные в п. 1, имеем „, <?ι 1/1 1 \ «ι —/Пп — + — — - — L 25 In η. (2.2*) Пусть β= ; перегруппируем члены; (2.1*) приобретает вид σο 2l 2at2 Ι^(1ηη + /Γ1πβ)-- χ я. ' (β2-1) " За. Прежде чем вычислять PF и Р^, найдем pi(L) —функцию плотности /. Все величины г% распределены нормально с нулевыми средними и диспер- К /= Ц НУ 1=1 Наша цель —найти pi (L): Ρ [0 < / < L] = Г рг (a) <ία = (2πσ2)~*/2 Γ ex О Ω К где Ω — область, в которой 2 гг·2 < L. Если положить г2= 2 ГЛ то объем г=1 ' /=1 сферической оболочки в /С-мерном пространстве, имеющей радиус г и толщину с/г, равен 174
zK~~ldz, где Г—гамма-функций, (τ! г L VL Γ ρ (α) da = -— Γ exp (- 2*/2оа) гк ~1 dz. J {2σψ!2 r (A.) J Пусть га = а, тогда l L —-ι —-ι L («)*«= f" 7("g/2q2)^. ,,<*)- L' exp(-L/2a^ ^ о (2a^r(-f) (2^)Tr(f) 36. PF = Ρ (Hi\H0) — вероятность выбора Ηχ при условии, что истинна гк потеза Я0: 4- d Г ,f.»wf f L exp(~L/2a„») 00 ^-_ι PF=~7ΊΓΤ \ У2 ехр(—y)dy. "ri^ J . 2 / ν Аналогично: 2 PM=l~PD=l-—ΤγΤ" f »* exp(-t/)<ty. г| 2 ; ν 2σχ2 4./C=l, σχ* = 2, σ0*=1. οο Pf = 2 f —i=- exp (- α2/2) da = 2 erfсДУТ), ^Λί = 1 ~PD = ! -2 erfc, (Vy/2). Согласно п. 2 2(1ηη + /Γ1ηβ)σ1» γ= Ва—1 «4(1ηη + 1η2) = γΛ PF=2erfc*(Yo), PM=l-2erfc*(-^). 175
5. Минимаксный критерий требует, чтобы CF PF =СМ Рм, но CF =CM. Задаваясь PF=PM, получим γ0 = 0,80 и η = 0,83. Критерий минимакса наклон tg<x -o,bS нг AS 0,83 Но или Иг LS0,80. Решение задачи 2.2.10 1. Информация, содержащаяся в наблюдении однородного пуассоновского процесса счета на интервале 7\ полностью определяется временами ожидания событий. Пусть таковыми будет ряд {^/}, i = 1, ..., л*, который обозначим через л*-мерный вектор w. Отношение правдоподобия тогда можно записать как A(w рп* | ft, [N* Pw Pw. η* Ι ft, η* 1 ft. Pw [W, [W, N* | fti] N* | ft„j ftJWIiV*, fell P»· I *,[*·! *.] Pw|^.ft.[wlJV*. ft»! ' Если можно показать, что Pw|n'.*,lw|iVf fti] = Pw|„*,fto[W|W*>fe0], или что совместная плотность времен ожидания при условии, что произойдет п* событий, независима от средней частости, то мы устанавливаем, что п* есть достаточная статистика. Вспоминая, что указанные времена ожидания условно независимы и равномерно распределены на интервале 7\ и учитывая упорядочение (см., например, [30]), получим п*\ Pw|„*.*[W|W*, k\\ Tn* 0 < wt < 7\ 2. Поскольку стоимости равны, решения желательно принимать по максимуму апостериорной вероятности, т. е. выбрать гипотезу, для которой апостериорная вероятность является наибольшей. Это дает порог, равный 1: Берем логарифм ТЧ βχρ[-(^-^0)Π^1. £* (fei -fee) Г *0 / Я0 Яо In (А \ fto 176
3. Введем обозначение: (fei-feo)r ηβ=— In Ρ [e] = Ρ IH0) Ρ [я* > η0 I #„] + Ρ №1Ρ [я* < ηο I #ι] = />η0 ί^Ήο Решение задачи 2.2.15 1. Из (66) erfc,W = J-pfe="e"lfi#2^· (2Л*) Чтобы получить требуемый результат, перепишем это выражение в виде оо χ и, проинтегрировав по частям, будем иметь ·*.№-τ^[-τ·"",№·"*""*,1- I хх J -ϊ^τ·-ι,"-£?·"*,"4 χ>°· (2·2,) Ограничиться положительным Λ" необходимо из-за первого члена. Интеграл во втором члене является положительным, поэтому егк*(Х>< -ykre~X'/2· х>0- Для установления нижней границы, проинтегрируем второй член по частям: XX X где X > 0. Таким образом, Последний член положителен, поэтому Как показано на рис. 2.10 (стр. 52), верхняя и нижняя границы весьма близки при X ]> 2 и практически совпадают при X ;> 3. 177
2. Для обобщения п. 1 продолжим интегрирование ίιό частим и полуЧйм ряд *»-7Ёг-(-т)['+2 «-■г^#=а + L WI— 1 „,. /Р\ Г 1·3...(2η+1) / у2 \ I + (-l)"+»Xexp^T)J y2n;2 ;exp(-^-jrff/ h л -J «-(-.^■x-,(^-)J'-'^ff+M-f)* или Лр(~?) _ . ....... . .. . ...Ь-№ Пусть1) rJJ-J?.»(„l)-+in.3...(lto+l)]J-~ir^. '=-f 0/2-*2)> </ = (2*+*2)1/2 и Чтобы использовать выражение для Θ, данное в условиях задачи, рассмотрим (*„_,) v 2 =(-1)||[ЬЗ...(2п^1)]Г v " X J (2/ + Х*)я+ 7 ехР I — η I ^ е-(2' + *>/2 at о или _ (-1)"1ЬЗ...(2д-1)] Г» е-^ "-1 X2ri J / 2/ \η+ι/2 j7i . 2' ν Из условий задачи "ί л. Сравнивая выражения для /?я_ j и θ, получим «.--(-■»■■···■£-".■ *) Этот метод был предложен профессором Вашингтонского университета Коксом (J. R. Сох). 178
Границу величины θ можно установить в Ъиде оо оо 0<e=jV'^+-j^~'z~1/2^ < jV'^=i. Следовательно, 1 .3... (2я+1) 0<\Rn\< χ2{η+ιΤ ■ (2к + 2)! ' (п+\)\(2Х*)п+1 ' Верхняя граница есть абсолютная величина (л + 1)-го члена разложения eric*(X), и ввиду того, что θ положительно, Rn имеет такой же знак, что и данный (п + 1)-й член, что и является требуемым результатом. 3. Относительная ошибка в процентах 100 е-*2/2 ι —=—Rn\ Ϋ2πΧ Ι |егкЛХ)-2 erfc* (X) Ι «η Ι Γ2ηΧ \Rn\ erfc* (X) (τ^(-έ)). >*)' n = 2 : az = 3 : n = 4: Κ 2πΧ % ошибки 15/Х6 15 100 % ошибки 100 % ошибки 1 1 Χ2 105/Χ* 1 ~ *2 945/Χ1» 105 Χ2 (Χ*—Χ4)*' 100 1—- 1 rt 2 3 4 Χ 3 2,32% 1,80% 1,80% 5 0,1% 0,028% 0,01% Решение задачи 2.2.17 1. Подставляя две плотности вероятностей, приведенные в условиях задачи, в (2.13), получим критерий отношения правдоподобия *«>-Й£-Н(тЬ-^) -■] + + ехр или '[(· ах.* е i 1 2σ02 " + е 2 1 " 2σ^ -%■ г)х* 20l 1 Я0 σ0 179 η^.γ>
где ад ^ 2σ0* 2сг* Ради простоты допустим, что а > 0. Аналогичное рассуждение следует для а < 0. 2. Поскольку этот критерий зависит только от Χχ2 и х22, зададимся Критерий имеет вид /ιΔατΛ 12Ьх22. Области решений в плоскости /lf /2 показаны на рисунке, где 1 1 у L\u = L2u = — In γ, Lu = L2i = — In —. a a Z lf*z * Точные выражения для ошибок имеют вид я» Po=ili^r[exp(-^"-^")+ я. +ехр(~^"~й")]^^· Выполнить интегрирование по этой области часто бывает затруднительно. Поскольку указанные два угла ограничивают линию точных решений, их можно использовать для ограничения вероятностей ошибок. Нижнюю границу PFможно установить, используя линии/2 = L2U, h — L1Uy PF>\- J aLx \ dL2plil2{Ho(Llt L2\H0) = о о V~4^ Л/Ч* =1- ί ί ^7exp("S"^)^^ -V4u -Vh 180
или (Вспомним, что L1U = L2U и определение erf* ( · ) на стр. 49.) В качестве верхней границы используем L2 = L2i, Li = Li;. Это дает Аналогично, для Ρ D \ Прежде чем использовать эти выражения, следует проверить, насколько близки друг к другу верхняя и нижняя границы. Это легко сделать для любых заданных η, сг и σ0. Решение задачи 2.3.2 1.Воспользуемся выражением (2.98): Л= Σ ΣpJciJ$ Pri*.(Rltfj)*R = / = 0 /=0 2. J ί j z% i i z% Λί —Ι /Μ— 1 \ = Σ ί Σ CijP(Hj\R))pr(R)dR. (2.98) / = 0 zt \ / = 0 / Пусть Λί—1 β,-(R)= Σ CijP(Hj\K). (2-1*) Тогда Λί-1 Λ= Σ JPi(R)Pr(R)^R. (2.2*) ί = 0 2· Выпишем (2.1*) в виде ^=iPo(R)PP(R)^R+ JPi(R)Pr(R)^R+ ... + 2o 2j + J P^^RKWdR. zm-\ Каждое отдельное R войдет только в один интеграл. Желательно приписать его области Zf, где оно будет вносить наименьший вклад в £fc. Ясно, что это делается путем выбора наименьшего βί(Κ) и отнесения R к этой области. Это и является требуемыми результатом. 2. Теперь рассмотрим стоимости С« = 0, / = 0, 1, 2, ... , М— 1, С^=С, ίφ'η *\ / = 0, 1, ..., М-\. 181
Подставляя в (2.1*), получим Λί— 1 Λί-1 MR)= Σ СцР{Н,\*) = С 2 JMfylR) /= 0 /=0 \Ф1 или MR)=C[l-P(tf,|R)]. (2.3*) Из (2.3*) ясно, что выбор наибольшей Р[Яг· | R] эквивалентен выбору наименьшего $i(R). Примечание. В пункте 2 используется критерий максимума апостериорной вероятности. Рассматривая выражение для риска (2.98) при указанных выше стоимостях, видим, что & = Ρ(ε). Этот результат был показан для Μ = 3 в выражении (2.109). Решение задачи 2.3.3 1. Для минимизации Ρ(ε), как известно, необходимо выбрать гипотезу Η ι с наибольшей апостериорной вероятностью P(Hi\R)=P(R\Hi)j^-. Поскольку гипотезы Hi равновероятны, это эквивалентно выбору Яг·, для которой вероятность является наибольшей. Это, в свою очередь, эквивалентно выбору Яг·, для которой \R-nti\t 1 = 1, ... 5, является наименьшим. Пространство решений и границы имеют вид "' 1 I ~2т "г I -Л7 1 0 »* т 1 2т Зт 2 т 2 τη 2 Зт 2 2. Я(е) = -у [P(e|M0 + ...P(e|M5)]=-^erfc* {^. Решение задачи 2.3.5 1. Можно непосредственно использовать результаты, изложенные на стр. 59. Заметим, что гипотезы имеют в этой задаче индексы от 1 до 3, а не от 0 до 2, как на стр. 59: ехр| Л2(Я) = Рг|Я2(К1я*) 2πσι*σ22 Pri^Wtfi) Ri2 '12 J22 1 1 exp I — — 2лоц σ21 Ι 2 _Rl R£ 2 2 σϊι σ1ι Используя приведенные в задаче дисперсии и упрощая, получим A2(R) = /Cexp[aL!], где (2.1*) К* 1 182
Аналогично, Pv \нг 1«Ι#ι) Используя (2.103) — (2.105) и матрицу стоимостей, указанную в задаче, получим критерий Я2 ИЛИ #з #2 ИЛИ Яэ рЛ2 S (1-2р) + р(а-1)Л3; М3 S (1—2р) + р (а-1) Л2, Я! ИЛИ #з #1 ИЛИ Я2 Нх или Я, раЛ3 ^ раЛ2. (2.3*) Я! ИЛИ Я2 Используя (2.1*) и (2.2*) и полагая α > 0, (2.3*) можно свести к виду Я2 ИЛИ Я3 ι 9п е<"-*+(1-а)е' aL2 (\—а)еаЬ1 + е' Ηг или Я3 РК Ηζ или Я3 ι _ 9п Нх или Я2 Р^" Я1 или Я3 L2 «==; Li. Нх или Я2 (2.4*) (2.5*) (2.6*) 1 . у 1т? 7-а IT Ι V Заметим, что для этого примера проще строить график областей решения в координатах Л2 — Л3. 2. Общее выражение имеет вид где г% — области решений, указанные на рисунке, И 1Δ где Pij = l P\ \Hj(L\Bj)dU г на рис ш· /i^!2 И /2Аг22. 183
Заметим, что из симметрии следует, что ^12=^13» ^21 = ^31 и ^23=^32· Итак, P(B) = P1(P2l + Psi) + P2(Pl2 + Pz2)+P3(PlZ + P2z) = = (l-2p)2P21 + 2p(P12 + P32). 3. Теперь положим а = 0. Это соответствует условию отсутствия потерь (т. е. нулевой стоимости), когда приемник путает гипотезы Н2 и Н3. Уравнения (2.4*) — (2.6*) обращаются в я2 или Я, ι ль еа1г _|_еа/2 ^ ^^ , (2.7*) Нг или Я3 К? Я2 или Я, ! Ор ee/» + ee/» S -?211 (2.8*) Я! или Я2 ^ Я! ИЛИ Я3 0^0. (2.9*) Нх или Я2 Уравнения (2.7*) и (2.8*) предполагают критерий Нг или Я3 ι oD ea/i + ea/2 ^ -^. (2.10*) Я, АР и (2.9*) всегда удовлетворяется со знаком равенства. Критерий в (2.10*) тождественен критерию, рассмотренному в задаче 2.2.17. Во всех случаях, когда путаница между двумя гипотезами не связана с потерями, задачу отыскания критерия можно свести от Λί-гипотезной к (М — 1)-гипотезной Решение задачи 2.4.2 Эта задача иллюстрирует идею воспроизводящей плотности. 1. Прежде всего вычислим моменты априорной плотности: оо Ε[λ]= (/*)П* [xn*e~u*dX=-^, (2.1*) 1 J г ы J /» ' о со Ε[λ,]="-&)ϋΐ Γλ"*+'β-λ'«<α="*("*+1), о σ»[λ]=£[λ»]-Ρ[λ]- п*("*г+1) -^-^, (2.2*) Напомним, что оценка по минимуму среднеквадратической ошибки до того, как сделаны какие-либо наблюдения, есть просто Ε [λ]. 2. Апостериорную плотность после одного наблюдения написать нетрудно: о /ι,νχ Ρ*|λ(*Ιλ>Ρλ(λ) Xe-**f«e-M*X"*-' /η* χ/ι* e-(U + X) λ ρ. . (λ Ι Χ) = . (2.3*) 184
Далее необходимо оценить рх(Х): оо ρκ(Χ)=Γλβ-λχ^τ^—β-λ'·λ"·-Ι<ίλ=^— Χ -хх _J^_ е- λ/, λ„. -1 dk= _J^_ Г (л.) Г (η») xf^.e-(Jf+/.)lu=Ji!: <V+I> = · "*/*"* . (2.4*) Подставляя (2.4*) в (2.3*) и упрощая, получим Ρλ|^λΙΧ) = ^Κ,/+(λΚ· //), (2.5*) где я*' = л*Ч- 1 и // = /» + *· Итак, апостериорная плотность имеет такую же форму, как и априорная плотность. Два параметра, которые определяют плотность точно, изменяются в результате наблюдения. Оценку Ams можно найти непосредственно или путем использования (2.1*) и свойства воспроизведения. Получим со %ms = E [λ I X] = j %p% , n<> h (λ Ι я/, /.') d\- ^L _ 3d± . 0 Величину E[(Xms — λ)2] находим в два этапа: E\(^-m = Ex{EUx(lms-%f\. (2.6*) Внутреннее математическое ожидание можно оценить, используя (2.2*): *иЛК^) = ^- (2.7·) Используя (2.4*) и (2.7*) в (2.6*), получим σο [(£ms-^)2]=f (/* + Х)2 (h + X)n*+i ~ (л»+2)// Указанная возможность отыскания \ms и внутреннего математического ожидания путем простого исследования формы является основным преимуществом воспроизводящей плотности. 3. Этот результат можно получить методом индукции. Априорная плотность для второго наблюдения есть апостериорная плотность из первого наблюдения. Следовательно, PM*lf*,<M*b *2)=·ρλΊ«../.<λΙ*Λ //), где п*"=\+п*' = 2 + п* и /*" = Χ2 + /*' = Χ2 + Χι + /*. Продолжая рассуждения вплоть до η наблюдений, получим требуемые результаты. 4. Дифференцируя апостериорную плотность вероятности, находим для одного наблюдения ί _ Ц± ~~ * я* 185
Для п наблюдений я# + л — 1 rvmap = Мы видим, что ^ap=^=Xms, но они практически равны при больших п. Решение задачи 2.4.3 1. По правилу Байеса X Г ^о / У(Л-т0)2 \\ lVT*oneXP{- 2σ„2 )\рт 2ση2 )\ pr(R) pr(R) 2πση* Χ Χ exp [■ (1 + У)Л»-(2ут,+2К)Л + (К2 + Ут0*) 2ση* ]- 1 Pr(R) 2πση* 1 Χ exp [■ 2σ„2 exp — Λ»+ν«β*· / - Ущ + R \ 2σ„» H-feo (# + V"o2)2 Χ l+fe( F)]- где 1 Γ_ (Л-тх)2] ~ Υ'2άσ1 6XPL 2σχ» J' fe02mQ + fl tni±- 1 + W и ах2 Δ. Это и есть требуемый результат. Заметим, что нет необходимости оценивать f(R), так как в наших целях вполне достаточно того факта, что данная плотность при интегрировании должна давать единицу. 2. Аналогично, рв|г(Л|Н)=рГ|в(ИМ)£^ = лГГТ X P,(R) N+l (2я) X Г pr(R) = /(R)exp exp 24 V+# 2σί ί=1 X exp 1 2σ " ΥΪ=Τ tf+ft.» = g(R)exp 2σ2„ [Α- N + W ) m
где ι M *£Σ *·■ ί= 1 Это и есть требуемый результат. Настоящая задача еще раз иллюстрирует преимущество воспроизводящей плотности. Решение задачи 2.4.9 I. Для испытания эффективности найдем d\npr{a(R\A) дА и проверим, выполняется ли (2.187): pM<^|a)=yfcexp(~^' 1η»Γ|σ(Λ|σ)-Ιη(^τ)-1ησ—g, οσ σ σ3 σ3- Выражение (2.1*) нельзя записать в форме k(a) [S(R)-o], следовательно, эффективных оценок σ не существует. 2. Теперь желательно оценить ЛДа2: рг, α (β I Л) =-p=L=- ехр ( - -g-), dlnpr.e(RM) 1 Я2 1 /Λ Следовательно, данная оценка эффективна. Решение задачи 2.4.12 1. Простейший путь решения данной задачи — это использовать матричную форму записи. Обозначим: гаМ, sa[4 „аГЧ χλ[*" '"I, I Г2 J L 52J L «2J L*21 *22 J где s = xA. Поскольку nx и n2 — аддитивные независимые помехи, то Pr|a(R!A)=i^^i7^exp[-Y(R7'-s7')A-1(R-s)], (2.1*) где Α = ση»1. 187
Логарифмируя (2.1*), получим lnpr|a(R|A)=fc—^-[(R^-sOA-^R-s)]. (2.2*) Чтобы получить ать продифференцируем (2.2*) и приравняем результат нулю: ainpr,a(R|A) nf dlnpr|a(R|A) r0f xTA~l [R—xA] ал -[?] = 0, (2.3*) = 0. (2.4*) Комбинируя (2.3*) и (2.4*), получим x7,A~1[R-xSm;] = 0. (2.5*) Если х""1 существует, то &т\ = х R> ^[am,] = ^{x-1[xA + n]} = A, (2.6*) следовательно, оценки по максимуму правдоподобия являются несмещенными. 2. Для вычисления дисперсии необходимо сначала убедиться, что (2.5*- имеет форму, требуемую для эффективной оценки [см. (261) на стр. 90.] Уравнение (261) можно переписать в векторной форме: I (R)-A= К (A) Va [In рг, А (R I A)]. (2.7*) Подставляя (2.5*) и (2.6*) в (2.7*), получим х"1 R-A= К (А) [х^Л-1] [R-xA]. Таким образом, К"1 (А) = х?,Л"1х, и эта оценка является эффективной. Во всех случаях, когда оценка эффективна, обычно бывает проще вычислять дисперсию, используя границу Крамера — Рао. Дифференцируя, получим J=xrA~1 χ. Для получения дисперсий найдем J-1: [9 О ι _ __^2+_f_\2 | —JSZ1_XJ2± *l2_*ll)_ — (*22 *2l + *12 Xll) j #21 +*11 Дисперсии являются диагональными членами. 3. Эффективность была доказана в п. 2. Примечания. I. Эту задачу можно также решить, используя свойство б (стр. 94). Такой способ требует несколько меньше алгебраических выкладок. 2. Если х-1 не существует, то задачу нельзя решить относительно а, которая является эффективной. Решение задачи 2.4.27 1. Требуется доказать, что ?х(АГВ) = (ухАг)В + (?хВг)А. (2.1*) 188
Это не что иное как известная формула дифференцирования произведения двух функций в векторной записи: \т Ъ=[а1а2 ... ап] = [αϊ Ьг + а2Ь2 + ... +ап Ьп], Vx(ArB) = дхх д дхп. [a1b1 + a2b2+... + anbn] [a1b1 + a2b2+ ... +anbn] Разделяя на две матрицы, получим V>rB) = дхг даг дхп bi + . *!+...+ дап дху дап дхп Ьп Ьп + dfri . . dbn — fli+...+ -z— ап дхг дхг дЪг дЬ* По определению оператора ух имеем VxAr= "даг да2 δχχ δχχ δα,χ да2 -— ах + ... + —- ап дхп дхп дап' δχχ дап дхп дхп (у,Аг)В- dctx да, дап ^-ь1 + -^ь2+... + -^ьп дхг даг L дхп дхп дхх да, Аналогично, (V. ВГ) А- дхх дЬх дхп аг + ~а2+...+-^ дхл <*ι + djh дхх д^ дхп дх± дхп db„ 0-2+...+ дЬп дх-п Используя (2.3*) и (2.4*) в (2.2*), получим (2.1*). 2. Путем замещения В на χ и А на В в (2.1*) получим Vx(Brx) = (VxB^)x + (Vxx^)B. (2.2*) (2.3*) (2.4*) (2.5*) Теперь В не является функцией х, поэтому первый член в (2.5*) равен нулю. Во втором члене г д -ι · [Х\ Х2 . . . Хп] τ Vxx = δχχ дхпЛ 1 О 1 1 = 1. (2.6*) 189
Таким образом, Vx(Brx) = IB = 6, что и является требуемым результатом. 3. Произведя перемножение, получим Г η \ η ||Л Ι ХГС = 2 CUXJ\ Σ C2JxJ\'-\ 2 CmjXj\ Для получения первой строки ух(хгС) возьмем производную д(хтс) дхг "— [^и ] ^21 ί · · · \ Cmi]· Остальные строки получаются аналогичным образом, давая требуемый результат: 1х(хтС) = С. (2.7*) 4. Этот результат был приведен в (2.6*). Решение задачи 2.4.28 1. Используя указание и результат задачи 2.4.27, имеем VxQ=Vx(A7,(x)AA(x)) = Vx(A7,(x)A1/2A1/2A(x)) = lxm mx\ = (νχ(Α7,(χ)ΛΙ/2))Λ1/2Α(χ) + (νχ(Λ1/2Α(χ)7,)(Α7,(χ)Λ1/2)7,= = (νχ(Α7,(χ)Λ1^2))Λ1/2Α(χ) + (νχ(Α7,(χ)Λ1/2))Λ1/2Α(χ). Следовательно, VxQ = 2Vx(A7>))AA(x), (2.1*) что и является требуемым результатом. 2. Если А(х) = Вх, · то, используя (2.7*) в решении задачи 2.4.27, получим Vx(A7,(x)) = Vx(x7,Br) = B7\ (2.2*) Используя (2.2*) в (2.1*), получим требуемый результат: VxQ = 2BrABx. (2.3*) 3. Требуемый результат следует из (2.3*) при В = I. Таким образом, Vx(x7,Ax) = 2Ax. Решение задачи 2.5.1 I. Для построения критерия идеального наблюдателя сначала найдем критерий максимального правдоподобия в предположении, что все параметры известны. Подстановкой данных плотностей в (2.13) и логарифмированием получим 1ηΛ(#) = 1η — Н-— \—Г — —г ^Ιηη. 190
Введя γ Δ UL > 1, оптимальный критерий можно записать в виде — σ0 Я, 2σι2 Нг R*& 2 Γ(1ηη + 1ηγ) Δ_β2 или | Л | ^ β. Н0 \У А) . # о Поскольку оптимальный критерий явно не зависит от ог. равномерно наиболее мощный критерий существует. Заметим, что требовалось условие, чтобы σχ > σ0. Без этого условия нам был бы неизвестен знак коэффициента R2 и нельзя было бы определить, какая область соответствует гипотезе Hv To обстоятельство, что σχ2 содержится в β2, не является существенным, так как для получения требуемой РрМЫ варьируем величиной β непосредственно. 'β β Соответствующие плотности показаны на рисунке. оо p-2iwexp(-5-)^=2erfc*(i)· β Если потребовать, чтобы PF = α, то P = a0erfc71(j). (* 1 ' /?2 \ -»·*.('■£·).—".[2-«^'(τ)]· с1 (τ)-'·' При α=^10~2 erfc" ,58 PD=2erfCjjc (•■-ΐ) 2. Как было показано выше, равномерно наиболее мощный критерий существует. 3. Ответ по п. 2 положителен, так что данный результат не требуется. Решение задачи 2.6.1 1. Из задачи 2.3.2 известно, что необходимо выбрать гипотезу Я/, которая минимизирует м м Pf=S<W0lR)-2<Vn*f(RI"*) .·— 1 .· 1 * /=» i=i ρ (Hj) i=l Μ. 191
Поскольку pr(R) является общей для всех членов, эквивалентный критерий заключается в вычислении м м 2 С„ ,,, я, (* I«,) I· [«,]-*, 2 С» (гд)ВД|«,,.„ Х XexpJ-^R^-m^Q^R-m.)!, i = l Μ, и выборе наименьшего. 2. Согласно п. 2 задачи 2.3.2 можно вычислить V4V*l^=(2^i|I/2x Xexp^-y^-m^Q^R-m.)) , i=l, 2, ...,Μ, и выбрать наибольшую. Беря логарифм и исключая общие члены, получим следующий алгоритм: вычислить li^nPi-\Xa\Ki\-\(^T-m')%^-mi) и выбрать наибольшее. Решение задачи 2.6.2 Правило решения сводится к следующему: найти гипотезу Ни которая минимизирует или, что эквивалентно, /,-lR—mf|». I. Минимальная размерность пространства решений никогда не превосходит Μ — I. Для отыскания минимальной размерности введем новое начало координат: 1 М moA-Ar2imr \ \ Н1 к / 4 / «#>< но С ^ =^ mf\*, \ \ \ "у \ «2 к Н7 от ^ I / / / / / т% т1 *ι 192
Вектор-средние в этой системе суть m ' Δ m.—Όΐ0· Минимальная размерность пространства решений равна числу линейно независимых mi'. Пример: при Μ = 2, тх =» (0, т), т2 =- (т, 0). Имеется только один линейно независимый nij'. Пример: при Μ = 3, /^ = (0, т), т2 =■ (0, — т), т3 =■ (т, 0). Теперь пространство решений является двумерным. 2. Согласно правилу решения выбираем гипотезу #г·, для которой £[г/#/] = тг· лежит наиболее близко к принятому вектору. Решение задачи 2.6.4 1. Характеристическая функция имеет вид оо — оо Г V / оо = |(1-2/сВГ1|,/2 f *_ |(Ι-2/4>Β)-'|-1/2Χ J V(2n)N — оо К(2я/ / [Хг(1-2/Ч»В) X] \ J xexpl- *—-^—ί I dX. Интеграл равен единице, поэтому Ма (/ί») = |(Ι—2/уВ)-'|1/2=|1—2/ί-ΒΓ1^2. (2.1*) Введем Теперь А = [1— 2/оВ]. N \Л\= Π λ,!., (2.2*) 1-1 ι где λ., — t-e собственное значение Л. Собственные значения (/ — 2jvB) явля- ются решениями уравнения | λ^. — I + 2/t>B| = 2p 2/у = 0. Поскольку %Bt—решения уравнения IB—λβφΐ|=0, получаем 1-λ, λβ= 2L ν£* э* 2р или λ. =1—2/ϋλο . (2.3*) i i Поэтому, используя (2.3*) в (2.2*), а результат — в (2.1*), получим Ν Ν \, {jv)= Π λΑ.= Π (1-2ΜΒ.)-ΐ/2. 193
2. Μ, (jv) = (l^2jv%rN^. Это характеристическая функция распределения хи-квадрат степени N [см. (2.406)]. 3. Пусть Тогда Ν/2 Ν/2 ί мяъ т=Π(1" 2ίυλί)~ι=Π /=1 г=1 1 2λ* 1 2λί ■Ρ Далее, οο NJ2 Χ Ν/2 π- • 2λΛ ^ίί 2Xft 2λ£ ΛΑ W/2 λ2 -2- — 2 ί = 1 *-<2/2λ2· W/2 π λι- В гл. 4 будет показано, что эта плотность появляется при рассмотрении передачи сигналов по релеевским каналам с неравными энергиями. Заметим, что некоторые из λΒ могут быть отрицательными, так как В мо- жет соответствовать AQ в (2.389). Решение задачи 2.6.7 Это общая гауссова задача: mi = x, m0 = y, Δηι = χ—у· Произведем преобразование координат так, чтобы пг и щ стали некоррелированными. Для этого найдем собственные значения ковариационной матрицы п: (λ-σ2)2-ρ2σ4 = 0; λ1§*=σ*(1 ± ρ). Найдем собственные векторы: (λχ I — Κ) Φι = 0; Фц—Φι а = 0; *^Фц + Φ12 = 0, После нормировки Φ,=- 1 Π Аналогично, Модальная матрица тогда примет вид φ·-ττ[-ί]· ет вид п=М Л· «г--,-н· 194
После преобразования г y,=My= ' r*+*i. Дт^К-^1. 2 1. l(R')=2 i = l λ, σ»(1+Ρ) + σ*(1-Ρ) 2. d2 -2 (A"V)2 (*i'-yi')a A (V-giT ί = 1 λί σ2(1+Ρ) σ^Ι-Ρ) Чтобы максимизировать d2, выберем | at | = \у\=~[/Е, χ = —у, причем χ—в на· правлении минимального шума Рассмотрим частные случаи: ρ > 0. Выберем х2' = у2' = 0 и х±'= — у\ =ΥΕ, тогда 4£ 1 Г ΥΈ~] у=—χ. ρ < 0. Выберем χ2' = ι/2' = 0 и хх' = —yx' =VEf тогда σ2(1^Ρ) T^2 L^gJ y=—x. ρ = 0. d2 имеет одинаковое значение для всех противоположных сигналов. 3. 4£ d2 = · 1-IPl 4. Интуитивно кривая представляется правильной. Рассмотрим случай ρ = 0. Это предполагает, что ях и п2 статистически независимы. Вследствие этого помеха имеет одинаковую энергию по всем направлениям сигналов и качество критерия должно быть минимальным. kri β-О ♦Ι ρ Помеха с кругоВои, симметрией Помеха с \j кругоВои, щщ) MM&mntjpif^y Помеха с .кругобой ) симметрией 195
Шаграф шума уГодоераф шума Теперь рассмотрим случай |р| = 1. Величины пх и п2 статистически независимы и | пх | = | п2 |. Надлежащим выбором величин χ и у можно сделать помеху ортогональной к сигналу, поэтому качество критерия должно быть максимальным: d2 = оо. Решение задачи 2.6.8 1. Можно найти необходимое условие существования атар, используя выражение (2.241): VAllnPa|r(Al R)]|A«a ^ = °· "imp Плотности вероятности имеют вид ""•(1"А)°(2,)"/'|к„11""''(-Т(',Г-лГ)0'",-А)) Поэтому Va (In Ра ι г (А I Ю) = VA pn Pr, a (R I A) + In pa (A)] = = -}vA[ln|K„| + (Rr-Ar)Q„(R-A) + ln|KJ + A3-QaA] = = -7VA[-2ArQnR + Ar(Qn + QJA]. Используя результаты задач 2.4.27 и 2.4.28, получим VA1nPa|r(A|R)=-(Q„ + Qa)A + Qn«. Приравняв (2.1*) нулю, имеем (Qn + Qa)amap=QnR или amap = (On + Qar1QnR, или amaP=(KnQa + ir1R. 2. Оценка будет эффективной, если Va (1п Ра | г (а I ^)) =с I а (R)—А ]. 196 (2.1*) (2.2·)
Это аналог (2.261) для случайной величины. Используя (2.2*) в (2.1*), получим VA(lnpa|r(A|R))=-(Qn + Qa)A + + Qn (КЛ Qa + I) «map = (Qa + Qn) ( атар — А). Следовательно, оценка является эффективной. 3. Поскольку оценка по максимуму апостериорной вероятности является эффективной, нам известно, что Λ,-Jf1, где M-£[VA({VA[lnpa|r(A |R)]}T)]. Это выражение аналогично (2.260) для случайной величины: Va [{Va [in Ρ, ι , (R I Α)]}Γ] = —γ νΑ [{νa [(Rr- -ΑΓ) Q„ (R-A)] Y\ = -\ VA[[2Qn A-2Qn R]r] = = —VA(ArQn)=—Qn, Va [{Va [In Pa W]}T] = —\ Va [{Va'[A^ Qa A]}7] = -Va [(Q0 Α)η = _Qa, JT = JD + Jp=-E[-Qa]-E[-Qn] = Qa + Qn, Ae = [Qa + Qn]-1 ИЛИ Λε = Κη[Κ0 + ΚηΓ1Κ(1. Решение задачи 2.6.9. ■ 1. Используя промежуточный результат задачи 2.6.8, имеем amap=ams =(Qo + Qn)_1Qn R· Но (Qa+Qnr1Qrt = [K»(Q0+Qn)r1 = [(K„+Ko)Qor1 = Ka(Kn+K0)-1. Поэтому amap = Ka(Kn + K„)-IR. Если Κ„ = σ„4, то К0 и (Κη + Κα)-1 можно менять местами и «mao=(^2I+Kar,KaR. "тар" 2. L 1 1 ίΙ^Μ + ΚβΓ^βΚ =— R' ams (формулы 2.397, 2.398) ч—*1 ΐ [·£-1μ,Ί*Μ"'«. ~<gH №} VZ 197
3. As=£(aea/) = £{[Ka(K0+Knr1R-a][Ka(Ka+Knr1R-a]7,} = = Κα(Κ0+ΚΛΓ1 (Κα+,Κη)(Κα+ΚηΓ1ΙΚα + Κα-2Κα(Κα + ΚηΓ^Κα = = [Ι~Κα(Κα + ΚΛΓ1]Κα = [(Κα + Κη)-Κα](Κα + ΚηΓ1Κα= = Κη(Κα + Κη) Κα· ОкончательнО| ξΙ = £[ΕεΓαε] = ΓΓ[Κη(Κα + ΚηΓ1Κα]. Решение задачи 2.6.10 1. Согласно (2.369) WA Φ/ ΦΝΤ ΓΦιΊ wwr= : [φ,.,.φ^] Φι Φι Φ2ΓΦι = 1. 2. x = Wa; η'AWn; Ε [χχΓ] = Ε [WAA7 W] = WKW7 = £[n,n'7,]=£[WnnrW7,l = ση2\νΐ\νΓ=σΛ4, все компоненты сиг независимо. 01ηρ,ί|Γ|(Χ,|/?,') VW 3. Так как все компоненты сигнала и помехи независимы, величины л можно оценивать независимо. xi=xi dXi 2ση2 dXt &-«гт^'-й')в* *"j 2λί &*г = 0; χί=^ λι 2ση* * ^ - - ' λ| + ση2 *Γ. 4. Из изложенного на стр. 94—95 можно записать: w *ϊ*4» нй>-^ н^т w .-/ map 198
5. Ε [&1 a8] =Ε [χΓ(W-»)r W-1 χε] =£[xj {νηψ (Wr W) W-l Xe] = ση2λί £Κ'.]=:·.·|γ^τ, ί=ι (2.1*) что и требовалось доказать. Задачи такого типа будут встречаться часто. Результат (2.1*) весьма важен. Решение задачи 2.7.1 Для отыскания μ(ί) подставим данные плотности в (2.449): μ(β) = 1η J ··· J ПТ7= ехр ~ L 2 μ!» Joo Li=i УгТГс! V 2θ!2 /J [£_^_expf_i*iZ^o)M |. "ι VSur, V 2σ0* j X dR1...dRN-- (Rt—mtps Xexp = ,n_l-1 Zv^oi-'^l—^ )dR1...dRN=N In [ . * , (- (fl;-m0)2(l-s) (/^2_2т1^ + т12) s_ (R2 — 2m0 fl + m02) (1—s) 2ах2 2σ02 = ΛΠη. ) dfl V*hh 1 (1-β))σ1«σ·- X 2σ„* Χ f 2(-20S1»+ 2σ0*(1 S)) / [Я-т]»\ где mx s m0 mA 2σ!2 2σ0 2 (1-s) — s ; σ2Δ 2σχ2 ' 2σ02 <1-» ~2(ί^+^(1·-5>)' ΛΔ -№+^7(1's)J 199
или s(l-s) ,_ 4σ0^σ^ (mi— m0) 2σχ2 2σ0! Интеграл равен единице, так что ел μ(5) = ΛΜη (1-s) 2σ0! или Κ^+^μ|·.'·Γ ^>-™-т'"К^+^)«'-"]· Решение задачи 2.7.2 1. Рассмотрим решение задачи 2.7.1 для случая, когда Используя эти значения в формуле, полученной в задаче 2. 7. 1, имеем / mi*s(l-s) \ μ(5)=^1„ eXPA_jto,-a.« + 0»·.-/ Г _^((1--£)£_ 1 / S l-g\ L 4оя»в.» + сп» 2.'Ч 2(σβ»+σ„») + 2o* J' ιση— —1π2 , m^ps— 1) - -|-lnan2 + as2_(l_S)ln« А«-"[т5 + »σβ»+ση· -r2(0n2 + (Js2(1_s)) 2 -|ln(an2 + os2) + ln>nl. Таким образом, μ L 4σ„»(σ,» + ση») ^ 2(ση* + σ,»(1-β)) T Unf + o.»/J Дифференцируя еще раз, получим μ }~ L 4σΛ2(σδ2 + Gn2) + 2(an2+as2(1_s))2J· 2. Для отыскания границы вероятности ошибки можно нспол вать (2.473): Ρ(ε)<— exp^(sm)], где sm определяется из условия 200
Величину sm можно определить путем решения уравнения nix2 as2 ( <5п \ 4Ъп2(о8* + ап2) (2β~1)+2(σΛ« + σβ·(1-5)) + Ь (ση* + σ$* ) = °' Произведя перегруппировку, имеем (2s—1) (on2 + os2 (1_s)) + 2±. + (σηι + σ#« (i-S))X что сводится к 1 2 , [ОпЧ^ + Оп2) ~т s + s Xln(^—)=0, ^(σ^ + ση2), / ση ^ 11 + (σ,2 + σδ2)(^-^-^(σΛ2 + σδ2)1π(-1^))=0. \os2 2m12 m^s2 \on2+o82JJ Это квадратное уравнение, решением которого и является sm. 3. При больших N можно ^использовать (2.485) при значениях величин μ($τη)> Ksm) и H-(Sm) определенных выше. Л итература 1. ДавенпортВ. Б., Рут В. Л. Введение в теорию случайных сигналов и шумов. Пер. с англ., под ред. Р. Л. Добрушина. Изд-во иностранной литературы, I960. 2. Баруча-Рид А. Т. Элементы теории марковских процессов и их приложения. Пер. с англ., под ред. А. Н. Ширяева. Изд-во «Наука», 1969. 3. A b г a m о ν i t ζ Μ., S t e g u η I. A. (ed.). Handbook of Mathematicaf Functions. National Bureau of Standards, U. S. Goverment Printing Office, Washington, D. C, June 1964. 4. Greenwood J. Α., Η a r t 1 e у Η. Ο. Guides to Tables in Mathemati cal Statistics. Princeton University Press, Princeton, New Jersey, 1962. 5. F i s h e r R. A. Theory of Statistical Estimation. Proc. Cambridge Phil. Soc, 1925, v. 22, p. 700. 6. F i s h e г R. A. On the Mathematical Foundations of Theoretical Statistics. Phil. Trans. Roy. Soc, 1922, v. 222, p. 309. 7. F i s h e r R. A. Two New Properties of Mathematical Likelihood. Proc. Roy. Soc, 1934, v. 144, p. 285. 8. F i s h e r R. A. The Logic of Inductive Inference. J. Roy Statist. Soc.,. 1935, v. 98, p. 39. 9. Κ ρ a μ e ρ Г. Математические методы статистики. Пер. с англ., под ред. А. Н. Колмогорова. Изд-во иностранной литературы, 1948. 10. У и л кс С. Математическая статистика. Пер. с англ., под ред. Ю. В. Лин- ника. Изд-во «Наука», 1967. 11. Kendall Μ. G., Stuart A. The Advansed Theory of Statistics, v. 2, Inference and Relationship. Hafner, New York, 1961. 12. Rao С R. Information and Accuracy Attainable in the Estimation of Statistical Parameters. Bull. Calcutta Math. Soc, 1945, v. 37, p. 81—91. 13. В h a t t а с h a r у у a A. On Some Analogues of the Amount of Information and their Use in Statistical Estimation. Sankhya, v. 8, p. 1, 201, 315 (1946,, 1947, 1948). 14. Van Trees H. L. A Generalized Bhattacharyya Bound. Internal Memo.„ Detection & Estimation Theory Group, MIT, 1966. 201
15. В а г а η к Γη Ε. W. Locally Best Unbiased Estimates. Ann. Math. Stat., 1949, v. 20, p. 477. 16. Б е л л м а н, Р. Введение в теорию матриц. Пер. с англ , под ред. В. Б. Лидского. Изд-во «Наука», 1969. 17. Леман Э. Проверка статистических гипотез. Пер. с англ., под ред. Ю. В. Прохорова. Изд-во «Наука», 1964. 18. Η i l d e b гГа η d F. В. Methods of Applied Mathematics. Prentice-Hall, Englewood Cliffs, New Jersey, 1952. 19. Fisher R., Yates F. Statistical Tables for Biological, Agricultural, and Medical Research. Oliver & Boyd, Edinburgh, 1953. 20. Sherman S. Non-mean-square Error Criteria. Trans. IRE, 1958, v. IT-4, № 3, p. 125, 126. " .21. Ρ e a r s ο η Κ· Tables of the Incomplete Γ-Function. Cambridge University Press, Cambridge, 1934. 22. Ρ i e г с e J. N. Theoretical Diversity Improvement in Frequency-Shift Keying. Proc. IRE, 1958, v. 46, May, pp. 903—910. 23. Shannon С. Е. Seminar Notes for Seminar in Information Theory. MIT, 1956 (unpublished). 24. Φ a H о Р. Передача информации. Статистическая теория связи. Пер. с англ., под ред. Р. Л. Добрушина. Изд-во «Мир», 1965. 25. S h а η η ο η С. Ε., G a 1 1 a g е ι R. G., Berlekamp E. R. Lower Bounds to Error Probability for Coding on Discrete Memoryless Channels. Information and Control, 1967, v. 10, № 1, p. 65—103. 26. Gal lager R. G. Lower Bounds on the Tails of Probability Distributions. MIT, RLE, QPR 77, April 1965, p. 277—291. 27. J а с о b s I. M. Probability-of-Error Bounds for Binary Transmission on the Slow Fading Rician Channel. Trans. IEEE, 1966, v. IT-12, № 4 (Oct.). 28. С h e г η о f f Η. A Measure of Asymptotic Efficiency for Tests of a Hypothesi based on the Sum of Observations. Ann. Math. Stat., 1962, v. 23, p. 493—507. 29. В h a t t а с h a r у у a A. On a Measure of Divergence Between Two Statistical Populations defined by their Probability Distributions. Bull. Calcutta Math. Soc, 1943, v. 35, № 3, p, 99—110. 30. Φ e л л е р В. Введение в теорию вероятностей и ее приложения, т. I. Пер. с англ., под ред. Е. Б. Дынкина. Изд-во «Мир», 1964. 31. Dugue D. Application des Proprietes de la Limite au Sens du Calcul des Probabilities a L'etude des Diverses Questions D'estimation. Ecol. Poly., 1937, v. 3, № 4, p. 305—372. 32. S о m m e r f e 1 d A. An Introduction to the Geometry of N Dimensions. Dutton, New York, 1929. 33. Φ e л л e ρ В. Введение в теорию вероятностей и ее приложения, т. 2. Пер. с англ., под ред. Ю. В. Прохорова. Изд-во «Мир», 1967. 34. Υ u d k i η Η. L. An Error Bound for Gaussian Signals in Gaussian Noise. MIT, RLE, QPR 73, April 15, 1964. 35. G о b 1 i с k T. J. Study of An Orbiting Dipole Belt Communication System. Lincoln Laboratory, Technical Report 369, December 22, 1964. 36. В и т е р б и А. Дж. Принципы когерентной связи. Пер. с англ., под ред. Б. Р. Левина. Изд-во «Советское радио», 1970. 37. Ρ е a*r s о η К. On the Systematic Fitting of Curves to Observations and Measurements. Biometrika, 1902, v. I, p. 265. 38. К a 1 m a n R. E. A New Approach to Linear Filtering and Prediction Problems. J. Basic Eng. (Trans. ASME), I960, v. 82D, p. 35—45. Дополнительная литература 39* Дуни н-Б арковский Η. В., Смирнов Н. В. Теория вероятностей и математическая статистика в технике. Гостехиздат, 1955. 40*. В а н-д е р-В а р д е н Б. Л. Математическая статистика. Пер. с нем. Изд-во иностранной литературы, I960. 41*. Большое Л. Н., Смирнов Н. В. Таблицы математической статистики. Вычислительный центр АН СССР, 1968. 42*. Пагурова В. И. Таблицы неполной гамма-функции. Вычислительный центр АН СССР, 1963.
3. Представления случайных процессов ЗЛ„ Введение В этой главе мы кратко рассмотрим некоторые методы описания (задания) случайных процессов, необходимые для изложения последующего материала книги. Следует особо выделить так называемый прямой метод. Существует много других способов задания колебаний и случайных процессов, однако какой из них является наилучшим, — сильно зависит от конкретной задачи, которую необходимо решать. Рациональное задание зачас- t„ тую делает решение почти J тривиальным. Г 1 Несколько .методов опи- г\ 1 ι 1 сания сигналов сразу же при- I I ходит в голову. Это прежде | I I 1 всего задание во временной I | 1 J * 1 1 области. Типичный сигнал, образованный импульсами Рис. 3.1. Типичная форма сигнала, различной длительности, изображен на рис. 3.1. Задание сигнала во времени часто характеризует его форму. Хорошо ли такое представление? Чтобы ответить на этот вопрос, нужно указать, что мы собираемся делать с сигналом. На рис. 3.2 иллюстрируются два возможных случая. В первом случае сигнал про- *(t) y У; 1_ ΪΤ ί-1 »· 0,5 X nit) т _*<t) 1 А"0 ω)\ -2xw 2жн ω —— 1 f тц > α) δ) Рис. 3.2. Операции, осуществляемые над сигналами: я —в ограничителе; б —в идеальном фильтре нижних частот. пускается через ограничитель и необходимо определить выходное напряжение. Задание во времени позволяет нам найти выходной сигнал путем наблюдения. Во втором случае мы пропускаем сигнал через идеальный фильтр нижних частот и хотим вычислить мощность сигнала на его выходе. В этом случае временной подход затруднителен; 203
Однако если воспользоваться преобразованием Фурье сигнала s (t) оо S(/a>)= ξ s(t)e-i^dt, (1) —оо то задача становится прямой. Мощность, заключенная в колебании у (/), равна 2nW ЕУ = 2 J lS^)l2S· (2) Итак, как хорошо известно, временное и частотное описание сигналов и помех играют важную роль в анализе систем. Приведенный пример подчеркивает то обстоятельство, что выбор наиболее целесообразного описания зависит от интересующей нас задачи. -С ^ n{t)-n^ai(t)*ns0a (t) -В m Приемник я) H,:$,(t) =0 ■Rzr*. (t) 6) tbJt) 'ί^',^Ι^Λίί) Ф^\ ПриемниГ] vv<> ^ ^nj" ф°- r« Приемник в) Vhc. 3.3. Три гипотетические системы связи с активной паузой и различными формами сигналов и аддитивной помехи. Для обоснования другого метода задания сигналов рассмотрим простейшие системы связи, изображенные на рис. 3.3. Когда справедлива гипотеза 1, передается детерминированный сигнал st (t)^ когда верна гипотеза 0, передается сигнал s2 (t). Конкретные формы переда-* 204
ваемых сигналов в системах а, б, в различны. Помехи в каждой идеализированной системе конструируются путем умножения двух детерминированных колебаний на независимые нормальные случайные величины, имеющие нулевые средние, и сложения результирующих колебаний. Мешающие колебания в каждой системе будут иметь различную форму. Приемник должен решить, какая из гипотез является истинной. Мы видим, что передаваемые сигналы и аддитивные помехи в системах я, б, в существенно отличаются по форме. Однако во всех случаях их можно записать в виде β1(ί)=5ιΦι(ί), 0<f<7\ s2(t)=s202(t), 0<f<7\ (3) η (t) =. ηλ Фх (t) + п2 Ф2 (t), 0 < t < 7\ где Φι (0 и Ф2(0—ортонормированные (ортонормальные) функции, т. е. τ $Ф,(0Фу(0Л=в|У, ί, /=1, 2. (4) о Функции Φι (0 и Ф2(0 для трех указанных систем будут различны. Очевидно, что поскольку r(t)=(s1+nl)01(t)+n2O2(t)9 0^^Т:Н19 (5) r(t)=n101(t)+(s2+n2)02(t)1 0<ί<7\#0, - то следует основывать наше решение на наблюдаемых значениях коэффициентов этих двух функций. Следовательно, алгоритм испытания можно записать как Но это задача классической теории обнаружения, с которой мы уже встречались в гл. 2. Следует обратить внимание на одно важное обстоятельство: любая пара ортонормированных функций обеспечивает одинаковую достоверность обнаружения. Поэтому.как временному, так и частотному заданию свойственно выделять существенные особенности конкретной задачи. Мы называем этот третий метод задания сигналов и помех как представление ортогональными рядами. Этот метод задания детерминированных сигналов и случайных процессов излагается в настоящей главе. 205
3.2. Детерминированные функции, ортогональные представления Рассмотрим функцию χ (ί), которая определена на интервале [О, Т], как показано на рис. 3.4. Предполагается, что энергия этой функции имеет некоторое конечное значение г Ex = \x*(t)dt<oo. (7) x(t)k Далее предполагается некоторый способ задания функции χ (ή. Для любого t мы знаем значение функции χ (f). Однако можно потребовать задания функции χ (f) посредством счетного множества чисел. Простой пример из предыдущего параграфа предполагает написание Рис. 3.4. Ограниченная во времени функция. (8)х> где Фг (t) — некоторый ряд (множество) ортонормированных функций· Например, можно выбрать ряд синусоид и косинусоид ,1/2 *(0-(f)' *,(i>-(f)"!cos(ff), φ.(ή-(|)""*(*ι. 0<*<7\ (9) ф«»(0 = ( 1/2 /2π Λ COS I — tlt\ \ В связи с этим возникает ряд математических и практических вопросов. К числу математических вопросов относятся следующие. 1. Поскольку практически можно использовать только конечное число (N) коэффициентов, то как следует выбирать коэффициенты, чтобы минимизировать среднеквадратическую ошибку приближения (или представления)? Х) На протяжении большей части нашего изложения мы имеем дело с разложением в ряд действительных колебаний, используя действительные ортогональные функции и действительные коэффициенты. Модификации, включающие комплексные ортонормированные функции и коэффициенты, могут быть получены простым и непосредственным методом. 206
2. Нам хотелось бы, чтобы по мере увеличения N среднеквадра- тическая ошибка приближения^бращалась в нуль. Когда это имеет место? Вопрос практического порядка заключается в следующем. Если колебание χ (t) принимается в виде напряжения, то каким образом можно генерировать коэффициенты экспериментально? Рассмотрим сначала математические вопросы. Ошибка представления при использовании N членов равна ы eN(t)=x(t)- Σ *i®i(t). (Ю) Энергия ошибки составляет Ее(Ν) Δ \е^(t)dt = \ \x(t) -2 *,Φι (θ!* dt. (11) о о L *=»i J Требуется минимизировать эту энергию для любого N путем соответ - ствующего выбора xt. Дифференцируя по некоторому конкретному xjt приравнивая результат нулю и решая относительно xj, получим г Xj = \x(f)<b!(t)dt. (12) о Так как вторая производная яляется положительной постоянной величиной, то */, определяемое (12), обеспечивает абсолютный минимум. Выбор коэффициентов при увеличении N не меняется ввиду орто- нормальности рассматриваемых функций. Рассмотрим теперь энергию, содержащуюся в ошибке представления при N -+- оо. ΕΛΝ)±№(*)**>1 \x(t)- Σ *,Φ,(ί) Λ = ο ο L /— ι J Ν Τ =ΕΧ-2Σ \χ{ί)χιΦι{ί)άΙ + /=ι ο Τ Ν Ν Ν + ΙΣ Σ*ι**φ,(0Φ/(0Λ=£*- 2 *Λ (ι») ο /= ι /= ι /=ι Так как xt*— величина не отрицательная, ошибка является монотонно убывающей функцией N. Если UmEe(N)=0 (14) N-+•00 для всех χ (ή с конечной энергией, то говорят, что Ф; (Q, f = 1, ..., — полный ортонормальный ряд на интервале [0, Т\ для класса функций с конечной энергией. Смысл полноты ряда очевиден. При использовании большего числа коэффициентов ошибка представления 207
убывает. Вообще говоря, желательно иметь возможность уменьшать энергию ошибки до сколь угодно малрйгвеличины, задаваясь достаточно большим N. Заметим, что для полных ортонормальных рядов ΕΧ=Σ *,f. (15) Уравнение (15) есть просто запись теоремы Парсеваля. Отметим также, что xt2 представляет энергию конкретной компоненты сигнала. Два возможных способа построения системы коэффициентов Показаны на рис. 3.5. В первой системе χ (t) умножается на Фь (t) и интег- Рис. 3.5. Генерация коэффициентов разложения: а—корреляционная операция; б —фильтровая операция. рируется на промежутке [О, Т]. Эта операция носит название корреляционной. Во второй системе мы пропускаем χ (t) через набор линейных фильтров с импульсными характеристиками ht (τ) = Φί (Τ — τ) и наблюдаем выходные напряжения в момент времени Т. Нетрудно видеть, что отсчет напряжения на выходе *-го фильтра равен г $*(т)А,(Г —τ)άτ. о Для конкретной используемой импульсной характеристики эту величину можно записать в виде т *ι = $*(τ)Φ|(τ)Λ, ί=1, 2, ..., Ν. (16) о В гл. 2 было показано, что удобно рассматривать результаты N наблюдений как точку в АЛмерном пространстве. Позднее мы убедимся, что столь же полезно считать, что N указанных коэффициентов определяют собой точку в пространстве. Для произвольных сигналов может потребоваться пространство с бесконечным числом измерений. 208
Таким образом, сигнал, имеющий конечную энергию, может быть представлен как вектор. На рис. 3.6 изображены два сигнала — Si (t) и s2 (ή: 3 3 Si (0 = Σ «и Φ| (0, *2 (0 = 2 S2i Φ, (f). Соответствующие сигнальные векторы записываются в виде SiA ^11 S12 LS13. = Σ διιΦιι /=1 Рис. З.6. Представление сигнала в виде вектора. S21 522 LS23. = Σ % φ/. ί= 1 9,~s,(t) Ъ~ФГ(*) %~<P2(t) (17a) (176) Из изложенного непосредственно следует несколько выводов. 1. Квадрат длины (модуля) сигнального вектора равен энергии сигнала |si|2 = £x, |s2|2=£2. (18) 2. Коэффициент корреляции между двумя сигналами определяется как j S! (Ζ) S2 (0 at Pl2^ VEXE% (19) Подставляя (17а) в (19), имеем Ри Σ *u*i(o г=1 Σ *«W) <*/ (20) Vexe% С учетом ортонормальности координатных функций интеграл (20) равен з Σ susu Pl2 = /=1 Ve±e2 209 (21)
Числитель (21) представляет собой скалярное произведение векторов Si и s2. Заменяя в знаменателе (21) £Ί и £2 их значениями из (18), получим Pl2 = Sl'S2 (22) I Si I I s21 Очевидным достоинством векторно-пространственной интерпретации сигналов является то, что она позволяет нам при работе с колебаниями использовать известные геометрические представления. Распространим теперь эти представления на случайные колебания. 3.3. Задание случайных процессов Начнем изложение этого параграфа с краткого обзора принятых способов определения и задания случайных процессов. 3«3.1. Обычные способы задания случайных процессов Понятие случайного процесса хорошо знакомо. Каждый раз, когда проводится эксперимент (опыт), итогом его является функция, определенная на интервале времени, а не какое-либо одно число. Математическая модель случайного процесса иллюстрируется рис. 3.7. К^ч/ЛЛЛ Исход первого опыта f^\p\ Исход Второго опытен ^/ψ\ Исход j-e§ опыта Рис. 3.7. Ансамбль выборочных функций. Каждая точка в выборочном пространстве Ω отображается во временную функцию. Мы могли бы записать функцию, происходящую из ωί9 как χ (tf ω^) с тем, чтобы подчеркнуть ее происхождение, однако проще обозначать ее просто как χ (ί). Набор колебаний, связанных с точками пространства Ω, называется ансамблем. Наблюдая ансамбль в любой данный момент времени, скажем ti9 будем иметь случайную 210
величину xtlAx(tu ω). Айшюгично, в другие моменты времени,, скажем tif это будут случайные величины xtr Очевидно, мы могли бы характеризовать любую заданную случайную величину xt. ее плотностью вероятности. Более трудный вопрос заключается в том, как характеризовать весь процесс. Существует одно очевидное свойство, которым должен обладать метод задания (представления). Если рассматривать ряд моментов времени tu t2, ..., tn на интервале определения процесса, то им соответствуют η случайных величин xtl, xt2, ..., xtfl. Всякое полное задание должно позволять определить совместную плотность вероятности pxt , Xt %i (Xи Χ29 ..., Χη)- Кроме того, оно должно позволять определить эту плотность для любого множества η моментов времени на заданном интервале (для любого конечного п). К сожалению, то, что представление этого типа будет адекватно для ответа на все интересующие вопросы относительно случайного процесса, не является очевидным. Даже если оно оказывается адекватным, имеется практическая трудность в фактическом задании (определении) указанных плотностей для произвольного случайного процесса. Существует два общепринятых способа преодоления этой трудности в определении плотности л-го порядка. Структурные процессы. Рассмотрим только те процессы, в которых любая плотность η-го порядка имеет определенную структуру, которая может быть воспроизведена (получена) путем использования плотности низшего порядка и известного алгоритма. Пример. Рассмотрим плотность вероятности для упорядоченного множества моментов времени h<h< *з<... < tn-\ <*η· Если то процесс называется марковским. В этом случае знание плотности второго по· рядка позволяет конструировать плотность п-го порядка (см., например, [2] или задачи 3.3.9 и 3.3.10). Другие структурные процессы будут рассмотрены далее по ходу изложения. Частичное задание. Рассмотрим теперь операции над случайным процессом, которые могут быть изучены без фактически полного задания процесса. Для таких операций нам необходимо только частичное задание процесса. Возможно большое число частичных заданий. Укажем два наиболее распространенных: 1. Представление только в один момент времени. 2. Представление вторыми моментами. При задании в один момент времени определяется только pxt (X) — плотность вероятности первого порядка в момент времени t. Вообще говоря, она будет функцией времени. Полезность такого представления иллюстрируется простейшим примером. 211
Пример, Пусть r[(t) = x(t)+n(t). (24) Предположим, что xt и tit — статистически независимы , а pXt(X) и рП/(N) — известны Процесс r(t) обрабатывается безынерционным нелинейным устройством с целью получения по критерию минимальной среднеквадратической ошибки оценки процесса x(t), которую обозначим через x(t). Согласно главе 2 x(t) есть просто условное среднее. Так как устройство обработки безынерционное, то можно использовать только r{t). Тогда χ (0 = ] Xt РЧч (Х£\ Rt) dXt δ / {Rt). (25) —οο Если xt — нормальная случайная величина с распределением W(0, σχ) и tit — нормальная величина с распределением N(0, ση), то несложно показать (ср. задачу 3.3.2), что п«1);-£+&«*· (26) так что безынерционное устройство обработки оказывается линейным. Отметим, что поскольку мы были ограничены только безынерционным устройством, полное задание процесса является необязательным. При задании процесса его вторыми моментами мы задаем только первые и вторые моменты процесса. Функция среднего значения процесса определяется формулой оо "**(*)££(*,)= $ XtPxt{Xt)dXt. (27) —оо Вообще говоря, это есть функция времени. Корреляционная функция определяется выражением Rx(t,u)bE(xtxu) = оо = ^XtXapx%2(Xt, Xu)dXtdXa. (28) —оо Ковариационная функция определяется как] Kx(t, u)bE{[Xt-mx(t)][xu-mx(u)]} = = Rx(t,u)-mx\(t)mx(u). (29) Частичное задание процесса хорошо подходит к линейным операциям над случайными процессами- Этот тип приложения хорошо известен (см., например, [1]). Ковариационная функция обладает несколькими полезными для нас свойствами. Как явствует из определения (29), она симметрична Kx(t,u)=Kx(u,t). (30) 212
Если умножить выборочную функцию χ (ή на некоторую детерминированную функцию / (0, интегрируемую в квадрате, и проинтегрировать на интервале [О, 7Ί, то получим случайную величину τ */Δ§ x(t)f(t)dt. (31) о Среднее этой случайной величины равно τ τ Ε (xf) = xr± E\x{t)f (t) dt = \mx (t) f (t) dt, (32) о о а дисперсия o*(xt)&E[(xf-If)2] = {Τ Τ \ 5 [x {t)-mx (t)] f (t) dt $ [x (a) -mx (u)] f (u) du . (33) Введя математическое ожидание под знак интеграла, получим τ σ2 (xf) = ξ ξ f (t) Kx (t, u) f (u) dt du. (34) о Дисперсия должна быть больше или равна нулю. Таким образом, мы показали, что τ S S f (О К* (*. ") f (и) dtdu^O (35) о для любой'/ (ή с конечной энергией. Это свойство называется неотри-, цательной определенностью. Если неравенство (35) выполняется строго для всех / (t) с ненулевой конечной энергией, то говорят, что Kx(t, и) положительно определенная. Свойства (30) и (35) понадобятся нам в следующем параграфе. Если процесс определен на бесконечном интервале и его ковариационная функция зависит только от 11—и\> а не от t или и порознь, то говорят, что процесс ковариационно-стационарен и записывают Kx(t,u) = Kx(t-u)=Kx(r). ~(Щ1} Аналогично, если корреляционная функция зависит только от 11 — и\> то говорят, что процесс корреляционно-стационарен, и записывают Rx(t,u) = Rx(t-u) = Rx(x). (37) *> Следует заметить, что хотя Кх {t, и) является функцией двух переменных, а Кх (τ),— только одной переменной, для обеих используются одинаковые обозначения. Это дает экономию обозначений и не ведет к путанице. 2)3
Для стационарных процессов задание, использующее спектр плотности мощности (энергетический спектр) Sx(q>)y эквивалентно заданию корреляционной функции оо 5Λ(ω)Δ $ Rx(x)e-*"d* *.W= J 5,(ω)β^^. (38) Как уже указывалось, частичные виды задания полезны только тогда, когда операции, выполняемые над случайными процессами, имеют вполне определенную форму. Гораздо более пол езным представлением для интересующих нас задач является представление в виде ортогональных рядов. В следующем параграфе мы используем разложение в ряд для развития представления случайного процесса моментами второго порядка. В § 3.3.3 мы распространим этот метод для того, чтобы получить полное описание для конкретного интересующего нас процесса. Следует заметить, что нам еще пред сто и τ овладеть полным заданием случайного процесса. 3.3·2. Представление выборочных функций случайных процессов рядами В § 3.2 мы познакомились с методами представлен и я детерминированных колебаний, имеющих конечную энергию, в ви де рядов. Теперь распространим эти идеи на выборочные функции ел учайного процесса. Начнем с выбора произвольного полного ортонор мального ряда <Ε>! (ί), Φ2 (ί), ... Пока не будем уточнять форму ряда Φ t (t). Для разложения χ (t) в ряд запишем N x(t)=Um Ц*|Ф|(0. 0<*<7\ (39) W-OO /=1 где λ^Δ jj χ(ί)φ.(ήάί. (40) о Мы еще не задали вид сходимости, требуемой от су ммы в правой части (39). Различные виды сходимости для последовательностей случайных величин рассматриваются в [1], [29]. Обычный предельный переход в этом случае не используется, поскольку он требует наложения на процесс условий, гар антирующих, чтобы каждая выборочная функция могла быть представлена таким образом. 214
Более практичным видом сходимости является сходимость в сред- неквадратическом N x(t)= l.i.m Σ *ι*ι(0. 0<*<Т, (41) Обозначение «1. i. m.» (сокращение от англ. limit in the mean—предел в среднем) соответствует пределу, определяемому равенством limf U- Σ Xi<bt(t)) = 0, 0<f<T. (42) Предположим пока, что можно найти условия, налагаемые на процесс, которые гарантируют сходимость, оговоренную в (42). Прежде чем искать эти условия, обсудим соображения по выбору ор- тонормального ряда. При рассмотрении нами классической теории обнаружения пр остранство наблюдений имело конечное число измерений и обычно входило в наши рассуждения с собственной системой координат. В § 2.6 было установлено, что задачи часто решаются значительно проще, если перейти к новой координатной системе, в которой случайные величины были бы некоррелированными (если они имеют нормальные распределения, то они к тому же будут и статистически независимыми). В случае непрерывных колебаний имеется то преимущество, что нет заданной системы координат и, следовательно, мы можем выбрать ее так, чтобы она соответствовала условиям задачи. Учитывая сказанное, можно выбрать такой ряд Фг (ί), который дает нам некоррелированные коэффициенты. Если £(*ι)Δ/Η„ (43) то желательно иметь £ [(*!-/",) (xj-nij)] = λ, 6U. (44) Ради простоты допустим, что mi = 0 для всех i. Сделаем ряд замечаний. 1. Величина xf имеет простую физическую интерпретацию. Она соответствует энергии по координатной функции <bt (t) в данной выборочной функции. 2. Аналогично, Ε (л^2) = λ£ соответствует ожидаемой величине энергии по координате Фь (ή в предположении, что тг = 0. Очевидно, λ£ > 0 для всех i. 3. Если Кх (t> и) есть величина положительно определенная, то любое Хг больше нуля. Это вытекает непосредственно из (35). Немного позднее нетрудно будет показать, что если Кх (t, и) не положительно определенная, то по крайней мере одно λ^ должно равняться нулю. Теперь не обходимо определить, в чем состоит существо требования (44) по отношению к полному ортогональному ряду. Подставляя (40) 215
в (44) и вводя математическое ожидание под знак интеграла, получим г τ τ ί Ми = £(*,*,) = Я 1хУ)Ф&) dtlx(u)<l>j(u)du = Lo о J τ τ = j Φι (0 dt } Κχ (ty и) Φ7· (и) du, для любых i и /. (45) о о Для того чтобы (45) выполнялось для всех выборов i и заданного /, необходимо и достаточно, чтобы внутренний интеграл был равен λ/D; (О, т. е. τ Xj φj (t) = J Κχ (ty и) Ф7· (и) du, 0 < t < T. (46) о Функции ф: (t) называются собственными функциями, а числа λί — собственными значениями. Итак, мы хотим показать, что для некоторого полезного класса случайных процессов существуют решения уравнения (46) с требуемыми свойствами. Заметим, что по своей форме (46) есть вариант записи уравнения, которым задавались собственные векторы и собственные значения формулы (363) в § 2.6 λΦ-Κ,Φ, (47) где Кх была симметричной неотрицательно определенной матрицей. Это была система однородных линейных уравнений, где N было размерностью пространства наблюдения. Используя результаты теории линейных уравнений, мы установили, что существует N действительных неотрицательных значений λ, при которых (47) имеет нетривиальное решение. Теперь размерность координатного пространства бесконечная и нам необходимо решить однородное линейное интегральное уравнение. Функция Кх (ty и) называется" ядром интегрального уравнения, и, будучи ковариационной функцией, она симметрична и неотрицательно определена. Ограничимся рассмотрением процессов с конечным .среднеквадратическим значением, т. е. Ε [χ2 (01< °°· Их ковариационные функции удовлетворяют условию 1 I ' HKx*(t,u)dtdu^ \E[x*{t)\dt 2 < оо, (48) где Τ — конечное число. Условия (ограничения), сформулированные в последнем параграфе, позволяют нам использовать общеизвестные результаты теории линейных интегральных уравнений1* (см., например, Курант и Гильберт [3] гл. 3, Риц и Наги [4], Ловит [5] или Трикоми [6]). Х) Здесь мы следуем Давенпорту и Руту [I]. 216
Свойства интегральных уравнений. 1. Существует по крайней мере одна интегрируемая в квадрате функция Φ (t) и одно действительное число λφΟ> которые удовлетворяют (46). Вполне очевидно, что может и не существовать более одного решения. Например, уравнение Kx(ttu) = af*f(t)f(u)f 0<f, u^T (49) имеет только одно ненулевое собственное значение и одну нормирован* ную собственную функцию. 2. Из (46) следует, что если Ф7\(/) является решением, то и сФ7· (f) есть также решение. Поэтому мы всегда можем нормировать собственные функции. 3. Если Φi (t) и Ф2 (t) суть собственные функции, связанные с одним и тем же собственным значением λ, то с1Ф1 (f) -f- с2Ф2 (ή есть также собственная функция, связанная с λ. 4. Собственные функции, соответствующие различным собственным значениям, являются ортогональными. 5. Существует не более как счетное бесконечное множество собственных значений, и все они ограничены. 6. Для^любого заданного λ существует не более как конечное число линейно независимых собственных функций. (Укажем, что понимается под линейной независимостью; функция / (t) линейно независима от множества Фг (t)y i = 1, 2, ..., К> если ее нельзя записать как взвешенную сумму функций Φ ι (ή. ) Их всегда можно сделать ортонорми- рованными (например, методом Грама — Шмидта, см. задачу 4.2.7 в гл. 4). 7. Так как Кх (*, и) неотрицательно определена, ядро Кх (t, и) может быть разложено в ряд: оо Кх(*>")= ^^Φ,ίΟΦ,ία), 0<ί, и<7\ (50) где сходимость равномерная для O^i, u^.T. (Это свойство называется теоремой Мерсера.) 8. Если Кх (U и) положительно определена, то собственные функции образуют полный ортонормальный ряд. С учетом результатов § 3.2 это означает, что любу ю детерминированную функцию с конечной энергией можно разложить в ряд по собственным функциям. 9. Если Кх (Ч и) не является положительно определенной, то собственные функции не могут образовывать ортогональный ряд. (Это следует непосредственно из (35) и (40). ) Часто для получения полного ряда собственных функций его дополняют некоторым числом дополнительных ортогональных функций. Эти дополнительные функции называются собственными функциями с нулевыми собственными значениями. 217
10. Сумма собственных значений есть ожидаемое значение энергии процесса на интервале (0, Г), т. е. [Τ Ί Τ оо ί=1 (Напомним, что χ (t) предполагается имеющей нулевое среднее.) Перечисленные свойства гарантируют, что всегда можно найти ряд Фь (ί), обеспечивающий некоррелированные коэффициенты. Остается только подтвердить допущение, сделанное нами в (42). Обозначим ожидаемое значение ошибки, если χ (t) аппроксимируется первыми N членами, через InV)*e (51) (52) Ν \21 к(0-Д**Ф*(0) J. Вычисляя математическое ожидание, получим lN(t)=KAt>t)-2E[x(t)%iXi<bi(t)] + +ε\ς Σ*ι**Φι(<)φ*(<)1. . lN(t)=Kx(t> t)-2E\x(t) 2 ( \х(и)Фг(и)аи J Φ, (/) + 2^0,(00^), lN(t)=Kx(t>t)-2 2 ( 1КхУ,и)ФЛи)аи]Фгу) + + Ц^Ф4(<)Ф«(<). (54) + (53) /=ι Ν bv(<)=/C«(<,0-Σ^,Φ,ίΟΦ,ίί). (55) Свойство 7 гарантирует, что сумма будет сходиться равномерно к Кх (t, t) при N -*~ оо. Следовательно, (56) что и требовалось доказать. (Заметим, что из сходимости в свойстве 7 следует, что для любого ε > 0 существует такое Ν ι, независящее от t, что \м (t) < ε при всех N > Nt.) Разложение в ряд, рассмотренное в настоящем параграфе, обычно называют разложением Карунена—Лоэва (Карунен [25], Лоэв [26], [30]). Оно обеспечивает задание процесса его вторыми моментами посредством некоррелированных случайных величин. Само 218
по себе это свойство не очень существенно. В следующем параграфе будет показано, что для конкретного интересующего нас процесса — гауссова случайного процесса (т. е. процесса с нормальным распределением) коэффициенты разложения суть статистически независимые гауссовы случайные величины. Именно в этом случае данное разложение находит свое наиболее важное применение. 3.3.3. Гауссовы процессы Вернемся к вопросу о целесообразном полном определении случайного процесса. Ограничимся рассмотрением гауссовых случайных процессов. Для отыскания требуемого определения вспомним, каким образом мы определили совместно нормальные величины в § 2.6. Утверждаем, что случайные величины xiy х2> ..., xn являются совместно гауссовыми, если N У= Σ gi*i (57) /= ι есть гауссова случайная величина для любого множества gt. В § 2.6 N было конечным и требовалось, чтобыgt также было конечным. Если N — счетное бесконечное, то мы требуем, чтобы gt было таким, что Ε [у2] < оо . В случайном процессе вместо линейного преобразования над множеством случайных величин мы интересуемся линейным функционалом случайной функции. Это предполагает следующее определение. Определение. Пусть χ (t) есть случайный процесс, определенный на некотором интервале [Γα, Γβ] со средним значением mx(t) и ковариационной функцией Kx(t> и). Если каждый линейный функционал от χ (f) есть гауссова случайная величина, то χ (t) является гауссовым случайным процессом. Другими словами, если • Γβ У=§ g(u)x(u)du (58) и g (и) — какая угодно функция, удовлетворяющая условию Ε [у2] <оо, то для того, чтобы χ (и) был гауссовым случайным процессом, у должно быть гауссовой случайной величиной для каждого g (и) в указанном выше классе. Из этого определения непосредственно вытекает несколько свойств. Свойство 1. Выходная величина линейной системы есть интересующий нас заданный линейный функционал. Обозначим импульсную реакцию — выходную величину в момент времени ί, обусловленную воздействием на вход единичного импульса в момент времени и через h (ί, и). Если входная величина равна x(t) и является выборочной функцией гауссова случайного процесса, то выходная величина у (t) также является выборочной функцией гауссова случайного процесса. 219
Доказательство: Ч y(t)= \h{t,u)x{u)duy Γν<ί<ΓΔ. (59) Та Интервал [Ту> Тд] есть просто область, на которой определена функция у (t). Предполагается, что h (ί, и) такова, что Ε [у2 (t)] < оо при всех t в интервале [Tv, Гд]. Из определения следует, что у (t) есть нормальная случайная величина. Чтобы показать, что у (ί) есть нормальный случайный процесс, мы должны доказать, что любой его линейный функционал есть нормальная случайная величина. Таким образом, г Δ $ gy(t)y(t)dt, (60) ту или та Ц z= ^ gy{t)dt } h(t> u)x(u)du> (61) должно быть нор'мальным для всех gy (t) [таких, что Ε [ζ2] <~оо]. Интегрируя по ί и обозначая результат через ТА *(")*$ gv(t)h(t,u)dt9 (62) имеем функционал 2= § g(u)x(u)duy (63) который является нормальным по определению. Итак, мы показали, что если на входе линейной системы имеется нормальный случайный процесс, то и на выходе ее будет нормальный случайный процесс. Свойство 2. Если Ч Уг= I gi(u)x(u)du (64) Та = § g2(u) x(u)duy (65) 220
где χ (и) есть нормальный случайный процесс, то уу и у2 —совместно- нормальные случайные процессы. (Доказательство очевидно в свете (67).) Свойство 3. Если Γβ **= § &iKu)lx{u)du] (66) Γβ xj = ^ <&j [и) χ (и) duy (67) где Ф£ (и) и Φ7· (α) — ортонормированные собственные функции уравнения (46) [теперь интересующий нас интервал равен (Γα, Γρ) вместо (О, Т)]> то Χι и xj(iz£j) — статистически независимые нормальные случайные величины. Таким образом, мад-^-р [-*£*]· где Ч «|Д $/ηχ(ί)Φ,(0Λ· (68) (69) Это сеойство вытекает из свойства 2 и (45). Свойство 4. Для любого множества моментов времени tiy t2, tdJ ..., tn в интервале [Γα, Τβ] случайные величины xtl9xtt9 ···> #*rt совместно-нормальные случайные величины. Доказательство. Если обозначить случайные величины через вектор χ,Δ (70) среднее значение которого равно ΙΠ,Δβ V *и ~ *и Lxt J == Γ m* (Ί) Ί mx(tt) _«*(*η) J (71) то совместная плотность вероятности будет равна рч(Х)= [(2я)"/2|Лх|'/2]-1ехр|^—|-(Х-тх)7'Л71(Х-тх)], (72) 221
а совместная характеристическая функция есть Мн (/v) =exp (Vmx — ±ν^ Αχ ν) , (73) где Лх — ковариационная матрица случайных величин xtlJ xt2> ..., xtn. [Предполагается, чтоЛх — невырожденная (несингулярная).] Ее ij-й элемент есть Ах, а = Ε [(хи-тх(Щ (xtj- тх Щ. (74) Это свойство доказывается, если воспользоваться функцией g(u)=l>igiHu-ti) (75) в (58), а затем результат подставить в (57). Итак, видно, что наше определение обладает требуемым свойством, указанным в § 3.3.1, так как оно однозначно определяет совместную плотность для любого множества моментов времени. Свойство 4 часто используется как основное определение. Недостаток такого подхода заключается в том, что труднее доказать, что наше определение и свойства 1—3 вытекают из (72), чем наоборот. Нормальный процесс, который нами определен, обладает двумя главными достоинствами. 1. Для физических явлений, порождающих многие процессы, подходящей является модель нормального (гауссова) случайного процесса. 2. Нормальный процесс обладает многими свойствами, которые делают аналитические результаты более прозрачными. Обсуждение физических явлений, логически приводящих к нормальным процессам, можно найти в [7 и 8]. Другие свойства нормального процесса, которые не являются необходимыми для изложения основных вопросов, рассмотрены в задачах вне основного текста (см. задачи 3.3.12—3.3.18). Мы будем встречаться с несколькими процессами, которые являются совместно-нормальными. Их определение непосредственно следует из предыдущего определения. Определение. Пусть xt(ty9 х2 (0> ···> xn (t) —множество случайных процессов, определенных на интервалах (Γαι, Τ$χ (Γα2, Τβ2), ..., (ΤαΝ, Τ$Ν) соответственно. Если любая сумма произвольных функционалов от хг (t)y i = 1, 2, ..., Ny есть нормальная случайная величина, то процессы хг (/), х2 (t)> ..., хиЦ) являются совместно-нормальными. Другими словами, сумма N Th У= Σ $ gii^Xii^du должна быть нормальной для любого множества gt (и) такого, что 222
Ε [у2] <. oo . Прочие свойства совместно-нормальных процессов обсуждаются при изложении задач. Важность свойства 3 объясняет наше особое внимание к разложению Карунена — Лоэва. Оно позволяет характеризовать нормальный процесс при помощи счетного бесконечного множества статистически независимых нормальных случайных величин. Значение этого будет, по-видимому, наилучшим образом оценено, когда мы увидим, насколько облегчается решение многих задач. Заметим, что если бы мы предпочли уделить основное внимание марковским процессам, то метод задания процесса разложением в ортогональный ряд оказался бы не особенно полезным. В § 6.3 мы обсудим представление, посредством которого особо выделяется структура марковского процесса. Разложение Карунена — Лоэва полезно с двух точек зрения: 1. Во многих наших теоретических построениях оно используется в качестве математического инструмента. В большинстве этих случаев собственные функции и собственные значения не входят в окончательной результат. Интегральное уравнение (46), которым они определяются, решать никогда не приходится. 2. В других случаях результат требует точного решения для одной или нескольких собственных функций и собственных значений. Здесь необходимо точно решать это уравнение или находить решения, являющиеся хорошими приближениями. В следующем параграфе мы рассмотрим некоторые полезные примеры, в которых могут быть получены решения. 3.4. Однородные интегральные уравнения и собственные функции В этом параграфе с достаточной подробностью будет изучено поведение решений уравнения (46)., Помимо очевидной цели — научиться находить собственные функции, когда это необходимо, мы преследуем здесь и ряд других целей: 1. В результате изучения нескольких типичных случаев и отыскания собственных значений и собственных функций в некоторой мере облегчается достижение наглядности разложения по координатам. 2. Во многих случаях для получения окончательного результата мы будем вынуждены делать приближения. Нам необходимо выработать некоторую интуицию с тем, чтобы уметь оценивать, чем можно пренебречь, а что является важным. 3. Мы хотим увязать поведение собственных значений и собственных функций с более знакомыми понятиями, например, со спектральной функцией. В § 3.4.1. иллюстрируется метод, оказывающийся полезным, если случайный процесс является стационарным и имеет рациональный спектр. В § 3.4.2 рассмотрены стационарные процессы с ограниченным спектром, а в § 3.4.3 — важнейший, нестационарный процесс. 223
Далее в § 3.4.4 вводится понятие «белого» процесса. В § 3.4.5 синтезирован оптимальный линейный фильтр для оценки сообщения на фоне помех. Наконец, в § 3.4 6 исследуется асимптотика собственных функций и собственных значений для больших интервалов времени. 3.4.1. Рациональные спектры Первую группу интересующих нас случайных процессов составляют стационарные процессы, имеющие спектры, которые можно записать в виде отношения двух полиномов от ω2 s;(co) = ^1, (7б) *Л D (со2) ' ν ' где i/ (ω2) — полином порядка q по ω2, a D (ω2) — полином порядка ρ по ω2. Так как предполагается, что χ (f) имеет конечное среднеквад- ратическое значение, то q < р. Такие спектры наз ываются рациональными. Существует шаблонный, но утомительный метод решения. Основная идея чрезвычайно проста. Интегральное уравнение преобразуется в дифференциальное, решение которого можно легко найти. Затем найденное решение подставляется в исходное интегральное уравнение для удовлетворения граничным условиям. Сначала мы покажем применение этого метода на простом примере, а затем вернемся к рассмотрению общего случая и формализуем процедуру решения. (Подробное обсуждение сходных проблем имеется у Слепяна [9], Юла [10], Давен- порта иРута[1], ЛенингаиБэттина [11], Дарлингтона[12], Хелстрома [13, 14], Заде и Рагазини [22].) Пример. Пусть 2аР S* ((0>=,л2 . „2 ' -°°.< ω < °°> <77> СО —j- ОС или /?зс(т) = Рехр'(—α|τ|), — оо < τ < оо. (78) Среднеквадратическое значение величины x(t) равно Р. Интересующее нас интегральное уравнение имеет вид: τ J Pxtxv{—a\t-~u\)<b(u)du = %<b{t)y —T<t<T. (79) —7 (При симметричном интервале выкладки значительно упрощаются). Как указывалось выше, интегральное уравнение решается путем отыскания соответствующего дифференциального уравнения, решения последнего и подстановки этого решения обратно в интегральное уравнение. Сначала перепишем (79) так, чтобы исключить знак модуля, t τ λΦ(0= f Pexp[ — a(f— и)]Ф(ы)<*"+]>ехр[—сс(ы — Ц)Ф(и)аи. (80) -7 t 224
Дифференцируя, получим t τ λΦ(0= —Pae"at j* e+au<&(u)du + Pae+(xt [ e~a" Ф (и) du. (81) —τ t Второе дифференцирование дает τ λΦ(0 = Ρα2 f e-aU-u] Φ (и) du—2РаФ (t); (82) но первый член правой части есть просто α2λΦ(£). Следовательно, λΦ (t) = α2 λ Φ (0 — 2ΡαΦ (t) (83) или, для λ Φ 0, α2 (λ—2Ρ/α) Φ(0= —~1 — Φ(0· (84) Решение (83) .имеет четыре возможные формы, соответствующие случаям: 1) λ = 0; 2Р 2) 0 < λ < —; ос 3) λ = ^; (85) a л 2Ρ 4) λ > — . α Можно показать, что интегральное уравнение не удовлетворяется для условий 1, 3 и 4 (ср. задачу 3.4.1). Для условия 2 можно записать — α2 (λ—2Р/а) 62 = Ц: *-*-, 0<62<оо. (86) λ Тогда O(0 = c1e/w+c2e-/w. (87) Подставив (87) в (80) и выполнив интегрирование, получим n_»-«/pie-<«+'»>r с,е-<«-/»>Н_ L — а + /6 τ —α —/6 J v ' Нетрудно убедиться, что если сг φ ±с2, то (88) не удовлетворяется никогда. При сх = —с2 требуем, чтобы tg ЬТ — —Ь/а. При сг = с2 требуем, чтобы tg ЬТ = а/6. Комбинируя эти два соотношения, имеем \\gbT + ^ [tgbT-j^j = 0. (89) Значения 6, удовлетворяющие (89), можно определить графически, как показано на рис. 3.8. Верхний ряд пересечений соответствует второму члену (89), а нижний ряд — первому. Соответствующие собственные значения равны 2Ра λ'=^Τ^· <-»·* <90> 8 Зак. 693 225
Отметим, что мы упорядочили решения (89) в виде Ьг < Ь2 < Ьг < .... Из (90) следует, что в результате этого собственные значения упорядочиваются в виде λχ > λ2 > λ3 .... Решения, имеющие нечетные номера, соответствуют случаю сг = с2 и, следовательно, Фг(0= 1/2 Л sin26try/2 cos6^' -T<t<T (91) (i—нечетно). Рис. 3.8. Графическое решение трансцендентного уравнения. Решения, имеющие четные номера, соответствуют случаю с2 = —с2 и, следовательно, Ф'О- , sin 2bt Τ γ /2, ""**', -Γ<*<:Γ (92) (/—четно). Видим, что собственные функции являются косинусоидами и синусоидами, частоты которых не находятся в гармоническом соотношении. В связи с этим примером можно сделать несколько интересных выводов. 1. Собственное значение, соответствующее данной собственной функции, равно высоте энергетического спектра на этой частоте. 2. При увеличении 7\ Ъп монотонно уменьшается, и, следовательно, λη монотонно возрастает. 3. По мере увеличения ЬТ верхние точки пересечения имеют место приблизительно при (i—1) π/2 (i — нечетное), а нижние — примерно при (i — 1) π/2 (i — четное). Из (91) и (92) следует, что соб- 226
ственные функции более высоких индексов образуют приближенно ряд периодических синусоид и косинусоид Ф|(0« ! cos Γ(^ζ11ϋ Л , _r<f<7\ V 2biT ) (i—нечетно) ί sin Γ <t=zl>_» Л э -Γ<ί<7\ 1/2 / sin26,ry/2 I 2Г J ^ ^ \ 2b ι Τ ) (i—четно) Такое поведение функций называется асимптотическим. Первый вывод в общем виде несправедлив. Ниже (стр. 241) мы покажем, что λη всегда являются монотонно возрастающими функциями Т. Мы также покажем, что асимптотическое поведение, установленное в данном примере, для стационарных процессов является типичным. До сих пор рассматривался конкретный спектр. Вернемся теперь к рассмотрению общего случая. Рассмотренный метод легко обобщить на произвольные рациональные спектры. Сначала запишем Sx (ω) в виде отношения двух полиномов sx(*) = ai£i. - (93) Рассматривая (83), видим, что дифференциальное уравнение не зависит в явном виде от Т. Эта независимость справедлива, если спектр имеет форму (93). Следовательно, мы получили бы то же самое дифференциальное уравнение, если бы начали наши выкладки с интегрального уравнения оо λΦ(ί)= § КхУ—и)Ф(и)аи, — оо<*<оо. (94) —оо Формальное решение этого уравнения получается сразу, если применить преобразование Фурье: λΦ (/ω) =SX (ω) Φ (/ω) = ^Μ. φ (/ω), (95) ИЛИ 0 = [λΟ (ω2) —Ν (ω2)] Φ (/ω). - (96) Существует 2р однородных решений дифференциального уравнения, соответствующего (96), для каждого значения λ (соответствующего корням полинома, заключенного в скобки). Обозначим их через Ф/гД*, λ), i = 1, ..., 2р. Чтобы найти решение (46), подставим Ф(0=2а,Фл,(*Д) (97) 8* 227
в интегральное уравнение и решим его для тех значений λ и аи которые приводят к решению. При этом мы не встретим принципиальных трудностей, однако процедура решения громоздка и утомительна1*. Один частный класс спектров служит в качестве полезной модели для многих физических процессов и также приводит к удобным реше- 0,01 0,1 1,0 10,0 Рис. 3.9. Спектры Баттерворта. ниям интегрального уравнения обсуждаемой задачи. Этот класс описывается уравнением sin (л/2п) о й - ν / 2пР \ si 5. (ω :*)-(—)- (98) и называется классом Баттерворта. Спектры этого класса иллюстрируются рис. 3.9. При η = 1 мы имеем простейший однополюсный спектр. При увеличении η скорость нарастания ослабления от частоты при ω > α увеличивается. В пределе при η ->- оо мы имеем идеальный ограниченный по полосе спектр. В следующем параграфе будут рассмотрены собственные функции и собственные значения для спектра, ограниченного по полосе. 3.4.2 Спектры с ограниченной полосой Когда спектр не является рациональным, дифференциальное уравнение, соответствующее интегральному уравнению, имеет, как лра- вило, изменяющиеся во времени коэффициенты. Однако во многих х> В приложении 1 второй части монографии будет изложен метод, разработанный Бэггерером [32, 33], который является более эффективным. На данном этапе нашего курса для изложения этого метода у нас не хватает необходимых исходных предпосылок. 228
случаях, представляющих интерес, результирующее дифференциальное уравнение получается некоторого канонического типа, решения которого являются табличными. Примером такого спектра может служить спектр, изображенный на рис. 3.10. В этом случае ίϋί_, |ω|<α, I 0, |ω|>α, или, переходя от радиан к герцам, 5Λ(ω)= 2W m^ I, 0, \f\>W9 где (99) (100) I4W P/2W -2XW 2ltw ω Рис. ЗЛО. Ограниченный по полосе спектр. 2nW=a. (101) Соответствующая ковариационная функция имеет вид «.ftll)_,-^. Интересующее нас интегральное уравнение принимает вид Г/2 λφ( С р «!„«(*-«,) ф и (102) (103) (Это уравнение есть ни что иное, как (46), где для упрощения обозначений сдвинут интервал.) И на этот раз задача сводится к отысканию соответствующего дифференциального уравнения и исследованию его решения. Однако нас больше интересуют окончательные результаты, чем подробная методика решения. Поэтому мы их просто сформулируем, отослав читателя, желающего познакомиться подробнее, к [9,. Jj>—18]. Соответствующее дифференциальное уравнение на нормированном интервале имеет вид (1—ί»)7(0—2^(ί) + (μ—caia)/(i)=0; —1<«1, (104) где 2 (105) и μ — собственное значение. Это уравнение имеет непрерывные решения для некоторых значений μ (с). Эти решения называются круговыми сферическими функциями и обозначаются как S0n (с, t), n= 0, 1, 2, .... График типичной функции S0n (с, t) можно найти в Ц£—17]. Указанные функции удовлетворяют интегральному уравнению: + 1 2[<>(с, l)fs0n(c.t)= Г ^^-fs^^du, -1<*<1,(Ю6) 229
или, если заменить переменные, -7*^*·(τ1-τ-)*· -τ<'<τ· <107> -7/2 где Roln (α772, 1) — радиальная сферическая функция. Таким образом, собственные значения интегрального уравнения можно записать в виде К=рт[#£[*£,1)]ш, «=0,1,2,...!. Эти функции табулированы в ряде руководств (например, [18] и [19]). Первые несколько собственных значений для различных значений WT показаны на рис. 3.11 и 3.12. Отметим один весьма интересный факт. Для n>(2WT + 1) значения λη быстро стремятся к нулю. Можно вычислить полную энергию, содержащуюся в остальных собственных значениях, так как оо 7/2 Σλ* = S Kx(t9t)dt = PT9 (108) ί = 0 —7/2 На рис. 3.11 2WT = 2,55 и сумма первых четырех собственных значений составляет (2,54/2,55) РТ. На рис. 3.12 2WT = 5,10 и сумма первых шести собственных значений равна (5,09/5,10) Ρ Т. Эта закономерность подробно рассмотрена в [17]. Из нашего примера вытекает следующее утверждение. 2^7=2,55 λ0 = 0,996 — ; 0 2W *1«0.912-£ ; λ2 = 0,519^; j 2W7=2,55 *,=0.110-£: Λ.-Ο.00Θ ·£■; λ5 = 0,0004^. Рис. 3.11. Собственные значения ограниченного по полосе спектра. 230
2WT = 5,\Q Ρ λ0= 1,000-—; 0 2W λ! = 0,999 — ; 21Г λ2 = 0,997 —; 2 2Ψ λ3 = 0,961—; 2Г ' ! я = ο,748—; 2WT = 5t10 λ5= 0,321^; | λβ = 0,061^; λ7 = 0,006^; λ8 = 0,0004-^. Рис. 3.12. Собственные значения ограниченного по полосе спектра. Если процесс с ограниченным спектром [ — W> W Гц] наблюдается на интервале Те, то имеется только (2 TW + 1) существенных собственных значений. Этот результат будет важен для нас в последующих главах (особенно в гл. 2 и 3 тома II), когда мы получаем приближенные решения, пренебрегая собственными значениями высоких порядков. Более точные утверждения относительно решений можно найти-в [15—17]. 3.4.3» Нестационарные процессы Интересующий нас процесс является простым винеровским процессом. Он был разработан в качестве модели броуновского движения и подробно рассмотрен в [20, 21]. Типичная выборочная функция этого процесса представлена на рис. 3.13. Данный процесс определен для /^0 и ему присущи следующие свойства: *(0)=0, E[x(t)]=0, (109) E[x2(t)] = o49 (ПО) px(Xt) = -r=L=exp(— -££-) . (Ill) Приращения функции являются независимыми, т. е. если t3> t2 > tu то (**3 — xt2) и (xtz — xtl) статистически независимы. В следующем примере мы решим уравнение (46) для винеровского процесса. 231
*WI *-t Рис. 3.13. Выборочная функция винеровского процесса. Пример. Винеровский процесс. Используя свойства винеровского процесса, можно показать, что Kx{t,u) = a*min(utt)= {**"' "**' (112) В этом случае (46) имеет вид λΦ {t)=\ КхУ,и)Ф (и) du, 0<t <T. о Подставляя (112) в (113), получим t Τ λΦ(0 = σ2|«Φ (и) du + o2t §Ф\и)аи. о t (113) (114) Поступая, как и в § 3.4.1, в результате дифференцирования (114) получим τ λΦ(0 = σ2|φ(«)ίί«. (115) Дифференцируя повторно, имеем λφ(0 = — σ2Φ(0, или, при λ=£0, Ф(*)+-у Ф(0 = 0. Существует три возможных области изменения λ: 1) λ<0, 2) λ = 0, 3) λ > 0. (116) (117) (118) 232
Можно легко убедиться (ср. задачу 3.4.3), что 1) и 2) не дают решений, удовлетворяющих интегральному уравнению. Для λ > 0, поступая точно так же, как и в предыдущем параграфе, находим а2Т2 и a>n(0=(f)Fsin[(^i)f'4 0<t<T- <120) И в этом случае собственные функции являются синусоидами. Винеровский процесс важен по ряду причин. 1. Широкий класс процессов может быть преобразован в винеровский процесс. 2. Широкий класс процессов можно генерировать, пропуская винеровский процесс через линейную или нелинейную систему. Подробнее мы рассмотрим это позднее. 3.4.4. Процессы типа белого шума Другой интересный процесс может быть получен из винеровского процесса. Используя (41) и (120), можно разложить χ (ή в ряд *(0 = Шл.2ЦА)^п[(„_1)^], (121) где среднеквадратическое значение коэффициента определяется формулой ( Э): Е[хп*] = "Т, (122) Обозначим /(-членную аппроксимацию через хк (f). Теперь определим, что произойдет, если продифференцировать χχ (ή: MO-i*,(*-!)^fcos[(n-i)i(]j. (I23) Видим, что временная функция внутри фигурных скобок по-прежнему является нормированной. Поэтому можно записать МО-2 ^{тУ^{п-\)т <> (124) где £(*„«) = σ». 233
Мы получили процесс, для которого все собственные значения равны. Совершенно ясно, что если положить /С -> оо, то ряд не будет сходиться. Если бы он сходился, то он соответствовал бы процессу с бесконечной энергией на интервале [О, Т]. Можно формально получить ковариационную функцию этого результирующего процесса путем дифференцирования Кх {t, и): К* <'■ ")= -&- К* <'■ "> = ΊΖΤΓΪ0*min <'» UK = dt ди dt ди = σ·δ(ί—и), 0<f, и<7\ (125) Ковариационная функция есть импульс. Продолжая рассуждать формально, можно искать решение интегрального уравнения (46) для импульсной ковариационной функции: τ ΧΦ(ί) = G%\ δ (f—и) Ф(и) du, О < t<T. (126) о Это уравнение удовлетворяется для любого Φ (f) при λ = σ2. Следовательно, любой ряд ортонормальных функций пригоден для разложения этого процесса. Причина неоднозначности (неединственности) решения заключается в том, что импульсное ядро не интегрируемо в квадрате. Свойства, изложенные на стр. 217—218, предполагали интегрируемость в квадрате. Позднее будет показано, что результирующий процесс является весьма полезным инструментом для многих моделей. Суммируем эти свойства в следующих определениях. Определение. Нормальный процесс типа белого шума является нормальным [процессом, ковариационная функция которого есть σ2 δ (t — и). Его можно разложить на интервале [О, 7Ί, используя любой ряд ортонормальных функций Φζ· (ί). Коэффициенты по каждой координатной функции являются статистически независимыми нормальными случайными величинами с одинаковой дисперсией σ2. С этим определением связан ряд свойств, которые легко установить. Свойство 1. Формально можно записать оо о28(/-м)=2о2Ф^(0ФП«), 0<ff и<7\ (127) или в эквивалентной форме оо δ(ί—и}= 2 Ф|(*)Ф«(и). 0<f, и<Г. (128) Свойство 2. Если коэффициенты некоррелированы, имеют равные дисперсии, но не являются нормальными величинами, то процесс называют белым. Свойство 3. Если процесс определен на бесконечном интервале, то его спектр есть 5,(ω)=σ2, (129) 234
т. е. он постоянен на всех частотах. Значение всех собственных значений соответствует спектральной плотности σ2. Наряду с импульсными входными функциями процессы типа «белого шума» находят широкое применение при анализе линейных систем.. Точно так же, как мы можем наблюдать импульс только после того, как он пройдет через систему с некоторой ограниченной полосой, белый шум мы можем наблюдать только на выходе аналогичной системы. Поэтому, если ширина спектра шума значительно больше полосы пропускания системы, то можно считать, что шум имеет неограниченный спектр. Для иллюстрации типовых случаев применения разложения по собственным функциям рассмотрим простейшую задачу. 3.4.5. Оптимальный линейный фильтр В этом параграфе рассмотрим задачу оценки сообщения в присутствии помехи. Наше обсуждение будет по необходимости кратким; мы вернемся к этсй задаче-и исследуем ее подробно в гл. 6. Здесь же мы преследуем три цели: 1. Ознакомление с теорией линейных фильтров с переменными во времени параметрами и простыми методами минимизации. 2. Получение конкретных результатов, необходимых при изложении последующих глав. 3. Практическое применение метода ортогонального разложения, развитого в предыдущих параграфах, в целях получения формального решения интегрального уравнения. Интересующая нас система представлена на рис. 3.14. Сообщение a (t) — выборочная функция случайного процесса с нулевым средним, конечным среднекяадратическим значением и ковариационной "(f) 1 ' u(t) a(t) ■θ r(t) Линейная система. -э» Рис. 3.14. Задача линейной фильтрации. функцией Ка (*> и)· Сигнал наблюдается на фоне некоррелированной аддитивной помехи η (t) с нулевым средним и ковариационной функцией Кп (t, и). Мы наблюдаем сумму указанных процессов r(t)=a(t) + n(t), 0<f<7\ (130) Для получения оценки a (t) сообщения a (t) пропустим г (t) через линейный фильтр. Поскольку процесс a (f) не обязательно является стационарным, а интервал наблюдения конечен, для получения наилучшей оценки 235
нам может понадобиться фильтр с изменяющимися во времени параметрами. Мы характеризуем фильтр его импульсной реакцией h (ί, и), которая является значением выхода в момент времени ί, когда на вход воздействует импульс в момент времени и. Если система является физически реализуемой, то h (ί, и) = О, t<lu, так как выходной импульс не может появиться раньше входного. Если параметры системы во времени не изменяются (т. е. система инвариантна во времени), то h (t, и) зависит только от разности (t — и). Предполагается, что г (β) = 0 при t < 0 и t > Т. Поскольку система является линейной, то выходной импульс, обусловленный воздействием г (t), 0<ί<7\ можно записать в виде г a{t)=\h{ttu)r(u)du, (131) о являющимся очевидным обобщением интеграла свёртки (интеграла Дюамеля). Нам необходимо выбрать h (t, и) так, чтобы минимизировать среднее значение квадрата ошибки, проинтегрированной на интервале (О, Т]. Другими словами, требуется выбрать функцию h (t, и), минимизирующую величину lUEU^[a(t)-a(t))2kdt\ =EUUa(t)-§h(t9u)r(u)du\ dt\. "(132) Таким образом, мы минимизируем среднеквадратическую ошибку, проинтегрированную на заданном интервале. Величина ξ/ является ошибкой интервальной оценки. Аналогичным образом можно определить ошибку точечной оценки ЫО-Я a(t) — [h(t,u)r(u)du о 01</<7\ (133) Очевидно, если минимизировать ошибку во все моменты времени, то будет минимизирована ошибка на всем интервале. Один из путей решения задачи минимизации заключается в использовании стандартного метода вариационного исчисления (см., например, [31], гл. 2). Наш подход носит менее формальный характер и ведет прямо к необходимым и достаточным "условиям. Потребуем, чтобы реакция h (ί, и) фильтра была непрерывной функцией по обеим переменным в области 0<ί, α<7\ Обозначим h (ί, и), минимизирующую \Р (f), через h0 (ί, и). Любая другая функция фильтра h (t, и) в разрешенном классе может быть записана как h(t, w)=Mi, и)+гЪу,и), 0<ί, и<7\ (134) где ε — действительный параметр, a hz (t, и) — характеристика фильтра в разрешенном классе.. Вычислив математическое ожидание 236
от (133), подставив,результат в (134) и сгруппировав члены по степеням ε, получим τ lP(t :г) = Ka(t9 t)—2^h(t9 u)Ka(t9 u)du + τ τ + \dv\jduh(t9 v)h(t9 и) Kr(u, ν) (135) о о или b(t:e)=Ka(t, t)—2lh0(t,u)Ka(t,u)du + о τ τ + }άυ^duh0(t, и)h0(t, υ)Kr(u9 ν) — о о τ г τ η — 2e^duhe(t9 u) \Ka(t9 u) — \hb(U v)Kr(u, v)dv\ 0 L 0 J τ + ε2 ^ he (t, v) he (t, u) Kr (u, v) du dv. + (136) Если первые три члена обозначить ч ерез ξ/>0 (f)9 а последние два— через Δξ (t: ε), то (136) можно записать ξρ(*:β) = ξρ.(*)+Δδ(ί:β). (137) Если h0 (ί, и) — характеристика оптимального фильтра, то Δξ (t: ε) должна быть больше или равна нулю для всех допустимых he (t, и) и всех εφΟ. Покажем, что необходимое и достаточное условие для того, чтобы это было справедливо, сводится к выражению τ Ka(t,u) — lh0(t,u)Kr(u,v)du = 0, O^t^T, 0<и<Т. (138) о Выражение для Δξ (t: ε) имеет вид Δξ (t: ε) = — 2ε jjduhe(t9 и) Ка(t, и) — ^ h0{t, v) Kr (ut ν) dv \ + 0 L 0 J τ + ε2 jj J he (t, υ) he (t, и) Kr (u9 v) du dv. (139) о Необходимо сделать три замечания. 1. Второй член является неотрицательным при любом выборе hz (t9 ν) и ε, так как Кт (t9 и) неотрицательно определенная· 2. Если τ г τ η \he{t9 u)\Ka(t9 u)—\h0(t9 v)Kr(u, v)dv tfw=0, (140) о L о J 237
то для всех непрерывных hz (t, и) существует область значений величины ε, в которой Δξ (t : ε) отрицательна, а именно, Δξ (t: ε) < О для всех τ г τ 2 $ hB (ί, и) Ι Κα (ί, и) - J Л0 (ί, υ) *г(и, tr) <fo 0<ε<-^ - · (HI) Τ $$M'» ϋ)Μ*' ")^r(". »)<*"*> о если числитель правой части (141) положителен. Величина Δξ (t: ε) отрицательна для всех отрицательных ε, больших, чем правая часть Х141), если числитель отрицателен. 3. Чтобы (140) выполнялось, необходимо и достаточно тождественного равенства нулю выражения в квадратных скобках при всех 0 <С и < Т. Таким образом, τ Ka{t,u) — \h0{t, v)Kr(u, v)dv = 0, 0<f <7\ 0<и<7\ (142) о Неравенство по и является строгим, если в r(t) имеется составляющая белого шума, так как второй член не непрерывен при и = 0 и и = Т. Если (142) не справедливо, то мы можем сделать левую часть (140) положительной путем выбора he(t, u)> 0 для тех значений и, при которых левая часть (142) больше нуля и he (t9 и) <С 0 при всех прочих значениях и. Три указанных замечания исчерпывают доказательство (138). Результат (138)-имеет фундаментальное значение для многих из проблем, рассматриваемых ниже. Пока же предположим, что аддитивный шум является белым. Тогда КЛи и)= H±b{t^u)+Ka{ti и). (143) Подставляя (143) в (138), получим τ ^-h0(t,u)+\h0(t,u)Ka(u,v)dv = Ka(t,u), °5'5^.' (144) о Заметим, что h0 (t9 0) и h0 (t, T) однозначно определяются из условия непрерывности Л0 (if 0) = lim h0(t9 и), (145а) h0(t,T)= lim h9(t,u). (1456) Так как α (ή имеет конечное среднеквадратическое значение, то из (145а), (1456) следует, что (144) также справедливо при и = 0 и и = Т. 238
Результирующую ошибку оптимального устройства обработки можно найти без особого труда. Она просто равна первому члену (137) τ lp.(t)=Ka(t9t) — 2lh0(t9u)Ka(t9u)du + о τ + S$M*. иЖ(*> v)Kr(ut v)dudv (146) или Ьо(0 = ^αС О—$Л0(Л и)К*(Л a)А*- о τ г τ —\h(t, и) Ka(t, u)—\h0{t, O)Kr(u, v)dv о L du. (147) 0 J Но из (138) вытекает, что выражение в квадратных скобках равно нулю. Следовательно, τ lp.(t)=Ka(t>t) — lh0(t9u)Ka(t,u)du. (148) о Для случая белого шума подстановка (144) в (148) дает ξΜ0=ΊΓ]Μ''°· [(149) В качестве окончательного результата нашего предварительного рассмотрения оптимальных линейных фильтров покажем, как решение уравнения (144) получается в терминах собственных функций ядра Ка (t* ti). Начнем с разложения ковариационной функции сообщения в ряд Ka(t9u)= Σ λ, Φ, (Ο Φ, (α), (150) /= ι где λ| и Φι (t) есть решения уравнения (46), когда ядро есть Ка ('» и). Используя (127), компоненту белого шума в (143) можно разложить в ряд Kw(t,u)=.-^8(t-u)= J "^ Φι W Φι («). (151) Для разложения в ряд белого шума нам необходим полный ортонор- мальный ряд. Если Ка (U и) не является положительно определенной, то можно дополнить его собственные функции с тем, чтобы сделать ряд полным ортонормальным (см. свойство 9 на стр, 217). Тогда Kr(t,u)= J (λι+-^-)φί(0Φ,(«). (152) 239
Так как Фь (t) образуют полный ортонормальный ряд, будем искат решение в виде ί = ι Подставляя (150), (152) и (153) в (144), находим М',«)=2 λι - >.+*■ Фг (ί)Φ, (и). (153) (154) Таким образом, переходную характеристику оптимального линейного фильтра можно выразить через собственные функции и собственные значения ковариационной функции сообщения. Модель /(-членной аппроксимации показана на рис. 3.15. Ф,М r(t) r®4 <PK(t) idt Jodt » » » Yodt ^ Я, | vv* 2 Xe*Mt/2 AK XK+N0/Z *кЮ Рис. 3.15. Оптимальный фильтр. Нереализуемость (154) можно устранить введением задержки на Τ сек во второй ступени перемножения. Заметим, что (154) представляет собой практическое решение только тогда, когда число собственных функций мало. В большинстве случаев решение в терминах собственных функций будет полезно только для теоретических целей. При подробном изучении вопросов фильтрации и оценок в последующих главах мы найдем более практичные решения. Ошибку также можно выразить через собственные значения и собственные функции. Подстановкой (154) в (149) получаем #0 U (0 = ^2 λ« т*|+т Φ,*(ί). 0<*<Г (155) 240
b-xju^-^j-^- (156> λ,· + -2 Помимо весьма полезного результата решение данной задача дает нам наглядный пример использования собственных функций и собственных -значений при отыскании решения интегрального уравнения в виде ряда. Следует еще раз подчеркнуть, что все результата настоящего параграфа основываются на исходном допущении линейности устройства обработки и в дополнительном требовании нормальности распределения нет необходимости. Вернемся теперь к основной теме и установим ряд интересующих нас свойств. 3.4.6. Свойства собственных функций и собственных значений В данном параграфе мы сформулируем два интересных свойства,, которые будут полезны при изложении последующего материала. Свойство монотонности1*. Рассмотрим интегральное уравнение τ λ| (Τ) Φι (t: Τ) = J Kx (/, и) Φ, (u:T)du, О < t < Г, (157) о где Кх (t, и) — интегрируемая в квадрате ковариационная функция. Это то же самое уравнение, что и (46), только переписано с тем, чтобы подчеркнуть зависимость решения от Т. Каждое собственное значение λ| (Τ) есть монотонно возрастающая функция длины интервала Т. Доказательство. Умножая обе части (157) на Фг (t : Т) и интегрируя по t на интервале [О, Г], имеем τ К. (Т) = J §ф. (t: Τ) Κχ (ί, и)Фг(и: Τ) dt du. (158) о Дифференцируя по 7\ получим дМП _oCd0>i(t:T) = 2§δΦίδΤΤ) dt§Kx(t,u)<S>i(»--T)du + дТ о τ Используя (159), получим + 2Ф^ (Т : Т) j /Ся (Г, и) Ф£ (w: Г) da. (159) о 0λ* (Т) τ 2λ* (Г) Г дФг^:Т) Ф, (f: Г) Л + 2λ, (Г) Ф^2 (Г: Т). П60) о Х) Этот результат принадлежит Хуангу [23]. 241
При упрощении этого уравнения учтем, что τ \<&?{t\T)dt = \. (161) о Дифференцирование (161) дает τ 2 f аф*(t: Т) Ф, (t: Τ) dt + Φ?(Τ: Τ) = 0. (162) о В результате подстановки (162) в (160) получим ^Ώ = λ, (Τ) Of2 (T : Γ) > 0, (163) что и требовалось доказать. Второе интересующее нас свойство связано с поведением собственных функций и собственных значений стационарных процессов при больших Т. Асимптотические свойства. Во многих случаях нам приходится иметь дело со стационарными процессами, которые требуется задавать на бесконечном интервале. Для исследования поведения собственных функций и собственных значений вернемся к (46). Предполагается, что процесс является стационарным, а интервал наблюдения бесконечным. Тогда (46) преобразуется к виду оо λΦ(/)= ξ Kx(t—u)<$>(u)du, —oo<t<oo. (164) —оо Чтобы завершить решение, вспомним простейшую задачу линейной фильтрации, иллюстрируемую рис. 3.16. На входе фильтра имеет- z(t) ^ Рис. 3.16. Линейный фильтр. ся воздействие y(t), его импульсная характеристика есть Λ(τ), на выходе получается процесс z(t). Все эти функции связаны интегралом свертки оо г(0= J h(t—u)y(u) du, — οο<ί<οο. (165) —оо Из сравнения (164) и (165) видно, что решение (164) есть просто такая функция, которая будучи введенной в линейную систему с импульсной характеристикой Кх(ъ), выходит из системы, не претерпев никаких изменений, за исключением только амплитуды. Из элементарной теории линейных цепей хорошо известно, что этому условию удовлетворяют комплексные экспоненциальные функции. Таким образом, Ф(*)=е/®', — οο<ω<οο (166) y(t) fi(r) 242
есть собственная функция для любых ω на вещественной оси1*. Подставляя (166) в (164), имеем оо Xemt = J яя (f _ ц) е/<*« du (167) —оо или оо λ=--\ Kx(t — u)e-i'i><i-^du=Sx(<u). (168) —оо Таким образом, собственное значение для данной ω есть значение энергетического спектра процесса на данной частоте. Теперь единственная трудность в нашем рассуждении заключается в том, что мы уже не имеем счетного множества собственных функций и собственных значений, с которыми могли бы работать, и идея разложения выборочной функции ε ряд теряет свой смысл. Существует два возможных пути для преодоления указанного затруднения. 1. Вместо того чтобы использовать представление выборочных функций рядами, можно попытаться найти некоторое интегральное представление. Подобное преобразование должно быть аналогичным преобразованию «ряд Фурье — интеграл Фурье» для детерминированных функций. 2. Вместо того чтобы начинать сразу с бесконечного интервала, можно было бы рассмотреть конечный интервал и исследовать поведение аппроксимирующего ряда при увеличении длины интервала. Это могло бы привести к некоторым простым приближенным выражениям для больших Г. В § 3.5 и 3.6 будет развит первый из указанных методов. Этот- метод пригоден при бесконечном интервале, который можно сделать конечным. Второй метод, который мы сейчас изложим, является чисто эвристическим, но приводит к точным результатам и прост в применении. Начнем с (46) и зададимся пределами —Г/2 и Г/2: Т/2 λΦ(/)= j /С*0-и)*(")<*". -^<'<-Т- (169> —772 Z l Положим U = \ (170) и будем искать решение в виде <$>n(u)==ej2nf0nuj _JL <U^JLy (171) х> Функция е(а+1'®)* также удовлетворяет (165) для значений σ, при которых существует экспоненциальное преобразование h (τ). Семейство экспоненциальных функций с σ = 0 вполне подходит для наших целей. Это первый случай использования нами комплексной собственной функции. Как указывалось в начале § 3.2, эти модификации должны быть очевидными (см. задачу 3.4.11), 243
где п = О, ±1, ±2, .... (Индекс берется по положительным и отрицательным целым числам для удобства.) Положим fn = nfo· Подставляя (171) в (169), имеем Т/2 КФп«)= $ Kx(t-u)ei2nfn»du. —7/2 Теперь Kx(t-u)=lsx(f)el2nfit-u)df. —оо Подставляя (174) в (173) и интегрируя по и, получим оо λ»Φ»(')= $ ^(Пе/^Г51"^^^]^ _оо L π(Αη— Г) J (172) (173) (174) (175) -Функция в квадратных скобках, показанная на рис. 3.17, симметрична относительно / = /п, причем ее высота равна Т. Ее ширина обратно пропорциональна 7\ а ее площадь равна единице при всех значениях Т. SiMt-T(fn-f)L Рис. 3.17. Весовая функция в выражении (175). Следовательно, при больших значениях Τ функцию, заключенную в квадратные скобки, приближенно можно считать импульсом на частоте /Л. Таким образом, ληΦη(0^ $ Sx(f)el2*n(f-fn)df=Sx(fn)el2ltfnt —оо Следовательно, и Xn~Sx(fn)=Sx(nfo) γψ 2 ^ ^ 2 (176) (177) (178) для больших значений Т. 244
Из (175) видно, что значение Г, необходимое для того, чтобы указанное приближение было справедливым, зависит от скорости изменения Sx(t) вблизи /а. В (156) мы столкнулись с бесконечной суммой функций собственных значений Более часто, однако, мы встречаемся с суммами вида оо *χΔΣ*(λ,). (180) Приближенное выражение для g^t полезное при больших значениях Т, следует непосредственно из приведенных выше результатов. На Рис. 3.18. Приближенные "собственные значения при больших Г. рис. 3.18 изображен типичный спектр и приближенные собственные значения, как это следует из (177). Мы видим, что £λ« Σ g(Sx№)=T Σ g(Sx(0)L (181) /г=—оо л=—оо где второе равенство вытекает из определения (170). Для больших значений Τ рассматриваемую сумму можно аппроксимировать интегралом оо g^T \g{Sx(!))dft (182) —оо что и является искомым результатом. Следующие свойства связаны с величиной наибольшего собственного значения. Максимальные и минимальные собственные значения. Пусть χ(ή — стационарный случайный процесс, определенный на интервале времени длиной Т. Наибольшее собственное значение%max(T) удовлетворяет неравенству K*AT)<™yLSx{f) 245
для любого интервала Т. Этот результат получается комбинированием (177) со свойством монотонности. Выражение для другой границы максимального собственного значения следует непосредственно из свойства 10 на стр. 218: Т/2 оо К*АТ)< I К At, t)dt=T\ sx(f)df. —Т/2 -оо Нижняя граница получена в задаче 3.4.4: 7/2 К**(П> $$ fV)KAt, u)f(u)dtdu, —Т/2 где f(t) — любая функция единичной энергии на интервале (—772, Г/2). Асимптотическое свойство, установленное на стр. 242—245, достаточно для большей части нашей работы. Во многих случаях, однако, нам будут желательны менее эвристический метод представления стационарных процессов и бесконечный интервал. В § 3.6 излагается метод, представления стационарных процессов на бесконечном интервале. К этой проблеме удобно подойти как к предельному случаю периодического процесса. Поэтому в § 3.5 мы делаем краткое отступление и рассматриваем представления периодических процессов. 3.5. Периодические процессы1} До сих пор мы занимались представлением процессов на конечном интервале времени. Однако часто бывает удобным рассматривать бесконечный интервал времени. Начнем наше рассмотрение с определения периодического процесса. Определение. Периодический процесс — это стационарный случайный процесс, корреляционная функция /?*(τ) которого является периодической функцией с периодом Т: Rx (τ) = Rx (τ + Τ) при всех τ. Нетрудно показать, что из этого определения вытекает, что почти все выборочные функции являются периодическими [т. е. x(f) = x(t + + Τ)]. Математическое ожидание квадрата разности равно E[(x(t)-x(t + T))2]=2Rx(0)-2Rx(T)=0. Следовательно, вероятность того, что x(t) = x(t + Τ), равна единице. Нам необходимо представить x(t) в виде обычного ряда Фурье со случайными коэффициентами. Сначала рассмотрим синусно-косинус- Х) § 3.5 и 3.6 не существенны для большинства наших последующих рассуждений и при первом чтении могут быть опущены. 246
ный ряд и ради простоты обозначений допустим, что процесс имеет нулевое среднее. Разложение в ряд по синусам и косинусам. Разложение данного процесса в ряд имеет вид + *etsin^tfY|> —оо</<оо, (183) 7/2 xci = jr j χ№ο*(ψίήΛ (184) где 7/2 -7/2 7/2 *.i=-f j χ (t) sin ^ ή dt. (185) —7/2 Ковариационную функцию можно разложить в ряд вида ^)=£p*cos(|^t), (186) где 7/2 Pi = \ \ Κχ(τ)**(ψ*)<1τ· (187) —7/2 Отсюда без труда получаем Ε (Xci Xd) = Е (Xsi *sj) = °> ΙΦ\* E(xci xsj) = 0 при всех i, j. (188) Таким образом, коэффициенты ряда — некоррелированные случайные величины. (Это означает, что собственные функции любого периодического процесса для интервала (—772, Г/2) являются гармоническими, т. е. синусоидальными и косинусоидальными функциями.) Аналогично, E(x2cl)=E(x2si)=Pi. (189) Заметим, что мы не производили нормировки координатных функций. Это объясняется тем, что нас интересует мощность, а не энергия на данной частоте. Если опустить γ Τ в координатных функциях, то величина (xci2 тЬ Xsi2) представляет мощность, а не энергию. Ожидаемое значение мощности на частоте ω$ Δ 2ni/T Δ ш0 равно pt. 247
Разложение по комплексным эспоненциальным функциям. Другой способ разложения процесса заключается в использовании комплексных экспоненциальных функций Кх<?)= 2 f*p(/ftt) (190) ί =—оо i=N jc(i) = l.i.m. Σ x,exp(/^-«), —οο<ί< Ν~+οο i= — N \ Τ J CO. Для положительных i *ι = γ(*οΐ —ixsd> i>1- (191) (192) Значения отрицательных индексов являются комплексно-сопряженными со значениями положительных индексов: Xf — X— i у (193) (194) Т/2 = ± J χ(ί)βχρ(-/.2ϊ«)Λ. — Г/2 Видим, что коэффициенты ряда некоррелированы. f *ti '2/ге( Τ ' 1 Ι ι Ι ' ιχ Ьх Τ Τ *ΰ I 1 t 1 1 1 1 1 τ I 1 I wx τ ^^ 1>J \*si=-21m(Xi) r ί n | ll! 1 2x ϊχ 6x \ Wx % Τ Τ Τ 4 Τ ^ ω *) δ) - (195) Рис. 3.19. Коэффициенты для типичной выборочной функции. Pi1 £(*ыг)' Τ 1 1 1 1_ τ 1 _1_ -£<*н') ϊ τ I 1 -J L_ ~Pi 1 I -2£(\xt Ll ■л ^. τ τ тс τ rtx τ ω Рис. 3.20. Дисперсия коэффициен- . тов, периодический процесс. 248
Точно так же, как и в случае конечного интервала, каждая выборочная функция определяется в среднеквадратическом смысле ее коэффициентами. Для удобства можно представить эти коэффициенты в функции частоты ω. На рис. 3.19 они показаны для типичной выборочной функции. На рис. 3.20 иллюстрируется статистическое среднее квадрата коэффициентов (дисперсия). 3.6. Бесконечный интервал времени. Спектральное представление 3.6.1. Спектральное разложение Рассмотрим теперь поведение ряда, если Τ — период процесса устремить к бесконечности. Представление тригонометрическими рядами. Из рис. 3.19 видно, что при увеличении Τ линии спектра сближаются. Учитывая это, более удобным графиком является кумулятивный график уровня, Рис. 3.21. Кумулятивная функция напряжения, периодический процесс. kzc(ta) У О £Г Τ J 1 1 1 I 1 ι ι τ 18уС ω Τ показанный на рис. 3.21 для типичной выборочной функции. Функция Ζ0(ωη) есть сумма коэффициентов при косинусах от 1 до ωη(Δηω0) Ζβ(ωη)=Σ*οΐ· (196) Аналогично, г=1 (197) Мы видим, что вследствие нашего допущения о нулевом среднем, Zc(0)=Zs(0)=0 (198) и 2βΚ) = Σ*βί=Σ^τ S x(t)co&(toot)dt. (199) 249
Из (183) видно, что можно записать N x(t) = l.i.m. 2 [Zc(con)—Zc(<oll_i)]cos<DJlf + Ν-*οο η=1 + l.i.m. 2 [Ζ5(ωη)—Ζβ(ωΛ_ι)]5ίηωηί. Ν -too η= ι (200) Из самого способа определения ясно, что £{[Ζ0(ω,ι)-Ζ0(ωη_1)]2}=£{[Ζί(«)η)-Ζ,(ωπ_1)]2}=ρη. (201) Кумулятивную среднюю мощность можно обозначить через функцию Gc(con), где г=1 Типичная функция изображена на рис. 3.22. (202) Рис. 3.22. Кумулятивный спектр мощности, периодический процесс. Ковариационную функцию можно выразить через Gc((Dn), используя (186) и (202): Κχ(τ)= Σ [GcW — Gc(cDrt_i)]coscDnT. /2=1 (203) Представление комплексными экспоненциальными функциями. В комплексном виде можно записать Z((Dn)-Z((oJ= Σ xt= Σ -ψ- I x(t)erl«->< ί—m+l i=m+l 1 _τ/2 {dt x(i)=U'um. Σ [Z(<an)—Z(vh^l)]e,^t. (204) Среднеквадратическое значение η-го коэффициента равно £[|Ζ(ωη)-Ζ(ω„_0|2] = ^, п = -оо,..., -1, 1,..., оо. (205) 250
Кумулятивная средняя мощность равна 0(ωη)= 2 -ζ-, ω„>-οο (206) Κ,(τ)= Σ [G(<on)-G(«>„_,)]β/ωη*. (207) Косинусно-синусное представление. Вернемся теперь к косинус- но-синусному представлению и исследуем его поведение при Г-*· оо. Прежде всего изменим на обратный порядок суммирования и интегрирования в (199). Это дает Zc((Dn)= ) 2x(t) Σ cos (ιω01) ±. dt. (208) —Τ/2 ί=1 1 Пусть 2π ' Г и Считая ηω0 постоянной и полагая Г->- оо, получим Zc(co) = $ 2*(ί)Λ J coscoi — (209) 2π ИЛИ Аналогично оо Zc(0)) = i J 2-^-x(t)dt. (210) Ζί(ω)=^ J2b^x(0^. (211) —оо Сумма, представляющая x(t), также превращается, в интеграл оо оо x(t)*l dZc((o)cos a>t + ^dZs((o)s\n(ut. (212) о о Мы записали эти интегралы в виде интегралов Стилтьеса. Они определяются как предел суммы (200) при Г-»- оо. Следует отметить, что мы никогда не будем интересоваться вычислением интеграла Стилтьеса. Типичные графики функций Zc((o) и Ζ5(ω) показаны на рис. 3.23. Это процессы с нулевыми средними, обладающие следующими полезными свойствами. 251
1. Приращения на неперекрывающихся интервалах являются некоррелированными, т. е. Ε {[Zc(<*i)-Zc(<*i-b<*i)] [Zc (cd2)-Zc(cd2-Acd2)]) =0 (213) и Ε {[^(ωΛ-Ζ,Κ-ΔωΛ] [Ζβ(ω2)-Ζδ(ω2-Δω2)]} =0, (214) если интервалы (ω! — Δωχ, ωχ] и (ω2 — Δω2, ω2] являются неперекрывающимися. Этот результат полностью аналогичен некоррелированности коэффициентов при разложении в ряд. k^eM hzsM ^ω Рис. 3.23. Типичный интегральный спектр напряжения. 2. Квадратурные компоненты некоррелированы даже на одном и том же интервале, а именно, £{[Ζβ(ω1)-Ζ0(ω1-Δω1)][Ζβ(ω2)-Ζ3(ω2-Δω2)]}=0 (215) для всех щ и ω2. 3. Среднеквадратическое значение приращения функции имеет простое физическое истолковани Ε {[^(ωΛ-Ζ,Η-Δω)]*} =00(ω1)-0,(ω1-Αω). (216) Величина, стоящая в правой части (216), представляет среднюю мощность на частотном интервале (ωχ — Δω, ωχ]. 4. Во многих представляющих интерес случаях функция Gc((o) является дифференцируемой: ω2 Gc(o\)~Gc(<»1)=l2Sx(<»)^. (217) (Коэффициент 2 под интегралом появляется ввиду того, что Sx((o) — двусторонний спектр.) dGc(a>) д 2Sx((o) ^ (Ш) άω - 2π 5. Если χ(ή содержит периодическую компоненту с частотой сос, то Gc(<*>) будет иметь разрыв первого рода в точке сос, a Sx((o) будет содержать импульс на частоте сос. Функции Zc(cd) и Ζ8(ω) называются интегральными преобразованиями Фурье функции x(t). Функция Gc(cd) является интегральным спектром функции χ(ή. 252
Возникает вполне логичный вопрос: почему мы используем Ζ0(ω) вместо обычного преобразования Фурье функции x(t)? Трудность использования обычного преобразования Фурье можно показать. Положим Г/2 ХсТ(а)= jj X(t) cos cotdt (219> —Г/2 и исследуем поведение интеграла при Τ ->- сх>. Допустим, что Ε[χ(ή] = = 0, E[XCtT((d)]=0 (220> и 7/2 Г/2 J £[|ΧΓ,7(ω)|2]= ξ rf/ J duRx(t—w) cos ω/cos cow. (221) —7/2 —Γ/2 Легко показать, что правая часть (221) становится сколь угодна большой при Τ -+■ оо. Таким образом, для каждой ω обычное преобразование Фурье есть случайная величина с неограниченной дисперсией. 2$.Hg(ju>)=0 x(t) hg(r) y(t) Рис. 3.24. Комплексный фильтр. Представление комплексными экспоненциальными функциями. Результат, аналогичный (210), можно получить и для комплексное представления Z(coJ-Z(cDm)=^ J (* -± Jx(t)dt (222) x(t)= jj dZ(<o)e/«'. (223) Выражение (222) имеет простую физическую интерпретацию. Рассмотрим комплексный полосовой фильтр и его передаточную функцию, изображенную на рис. 3.24. Импульсная характеристика является комплексной hAt) 1 е"°»'-е/(ат' 2π jt 253 (224)
Выходная величина при ^=0 равна У(0)= j ^(e -=J J*(T)dx=Z(0j-ZK). (225) —оо Таким образом, приращения функций в процессе Ζ(ω) соответствуют выходу комплексного линейного фильтра, когда на его входе присутствует x(t). α(ω)\ Рис. 3.25. Интегральный спектр мощности и энергетический спектр. Интересующие нас свойства комплексного представления полностью аналогичны свойствам (213)—(218) и перечислены ниже: Ε [ | Zj(co)—Ζ (ω — Δω) |2] = G (ω) — G (ω — Δω). Если G((d) дифференцируема, то dG (ω) Α Sx(v) ^ dm- — 2π Типичный случай показан на рис. 3.25. ω £{|Ζ(ω)-Ζ(ω-Δω)|*}=^- j Sx(v) άω. ω—Δω Если ω3>ω2>ω1, то Ε {[Ζ (ω3)-Ζ (ω2)] [Ζ* (ω2)-Ζ* (ωχ)]} = 0. (226) (227) (228) (229) Другими словами, приращения функций некоррелированы. Указанные свойства можно получить в виде предельных соотношений из экспоненциальных рядов или непосредственно из (225), используя соотношения вторых моментов для линейной системы. Сделаем несколько выводов, которые будут полезны в дальнейшем. 1. Величина άΖ(ω) играет точно такую же роль, как и преобразование Фурье для сигнала с конечной энергией. Рассмотрим, например, линейную систему, изображенную на рис. 3.26. Имеем y(t)=. }h{x)x(t—x)dx (230) 254
или •θ ОО ОО jj dZy (ω) е/»'= ξ <ίτΛ(τ)$ dZ, (ω) е'· <«-*>; (231> —·» —β· —oo •β ОО 5 dZ„(a>)e*»'= J НЦ<й)с1гх(<о)е№. (232) —·© ОО Таким образом, dZj, (ω) = Я (/ω) dZx (ω) (233> и 5,(ω) = |^(/ω)|2 5χ(/ω). (234) 2. Если процесс является нормальным, то случайные величины [Ζ (ωχ) — Ζ(ωχ— Δω)] и [Ζ(ω2)—Ζ(ω2—Δω)] статистически независимы при условии, что указанные интервалы являются неперекрывающимися. *(*) h(-c) H(J(o) y(Vx Рис. 3.26. Линейный фильтр. Мы видим, что спектральное разложение1* процесса дает такой же результат для стационарных процессов на бесконечном интервале, чта и разложение Карунена—Лоэва на конечном интервале. В результате спектрального разложения мы получаем функцию Ζ(ω), связанную со всеми выборочными функциями. Кроме этого, можно разбить ось ω на произвольные неперекрывающиеся частотные интервалы так, что результирующие случайные приращения на' этих интервалах будут некоррелированы (в случае нормального процесса и статистически независимы). Для иллюстрации практического применения сделанных выводов рассмотрим простую задачу оценки. 3.6.2. Применение спектрального разложения. Оценка параметров нормального процесса по максимуму апостериорной вероятности Рассмотрим простую систему, показанную на рис. 3.27: r(t) = a(t) + n(t)f — οο<ί<οο. (235) Предполагается, что a(t) — сообщение, подлежащее оценке. В терминах интегрального преобразования Zr (ω) = Ζα (ω) + Ζη (ω), — οο < ω < οο. (236) Χ) Более подробное изложение спектрального разложения можно найти у Гнеденко [27] или Бартлета ([28], § 6.2). 255
φ) a(t) ■e r(t) Пусть a(t) и η(ή являются выборочными функциями некоррелированных нормальных случайных процессов, имеющих нулевые средние и спектральные плотности Sa(<*>) и Sn((u) соответственно. Так как Ζα(ω) и Ζη(ω) — линейные функционалы нормального процесса, то они также являются нормальными процессами. Если разбить ось частот на множество непересекающихся интервалов, то величины приращений будут независимыми (рис. 3.28). Рассмотрим теперь , один какой-либо интервал (ω — da), ω] длиной άω. Обозначим величины приращений на этом интервале через άΖΓ(ω) и άΖη(ω). Ввиду статистической независимости величину каждого приращения άΖα{ώ) можно оценить отдельно, а ввиду коммутативности оценивания по максимуму апостериорной вероятности и по минимуму средне- квадратической ошибки при линейных преобразованиях, это эквивалентно оцениванию сообщения α(ή. Рис. 3.27. Простая система оценки параметра процесса. :ГМ Разность раб на Ζη (ω) Ζа (ω) Рис. 3.28. Интегральные преобразования a (t) и г (t). Апостериорная вероятность величины άΖα(ω) при условии, что было принято άΖΓ(ω), есть просто Pdza (ω) ι dzr (ω)[άΖα (ω) Ι dZr (ω)] = 1 \dZr(<u)-dZa(<u)\* 1 \άΖα(ω)\2 = &exp ί - (237) 2 Sn (ω) άωβπ 2 Sa (ω) άω/2π J [Это есть не что иное, как формула (141) гл. 2 при N = 2, так как άΖΓ(ω) — величина комплексная.] Поскольку апостериорная плотность является гауссовой, оценки по максимуму апостериорной вероятности и по минимуму среднеквад- ратической ошибки совпадают. Решение легко можно найти дополнением до полного квадрата и выделением условного среднего. Это дает άΖε(ω)=άΖα(ω) = Sg(CD) 5α(ω) + 5η(ω) 256 άΖΓ(ω). (238)
Следовательно, оценку по минимуму среднеквадратической ошибки можно получить, если пропустить колебание r(t) через линейный фильтр Н0 (/ω) = _^_И . (239) Итак, допущение нормальности процесса и критерий минимальной среднеквадратической ошибки приводят к линейному фильтру. В модели, описанной в § 3.4.5, мы требовали линейности, но допущения о нормальности не выдвигали. Ясно, что оба фильтра должны быть идентичными. Чтобы убедиться в этом, можно взять предел от выражения для конечного интервала времени. Для частного случая белого шума результат (154) можно несколько видоизменить, приняв во внимание комплексные собственные функции и суммирование в пределах от — оо до + оо. В результате получим А° V'и) = Σ vw Φί (/) Φί*(ы)- (24<0) ί= — оо Используя (177) и (178) , имеем оо limft0(*. и) = 2 Г S-^ cos ω (ί—и) — , (241) г^оо 0V ' J Sa(<g>) + N0/2 V ' 2π ν ; ο что соответствует (239). В большей части наших построений мы рассматриваем конечный интервал времени и используем разложение в ортогональный ряд, развитое в § 3.3. Затем, чтобы охватить случай стационарных процессов на бесконечном интервале, используем асимптотические результаты § 3.4.6. Этот эвристический путь приводит к правильному ответу для бесконечного интервала времени. Строгий подход для случая бесконечного интервала времени потребовал бы применения метода ин тегрального преобразования, который только что был изложен. Прежде чем сделать выводы по материалам данной главы, обсудим кратко, как можно результаты § 3.3 распространить на векторные случайные процессы. 3.7. Векторные случайные процессы Во многих случаях, представляющих практический интерес, мы имеем дело сразу с несколькими случайными процессами. Например, в фазированных антенных решетках, используемых в радиолокационных системах, необходимо учитывать ЭДС каждого элемента. Аналогичные проблемы встречаются в решетках гидроакустических и сейсмических систем, где принятый сигнал содержит ряд компонент. В те* 257
леметрических системах одновременно передается несколько сообщений. Во всех перечисленных случаях удобно иметь дело с одним векторным случайным процессом x(t)t компоненты которого являются интересующими нас процессами. Если имеется N процессов χχ(ήΛ x2(t)t ...., χν(Ϊ), τοχ(ή определяется матрицей-столбцом χ (О Δ рх(*)П xt(t) l_M')J (242) Размерность N может быть конечной или счетно-бесконечной. Точно так же, как в случае одного процесса, свойства моментов второго порядка описываются при помощи средних значений и ковариационных функций процессов. Кроме этого, необходимо также знать взаимно ковариационные функции различных процессов. Функция средних значений есть вектор шх(/)А£ рмо~ *,(/) \_XN (0 J — I Γ/Μ/Π m2(t) _mN(t)\ (243) а ковариационные функции могут быть описаны матрицей Ν χ Ν, обозначаемой вектором Кх(/, и), элементы которой равны Kiltf. и)±Е[[Х1У)-т;№х,(и)-т3(и)]). (244) Нам необходимо получить разложение в ряд для векторного случайного процесса х(/). Существует несколько возможных представлений, но два из них являются наиболее эффективными. Первый метод заключается в использовании в качестве координатных функций ряда векторных функций при скалярных коэффициентах. Второй метод заключается в использовании в качестве координатных функций ряда скалярных функций при векторных коэффициентах. Для первого метода и конечного N нетрудно установить свойства, аналогичные рассмотренным на стр. 217—218. При бесконечном N следует быть более осторожными^ Подробный вывод, который справедлив при бесконечном N, приведен в [24]. В основном тексте рассматриваются некоторые детали для случая конечного ΛΛ В гл. 5 второго тома мы используем результата полученный для бесконечного N, без доказательства. Для применения второго метода необходимы дополнительные ограничения. Обратимся вновь к процессам с нулевыми средними. Метод 1. Векторные собственные функции, скалярные собственные значения. Пусть N х (0 = l.i. m. Σ*ί<Μ*), Ν-+οο i=\ (245) 258
где *i = I Φ/ (t) x (О Л = ξ хг (О Фг (О dt = о о Φ|(ΟΔ ■Ф.ЧО' Ф|'(0 Ф,"(0 (246) (247) выбраны так, чтобы удовлетворялось уравнение τ λ|Φ«(ί) = ίΚχ(Λ u)H>t(u)du^ 0<ί<7\ (248) Заметим, что здесь собственные функции являются векторами, но собственные значения по-прежнему величины скалярные. Уравнение (248) можно также записать в виде Σ JXi(/, и)Ф,/(α)Λ=λι ©,*(/), * = 1,..., tf, 0<f<7\ /=ι ο (249) Скалярные свойства можно установить непосредственно. В частности, E(xixj) = ki8iji (250) а координатные функции являются ортонормированными, т. е. или о ./ т Σίφ|*(0Φ/(0Λ=δι;. Матрица о *=ΐο (251) (252) Кх (ί, и) = £ [χ (ί) хГ (и)]—шх (/) ш/ (и) = ИЛИ = Σ 2 cov [xt Xj] Φ, (0 Φ/ (и) = 2 λ, Фг (ί) Φ,»· (и) (253) Ζ=1 /=1 <=1 Κ« .*/(*, ю)= 2 Я(Ф,*(*)Ф,'("). k, j = l,..., N. (254) г=1 Это не что иное, как многомерный аналог (50). 259
Одно из свойств, которое делает данное разложение полезным, заключается втом, что коэффициент является скалярной величиной, а не вектором. Это обстоятельство интуитивно, пожалуй, воспринимается с трудом. Как это получается, показывает тривиальный пример. Пример. Пусть *ι (0 =*%(').. 0</<7\ x2(t) = bs2{t), 0<f<7\ ( ] где α и & — независимые случайные величины с нулевыми средними, a sx{t) и s2(t) — ортонормированные функции τ $5|(0ву(0Л = ву. *. /=1, 2 (256) о*(а)=аа\ o*(b) = ob*. (257) Тогда ν и ^ К MOM") 0 ] М/'"Ч о *·μομ«>]· (268) Можно доказать, что существуют две векторные собственные функции Фх(0 = [51^]; h = oa* (259) г о ι U(d; λ) Ф2(0 = [£.2(0]; λ2 = σ6*. (260) Таким образом, мы видим, что в данном вырожденном случае1) в записи коэффициентов можно достичь простоты, если увеличить число векторных собственных функций. Очевидно, это несущественно, когда имеется бесконечное число собственных функций. Вторым методом представления можно воспользоваться, если ввести комплексные собственные значения. Метод 2. Матричные собственные значения, скалярные собственные функции. При использовании данного метода мы полагаем χ(0=ΣχιΨι(0. 0<*<Γ (261) Χι=§χ(<)Ψι(0Λ· (262) Х) Важно, чтобы данный вырожденный пример не ввел в заблуждение. Полезное приложение находит случай коррелированных процессов. Здесь алгебраические выкладки при вычислении реальных собственных функций довольно утомительны, однако представление остается по-прежнему простым. 260
'Гребуется найти такую систему Аг и ψ|(ί)» что E[xix/]=Ai8ij (263) и τ Sb(i)b(t)dt = bu. (264) О Указанные требования приводят к уравнению τ Α,ψ,(0 = $Κχ(/, u)$t{u)du9 0<f<7\ (265) о Для произвольных интервалов времени (265) не имеет решения, за исключением нескольких тривиальных случаев. Однако, если ограничиться рассмотрением стационарных процессов и больших интервалов времени, то можно получить некоторые асимптотические выражения. Вводя оо Sx(cd)A $К,(т)е/«"Л, (266) —оо и считая интервал большим, находим b(t)^^=^li (267) у т и Α,^β,ίω,). (268) Как и прежде, для строгого рассмотрения случая бесконечного интервала времени необходимо пользоваться интегральным преобразованием Zx(con)-Zx(oJA je ^ x{t)dt (269) x(0= $ rfZx(©)e/«". (270) —oo Второй метод представления содержит значительный элемент интуитивного подхода в случае большого интервала времени, когда он только и справедлив, однако первый метод позволяет решать задачи более общего класса. По этой причине мы будем пользоваться первым представлением в основном тексте, оставив второй для решения задач. Трудно оценить важность первого метода разложения, пока не будут разобраны некоторые приложения. Тогда можно убедиться, что он позволяет получать результаты для многомерных задач сравнительно просто. Эта простота объясняется тем, что в данном случае мы все 261
еще имеем дело со скалярными статистически независимыми случайными величинами. Следует еще раз подчеркнуть, что мы не доказывали, что рассмотренные представления обладают требуемыми свойствами. Точнее, не было показано, что решения уравнения (248) существуют и имеют необходимые свойства, что справедлив многомерный аналог теоремы Мер- сера или что ряд сходится в среднеквадратическом смысле (в [24] это доказывается для первого разложения). 3.8. Краткие итоги В этой главе был развит аппарат для описания и задания случайных процессов. Основное внимание было уделено одному из методов представления, который особенно удобен для решения таких задач обнаружения и оценки, в которых случайные процессы имеют нормальный (гауссов) характер. Для негауссовых процессов подобное представление обеспечивает адекватное задание вторых моментов, однако оказывается не особенно полезным в качестве метода полного описания процесса. Для конечных интервалов времени желательным представлением является ряд ортонормированных функций, коэффициенты которого— некоррелированные случайные величины. Выбор координатных функций зависит от ковариационной функции данного процесса через интегральное уравнение №(t)=^K(t%u)Q>(u)du% Tt^t^Tf. (271) Собственные значения λ физически соответствуют ожидаемому значению энергии поданной координатной функции Ф(/). Мы показали, что это представление полезно как с теоретической, так и с практической точки зрения. Было рассмотрено несколько классов процессов, для которых могут быть получены решения уравнения (271). Один из примеров таких процессов — простой винеровский процесс — логически подводит нас к понятию процесса типа белого шума. Позднее мы будем иметь возможность убедиться, что этот процесс является весьма полезным инструментом во многих наших исследованиях. Для иллюстрации возможных приложений рассмотренных методов разложения была решена задача оптимальной линейной фильтрации на конечном интервале времени. Оптимальный фильтр для аддитивного белого шума соответствует решению интегрального уравнения Tf γ-К С ") + \Ка(*, г) h0 (ζ, и) dz =Ка (t, u), Tt^t9u^ Tf. (272) Ti Это решение может быть выражено через собственные функции и собственные значения. 262
Для больших интервалов времени было установлено, что собственные значения стационарного процесса приближаются к энергетиче- кому спектру процесса, а собственные функции становятся синусоидальными. Поэтому для данного класса задач разложение в ряд можно интерпретировать при помощи известных величин. Для бесконечных интервалов времени и стационарных процессов собственные значения не являются счетными и ими уже нельзя пользоваться. В этом случае, приняв в качестве исходного периодический процесс и устремив его период к бесконечности, мы получаем полезное представление. Вместо разложения в ряд для каждой выборочной функции в этом случае используется интегральное представление оо x(t)= ξ <ίΖ,(ω)β/·<. (273) —оо Функция Ζχ(ώ) является интегральным преобразованием χ(ή. Это выборочная функция случайного процесса с некоррелированными приращениями по частоте. Для гауссового процесса эти приращения являются независимыми. Таким образом, величины приращений для бесконечного интервала времени играют точно такую же роль, что и коэффициенты ряда на конечном интервале времени. Одно из возможных приложений данного свойства было показано на простом примере. Наконец, рассмотренные понятия и представления были распространены на векторные случайные процессы. Наиболее существенный результат такого подхода заключается в том, что мы получили возможность описывать процесс при помощи скалярных коэффициентов. Эти методы представления случайных процессов найдут применение в гл. 4 для решения задач обнаружения и оценки. 3.9. Задачи Многие из задач к § 3.3 носят обзорный характер и могут быть опущены читателями, имеющими достаточную подготовку в области теории случайных процессов. В задачах 3.3.19—3.3.23 иллюстрируется подход к решению непрерывной задачи, отличный от метода, развитого в основном тексте. Задачи к § 3. 3. Представление случайных процессов Задание процесса вторыми моментами Задача 3.3.1. В гл. 1 была сформулирована задача выбора линейного фильтра, максимизирующего отношение сигнал/шум, выражение для которого на выходе фильтра имеет вид [h(T—τ) s (τ) άτι ш.г1Ц—- 4 /0 Λ^0/2 J /ι2 (τ) ίίτ ο 263
1. Используя неравенство Буняковского — Шварца, найти . функцию Λ(τ), которая максимизирует (S/N)0. 2. Построить ориентировочный график /ι(τ) для какого-либо типичного сигнала s(t). Примечание. Получающийся при этом фильтр носит название согласованного фильтра и впервые был синтезирован Нортом [34]. Задача 3.3.2. Проверить формулу (26) гл. 3. Задача 3.3.3 [1]. На вход устойчивой линейной системы, имеющей передаточную функцию #(/(°)> поступает процесс x(t) с нулевым средним, корреляционная функция которого есть **(**) =-γ δ ΜΙ. Найти выражение для дисперсии выхода y(t). 2. Шумовая полоса схемы определяется равенством оо j* \Η(ίω)\2άω/2π . ^ν-—-—гт/ j~2 (двухсторонняя, Гц). • "max I Убедиться, что „t_NtBN\Hm„\* σ* 2 Задача 3.3.4. [1]. Рассмотрим линейную систему с постоянными параметрами, определяемую выражением O(t) = x(t—S) — x(t) и y(t)= | v(u)du. —оо 1. Определить импульсную характеристику, связывающую вход x(t) с выходом y(t). 2. Определить функцию системы. 3. Определить, устойчива ли система. 4. Найти BN. Задача 3.3.5. [I]. Передаточная функция #С-схемы имеет вид У (/ω) _ 1 Χ(/ω) 1+ЯС/со · На вход схемы воздействуют шум, представляющий собой выборочную функцию стационарного случайного процесса с равномерной спектральной плотностью N0/2y и сигнал, являющийся последовательностью импульсов прямоугольной формы, имеющих одинаковую амплитуду. Длительность импульса равна δ, а минимальный интервал между импульсами равен 7\ где δ < Т. Отношение сигнал/шум на выходе этой системы определяется здесь как отношение максимальной амплитуды выходного сигнала при отсутствии шума на входе к среднеквадратическому значению выходного шума. 1. Вывести выражение, связывающее отношение сигнал/шум на выходе в указанном выше смысле с длительностью импульса на входе и эффективной шумовой полосой схемы. 2. Определить, какое соотношение должно существовать между длительностью входного импульса и эффективной шумовой полосой схемы, чтобы получить максимальное отношение сигнал/шум на выходе. 264
Другие предстабления случайных процессов инё- гауссовы случайные процессы Задача 3.3.6. (представление процесса отсчетами). Если интервал наблюдения бесконечен, а рассматриваемый процесс имеет ограниченный по полосе спектр, то иногда бывает удобно пользоваться представлением процесса его выборочными значениями (отсчетами). Рассмотрим стационарный случайный про- Рис. 3.1.*. -W цесс x(t) со спектром, изображенным на рис. 3.1*. Допустим, что каждые 1/(21^) секунд берется выборка nsx(t). Обозначим эти отсчеты через x(i/(2W)), i = —оо,... ..... О, ... 1. Доказать, что *-*°° ^ \2WJ 2nW(t—i/(2W)) 2. Найти E[x{il(2W))x{JI(2W))]. Задача 3.3.7. (продолжение). Пусть Введем ^ t ,_ sin2nW (t— i(2W)) φ, (t)=V2W - — , — эо < t < lK) V 2nW(t-i/(2W)) ' Доказать, что если то К x(t) = \.l.m. Y Xi<&i(t). /c~>0° i=-K Ε (χι Xj)= P$ij при всех i, /, s*(f)=^, \f\<w. Задача 3.3.8. Пусть x(t) — полосный процесс с симметричным относительно частоты /с спектром, т. е. с m = 0 \f-fe\>W. />0, х(" ' \f+fc\>w, /<о. Требуется представить x(t) в виде двух процессов нижних частот xc(t) и xs(t)> физически получаемых так, как показано на рис. 3.2*. Введем в рассмотрение х (t) =У2хс (t) cos (2лfс () + У2х8 (0 sin (2л/с /). 1. Доказать, что £{[*(*)-*(*)]*} = 0. 2. Найти SXe(f), 5Xs(/)hSVs(/). 3. Каково необходимое и достаточное условие для того, чтобы s*c *,(/)=о? 265
Заметим, что это позволяет нам заменять любой полосный процесс двумя процессами нижних частот или одним векторным процессом нижних частот, спектры которых ограничены только сверху, ' U<oJ j—<g> V?cos2xfcft) н*>— Y2sir)2xfc(t) Ч -w w H(f) 1k -w w *f "(f) Рис. 3.2*. xe(t) *s(*) Задача З.З.9. Показать, что n-мерную плотность вероятности марковского процесса можно выразить в виде £2 **<*-! ***(***-Ь*Ч) Задача 3.3.10. Рассмотрим марковский процесс в три упорядоченные момента времени tx < t2 < t3. Показать, что условная плотность, связывающая первый и третий моменты времени, должна удовлетворять следующему уравнению: РХН 1**1 (Xt* I XtJ =$dXt2 PxtZ I Xt 2 (*f3 I Xh) P*t2 I Xt 1 (Xt2 I X'l)· Задача 3.3.11. О случайном процессе с непрерывным параметром говорят, что он имеет независимые приращения, если при любом выборе индексов t0 < < d... < in n случайных величин *(*ι) — * (to), ···> x(tn)— *{*п-\) являются независимыми. Считая x(t0) = 0, показать, что Μ xtixt2 '•'xtnUui> — »/»n) = Ai*/1(/»i+/»i+... + /»n) X Χ Π ЛЦ *, .j (/»*+·.. + Μι)· Гауссовы процессы Задача 3.3.12. Разложение моментов более высоких порядков на множители. Пусть x(t), t ( Г, является гауссовым процессом с нулевым средним значением E[x(t)] = 0. ■ 266
1. Показать, что моменты нечетных порядков процесса x(t) равны нулю, а моменты четных порядков можно выразить через моменты второго порядка при помощи следующей формулы. Пусть η — целое четнре число, a tlt ..., tn — точки на отрезке Г, некоторые из которых могут совпадать. Тогда Ε [χ (f О ...χ (*„)] = Σ ΕΙ χ (th) χ (*,,)] Ε [χ (th) χ (tti) ] ... £[*(<!„_,) x (f <n)J, где сумма берется по всем возможным способам деления η точек на я/2 парных комбинаций. Число членов суммы равно 1.3. 5...(п — Щп — 1); например, Ε [χ ft) x ft) x ft) χ ft)] = E[x ft) χ ft)] Ε [χ ft) * (h)]+E [x ft) * ft)] X xElxMxtfM + ElxVoxitMElxVuxit,)]. Указание. Продифференцировать характеристическую функцию. 2. Использовать полученный результат для отыскания корреляционной функции четвертого порядка Rx ft, *2. *з> h) = £Uft)*ft)*ft)*(*4)l стационарного гауссова процесса, спектральная плотность которого равна s*(/) = f. Ι/Κ г. О, при прочих/. Чему равен lim Rx ft, t2, t3, *4)? W + oo Задача 3.3.13. Пусть x(t) — выборочная функция стационарного действительного случайного процесса с нулевым средним и конечным среднеквадрати- ческим значением. Пусть новый случайный процесс определяется посредством выборочных функций y(t) = x\t). Показать, что Ry(T) = Rx*(0) + 2Rx*(T). Задача 3.3.14. [1]. Рассмотрим систему, изображенную на рис. 3.3*. Пусть вход е0 (t) — выборочная функция стационарного действительного гауссового R Ϊ ^ 1 ' 1 Квадратичное устройство егАе,г ~~~t егЩ Рис. 3.3*. процесса с нулевым средним и равномерной спектральной плотностью во всей интересующей нас области частот, т. е. можно считать Seo(f) = No/2. 1. Определить автокорреляционную функцию или спектральную плотность e2(f). 2. Построить ориентировочный график автокорреляционной функции или спектральной плотности eB(t)y e^t) и e2(t). 267
Задача 3.3.15. Рассматриваемая система изображена на рис. 3.4*, где x(t) — выборочная функция эргодического гауссова случайного процесса. Передаточная функция линейной системы имеет вид Я(/) = (е2", \f\<W, [О при прочих /. 1. Найти мощность постоянного тока, переносимую процессом. 2. Найти мощность переменного тока, переносимую процессом. Линейная система H(f) y(t) т =г(*) Квадратичное устройство Рис.3.4*. Задача 3.3.16. Вход линейной системы χ (i) —выборочная функция стационарного нормального процесса с корреляционной функцией Rx (τ) = δ(τ); выход системы равен y(t) = $ h(x)x{t-x)d%. Нам хотелось бы, чтобы выход в заданный момент времени tx был статистически независим от входа в этот же самый момент времени. Найти необходимое и достаточное условие, которому должна удовлетворять функция h(x) для того, чтобы x(tx) и y{ti) были статистически независимы. V2 2W Рис. 3.5*. Задача 3.3.17. Пусть x(t) — действительный стационарный в широком смысле нормальный случайный процесс с нулевым средним. Процесс x(t) пропускают через идеальный ограничитель. На выходе ограничителя получается процесс y(f), y(t) = L[x(t)]t где - М") = (-1, «<0. Показать, что автокорреляционные функции двух упомянутых процессов связаны формулой Ry (τ) = — arcsin π [Я* (τ)] 268
Задача 3.3.18. Рассмотрим нормальный процесс с ограниченным по частоте спектром, изображенным на рис. 3.5*. Запишем Найти x(t) = v (t) cos [2я/с / + Θ (О]. Pv(t)(V) и PQ{t)W- Являются ли v(t) и Q(t) независимыми случайными величинами? Метод дискретизации непрерывных гауссовых процессов11 В гл. 4, 5 первого тома и в гл. 3 второго тома классические результаты распространяются на случай непрерывных колебаний при помощи разложения Ка- рунена — Лоэва. Если же, однако, мы намерены использовать эвристическое обоснование, то большинство результатов, полученных в § 2.6 для общей гауссовой задачи, можно легко распространить на случай непрерывных колебаний следующим образом. с^Л 1— 1 0 Τ m(t) Φ) 1 m(t)y(Vl 2 \Ur(tf Дискретизатор- усилитель «> Дискретизатор- усилитель Г) Рис. 3.6*. ? и 1 1 1 q^m^n^ ι = 1,. %ν Процессы и сигналы подвергаются дискретизации так, что отсчет берется каждые ε секунд, как показано на рис. 3.6, а*. Усиление в дискретизатсфе выбрано таким, что Τ Τ/ε \m2(t)dt =ПтУ. mf. Для этого необходимо, чтобы e-oiel mi="[/em(ti). (1*) (2*) 1)Мы останавливаемся здесь на методе дискретизации ввиду его широкого использования в литературе и в связи с мнением некоторых преподавателей о том, что он легче воспринимается. Результаты этих пяти задач выводятся и обсуждаются достаточно подробно в основном тексте позднее. 269
Аналогично для случайного процесса Я|=УГя(*|) (3*) и Ε [щ tij] = гЕ [п (*,) η (tj)] = гКп if и 0> · (4*) Для иллюстрации данной процедуры рассмотрим простую модель, изображенную на рис. 3.6, б*. Непрерывные колебания запишем в виде г(0 ί«(0 + "(0. 0<*<Г:ЯЬ W \л(0, 0<t<T:H0, ' где m(f) — известная функция, a n(t) — выборочная функция гауссова случайного процесса. Соответствующая задача в дискретной постановке запишется как г = т + п:Ях г = п://0, (6*) где r(h) r(tM)J и Ν = Γ/ε. Если предположить, что я(£) ограничен по полосе величиной l/ε гц, будучи симметрично двухсторонним, и имеет равномерную спектральную плотность No/2, то отсчеты можно считать статистически независимыми нормальными случайными величинами (см. задачу 3.3.7) Ε [ηητ] = Ε [η2 (ί)]\ = -γ\ Δ σ21. (7*) Векторная формулиров-ка задачи (6*) нам известна из §2.6 гл. 2. Из (2.350) достаточная статистика равна N /(R) = — У ««Я!. №*) «2S Используя (2*) и (3*) в (8*), имеем Γ/ε (R) = —S V^«('i)Vi>(i|). При ε -> 0 получим (полагая t# = ε) τ . 1. i.m. / (R)= А С м (t) r (t) dt±l(r (*)), что и является требуемым результатом. Некоторые представляющие интерес типичные задачи приведены ниже. Задача 3.3.19. Рассмотрим простой пример, описанный во введении. 1. Показать, что No где Ε — энергия колебания m(t). 2. Построить блок-схему приемника и сравнить ее с результатом задачи 3.3.1. 270
Задача 3.3.20. Рассмотрим дискретный случай, определяемый (2.328). Здесь £[ппг] = К и Q = K-1. 1. Дискретизировать ограниченный по полосе шумовой процесс n(t) с интервалом ε секунд для получения отсчетов n(^), n(t2), ..., n(tk)- Убедиться, что в пределе Q обращается в функцию двух аргументов, определяемую уравнением τ \Q(t,u)K(u,z)du = 6(t-z). Ό Указание. Задаться функцией Q(ti, tj) = (1/ε)<?^. 2. Использовать этот результат для того, чтобы показать, что в пределе τ / = ЯтД (t)Q(t,u)r(u)dtdu. о 3. Найти d2. Задача 3.3.21. В примере, определяемом (2.387), средние значения равны, а ковариационные матрицы — различны. Рассмотреть аналогичное непрерывное колебание и показать, что τ / = JJ г (ί) ΛΔ (ί, u)r(u)dtdu, о где ha(t9u)^Q0(t9u)-Q1(tfu). Задача 3.3.22. В задаче линейной оценки, сформулированной в задаче 2.6.8, принятый вектор записывался в виде г = а + п, а оценка по максимуму апостериорной вероятности была равна К^1 a=K71R. Проверить, что аналог этого результата для непрерывного случая можно записать в виде Τ τ J K~l (t, и)а (и) du = fJK;-1 (t, и) г (и) du 0< t < Т. о о Задача 3.3.23. Пусть r{t) = a{t) + n(f), 0< t < Г, где a(t) и n(f) — независимые нормальные процессы с нулевыми средними и ковариационными функциями Ka(t, и) и Kn(t, и) соответственно. Рассмотрим некоторый момент времени ^ в указанном интервале. Найти Pa{tt)\r{t).-lAu\r®· °<*<П. Указание. Дискретизировать r(t) с интервалом ε сек, а затем положить ε -*- 0. Задачи к § 3. 4. Интегральные уравнения Задача 3.4.1. Пусть имеется интегральное уравнение Τ f du Ρ exp (— α | *—и |) Φέ (и) =λ, Φ* (*), — Τ < t < Τ. 271
1. Доказать, что λ = 0 и λ =* 2Р/а не являются собственными значениями. 2. Доказать, что все значения λ > 2Р/а не могут быть собственными значениями приведенного выше интегрального уравнения. Задача 3.4.2. Вычертить ориентировочный график, характеризующий поведение наибольшего из собственных значений интегрального уравнения задачи 3.4.1 в зависимости от аТ. Задача 3.4.3. Рассмотрим интегральное уравнение (114) t - т λΦ (t) = o2 \ иФ (и) du + o21 § Φ (и) du, 0<ί <Τ. ο t Доказать, что значения λ < 0 не являются собственными значениями этого уравнения. Задача 3.4.4. Доказать, что наибольшее собственное значение интегрального уравнения Τ λΦ(*)= f Яп(/,и)Ф(и)<*и, -T<t<T, -τ удовлетворяет неравенству τ *1>Я f(t)Kn(t,u)f(u)dtdu, —τ где /(^)любая функция с единичной энергией на интервале [—7\ Г]. Задача 3.4.5. Сравнить границу в задаче 3.4.4, используя функцию /(0=у=Г, -T<t<T, с фактической величиной, найденной в задаче 3.4.2. Задача 3.4.6. [15]. Рассмотрим некоторую функцию, полная энергия которой на интервале —оо < t < оо равна оо Е= J |/(0I *dt. —оо Теперь ограничим f(t) во времени интервалом [—Т/2, 772], а затем ограничим полученную функцию по полосе интервалом (—W, W) Гц. Обозначим результирующую функцию через fDB(f), а ее энергию — через EDB, оо edb= J |/οβ(0|·Λ· —оо 1. Выбрать f(f) так, чтобы максимизировать Υ- Ε 2. Какое значение имеет γ при WT = 2,55? Задача 3.4.7. [15]. Допустим, что f(t) сначала ограничена по полосе /β(0= J F(.)^|. —2πω Δη Теперь ограничим ее во времени интервалом —Г/2 < t < Т/2, а результат ограничим по полосе интервалом (—W, W) с тем, чтобы получить fBDB* Повторить задачу 3.4.6, заменив DB на BDB. 272
tfn ('-") = {J Задача 3.4.8. f35]. Рассмотрим треугольную корреляционную функцию fl-|/-u|, \t—u\<l, [О при прочих | / — и | Найти собственные функции и собственные значения на интервале (О, Т) при Τ < 1. Задача 3.4.9. Рассмотрим интегральное уравнение λ Φ (0= / Кп (*, и)Ф (u)du, Tt <t<Tft iCn (*. ")= 2 *i2 cos ^ — J cos ^ — J , и ГАГ/—7V Найти собственные функции и собственные значения этого уравнения. Задача 3.4.10. Вход нереализуемой линейной системы с постоянными во времени параметрами есть x(t), а выход — y(t). Таким образом, можно записать где y(t)= J h (τ)χ(ί—τ)άτ. Предположим, что оо 1) J x*{t)dt=\. 1 )■ - 2) Η(τ)=ν^:^[--^τ)' 3) Ε, Δ ] у1(/)Л. ОО 1. Какую максимальную величину £у можно получить, используя x(t)y которое удовлетворяет указанным выше условиям? 2. Найти x(t), которое дает Еу, произвольно близкое к максимальному значению. 3. Обобщить ответы по пп. I и 2 на случай произвольной #(/ω). Задача 3.4.11. Все наши основные выводы исходили из предположения, что коэффициенты и координатные функции в разложениях сигналов и процессов в ряды являются действительными величинами. В данной задаче мы хотим вывести аналогичные соотношения для комплексных коэффициентов и координатных функций. По-прежнему предполагается, что сигналы и процессы являются действительными. Вывести соотношения, аналогичные (12), (15), (18), (20), (40), (44), (46), (50), (128) и (154). Задача 3.4.12. В (180) была рассмотрена функция ё%± 2*(λ,) 1*8=1 и получено ее асимптотическое значение (181). Теперь рассмотрим сигнал s(t) конечной энергии и введем функцию * Т/2 Si Δ J S(t)<&i(t)dtt -τ 12 273
где Q>i(t) — те же собственные функции, которые использовались в (180). Интересующая нас функция имеет вид г=1 Показать, что при больших Τ άω £λ'~ J |S(/0)|^(S^(0))— , где функция S(j(u) есть преобразование Фурье сигнала s(t). Задачи к § 3. 5. Периодические процессы Задача 3.5.1. Доказать, что если Rx(t) —функция периодическая, то почти все выборочные функции также периодические. Задача 3.5.2. Показать, что если автокорреляционная функция Rx(t) случайного процесса такова, что Rx(r1)= Rx(0) при некотором τχ Φ 0, то Rx(t) — периодическая функция. Задача 3.5.3. Рассмотрим случайный процесс N χ (0= 2Un cos (n(ui+®п) - Величины ап(п = I, 2 Ν) — независимые случайные величины: Ε (α1)=Ε(α2)=...=£(αΛ/)=0. Дисперсии указанных величин различны. Ъп (η = Ι, 2 Ν) — одинаково распределенные независимые случайные величины, 0 < θ < 2π. Величины θη и ап — независимы. 1. Найти Rx(tlt t2). 2. Является ли данный процесс стационарным в широком смысле? 4. Можно ли сделать какие-либо утверждения относительно структуры заданных выборочных функций? Задачи к § 3.6. Интегральные преобразования Задача 3 6.1. Рассмотрим систему с обратной связью, показанную на рис. 3.7*. Случайные процессы a(t) и n(t) — статистически независимы и стационарны. Спектры 5α(ω) и Sn (ω) — известны. 1. Найти выражение для Ζχ(ω) — интегрального преобразования Фурье процесса x(t). 2. Выразить Sx((u) через 5α(ω), 5Λ(ω), Gi(/co) и <j2(/cd).
Задача 3.6.2. И (221) Т/2 Т/2 E[\Xcj((u) |2]= \ at \ duRx(t —и) cos at cos ωιι. — Т/2 —Т/2 Доказать, что правая часть становится сколь угодно большой при Τ -> оо Задачи к § 3.7. Векторные случайные процессы Задача 3.7.1. Рассмотрим спектральную матрицу V~2k Ί S(a>) = 2 Y~2k j(u+k 2k |__/со+/г co2-|-/e2J Развить аппарат § 3.4 для отыскания векторных собственных функций и собственных значений по методу I. Задача 3 7.2. Исследовать асимптотическое поведение (т. е. при больших Т) собственных функций и собственных значений по методу 1 для ядра произвольной стационарной матрицы. Задача 3 7.3. Пусть xx(t) и x2(t)—статистически независимые случайные процессы с нулевыми средними и ковариационными функциями Kx\(t> и) и Кхъ{и и) соответственно. Собственные функции и собственные значения равны KXl(t, и)-Ли Ф|(0. '=1. 2 Kx(t, и): μι, ψ* (')■ /=1, 2, Доказать, что векторные собственные функции и скалярные собственные значения всегда можно записать в виде ЧГЬШЧТЬ Задача 3.7.4. Рассмотрим векторный процесс г(0 = а(0 + п(0, — ос</<оо. Процессы &(t) и n(t) — статистически независимые со спектральными матрицами Sa(co) и Sn(co) соответственно. Распространить идею интегрального преобразования на векторный случай. Использовать метод, рассмотренный в § 3.6.2, и дифференциальный оператор, введенный в § 2. 4.3 (2.239), для отыскания оценки. а(£) по максимуму апостериорной вероятности. Решение некоторых задач к главе 3 Решение задачи 3.3.1 1. Неравенство Буняковского—Шварца имеет вид причем знак равенства имеет место тогда и только тогда, когда f(t)=kg(t). 275
Используя это неравенство применительно к числителю данного выражения, получим Теперь Таким образом, ]h(T— x)s(x)dx ]h2(T—x)dx I J s2 (τ) dx -?s»« dx ?S»« dx § h2(T—x)dx=] h*(x)dx. (τ).<τ.$"«λ· Равенство достигается тогда и только тогда, когда h(T^-T) = ks(%), 0<τ<7\ или Заметим, что поэтому h{x) = ks{T—τ), 0<τ<7\ js2(t)<*t = £, о (3.1*) (3.2*) (3.3*) #/o,max #о* Этот результат не зависит от формы сигнала, если импульсная характеристика согласована с сигналом, как в случае (3.2*). 2. Некоторые типичные формы сигналов и соответствующие им характеристики согласованных фильтров приведены ниже. s(tl А fr h(t) = s(T-T) 1 Ι VT\ -*t Φ) A ι 1 >.* 1 0. *t 276
Решение задачи 3.3.6 1. Сначала вспомним теорему отсчетов для детерминированных функций. Пусть оо YU)*. J y(t)exp(-j2nft)dt. ОО Если У(/) = 0, 1/1 > W, то можно записать У^~ 2d y\2w) 2nW(t—k/2W) ■ А»= —оо Этот результат имеет прямое доказательство. Теперь Kx(t — и) является детерминированной функцией, преобразование Фурье который имеет ограниченный спектр. Поэтому можно записать Кх«-и)= 2 **[и-Ш) 2nW{t_k/2W) · (З·1*) k= — оо Это предварительный результат, который необходим для вывода теоремы отсчетов применительно к случайным процессам. Для доказательства сходимости в среднеквадратическом необходимо показать, что ,. „ IY ^ ( k \ s\n2nW(t— k/2W)Y] lrJ~llX{t)-lX[w) 2nW{t-k,2W) jj=0· hZl[[X{t)- 2*(яг) 2nW{t-k/2W) j J- = #ж(0)-Нт£ 2 У х (<)*(■ L -* Ho fe \ sin2jr1P(;—fe/2B7) V2U?J 2π№(* —Λ/21Ρ) + W Ν + , ·ν sin2jiJF ( t— -^- ) sin2nF (* — -~V "-"--*w Uj· (*"('-ώ)(»"('-,τ)). <*> sin2JiIF (t— — ) =кх(о)-2Укх({-±)—/ *γ + oo oo + Σ2«-α-2;) 2„r(;_j5' ЛГ(;_Г)'· ·*> 277
Сумма во втором слагаемом равна Kx{t — t) = Kx(ty согласно (3.1*). Используя (3.1*) дважды по отношению к третьему слагаемому, получим Кх(0). Таким образом, правая часть (3.2*) равна **(0)-2*ж(0) + **(0) = 0, что и требовалось доказать. 2. — оо . -*«](·--*-)~Μ^)]«-^"—»>· где «Δ ί — k. Если л = 0, то Заметим, что некоторые из коэффициентов являются коррелированными. В задаче 3.3.7 изложены необходимые и достаточные условия, которым должен удовлетворять спектр, чтобы отсчеты (выборки) были некоррелированными. Решение задачи 3.3.19 1. Согласно (2.334): о*Ц\Н0) к > 1 £■ 2в Т1& Согласно (8*) на стр. 270 ι чп ζε ^ri /(R)=^" 2dmiRi = T 2tmiRi- г=1 ° ί=1 Сначала оценим числитель 2ε τ£ 2 Τ£ Ell\H1]-E[l\H0]=— У mi(Elri\H1]-E[ri\H0])=— У m,«e. N° / = ι ^° / = ι В пределе при ε -*· 0 он обращается в τ 2Е ' о Чтобы оценить знаменатель, развернем его в виде Т/г Τ/ε _$m. <,>*-_. (3.2*) σ" [/|Я,]= ("^-)2«г 2 2 «i^^I^Ol^l· « = ι /=ι Из рассуждений на стр. 269—270 следует, что 278
Таким образом, Τ/ε 2 ^ί 2Ε Hma2[/|tfo] = lim— У m,»e= — ε->0 ε-0 #ο ^ W0 ί=1 Используя (3.2*) и (3.3*) в (3.1*), получим 2. Блок-схема приемника имеет вид (3.3*) l(r(t)) и представляет собой коррелятор, математически тождественный согласованному фильтру в задаче 3.3.1. Решение задачи 3.3.22 Уравнение оценки имеет вид КГ'а=Кг-'г. Записывая его в виде суммы, получим Τ/ε Τ/ε 2 44 = 2 44 Τ/ε Τ/ε lim 2 /Cj/a.= lim У 4/ri» 0 < t < Γ/ε. ε-*0 ;=! у ε-*0 ^Ξι Суммы в пределе обращаются в интегралы и мы имеем ι τ τ J K~l (t, и) а (и) du= J КГ' (*. u) r (") <*w> ° < * < Л о о что и требовалось найти. Решение задачи 3.4.4 Интегральное уравнение, которым определяются собственные значения и собственные функции, имеет вид (3.46) λΦ(0= J KnV, и)Ф(и)аи, —T<t<T. — г Сначала допустим, что Kn(t, и) положительно определено и τ τ J J \Kn{t, u)\*dtdu < oo. ,— T —T Тогда ортогональная система собственных функций образует полную ортонор- мированную систему и для любой функции f(t), которая интегрируема в квадрате, 27 9
можно записать f(t) = Σ fi^>i(t) (гДе равенство надо понимать в смысле предела в среднем). Рассмотрим теперь τ τ λ*Δ j* j f(t)Kn(t, u)f(u)dtdu, — Γ —Τ τ при f f2 (i)dt=\. Вставив разложение для f(t), получим -τ Τ Τ οο οο λ*= ί ί ΣΣΚί*φ*(*)Κη(ί.4)Φί(ιι)άί(Ια = -Τ—Τ ί i Τ οο οο Τ -Γ i ι -Τ = 22^/^7 ί Φι(0Φ;(0<« « / или λ*=22/ζ·/7·λ7·δυ=2λί/Λ Обозначим наибольшее собственное значение через λχ: так как Итак, λ*= 2 λ/^·2<λι2 /*2 = λι> ί = 1 /=1 J /■(*)* = 2/ι2=1. —г ί = 1 λι> J J f(t)Kn(t, u)f(u)dtdu. — T — Γ Равенство соблюдается, если /(ί) = Φι(0, когда имеется одно наибольшее собственное значение. Если наибольшее собственное значение имеет кратность М, то любая взвешенная сумма соответствующих собственных функций дает равенство. Если Kn(t и) является только неотрицательно определенной, то аналогичное рассуждение ведет к такому же результату. Решение задачи 3.4.6 Указанные операции показаны на рисунке. № Τ \s(t! φ) ι Π з -Τ/2 Τ/2 ,1 -w w Ά /*β(*) 280
I. Согласно теореме Парсеваля: оо W EDB = J | ΪΟΒ (0 |2 ** = ( | FDB (П |2 *f> (3· 1*) — oo —Ψ Γ/2 ^db(/)= ί 7(0ехр(-/2я/0Лдля |./|<JT. -Г/2 Подставляя FDB в (3.1*), получим W Г/2 Г/2 £DB= J J / (0 exp (— /2π/0 dt ] f (и) ехр (/2л/и) dt/d/, — W— Г/2 —Г/2 Г/2 Г/2 W Еп*= f j f(t)f(u)dtdu $exp(-j2nf(t-u))df, — Г/2 —Г/2 - W 772 Г/2 зш2яГ(^ — и) 'DB~ EDB=. \ Λ/0) \ f(u) ,, ' du. -Γ/2 -Γ/2 *(0 Используя неравенство Буняковского—Шварца, имеем Г/2 Г/2 4в< J /f(0^ | g*V)dt. -Г/2 -Г/2 Знак равенства соблюдается, если g(t) = Kf(t). Т£2 ,, sin2nW(t — и) , Τ л Τ Knt)= S /(ц) „(/-«) "■ -τ^τ· (*·2*) — Γ/2 ν ' Отсюда видно, что собственная функция, определяющая f(t)t является просто уравнением, определяющим собственные значения и собственные функции ядра к Sin2nr(M| π (t—u) Требуется сделать постоянное К как можно большим. Однако оно должно быть собственным значением (3.2*). Следовательно, Ε DB будет максимизировано, если f(t) является собственной функцией интегрального уравнения с наибольшим собственным значением λχ Г/2 EDB = K J f*(t)dt. (3.3*) — Г/2 Ε \ Tf2 -Г/2 y*-lT=-f I f2V)dt. (3.4*) Потребуем, чтобы £=. J P(i)dt. — OO Ясно, что γ максимизируется, если потребовать, чтобы /(0=о, Kl>-f- 281
Тогда Υ=λι· Из результатов, полученных на стр. 228—231, известно, что оптимальная функция f(t) будет угловой функцией вытянутого сфероида. 3. При WT = 2,55 для получения у можно использовать рис. 3.12. Р_ Ί=Κ_= *'V = _LQ_=JA =0,196. Ε ΡΤ 2WT 5,10 Решение задачи 3.4.8 Ковариационная функция имеет вид 1— \t — u\, \t — u\ < 1, k0 во всех прочих точках. Прежде всего необходимо найти дифференциальное уравнение. Из (3.46) Kn(t-u) = [{ Τ Ί λΦ(0= $(l—\t — u\)<b(u)du = l(\—t+u)<b(u)du + о о τ + J(l + i—И)Ф (u)du. (3.1*) (3.2*) Дифференцируя, получим t τ λΦ(0 = Φ(0— $<b(u)du— Ф(0+ J Φ (и) da, о * 2 Φ (0 = — Τ" φ (0 (полагая λ > 0). Решение этого уравнения не вызывает затруднений, \ = Ь\ (3.3а*) Ф(/)= Cle/bt+c2e"ibt. (3.36*) Для отыскания постоянных сначала подставим (3.3а)* в (3.1*): 2 t τ τ — ф(*) = \(\ — t + u)Q>(u)du+ U\ + t—u)Q>(u)du = \ Φ (и) du + о t о r t + ]*(/ — и)Ф(и)<*и+2]* (и—t)<b(u)du. (3.4*) о о Подстановкой (3.36)* в (3.4*), интегрированием и перегруппировкой членов получим -J-Me'W+O-c, (e-/^+0]+ Г-т(е/6Г-0 +^(ΐ-β"/&7) - /6 L ib ib 62 282
Чтобы Φ(ί) удовлетворяла интегральному уравнению, коэффициент члена, содержащего t, и постоянный член вместе должны быть равны нулю С1(е''6г+1) = с2(е-''6г+1)· Из этого следует, что (-f-)=C2exp( -f)· Подставляя теперь с2 = с1 exp (jbT) в постоянный член, получим -L(e^_l)+-L(e^_1)_J-(l+e/6r)_ _^(е/"-_1)—1-(β/«·+ΐ) = 0. 2=1(е/бг_1)я=А(е/бг+1); 1 о 27^(ехр(т")-ехр("^)) = т(ехр(^7~) + ехр( }ЬТ ИЛИ tg ЬТ 2 ; (2—Т)Ь Это трансцендентное уравнение, которое можно решить относительно Ь, Φί (0 = cte l + с2е l =c1\e l +e l ) = (3.5*) ; сх exp (Μ)μ.,(ί_ΐ))+,(4-{ -*ιβχρ(^) со. [б, (*--£)]. Фг(0 = Ссо8[/^(.-^)], (3.6*) где с—нормировочная постоянная. Формулу (3.6*) можно также записать в виде •i(0-«'[co.(|/"|r')+(t«l/^(-f)).In(j/- h и свести к *«-'■[« {уЪ)+[-£fr)'4v £')]■ 283
Литература 1. Давенпорт В. Б., Рут В. Л. Введение в теорию случайных сигналов и шумов. Пер. с англ., под ред. Р. Л. Добрушина. Изд-во иностранной литературы, 1960. 2. Миддлтон Д. Введение в статистическую теорию связи. Пер. с англ. под ред. Б. Р. Левина. Изд-во «Советское радио», т. 1, 1961, т. 2, 1962. 3. Курант Р., Гильберт Д. Методы математической физики. Гостех. издат, т. 1, 1933, т. 2, 1951. 4. R iesz F., S z.-N agy В. Functional Analysis. Ungar, New York, 1955. 5. L о w i t t W. V. Linear Integral Equations. McGraw-Hill, New York, 1924. 6. Трикоми Ф. Лекции по уравнениям в частных производных. Пер. с англ. Изд-во иностранной литературы, 1957. 7. Ρ а й с С. О. Теория флуктуационных шумов. Пер. с англ. в сб. «Теория передачи электрических сигналов при наличии помех» под ред. Н. А. Же- лезнова. Изд-во иностранной литературы, 1953. 8. В а н-д е р-3 и л. Флуктуации в радиотехнике и физике. Пер. с англ. Госэнергоиздат, 1958. 9. S 1 е ρ i a n D. Estimation of Signal Parameters Γη the Presence of Noise. Trans. IRE, 1954, v. PGIT-3, March, p. 68. 10. Youla D. The Solution of a Homogeneous Wiener-Hopf Integral Equation Occuring in the Expansion of Second-Order Stationary Random Functions. Trans. IRE, 1957, v. IT-3, Sept., p. 187—193. 11. Л э η и н г Дж. X., Б э тт и н Р. Г. Случайные процессы в задачах автоматического регулирования. Пер. с англ., под ред. В. С. Пугачева. Изд-во иностранной литературы, 1958. 12. Darlington S. Linear Least-Squares Smoothing and Predictions with Applications. Bell Syst. Tech. J., 1958, v. 37, Sept, p. 1221—1294. 13. Хелстром К· Статистическая теория обнаружения сигналов. Пер. с англ., под ред. Ю. Б. Кобзарева. Изд-во иностранной литературы, 1963. 14. Η е 1 s t r о m С. V/. Solution of the Detection Integral Equation for Stationary ^Filtered White Noise. Trans. IEEE, 1965, v. IT—11, July, p. 335—339. 15?)S 1 e ρ i a n D., Pollak H. O. Prolate Spheroidal Wave Functions, ^—"Fourier Analysis and Uncertainty — I. Bell Syst. Tech. J., 1961, v. 40, p. 43— 64. 16. L a n d a u H. J., Pollak H. O. Prolate Spheroidal Wave Functions» Fourier Analysis and Uncertainty — II. Bell Syst. Tech. J., 1961, v. 40» p. 65—84. 17. L a n d a u H. J., Pollak H. O. Prolate Spheroidal Wave Functions, Fourier Analysis and Uncertainty — III: The Dimension of the Space of Essentially Time - and Band - Limited Signals. Bell Syst. Tech. J., 1962, v. 41, p. 1295. 18. Flammer С Spheroidal Wave Functions. Stanford University Press, Stanford, 1957. 19. S tr a t t on J. Α., Μ ο r s е Р. Μ., С h u L. J., L i t t 1 e J. D. C, CorbatoF. J. Spheroidal Wave Functions. MIT Press and Wiley, New York, 1956. 20. Ρ a r ζ e η Ε. Stochastic Processes. Holden-Day, San Francisco, 1962. 21. Rosenblatt M. Random Processes. Oxford University Press, New York, 1962. 22. Ζ a d e h L. Α., R a g a ζ ζ i η i J. R. Optimum Filters for the Detection of Signals in Noise. Proc. IRE, 1952, v. 40, p. 1223. 23. Η u a n g R. Y., Johnson R. A. Information Transmission with Time- Continuous Random Processes. Trans. IEEE, 1963, v. IT—9, № 2 (April), p. 84—95. 24. К e 1 1 у Ε. J., Root W. L. A Representation of Vector—Valued Random Processes. MIT, Lincoln Laboratory, Group Report 55—21, revised, April 22, 1960. 25. К a r h u η e η Κ· Ober Linearen Methoden in der Wahrscheinlichkeit- srechnung. Ann. Acad. Sci. Fennical, Ser. A, 1946, v. 1, № 2. 284
26. Л о э в М. Теория вероятностей. Пер. с англ., под ред. Ю. 6. Прохорова. Изд-во иностранной литературы, 1962. 27. Г н е д е н к о Б. В. Курс теории вероятностей, изд. 3-е. Физматгиз, 1961. 28. Б а р τ л е τ τ Μ. С. Введение в теорию случайных процессов. Пер. с англ., под ред. Б. А. Севастьянова. Изд-во иностранной литературы, 1958. 29. Ρ а р о и 1 i s A. Probability, Random Variables, and Stochastic Processes. McGraw-Hill, New York, 1965. 30. L о e ν e M. Sur les Functions Aleatoires Stationnaires de Second Order. Rev. Sci., 1945, v. 83, p. 297—310. 31. Η ildebrand F. В., Methods of Applied Mathematics. Prentice-Hall, Inc., Englewood Cliffs, New Jersey, 1952. 32. В a g g e г о e r A. B. A State-Variable Technique for the Solution of Fred- holm Integral Equations. 1967 IEEE International Conference on Commuin- ication, Minneapolis, Minnesota, June 12—14, 1967. 33. В a g g e г о e r A. B. A State-Variable Technique for the Solution of Fred- holm Integral Equa MIT, RLE, Technical Report № 459, July 15, 1967. 34. Ν ο r t h D. O. Analysis of the Factors Which Determine Signal/Noise Discrimination in Radar. RCA Tech. Rep. PTR — 6—C, June 1943; reprinted in Proc. IRE, 1963, v. 51, July, p. 1016—1028. 35. К a i 1 a t h T. Some Integral Equations with 'Nonrational' Kernels. Trans. IEEE, 1966, v. IT—12, № 4 (October), p. 442—447.
4. Обнаружение сигналов. Оценка параметров сигналов 4.1. Введение В главе 2 были сформулированы классические задачи обнаружения и оценки сигналов. Чтобы дать основные исходные сведения для нескольких областей, сначала была изучена достаточно общая задача. Затем, в § 2.6 гл. 2 были исследованы более точные результаты, получаемые в рамках общего гауссова случая. В главе 3 был развит метод представления непрерывных процессов несколькими способами. Одно из представлений, которое было рассмотрено подробно, пригодно главным образом для гауссовых процессов. Теперь используем эти представления с тем, чтобы распространить результаты классической теории на случай, когда результаты наблюдения являются непрерывными функциями времени (непрерывными колебаниями). 4.1.1. Модели Задачи, которые нас интересуют в данной главе, можно разделить на две категории. К первой категории относятся задачи обнаружения, возникающие в трех обширных областях: цифровая связь, радио- и гидролокация, опознание образов и классификация. Ко второй категории принадлежит задача оценки параметров сигналов, которая также встречается в указанных трех областях. Обнаружение. Общепринятая модель простой цифровой системы связи изображена на рис. 4.1. Источник сообщения выдает двоичную цифру (либо 0, либо 1) каждые Τ секунд. Наиболее просто и естественно построить такую систему связи, которая передавала бы в течение каждого интервала времени либо / Etos0(t)> либо ]/Et^t). В типичной космической системе связи претерпевшая ослабление копия переданного сигнала будет приниматься с пренебрежимо малыми искажениями. Принятый сигнал содержит ι/ Ε^(ί) или /Ε^ί) и компоненту аддитивного шума. Способ задания помехи зависит от конкретной области применения. Одним из источников помех, который всегда имеет место, является тепловой шум. Шумы входных цепей и каскадов приемника можно моде- 286
лировать как выборочную функцию нормального случайного процесса. По мере ознакомления с более сложными моделями мы будем встречаться и с другими источниками помех, которые могут оказаться более существенными, чем тепловой шум. Во многих случаях систему можно перестроить так, что влияние этих других помех будет полностью устранено. Тогда помехоустойчивость системы будет ограничиваться только тепловым шумом. В большинстве систем спектр теплового шума равномерен в интересующем диапазоне частот и его можно характеризовать посредством спектральной плотности NJ2 Дж/Гц. n(t) Источник — ■■>* Передатчик sAt)uiiA sf(t) φ ■<ν Приемник (на каждом интервале длительностью Τ сек) Получатель 0,1,1,1 Рис. 4.1. Цифровая система связи (система передачи дискретных сообщений). Другой обычно используемой формой задания является эффективная шумовая температура Те (например [1], [2] гл. 10). Эти две величины связаны простым соотношением N0 = kTe, (1) где k = 1,38· Ю-23 Дж/°К — постоянная Больцмана, Те — эффективная температура шума в градусах Кельвина (° К). Таким образом, в данном случае построение приемника можно характеризовать как задачу обнаружения одного из двух известных сигналов на фоне аддитивного белого гауссова шума. Если рассмотреть возможную систему более подробно, то построение типичного передатчика может иметь вид, показанный на рис. 4.2. Передатчик имеет генератор с номинальной средней частотой сос. Генератор бинарно модулируется по фазе в соответствии с тем, что имеется на выходе источника — 1(0°) или 0(180°). Мгновенная фаза генератора изменяется медленно и в приемнике может быть предусмотрено некоторое вспомогательное устройство для ее измерения. Если фаза изменяется медленно, то, как мы увидим, возможно ее точное измерение. Когда это условие выполняется, данную задачу можно моделировать так же, как и рассмотренную выше. Однако, если измерение выполняется неточно, то наша модель должна учитывать соответствующую неопределенность фазы. Системой связи второго типа является магистральная радиолиния ионосферного рассеяния (рис. 4.3), в которой передаваемый сигнал рассеивается соответствующими слоями ионосферы. В типичной системе можно передавать «единицу» посылкой синусоидального колебания определенной частоты, а нуль — посылкой синусоидального колебания другой частоты. Принимаемый сигнал может изменяться, как показано на рис. 4.4. Здесь на входе приемника действует сигнал, 287
Источник Генератор ]е'т[<*сиф(Щ Ч \ Передабаемый сигнал ( бинарный,<РМ) w Передатчик Рис· 4.2. Элементы типичной системы передачи. Передатчик Рис. 4.3. Линия связи ионосферного рассеяния. Изменяющаяся во бремени , огиоаннцая Изменяющаяся частота сигнала ω< ωη о1 ωή -ι 1 0 Τ 2Τ jt hi sr Рис. 4.4. Компонента сигнала в Ганале с изменяющимися во времени пара· метрами. т
флуктуирующий по амплитуде и фазе. В обычно используемом диапазоне частот аддитивный шум является гауссовым. Соответствующие задачи существуют и в радиолокации. Обычная импульсная РЛС излучает сигнал, изображенный на рис. 4.5. Если цель присутствует, то от нее отражается последовательность импульсов. Если цель флуктуирует, то амплитуда и фаза отраженных импульсов изменяются. Отраженный сигнал представляет собой последовательность импульсов, амплитуда и фаза которых неизвестны. Задача заключается в исследовании этой последовательности при наличии шума приемника и в определении факта присутствия цели. ^ J1 I И- μ—δ—-J a) f , -»—ι—-—t- Рис. 4.5. Сигналы в радиолокационной модели: а —передаваемая последовательность радиоимпульсов; б —принимаемая последовательность импульсов (временные сдвиги не показаны). Между двумя указанными областями существует очевидное сходство, однако имеется и некоторое различие. 1. В цифровой системе связи ошибки обоих типов (регистрация 1 при условии, что передавался 0, и наоборот) обычно имеют одинаковое значение. Кроме того, сигнал может присутствовать по обеим гипотезам. Это придает задаче симметрию, чем можно воспользоваться. В радио- и гидролокационной системе ошибки обоих типов почти всегда имеют неодинаковое значение. Кроме того, сигнал может присутствовать только по одной гипотезе. Это означает, что задача, вообще говоря, является несимметричной. 2. В цифровой системе связи вероятность ошибки обычно служит достаточной мерой качества (помехоустойчивости) системы. В радио- и гидролокационной системе, как правило, необходима достаточно полная рабочая характеристика приемника. 3. В цифровой системе связи передается последовательность цифр (разрядов). Следовательно, ошибки в цифрах могут быть исправлены, если предусмотреть определенную структуру последовательности. В радио- и гидролокационной системе такой возможности не имеется. Несмотря на^эти различия, большое число основных результатов можно использовать в обеих областях. Оценки. Второй интересующей нас задачей является оценка параметров сигнала, которая встречается как в связи, так и в радио- и гидролокации. Сначала обсудим соответствующую связную задачу. 10 Зак. 693 289
Рассмотрим источник аналогового сообщения, изображенный на рис. 4.6, а. Ради простоты положим, что выходная величина источника есть выборочная функция случайного процесса с ограниченным спектром (двусторонний симметричный спектр шириной 2W Гц). Тогда мы можем брать его отсчеты через каждые 1/2 W секунд, не теряя информации. Другими словами, имея эти отсчеты на приемном конце, мы можем восстановить сообщение точно (см. например, Найквист Аналоговый источник a(t) ч/ V Дискретизатор А 2 Α Αί> т I t Τ а) V Значения отсчетоб: -ч* Модулятор ЧИМ ЛЖЛ в) Рис. 4.6. Передача аналоговых сообщений. [4] или задачу 3.3.6) Каждые Τ секунд (Т = I/2W) передается сигнал, который зависит от конкретного значения At в момент последнего отсчета. В системе рис. 4.6, б амплитуда синусоиды определяется величиной At. Подобную систему называют системой амплитудно-импульсной модуляции (АИМ). В системе 4.6, в от значения отсчета зависит частота синусоиды. Такую систему называют системой частотно-импульсной модуляции (ЧИМ). Сигнал передается по каналу и искажается помехами (рис. 4.7). Принятый на /-ом интервале сигнал можно представить в виде r(t) = s(t9Ai)+n(t)f 7\</<Г/+1. (2) Приемник должен оценить значения последовательно передаваемых Αι и использовать эти оценки для восстановления сообщения, ?90
Типичная радиолокационная система показана на рис. 4.8. В обычной импульсной РЛС передаваемый (излучаемый) сигнал представляет собой синусоидальное колебание с прямоугольной огибающей 5|(*)«(^81'П0с' 0<ί<7\ (3а) 10 при других t. Отраженный сигнал задерживается на время распространения радиоволн до цели и обратно. Если цель движется, то имеет место допплеров- t a(t)m Дискретизатор и передатчик s(i ^® r(t) А ИМ или ЧИМ Приемник Рис. 4.7. Система передачи параметра. ский сдвиг частоты. Наконец, из-за флуктуации цели амплитуда и фаза сигнала приобретают случайный характер. Принятый сигнал в отсутствии шума можно записать в виде $Т (t) - \υ ^2Et Sin [((°c + ω°) {t _τ) + ФЬ при других t. (36) Здесь мы оцениваем τ и oiD (или, что эквивалентно, дальность и скорость цели). И на этот раз между связной и радиогидролокационной задачами имеется очевидное сходство. Основные различия сводятся к следующим. Цель ^^бкорость V. Передатчик Ь-*— Приемник Рис. 4.8. Блок-схема радиолокационной системы. 1. В связном контексте At есть случайная величина, плотность вероятности которой обычно известна. В радиолокации известными являются интересующие нас пределы дальности и скорости. Однако параметры лучше всего считать неслучайными величинами (см. например, § 2.4). 10* 291
U. б радиолокации указанное затруднение может усложняться отсутствием или недостатком сведений о наличии цели. Поэтому задачи обнаружения и оценки могут встречаться одновременно. 3. Почти во всех задачах радиолокации опорной фазы не имеется. Другие представляющие интерес модели будут появляться естественно по ходу изложения. 4.1.2. Организация материала главы Поскольку данная глава имеет большой объем, важно понять ее построение в целом. Основной подход к решению задачи можно разбить на три этапа. 1. Наблюдение представляет собой колебание r(t). Поэтому пространство наблюдений может иметь бесконечное число измерений. Первый этап — отображение принятого сигнала в некоторое удобное пространство решений или оценок. Благодаря этому данная задача сводится к задаче, рассмотренной в главе 2. 2. В задаче обнаружения мы далее выбираем области решений и вычисляем рабочую характеристику приемника или Ρ(ε). В случае задачи оценки мы оцениваем дисперсию или средний квадрат ошибки (сред- неквадратическую ошибку). 3. Полученные результаты исследуются с тем, чтобы выяснить, какие выводы из них можно сделать относительно построения и помехоустойчивости системы. Мы выполним указанные этапы последовательно для ряда моделей возрастающей сложности (рис. 4.9) и изложим задачи обнаружения и оценки параллельно. Подчеркивая их параллельный характер в простых случаях, можно значительно сэкономить на изложении материала в более сложных случаях, рассматривая только одну задачу в основном тексте и оставляя другую в качестве упражнения. Мы начинаем с простых моделей, а затем перейдем к более сложным. Возникает логичный вопрос: если задача столь проста, то почему же данная глава получилась столь объемистой? Это явилось результатом наших усилий определить, как модель и ее параметры влияют на Канал Аддитивный белый шум Аддитивный коррелированный (небелый) шум Простой канал со случайными параметрами Несколько (М) каналов Обнаружение сигнала Простое бинарное Бинарное, общий случай Многоальтернативное (М гипотез) Оценка параметров сигнала Один параметр, линейная Один параметр, нелинейная Несколько (М) параметров Рис. 4.9. Последовательность моделей. 292
структуру и помехоустойчивость системы. Мы считаем, что только путем подробного изучения некоторых характерных задач можно должным образом оценить прикладное значение теории. Прежде чем приступить к решению, будет уместным дать краткий исторический очерк. Математические основы для нашего подхода к этой задаче были заложены Гренандером [5]. Задача обнаружения в связи с оптимальными радиолокационными системами была разработана в лаборатории методов передач МассачусетскоТо технологического института (например, Лоусон и Уленбек [6]) в начале 40-х годов. Несколько позднее Вудворт и Девис [7, 8] подошли к радиолокационной задаче иным путем. Задача обнаружения была сформулирована примерно в то же самое время аналогично нашей постановке вопроса в работе Петер- сона, Бердсалла и Фокса [9] и в работе Миддлтона и Ван-Митера [10]. Задача оценки была впервые решена Слепяном [11]. Параллельные результаты со связным уклоном были получены Котельниковым [12, 13] в СССР. Книги Хелстрома [14], а также Вайнштейна и Зубакова [15] посвящены почти исключительно радиолокации. К числу книг, посвященных исключительно проблемам связи, относятся работы Ко- тельникова [13], Гармана [16], Багдади(ред. [17]), Возенкрафта и Дже- кобса [18], Голомба и др. [19]. Последние две части книги Миддлтона [47] охватывают ряд вопросов обеих областей. Помещая эти задачи рядом, мы надеемся обратить внимание читателя на их внутреннее сходство и оттенить их различие. 4.2. Обнаружение и оценка на фоне белого гауссова шума В этом параграфе формулируются и решаются задачи обнаружения и оценки для случая, когда помехой является аддитивный белый гауссов шум. Рассмотрим сначала задачу обнаружения применительно к простому бинарному случаю, общему бинарному случаю и многоальтернативному случаю. Используя понятие достаточной статистики, просто выводятся структуры оптимального приемника и оценивается их помехоустойчивость. Наконец, мы исследуем восприимчивость оптимального приемника к различного рода частным допущениям нашей модели. Как было показано при классическом рассмотрении, задачи обнаружения и оценки тесно связаны; линейное оценивание является по существу тем же самым, что и простое бинарное обнаружение. Когда мы перейдем к рассмотрению нелинейной задачи оценки, то будут развиты новые аспекты как в смысле определения структуры устройства оценки, так и в смысле оценки его помехоустойчивости. 4.2.1. Обнаружение сигналов в аддитивном белом гауссовом шуме Простое бинарное обнаружение. В простейшей задаче бинарного обнаружения принятый сигнал по одной из гипотез представляет собой полностью известный сигнал ΥEs(t) на фоне аддитивного белого гаус- 293
сова шума w(t) с нулевым средним значением и спектральной плотностью JV0/2; принятый сигнал по другой гипотезе представляет собой один шум w(t). Таким образом, r(t,{VEs(t) + w(t), О < / < Τ: Н1г О < t < Τ: Я0. Для удобства примем, что ]s*(t)dt = \, (4) (5) так что Ε есть энергия принятого сигнала. Задача заключается в том, чтобы наблюдая r(f) на интервале [0, 7Ί, решить, какая из гипотез Н0 или Нх — является истинной. Критерием может быть либо критерий Неймана — Пирсона, либо критерий Байеса. Следующие соображения облегчат нам решение данной задачи. 1. Результат нашего наблюдения есть непрерывное во времени случайное колебание. Первый шаг — свести его к множеству случайных величин (возможно, счетному бесконечному множеству). 2. Одним из методов является разложение в ряд (см. гл. 3): к г(0 = l.i. т. 2 γ,Φ^Ο; 0<f<7\ (6) Когда К =/(', имеется К коэффициентов ряда г19 ..., гк\ которые можно обозначить вектором г/с. В последующем рассмотрении мы опустим подстрочный индекс К' и будем обозначать коэффициенты через г. r(t) Непрерывное колебание Разложение по координат\ ным осям Вращение координатный f осей Решающее устройство Вектор с бесконечным ~ 1ц числом измерении " Достаточная статистика Рис. 4.10. Генерация достаточной статистики. 3. В гл. 2 мы видели, что если г преобразовать в два независимых вектора 1 (достаточная статистика) и у, как показано на рис. 4.10, то наше решение может основываться только на 1, поскольку значения у не зависят от гипотезы. Преимущество данного метода заключается в том, что размерность пространства решений сводится к размерности вектора 1. Поскольку рассматриваемая задача является бинарной, то, как известно, вектор 1 будет одномерным. 294
Этот метод прямо ведет к цели. Если выбрать в качестве первой ортонормированной функции s(t), то первый коэффициент разложения будет нормальной случайной величиной о J s (t) [VEs (t)+w(t)] dt = YE+w1: HL. (7) Остальные гг(1 > 1) — нормальные случайные величины, которые можно получить, используя некоторый произвольный ортонормальный ряд, члены которого ортогональны П = $<bt(t)w(t)dtbwt:H0, °т _ ίφΐ. J Φ, (t) [VE s(t)+w(t)] dt = wt: Нг. (8) Из гл. З (44) известно, что E(wiwj)=0; ьф\. Так как wt и w} — совместно нормальны, то они являются статистически независимыми (см. свойство 3 на стр. 221). Видно, что только гх зависит от того, какая гипотеза истинна. Далее, все rt(i > 1) статистически независимы от гх. Таким образом, гх есть достаточная статистика (гх = /). Прочие rt соответствуют у. Поскольку они не влияют на решение, то нет необходимости и вычислять r(t) Г dt J0 Сравнение с порогом Рис. 4.11. Корреляционный приемник. их. Отсюда непосредственно следует несколько эквивалентных структур приемного устройства. Структура рис. 4.11 носит название корреляционного приемника. Он ставит входное колебание r(t) в соответствие (коррелирует) хранящейся в памяти приемника копии сигнала s(t). Выходное колебание есть гг, являющееся достаточной статистикой (гх = /) и гауссовой случайной величиной. Коль скоро гх получено, задача на принятие решения становится тождественной классической задаче, рассмотренной в гл. 2 (в частности пример 1, стр. 39—41). Для вынесения решения необходимо сравнить / с порогом. 295
Эквивалентная реализация показана на рис. 4.12. Импульсная характеристика линейной системы есть просто обращенный и сдвинутый во времени сигнал Λ(τ)=β(Γ—τ). (9) Выходное колебание в момент времени Τ есть требуемая статистика /. Такой приемник называется приемником с согласованным фильтром, (Он впервые был разработан Нортом [20]). Математически обе структуры тождественны. Выбор используемой структуры зависит исключительно от простоты реализации. r(t) Линейная система Ь(х)" Наблюдение β момент времени t-T s(T-r); о Сравнение с порогом при др. Ь Рис. 4.12. Приемник с согласованным фильтром. Точно так же, как в примере 1 гл. 2, достаточная статистика / по любой гипотезе является гауссовой. Легко определить ее среднее и дисперсию: E(l\H^^E(rx\H^VE, Е(1\Н0) = Е(Г1\Н0)=0, σ*(1\Η0) = σ41\Η1) = ^. (10) Таким образом, можно использовать результаты (64) — (69) гл. 2, полагая d = (τ) 1/2 (Π) В этом случае непосредственно применимы кривые рис. 2.9, а и 2.9, б гл. 2, которые воспроизведены на рис. 4.13 и 4.14. Видно, что достоверность зависит только от энергии Ε принимаемого сигнала и спектральной плотности Ν0 шума, а форма сигнала значения не имеет. Это обстоятельство интуитивно представляется вполне логичным, поскольку по всем координатам шум одинаков. Ключом к упрощению решения задачи обнаружения служит понятие достаточной статистики, использование которого позволяет свести пространство наблюдений с бесконечным числом измерений к одномерному пространству решений. 296
Очевидно, что даже если мы и не осознаем того, что достаточная статистика имеется в нашем распоряжении, нам следует использовать тот же приемник. Чтобы показать это, мы непосредственно построим отношение правдоподобия. Три обстоятельства позволяют нам легко получить решение задачи. 1. Если аппроксимировать r(t) некоторым конечным рядом чисел Гц ···» гк, (г), то получим задачу классической теории обнаружения, которую мы можем решить. р* [ ъ »А 0,6 ол 0,2 -— ^--^91 ^-<Г ^"^s^/ /<$> /^ / / /ФАА / 7 / А '' 1 / / / 1 / / / ι / / / г / / / / / / / / / / / / 7/ / // / // / к/ к ι ι ι 1 1 Μ ОЛ Ofi 0,8 /? Рис. 4.13. Рабочая характеристика приемника: известный сигнал на фоне аддитивного белого гауссова шума. Рис. 4.14. Зависимость вероятности обнаружения от (2£/W0)ly4 2. Если выбрать ряд rl9 r2, ..., гк так, чтобы наблюдения были условно независимы, т. е. к = Π Рг.|я.(^.|Я,), ί = 0,1, (12) то задача становится легко разрешимой. 3. Поскольку известно, что для полного представления r(t) необходим бесконечный ряд чисел, то будем искать решение в такой удобной для нас форме, чтобы можно было положить /С-> оо. Обозначим приближение, при котором используется К коэффициентов, через rx(t). Таким образом, rK(t)= Σγ,Φ,Μ, 0<ί<7\ (13) ί=1 где ri=]r(t)Oi(t)dt, /=1,2,..., К, о (14) 297
и Φί(ί) принадлежат к произвольной полной ортонормальной системе функций. Используя (14), можно видеть, что по гипотезе Я0 Γ, = ία4ί)Φ,(ί)Λ = α>,, О5) о а по гипотезе Нг τ __ τ ri = $VEs(t)<l>t(t)dt + $w(t)<l>t(t)dt = st + wi. (16) о о Коэффициенты Sj соответствуют разложению сигнала в ряд 3κ(0*Σ4<Μ0, о<г<г (17) (=1 V~Es(t) =limsK(0· (18) /С-юо Все rt являются гауссовыми величинами с известными статистиками E(rt\Ho) = 0, E(rt\H1)=si, - ^щ o*(ri/H0) = o*(ri\H1) = -^. 4 Поскольку шум является белым, эти коэффициенты независимы в любой системе координат. Отношение правдоподобия имеет вид Π _-W- 1 {Ri~s^) Λ υ κ (t)\ — — —^ - ^ . (2U) Логарифмируя и приводя подобные члены, получим к к 1пА[гк (f)] = A J RiSi - -±- 2 «ι2· (21) Эти две суммы легко записать в виде интегралов. По теореме Парсева- ля У Risi=]rK(t)sK(t)dt г=1 0 и (22) /=1 0 298
Теперь мы имеем логарифм отношения правдоподобия в форме, удоб-. ной для перехода к пределу: l.i.m lnA[rK(t)]bJnA[r(t)]=2-^]r(t)s(t)dt--?-. (23) Первый член есть просто достаточная статистика, которая была получена выше. Второй член есть смещение. Окончательно критерий отношения правдоподобия имеет вид 2-YJL\r(t) s{t)dt ^ 1ηη+ — . (24) (Напомним из гл. 2, что η есть постоянная величина, которая зависит от стоимостей и априорных вероятностей при критерии Байеса и от требуемой вероятности ложной тревоги PF при критерии Неймана— Пирсона.) Следует заметить, что хотя плотность вероятности Pr{t)\m{r{t)\Hi) не является вполне определенной для любой из гипотез, отношение правдоподобия определяется полностью. Прежде чем перейти к более общим задачам, следует подчеркнуть два отдельных момента задачи обнаружения сигналов. 1. Сначала мы сводим принятое колебание к единственному числу, являющемуся точкой в пространстве решений. Эта процедура физически реализуется операцией корреляции; она инвариантна к выбираемому критерию решения. Указанная инвариантность имеет большое значение, поскольку она позволяет нам строить устройство обработки сигналов, не связывая себя с выбором какого-либо конкретного критерия. 2. Коль скоро принятое колебание отображено в пространство решений, нам остается учитывать только существенные особенности задачи. Но раз мы перешли к пространству решений, задача становится точно такой же, какая изучалась в гл. 2. Фактически принятое колебание не имеет уже значения и все физические ситуации, которые приводят к одной и той же картине в пространстве решений, являются для наших целей идентичными. Из нашего простого примера видно, что все сигналы одинаковой энергии отображаются в одну и ту же точку пространства решений. Вполне очевидно поэтому, что форма сигнала значения не имеет. Разделение двух указанных частей задачи ведет к более четкому пониманию фундаментальных вопросов. Общая бинарная задача обнаружения на фоне белого гауссова шума. Результаты для простой бинарной задачи легко распространить на общий бинарный случай. Пусть г (t) = [VEl si(t) + w(t)t 0 < t < Τ: Hlf 2g 299
где s0(t) и s^t) — нормированные, но необязательно ортогональные сигналы. Обозначим коэффициент корреляции между этими сигналами через τ P^s0(t)Sl(t)dt. О (Заметим, что |р| ^ 1, так как сигналы являются нормированными.) Выберем первые две ортогональные функции следующим образом: <S>1(t) = s1(t), 0<_/<7\ (26) Ф2 (t) «ττ===- [so (t)-рМОЬ 0<ί<7\ (27) У ι—ρ2 Видно, что Φ2(ή получается путем вычитания компоненты s0(/), коррелированной с Φχ(ή9 и нормировки результата. Остальные Ф&) образуют произвольный ортонормальный ряд, члены которого ортогональны с Φχ(ή и Ф2(0 и выбраны так, что вся система является полной. Коэффициенты равны ',=}г(*)Ф,(*)Л; г = 1,2,... (28) о Все ги за исключением гг и г2, не зависят от того, какая из гипотез является истинной, и статистически независимы от гх и г2. Поэтому адекватной является двумерная область решений, изображенная на рис. 4.15, а. Среднее значение величины по каждой из координат равно Elri\H0]=VT0\s0(t)Oi(t)dt^soit i=lf2:H0 ' (29) о и τ ^[Γ,Ι^Ι^ΜΜΟΦιίΟΛ^ιι. ί=1,2,:#ι. (30) о Критерий отношения правдоподобия следует непосредственно из (327) §. 2.6 1пА= -± 2(^-s1£)24--J-2 №t -^)2^1ηη, (31а) lnA = --i-|R-slp+_L|R_s |2^1ηη> (з1б) или, после приведения подобных членов и перегруппировки результата, ^-βοίϊ^Ιηη + ^Ο'ιΓ-ΚΙ*)· (31*) 300
Таким образом, только произведение RT на разностный вектор sx — — s0 используется для принятия решения. Поэтому пространство решений разделяется на две части прямой линией, перпендикулярной вектору sx — s0, как показано на рис. 4.15, б. Компоненты шума вдоль осей гх и г2 независимы и имеют одинаковые распределения. *9*емнв) Линия решения Ю Рис. 4.15. Пространства решений. Заметим, что координаты можно преобразовать, как показано на рис. 4.15, б. Компоненты шума по новым координатам по-прежнему независимы, только коэффициент по координате I зависит от выбора гипотезы, а с коэффициентом у можно не считаться. Следовательно, Рис. 4.16. Оптимальный корреляционный приемник, общая бинарная задача. r(t) "Ψ fodt можно упростить приемник путем генерирования I вместо гг и г2. Функция, необходимая для получения статистики, есть просто нормированный вариант разностного сигнала. Обозначим разностный сигнал через sA (ή: saW^V^iMO-V^oMO- Нормированная функция имеет вид Mlv , 4ι/2 (32) (33) Схема приемника показана на рис. 4.16. [Заметим, что этот результат можно было бы получить непосредственно выбором /а(0 в качестве первой ортонормированной функции.] 301
Таким образом, бинарная задача вновь свелась к одномерному пространству решений. Статистика I является гауссовой Ε(1\Ηύ- Ει— VE<iE1(> (Ε1-29^Ε0Ε1+Εο)1/2 ' E(l\H0) = - /EpEtp-Eo (34) (35) '(Ει^ρ/ΕοΕί+Εο)'/2 Дисперсия, как и прежде, равна Ν0/2. Таким образом, (Р=^-(Е1+Е0-2рУЁ~Щ). Заметим, что если нормировать систему координат так, чтобы дисперсия шума была единичной, то d будет расстоянием между двумя сигналами. Получающиеся при этом вероятности равны (36) P/? = erfc: Pd = erf с* f In η In η d (37) (38) Линия решён"ίο минчмольн'::": 77 "гроятностьн* ош$ки [Эти формулы совпадают с (2.67) и (2.68).] Отсюда ясен наилучший выбор сигналов. Показатель достоверности d есть монотонная функция расстояния между сигналами в пространстве решений. Для фиксированной энергии наилучшие характеристики получаются при ρ = —1, т. е. при МО = -*(*)· (39) Видим, что и на этот раз форма сигнала значения не имеет. Когда критерием служит минимальная вероятность ошибки (что вполне логично в случае бинарной системы связи), а априорные вероятности двух гипотез равны, границы области решении имеют простую интерпретацию: это перпендикуляр к отрезку прямой, соединяющей точки сигналов, проведенный через его середину (рис. 4.17). Таким образом при этих условиях приемник можно интерпретировать как приемник минимального расстояния. Вероятность ошибки равна Рис. 4.17. Пространство решений. '<·>-Л ткеч (-т) *--·«· (т)· (40) Если к тому же сигналы имеют одинаковую энергию, то упомянутый перпендикуляр проходит через начало координат, и мы просто выбираем сигнал, который в наибольшей степени коррелирован с r(t). 302
Такой приемник может быть назван приёмйиКом, осуществляющим выбор наибольшего сигнала (рис. 4.18). Эти рассуждения можно прямо распространить на случай Μ по- зиций. Многоальтернативная задача обнаружения на фоне белого гауссова шума. Допустим, что имеется Μ гипотез r(t) = YWiSi(t)+w(t), 0<*<Г:Я£. (41) Все si(t) имеют единичную энергию, но могут быть коррелированными τ ^8ί(ή8ι(ή(Κ = Ρα. м = 1,2,... ,Λί. (42) о Эта задача аналогична многоальтернативной задаче в гл. 2. Основная трудность применения критерия отношения правдоподобия при произвольном распределении стоимостей заключалась в определении границ областей решений. Займемся отысканием приемлемой системы достаточных статистик и оценим минимальную вероятность ошибки для некоторых интересных случаев. 4W Рис. 4.18. Приемник, осуществляющий выбор наибольшего сигнала. Построим сначала целесообразную координатную систему с тем, чтобы найти пространство решений с минимально возможным числом измерений. Процедура построения такой системы есть простое распространение метода, используемого для случая двух измерений. Первой координатной функцией является просто первый сигнал. Второй координатной функцией служит та компонента второго сигнала, которая линейно независима от первого сигнала и т. д. Пусть Φι (0 = %(*)■ (43а) ф2(0 = (1— р122)~1/2 [sa(f)-Pi.Mf)b (436) Чтобы построить третью координатную функцию, запишем . Фз (0 = сд [s, (t)-Cl Фг (f)-ct Ф2 (*)] (43в) и найдем q и с2 из требования ортогональности, а с3 — из требования, чтобы Ф3(0 была нормированной. (Этот метод носит наименование ме- зоз
тода Грама — Шмидта и подробно изложен в задаче 4.2.7.) Поступаем таким образом до тех пор, пока не произойдет одно из двух: 1. Будет получено Μ ортонормированных функций. 2. Будет получено N(<i M) ортонормированных функций, а остальные сигналы можно будет представить линейными комбинациями указанных ортонормированных функций. Следовательно, пространство решений будет иметь максимум Μ измерений или менее, если сигналы линейно зависимы.1) Далее мы используем эту систему ортонормальных функций для получения N коэффициентов (Ν ^ Λί) τ ^$г(0Фг(0^> * = 1,2,*...,ΛΛ (44a) о " Это статистически независимые нормальные случайные величины с дисперсией NJ2, средние значения которых зависят от того, какая гипотеза является истинной: Е[Гг\Н,]Ьти, [=\""Ν' (446) / = 1,...,М. Выражение для критерия отношения правдоподобия следует непосредственно из наших результатов в гл. 2 (задача 2.6.1). Когда критерием служит минимальная вероятность ошибки, необходимо вычислять величины N /, = 1пР,--£-2(Я«-т«)"· / = !.···.Λ1 (45) и выбрать из них наибольшую. (Вариант для другого распределения стоимостей дан в задаче 2.3.2.) Проиллюстрируем изложенное двумя примерами. 0<*<7\ ί=1,2,3,4, (46) ί=1, 2, 3, 4 Пример Si (t) = Ei = I. ■С •·Ε, Пусть 2 у/2 Τ J sin coc t + (i- a>c < 2πη Τ (η — произвольное целое число). Мы видим, что / 2 \1/2 φ1(ί) = I — sin сос t, 0 < t < Τ ( 2 \i/2 φ2(ί) = — COSCDc*, 0<*<7\ (47) X) Заметим, что речь идет об алгебраической зависимости. 304
Нетрудно заметить, что s3(0 и s4(0 есть — Φχ(ί) и — ф2(/) соответственно. Пространство решений показано на рис. 4.19, а. Области решений легко получить, когда используется критерий минимальной вероятности ошибки и априорные вероятности равны. Используя (45), получим области решений, показанные на рис. 4.19, б. % % •f Ч Рис. 4.19. Пространство решений. Пример 2. Пусть М0= (у-) 1/2 2пп sin t, Τ 1/2 4πη si n „ £, «8 (0 = ( -JT 1/2 6πη sin ■ *, 0 <t <Τ, 0 <t <T, 0<t < Τ (48) (п — произвольное целое число) и Et = E, ί=1,2,3. Теперь Φ|(0 = Μ0· < (49) В этом случае Μ = N = 3 и пространство решений является трехмерным, как показано на рис. 4.20, а. При критерии минимальной Ρ(ε) и равных априорных вероятностях области решений легко установить из (45). Границами служат плоскости, перпендикулярные к плоскости, проходящей через точки sl9 г/ # Н* ϊβκ-' ι ^ г*' а) ί) Рис. 4.20. Пространство решений при ортогональных сигналах: α—трехмерное; б—двумерное. s2 и s3. Таким образом, для принятия решения используется только проекция вектора R на эту плоскость. Следовательно, можно свести пространство решений к двумерному, как показано на рис. 4.20, б. (Коэффициенты г[ и г'г берутся по двум ортонормированным координатным функциям, используемым для определения плоскости.) 305
Заметим, что в примерах 1 и 2 системы сигналов были столь простыми, что процедуры Грама—Шмидта не потребовалось. Очевидно, эти результаты полностью аналогичны случаю гипотез в гл. 2. Как мы уже видели, вычисление ошибок по своей идее весьма просто, однако при Μ >2 обычно оказывается утомительным. Для иллюстрации этой процедуры вычислим Р(г) для примера 1. Пример 1 (продолжение). Предположим, что гипотезы равновероятны. Теперь задача стала симметричной. Следовательно, достаточно предположить, что был передан сигнал s^t) и вычислить получающуюся Р(г). (Очевидно, что Р(г) = P(e|#j), ί = 1, ..., 4). Заметим также, что ответ должен быть инвариантен к повороту системы сигналов на 45°, поскольку шум имеет круговую (центральную) симметрию. Таким образом, интересующая нас задача сводится к простой ситуации, показанной на рис. 4.21. Вероятность ошибки Ρ(ε) есть просто вероятность того, что г лежит вне первого квадранта, когда истинна гипотеза Ηλ. Теперь гг и г2 стали независимыми гауссовыми величинами с одинаковыми средними и дисперсиями: Первый, ква&ранг соот&е/пат 8:/ет правильному реш?- нин?у когд'а истинна гипотеза Ηή E(r1\H1) = E(r2 ,*>- (-f) 1/2 Рис. 4.21. Поворот сигнала. a2('i|#il· -o*(rt\Hi)=-y. (50) Ρ(ε) можно получить путем интегрирования ρ r^H^ (Rly #2|#ι) по площади, исключая первый квадрант. С другой стороны, Р(г) равна единице минус интеграл, взятый по первому квадранту: Г?/ JV0\-i/2 / (R1-yJl2)t\ Я(.)-1-[|(2я^) «р(- - J dRj. (51) Заменяя переменные, имеем Ρ -<-Ы-(ЭТ· (52) что и является требуемым результатом. Еще одним полезным примером может служить обобщение примера 2. Пример 3. Допустим, что Q<t <7\ Ни г=1, 2, ..., М, (53) P/j = oy (54) 306
и гипотезы равновероятны. Поскольку энергии сигналов одинаковы, удобно реализовать приемник, работающий по критерию отношения правдоподобия, как приемник «по наибольшему сигналу», показанный на рис. 4.22. И на этот раз за- r(t) W) f dt in* <-« Рис. 4.22. Приемник, выбирающий наибольший сигнал. дача оказывается симметричной, так что можно предположить, что истинной является гипотеза Η χ. Тогда ошибка возникает всякий раз, когда любая из h > к- / Φ 1. где τ О* J rm(t)sj(t)dt9 /=1,2, ..., Μ. ο Следовательно, Р{г) = Р(г\Н1) = 1-Р(все lj < к: j ф\ \Ηχ) , (55) или, замечая, что lj(j φ 1) имеет такую же плотность вероятности по гипотезе Нг. Р(е)=1- f plAHi(L1\H1) U I Pi2\Hl(L^H^dL^ M—\ dLx. (56) В этом частном случае плотности вероятностей равны .....«^-^К-^ No/2 (57) %*«*{1>*И*=7Щ^{-Т-Ш· ж Подставляя эти выражения в (56) и нормируя величины, получим 1_ V Υπ С л 1 ί U-(2H/^o)1/2]2) Ρ (ε) = 1 — j dx^zrexpl-1 K—~ Чх Χ 1ткЧ-т] 2 ιΛί — 1 dy (58) (59) 307
К сожалению, в этом выражении нельзя выполнить интегрирование аналитически. Численные результаты для некоторых значений Μ и Ε/Ν0 табулированы в [21] и показаны на рис. 4.23. Для некоторых наших целей более полезным является приближенная аналитическая формула. Выведем весьма простое граничное выражение. Ряд других полезных граничных выражений получен в задачах вне основного текста. Как легко заметить из (55), выражение для Р(&) можно переписать в виде Ю 2030 ε/ΝΓ Рис. 4.23. Вероятность ошибки в случае Μ ортогональных сигналов. ρ (ε) = Р(любое /у > /t : /' «£ 1 | #ι), Ρ(ε) = Ρ(/2>/1 или /3>/ь или или (60) (61) Но несколько lj могут быть больше, чем /х. (События не являются взаимно исключающими ) Следовательно, Ρ (β)< Ρ (/, > /ι) +Ρ (/, > /£) + + ... +/»(/Λί>/1), (62) Ρ(ε)<(Λί-1) χ Χ J 1 Ϋ2π exp (x-V2E/N0)2 Χ ίΤ2ΪΡχρ(-τ) dy I dx Χ (63) Но член в скобках есть просто выражение вероятности ошибки для случая двух ортогональных сигналов. Используя (36) при ρ = 0 и Ег = Е0 = = Ε в (40), получим Ρ(ε)<(Μ-1) Γ 1 Ve/n0 Ϋ2π exp — dy. (64) (Выражение (64) можно также получить непосредственно^ (63) путем замены переменной ) Это уравнение можно еще более упростить, если использовать (2.71) Ρ (ε) < Μ —1 /2π VE/Νο exp (- — (65) Заметим, что верхняя граница возрастает линейно с увеличением М. Граничное выражение для случая Μ = 16 представлено графически на рис. 4 23. Сходная задача, где имеет место Μ ортогональных сигналов, возникает при передаче последовательности двоичных цифр. Пример 4. Последовательность цифр. Рассмотрим простую цифровую систему, изображенную на рис. 4.24, где источник выдает двоичную цифру каждые Τ секунд. Значения 0 и I выходной величины равновероятны. Мощность передатчика равна Р. Ради простоты будем полагать, что используются ортогональные сигналы. Возможны следующие варианты выбора: 308
1. Передавать один из двух ортогональных сигналов каждые Τ секунд. При этом энергия, приходящаяся на элементарный сигнал, будет равна РТ. 2. Передавать один из четырех ортогональных сигналов каждые 2Т секунд. В этом случае энергия, приходящаяся на элементарный сигнал, составит 2РТ. Например, в кодирующем устройстве может осуществляться операция отображения: 00->s0(0, 01->Si(0, 10->s2(0, ll-s3(0. 00-+s0(t) 01-^s^t) 70-*sz(t) 11-+S3(t) Цифра каждые τ сек Ύ ■φ n(t) r(t) Кодер Сигнал каждые 2 τ сек .27· Приемник декодер 10,01 Решение каждые 2 Τ сек Рис. 4.24. Цифровая система связи. 3. В общем случае можно передавать один из Μ ортогональных сигналов каждые 74og2M секунд. При-этом энергия каждого сигнала будет равна PT\og2M. Для вычисления вероятности ошибки используем (59) ■(.)-!- ] dx 1 l/ΐπ exp flf/ 2PT\og2M \ i/2-i 2 \ {-t[x-{ n0 J J I χ χ [j.W64'("ί)"' Λί— ι (66) Вычисления по формуле (66) произведены численными методами [19] и представлены графически на рис. 4.25. Поведение Р(г) представляет интерес. Выше некоторого значения PTjN0 вероятность ошибки с увеличением Μ убывает. Ниже этого значения справедливо обратное. Поучительно исследовать поведение при Μ *> оо. Из (66) путем простой замены переменных получим оо lim(l-P(e))= Г dy М-+оо J — оо Xlim (erf^-1 \y+ ( -*/2/2 Χ V 2η 2PT\og2My/2 )"!· (67) Рассмотрим теперь предел логарифма от выражения, стоящего в фигурных скобках, 2PT\og2M у/2] In erL lim Г , / 2PT\og2M \ i/2-i [y+{ N0 ) \ м-»™ (М—l)-1 309 (68)
Вычисляя этот предел (считая Μ непрерывной величиной и используя правило Ло- питаля), найдем, что (см. задачу 4.2.15): lim In {"^} = м- 0, РТ No РТ N0 < In 2, > In 2. (69) Таким образом, из непрерывности функции логарифма следует, что lim Ρ (ε) = м- 0, 1, РТ No РТ No > In 2, < 1η2. (70) Итак, наблюдается вполне определенное явление порога. Значение Г определяется тем, насколько быстро источник создает цифры. Точно скорость передачи в двоичных единицах Рис. 4.25. Вероятность ошибки в секунду равна при вынесении решения в случае Μ ортогональных сигналов, _1_ ограниченных по мощности. Τ ' При использовании ортогональных сигналов мы видим, что если 1 Ρ R < 1п2 ' N09 (72) το вероятность ошибки будет стремиться к нулю. Очевидный недостаток использования таких сигналов заключается в потребной полосе частот, возрастающей с увеличением М. При Μ -> оо ширина спектра передачи неограниченно возрастает. Формула (72) была получена для конкретной системы сигналов. Шеннон показал (см., например, [22] или [23]), что правая часть (72) есть предельная скорость безошибочной передачи информации любой системой связи. Эта скорость называется пропускной способностью канала с аддитивным гауссовым шумом, имеющего бесконечно широкую полосу частот, Соо = бит/сек. \η2_Ν0 (73) Шеннон также получил выражение для канала с ограниченной полосой пропускания (здесь Wch — ширина канала до модулятора) С = ^Ч1+^о)· (74) 310
Эти формулы пропускной способности имеют фундаментальное значение для решения задачи передачи последовательностей цифр. Эту задачу мы рассматривать не будем, поскольку адекватное ее обсуждение отвлечет слишком далеко от нашей темы. Интересующегося читателя можно отослать к [18] и [66]. В этом параграфе мы получим канонические структуры приемника для многоальтернативной задачи, в которой принятый сигнал по каждой из гипотез представляет собой аддитивную смесь известного сигнала с белым гауссовым шумом. Простота полученных структур объясняется тем, что мы могли свести пространство наблюдений с бесконечным числом измерений к пространству решений, имеющему конечное число измерений. В задачах вне основного текста мы постараемся пояснить смысл некоторых результатов. В самих же задачах получены следующие частные результаты: 1. Вероятность ошибки для любой системы Μ одинаково коррелированных сигналов можно выразить через эквивалентную систему Μ ортогональных сигналов (задача 4.2.9). 2. Наименьшее значение равномерной корреляции равно —(М — — I)-1. Сигналы с этим свойством являются оптимальными, когда не имеется ограничения ширины спектра (задачи 4.2.9 — 4.2.12). Такие сигналы называются симплексными (простыми). 3. При больших Μ ортогональные сигналы являются практически оптимальными. Чувствительность. Прежде чем закончить рассмотрение задачи обнаружения сигналов в присутствии белого шума, следует обсудить важный вопрос, часто остающийся вне поля зрения. Мы занимались исследованием математической модели физической системы и предполагали, что такие интересующие нас величины, как s(t), Ε и Ν0, нам известны точно. В реальной системе указанные величины будут отличаться от своих номинальных значений. Представляет интерес определить, как изменяется помехоустойчивость оптимального приемника при дрейфе величин относительно номинальных значений. Если помехоустойчивость сильно зависит от малых уходов (отклонений), то результаты расчета помехоустойчивости, произведенного при номинальных значениях величин, становятся сомнительными. Рассмотрим вопрос о чувствительности приемника к отклонениям от номиналов для простой бинарной задачи обнаружения. Модель для этой задачи имеет вид: r(t)=iVEs(t) + w(t), 0<f<r://lf (75) \w(t)9 0<^<Г:Я0. Приемник состоит из согласованного фильтра, за которым следует решающее устройство. Импульсная характеристика согласованного фильтра зависит от формы сигнала s(t). Уровни энергии сигнала и шума влияют на порог решения в общем байесовском случае. (В случае критерия Неймана — Пирсона на установку порога оказывает влияние только уровень шума.) Существует несколько возможных методов ана- 311
лиза проблемы чувствительности приемника к отклонениям величин от номиналов. 1. Делается предположение о том, что энергия и форма сигнала идентичны с энергией и формой сигнала принятой модели и рассчитывается изменение величин PD и /V, обусловленное изменением энергии белого шума. 2. Делается предположение о том, что энергия сигнала и уровень шума идентичны энергии сигнала и уровню шума, принятым в модели, и рассчитывается изменение величин PD и PFi вызванное изменением энергии сигнала. В обоих случаях к решению данной задачи можно подойти, определив сначала изменение величины d, обусловленное изменениями, произведенными в модели, а затем исследовав, как влияет изменение d на поведение PD и PF. В настоящем параграфе мы исследуем влияние неточного знания сигнала на величину d. Прочие из упомянутых вопросов оставлены для самостоятельных упражнений. Предположим, что построен фильтр, согласованный с принимаемым сигналом s(t), h(T—t) + s(t), O^t^T (76) и что принятое колебание по гипотезе Нг есть r(t) = sa(t)+w(t)9 0<f<7\ (77) где sa(t) есть фактически принятый сигнал. Существует два общих метода установления связи между sa(t) и s(t). Первый метод назовем вариационно-функциональным. Вариационно-функциональный метод. Пусть sa(t) = VF s(t)+VE7se(t), 0<f<7\ (78) где se(t) — нормированное колебание, отображающее неточности. Энергия сигнала ошибки считается равной Εε. Наиболее просто влияние последнего ограничения можно установить путем исследования соответствующего пространства решений (точнее, модифицированного пространства решений). Чтобы включить в пространство решений все se (ή, мы мысленно добавляем еще один согласованный фильтр hAT-t) = 02(t)=S'{'\Z^t] , 0<ί<7\ (79) где ρε — коэффициент корреляции между se(t)ns(t). (Заметим, что физически мы этого не осуществляем.) Теперь имеется двумерное пространство. Отсюда очевиден смысл введенного ограничения. Любой сигнал sa(t) приводит к точке на окружности, охватывающей точку s, как показано на рис. 4.26. Заметим, что в решении все равно используется только координата по s(t); сигнал ошибки, обусловливающий наибольшее снижение достоверности, есть se(/) = -s(0 (80) 312
и, следовательно, 2_ No άΛ*=Ζ-(ϊΕ-γΕ,Υ Данный результат можно записать и по-другому 1/2 Ad d K2Ee/JV„ где Adbda—d. (81) (82) (83) Мы видим, что сигналы ошибки с малой энергией вызывают незначительное изменение достоверности (качества критерия). Таким образом, данный критерий нечувствителен к малым отклонениям параметров. Второй метод называется вариационно-параметрическим методом. Фг(Щ *5» . I I г i W) '* ' <P/t)~S(t) Рис. 4.26. Годограф сигнального вектора в случае, когда фиксирована энергия сигнала ошибки. Φ,(ϊ) Рис. 4.27. Годограф сигнального вектора в случае, когда фиксирована энергия полного сигнала. Вариационно-параметрический метод. Сущность этого метода лучше всего можно пояснить на примере. Пусть <Hf): /2 sin ω. ί, 0<ί<Τ (84) будет номинальным сигналом. Реальный сигнал можно записать как М0=(|-)1/2 sin (ωβ* + θ), 0<f<7, (85) что при θ = 0 соответствует номинальному сигналу. Преобразованное пространство решений изображено на рис. 4.27. Конец вектора, соответствующего реальному сигналу, движется по окружности с центром в начале координат 2Е у/2 -(f)1 cos θ (86) 313
и — =— (1— cos θ). (87) d Вновь убеждаемся в нечувствительности критерия к малым отклонениям параметров. Общий вывод, который можно сделать из двух рассмотренных методов, сводится к тому, что результаты обнаружения в присутствии белого шума не зависят от различного рода допущений детального характера. Другими словами, малые отклонения от тех допущений, на которых основывается расчет качества критерия, приводят к малым отклонениям в качестве. Почти во всех случаях этот тип нечувствительности является необходимым, если мы хотим, чтобы математическая модель позволяла точно предсказать качество реальной системы. Во многих работах по статистическому анализу этому вопросу не уделяется внимание. Причина этого, видимо, психологического характера. После того, как рассмотрены математически сложные задачи оптимизации, было бы приятно показать возможность существенного, скажем, на порядок, выигрыша оптимизированной системы по сравнению с системой, построенной исходя из интуитивных представлений. К сожалению, это не всегда получается. Когда же такой выигрыш имеет место, необходимо определить, не влияют ли некоторые ограничения детального характера на математический результат. В последующем нам придется встретиться с несколькими примерами подобной зависимости. Обратимся теперь к проблеме линейной оценки. 4.2.2. Линейная оценка В §4.1.1 была сформулирована задача оценки параметров сигнала в присутствии аддитивного шума. Для случая аддитивного белого шума принятое колебание можно записать в виде г (t) = s(t, А) + w (t); О <ί < Τ, (88а) где w(i) — выборочная функция белого гауссова процесса, имеющего спектральную плотность NJ2. Параметр А и есть та величина, которую мы хотим оценить. Если он является случайным параметром, то будем полагать, что априорная плотность известна, и используем байесовскую процедуру оценки. Если же он является неслучайной величиной, то будем использовать оценки по максимуму правдоподобия. Функция s(ty А) есть детерминированное отображение параметра А во временную функцию. Если s(/, А) есть линейное отображение (другими словами, справедлив принцип суперпозиции), то систему, в которой используется такой сигнал, называют системой линейной модуляции. Кроме этого, для интересующего нас критерия устройство оценки называется линейным. Поэтому данная задача называется задачей линейной оценки. В настоящем параграфе исследуется процедура ли- 314
нейной оценки, а в § 4.2.3 — нелинейной оценки. Для линейной модуляции (88а) всегда можно записать в виде r(t) = AVEs(t) + w(t)9 0<f<7\ (886) где s(t) имеет единичную энергию. Задачу линейной оценки легко решить, используя ее сходство с задачей обнаружения, которая только что была разобрана. Из § 2.4 известно, что для этого необходима функция правдоподобия. Напомним, однако, что данная задача существенно упрощается, если можно найти достаточную статистику и далее заниматься ею, а не принятым коле* банием. Если сравнить (886) и (4) — (7), то станет очевидным, что достаточная статистика есть τ Γχ= Jr(i)s(/)di. (89) о Точно так же, как и в § 4.2.1, плотность вероятности величины гг при условий, что а = Л, является гауссовой: Е(Г1\А) = АУЕ~ о*(Г1\А)=-^. (90) Легко убедиться, что координаты по другим ортогональным функциям [см. (8)] не зависят от а. Следовательно, задача обнаружения сигнала сводится к классической задаче оценки (см. стр. 67—69). Логарифм функции правдоподобия равен Если А — неслучайная величина, то оценка по отношению правдоподобия равна значению Л, при котором эта функция имеет максимум. Таким образом aml(R1) = j±i. (92) Приемник показан на рис. 4.28, а. Нетрудно заметить, что оценка является несмещенной. Если а есть случайная величина с плотностью вероятности ра(Л), то оценка по максимуму апостериорной вероятности равна значению Л, при котором величина lP(A)=-iiRl~£0fEf +1ηΡαΗ) (93) имеет максимум. В частном случае, когда а является гауссовой величиной, N(0f σα), оценку по максимуму апостериорной вероятности легко получить, дифференцируя 1р(А) и приравнивая результат нулю: 315
*map (ffi) = 2E/N0 2£/Λ?0+1/σο2 (95) В обоих случаях оценки — по максимуму правдоподобия и по максимуму апостериорной вероятности — легко показать, что результат совпадает с абсолютным максимумом. Приемник, реализующий оценку по максимуму апостериорной вероятности, изображен на рис. 4.28, б. Отметим, что эти два приемника отличаются только усилением. Нетрудно получить выражения для нормированных дисперсий ошибок. *чяъ 1 s(t) f dt | i R 1 , \ 1 a) f ί *f 2 Φ N0 *Щ + 1/баг " ^ *m\ map B) Рис. 4.28. Оптимальный приемник. Случай линейного оценивания: а — приемник по критерию максимального правдоподобия; 6—приемник по критерию максимальной апостериорной плотности. При оценке по максимуму апостериорной вероятности Е 1а\] = °a*"±o-J = 14 2σα*Ε Здесь σα2Ε — ожидаемое значение принятой энергии. При оценке по максимуму правдоподобия -! ■< '"'-■ (97) ®агп Δ _1 - Л2 No Здесь А2Е есть фактическое значение энергии принятого сигнала. Заметим, что дисперсия оценки по максимуму правдоподобия есть величина, обратная d2, — показателю достоверности (качества критерия) в простой бинарной задаче. В обоих случаях единственный способ уменьшить среднеквадратическую ошибку — это увеличить отношение сигнал/шум. Во многих случаях достижимые отношения сигнал/шум недостаточны для обеспечения требуемой достоверности. В таких случаях, стремясь достигнуть требуемой достоверности, мы пытаемся 316
применить нелинейные методы передачи и обработки сигналов. В еле* дующем параграфе будут рассмотрены вопросы нелинейных оценок. Прежде чем завершить изложение вопросов линейных оценок, следует указать, что оценка по максимуму апостериорной вероятности для широкого класса критериев совпадает с байесовской оценкой. Если величина а — нормальная, то апостериорная плотность вероятности также нормальна и применимы свойства 1 и 2 стр. 70—71 Указанная инвариантность относительно критериев зависит непосредственно от линейной модели обработки сигналов. 4.2.3. Нелинейные оценки Система, изображенная на рис. 4.7, иллюстрирует типичную задачу нелинейной оценки. Принятый сигнал можно записать в виде г (t) = s (t, Α) + w (t), 0 < t < Τ. (98) Из результатов классической теории известно, что в общем случае достаточной статистики не существует. Как и ранее, можно построить функцию правдоподобия. Метод решения данной задачи заключается в использовании аппроксимации r(i) при помощи ряда с К коэффициентами. Поступая так же, как на стр. 297—298, и используя очевидные обозначения, получим MrK(t),A] = pTla(R\A) = /=l VnN0 * \ 2 Л/о/2 J' где МЛ)ДЫ*,Л)Ф,(0Л. о Если теперь положить /(->оо, то Л lr^(t)f А] будет определено неточно. Напомним из гл. 2, что функцию правдоподобия можно делить на любую величину, которая не зависит от А, и при этом функция правдоподобия сохраняется. На стр. 297—298 мы избежали проблемы сходимости путем деления на к 1 / РгК«)\н0 [гK{t) | Я01 = Π -== ехр - 2 N0/2 прежде чем положить К -> оо. Поскольку эта функция от А не зависит, то здесь деление на нее будет вполне законным. Введем функцию Лг1гк«):А)= AtrVr>m1,tf1· (10°) 317
Подставляя в эту формулу предыдущие два выражения, приводя подобные члены, устремляя К-*- оо и логарифмируя, получим τ τ lnAJr(f),i4] = -M r(t)s(t9A)dt --L§ s*(t,A)dt. (101) о о Для отыскания ат1 необходимо найти абсолютный максимум этой функции. Чтобы определить α^ρ, прибавим к (101) In pa(A) и найдем абсолютный максимум. Основная операция над принятым колебанием сводится к формированию первого члена (101) как функции величины Л. Физическое устройство, которое используется для ее осуществления, будет зависеть от вида функции s (t9 А). Ниже мы рассмотрим некоторые конкретные случаи и найдем действительную структуру этого устройства. Прежде чем сделать это, выведем выражение для общего случая, которое потребуется нам в последующем. Заметим, что если максимум является внутренним, а функция In Аг(А) дифференцируема в точке максимума, то необходимое, но недостаточное условие получается путем однократного дифференцирования (101): !!i!M!L_i{M0_.(,M)1*£!U (102) (в предположении, что функция s(t, А) дифференцируема по А). Для атХ необходимое условие получается путем приравнивания нулю правой части (102). Для ЪтаР к правой части (102) мы прибавляем din pa(A)/dA и приравниваем сумму нулю. В частном случае, когда ра(А) — гауссова (N(0, σα)), получаем В линейном случае (103) сводится к (95) и дает единственное решение. В нелинейном случае может существовать ряд решений и, чтобы гарантировать абсолютный максимум, необходимо исследовать сумму (101) и In pa(A). Очевидно, точно так же, как и в гл. 2, выражение (102) позволяет найти границу дисперсии любой несмещенной оценки неслучайной величины, а добавление d2ln pa(A)/dA2 приводит к граничному выражению для среднего квадрата ошибки при оценке случайной величины. Для неслучайной величины дифференцируем (102) и берем математическое ожидание τ [il^L]=A|,oiK0_s(M)]x i_*J[U&4]»*}, (104) дА* 318
где предполагается, -что соответствующие производные существуют. Заметим, что в первом члене Е[г(/)—s(i, A)] =E[w(ί)1 =0. (105) Во втором члене случайных величин нет. Поэтому математическое ожидание равно самому интегралу. Подставляя в (2.179), получим σ2 (α—Α) > — ^ (106) 12 >im! для любой несмещенной оценки а. Знак равенства в (106) справедлив тогда и только тогда, когда lh^.=,k(A){a[r(t)]-A} (107) для всех А и r(t). Сравнивая (102) и (107), убеждаемся, что это соблюдается только для линейной модуляции. Следовательно, ат1 есть оценка с минимальной дисперсией. Аналогично для случайных величин где Εа означает математическое ожидание по случайной величине а. Вводя *·■*«./Нт1]'*· (109) имеем Ε Знак равенства в (110) имеет место тогда и только тогда, когда (см. 2.226) ампл1(л) +'''npaH)=const (111) Как и в гл. 2 (стр. 84), для выполнения равенства (111) необходимо и достаточно, чтобы pa\r(t)[A\r(t) : 0 ^ t ^ Т] была гауссовой плотностью вероятности. Это требует линейной системы передачи сигналов и гауссовой априорной плотности. В чем ценность этой границы, если она удовлетворяется только для линейных методов модуляции? Как и в классическом случае, она имеет два главных назначения. 1. Она всегда обеспечивает нижнюю границу. 319
2. Во многих случаях фактическая дисперсия (или средний квадрат ошибки) в случае нелинейных методов модуляции при определенных условиях будет приближаться к этой границе. Эти случаи аналогичны асимптотически эффективным оценкам в классической задаче. Впоследствии мы убедимся, что они соответствуют большим значениям E/N0. Для иллюстрации некоторых понятий в нелинейном случае рассмотрим два простых примера. при dp t Допустимые значения а 5) Рис. 4.29. а — форма импульса; б — допустимые пределы изменения параметра. Пример 1. Пусть s(t) — импульс, показанный на рис. 4.29, а. Параметр а — время прихода импульса. Нам необходимо найти оценку а по максимуму апостериорной вероятности. Область значений χα, которые может принимать параметр а (рис. 4.29, б), нам известна. Внутри этой области плотность вероятности равномерна. Ради простоты будем считать интервал наблюдения [—Г, Т] достаточно большим, чтобы он полностью содержал данный импульс. Из (101) известно, что операция над принятым колебанием сводится к отысканию \nAi[r(t), A]. Здесь τ τ In Л! [г (0, А] = — \ r(u)s(u-A)du— —- \s*(u—A)du. (112) ^о J N0 J — τ -Τ В данном частном случае второй член не зависит от Л, так как весь импульс всегда размещается внутри заданного интервала. Первый член соответствует операции свертки. Выход линейного фильтра с импульсной характеристикой /ι(τ) и входом г(ц) на интервале [—Г, Т] равен: τ y(t)= { r(u)h{t — u)duy —T<t<T. —τ Очевидно, что если положить Μτ) = 5(-τ), (113) (114) -то выходная величина как функция времени в области χα будет идентична функции правдоподобия от А. Мы просто выбираем максимальное 320
значение выходной величины фильтра как функции времени. Момент времени, когда имеет место максимальное значение, и есть атар. Рассматриваемый фильтр есть согласованный фильтр, с которым мы уже встречались в задаче обнаружения. На рис. 4.30 представлена структура приемника. Выход, соответствующий сигнальной компоненте, развернут вдоль линии (а). Типичные результирующие выходы при трех уровнях шума показаны на рисунках (б), (в) и (г). Из рис. (б) видно, что максимум 1пЛ(Л) велик по сравнению с уровнем шумового фона. Фактический максимум находится вблизи истинного, и можно полагать, что ошибку можно точно рассчитать, иснользуя выражение (110). В случае (в) уровень шума больше и начинают появляться большие дополнительные пики, не имеющие r(t) Согласованный фильтр .Т, А 2Р WF *J -ΑΙ чт m S) г) Рис. 4.30. Выходные величины приемника (оценивание времени поступления ' сигнала): α—сигнальная компонента; б—низкий уровень шумов; в—средний уровень шумов; г —высокий уровень шумов. отношения к истинному значению А. Наконец, на рисунке (г) шум достигает такого уровня, при котором максимум уже не связан с истинным значением. Таким образом, мы подошли к двум вопросам: 1. При каких условиях нижняя граница, определяемая выражением (ПО), позволяет точно рассчитать ошибку? 2. Как можно рассчитать достоверность обнаружения в тех случаях, когда нельзя использовать (ПО)? Прежде чем ответить на эти вопросы, рассмотрим второй пример с тем, чтобы проверить, не возникнут ли^ аналогичные вопросы. Пример 2. Другим распространенным примером нелинейного метода модуляции может служить дискретная частотная модуляция, называемая также частотной манипуляцией (ЧМ). Через каждые Τ секунд источник выдает новое значение параметра а. Передаваемый сигнал есть s(t, А): S(t,-A): (")" s\n((uc+pA)tt ~Ύ<ί<γ· (115) Здесь (Dc — известная несущая частота, β — известная постоянная, а Е — энергия передаваемого сигнала (энергия принимаемого сигнала). Предполагается, что ра(А) равномерно распределена на интервале (— УЪоа, Υ3σα). И Зак. 693 321
(101): Для отыскания amap построим функцию, соответствующую первому члену 1г(А)={ Т/2 | г (0 sin (G)c t + $At) d/, - ΥΖ σα < А < Vг σα, -Γ/2 о (116) при других значениях. [Второй член (101) и априорная плотность вероятности — постоянные величины и их можно не учитывать]. Одним из возможных способов построения 1г(Л) могла бы быть регистрация (запись) r(t) с последующим перемножением и интегрированием, указываемыми в (116) для последовательных значений А во всей области значений параметра. I -о f ь Ч •Г Рис. 4.31. Структура приемника (оценивание частоты сигнала). Но этот способ, очевидно, связан с большими затратами времени. Другой способ1) заключаемся в разбиении области изменения на приращения с шагом Див выполнении операции обработки, показанной на рис. 4.31 для дискретных значений А: Al=-V3ca+ — , 3Δ Α2=-Υ3 σα+γ, \ = -/Зай+(м-|)д, М = 2 /3 оа t 1 (117) 1} Такой подход и вытекающий из него анализ был впервые разработан Вудвордом (радиолокационное измерение дальности [8]) и Котельниковым (ФИМ и ЧИМ [13]). Впоследствии их результаты использовались с различными видоизменениями рядом авторов (например, Дарлингтоном [87], Акима [88], Возенкрафтом и Джекобсом [18], Вайнштейном и Зубаковым [15]. Наш подход аналогичен [18]. Третий метод оценки А обсуждается в [87] (см. также гл. 4 второго тома). 322
Здесь [·] означает наибольшее целое число, не превосходящее аргумента. Результатом такой предварительной обработки является Μ чисел. Мы выбираем наибольшее из них и считаем, что истинное значение А находится в этой области. Для получения окончательной оценки проведем локальную максимизацию (максимум находится внутри интервала), используя условие 7/2 ί —Г/2 ds(t, A) [r(t)-s(t, A)] yA dt Л = "тар==0· (118) Один из возможных способов такой максимизации иллюстрируется блок- схемой рис. 4 32. Мы ожидаем, что если при предварительной обработке интер- i ^_^ *(*,*) \У »3ь> \ds(t,&) Генератор с и гналоВ да Г т/2 f-r/2dt —9» Нуль- детектор а Регулировка а с цепью достижения нуля Рис. 4.32. Устройство локальной оценки. вал выбран правильно, то окончательная точность будет аппроксимироваться граничным выражением (108). Эту границу можно оценить довольно легко. Частная производная сигнала равна ds(t, А) дА /2Е\ 1/2 (у) fUcos((uct + $At)9 -T/2<t<T/2 (119) 772 2Е Г Т/2 ί -Т/2 ЕТ2 где t2 cos2 (a>ct + $At) dt~-—$*, Г»- (120) Далее нормированный средний квадрат ошибки любой оценки ограничен величиной σ2, „Δ —> A/Q 12 Л^о J_ J_ 2γα2 σα2 "" Γ2 2Ε β2 σΛ2 (121) Видно, что независимо от того, насколько мало Ε/Ν0, средний квадрат ошибки можно сделать сколь угодно малым путем увеличения β. К сожалению, этот метод не учитывает существенную часть проблемы. Как влияет на вероятность ошибки первоначального определения интервала величина β? Сделав ряд упрощающих допущений, можно получГить приближенное выражение для указанной вероятности. Обозначим истинное значение А через 11* 323
Aa (этот подстрочный индекс необходим потому, что А — аргумент функции правдоподобия). График величины 7/2 γ j S(f, Aa)8(t, A) at -7/2 для сигнала (115) в виде функции ΑΧΔ_Α — Аа приведен на рис. 4.33 (членом удвоенной частоты пренебрегаем). Видно, что сигнальная компонента 1г(А) проходит через нуль каждые 2π/βΓ единиц. Из этого следует, что логично выбрать величину Δ равной 2π/β7\ Для вычисления вероятности выбора неправильного интервала используем аппроксимацию, позволяющую заменить все А в первом интервале на Аг и т.д. Обозначим вероятность выбора неправильного интервала через Ρ(ε7). При такой аппроксимации задача сводится к определению того, какой именно из Μ ортогональных сигналов равных энергий присутствует. При больших Μ мы пренебрегаем остатком на конце интервала и полагаем 9,8 0,6 V ОЛ Q '0,2 • π βΤ $ίη(βΑχ7/2) у P*xT/i ι ι ι гх зя ья βΤ βΤ βΤ Αχ ι ι Ι 5χ Βχ βΤ βΤ М^УЪ σαβ· (122) Такая задача уже была решена [см. (64)]. Так как нас интересует случай большого β Г, то можно использовать приближенное выражение (65): Рис. 4.33. Зависимость компоненты сигнала от Ах. пгг ν ,(/3σαβ77π-ΐ) / Е\ (123) По мере увеличения σαβΓ вероятность того, что будет выбран неправильный интервал, возрастает1^Вывод, который можно сделать из этого результата, имеет фундаментальное значение в теории нелинейных оценок. Для фиксированных ΕΙΝ0 и Τ можно увеличить β настолько, что локальная ошибка будет сколь угодно малой, если приемником был выбран правильный интервал. Однако при увеличении β вероятность того, что выбран правильный интервал, стремится к нулю. Таким образом, при заданном β необходимо некоторое минимальное значение Ε/Ν0 для обеспечения того, чтобы вероятность пребывания в ошибочном интервале была достаточно мала. Выражение (123) предполагает следующую процедуру расчета. Считаем, что приемлема некоторая вероятность ошибки Ρ(ε7) (скажем, р0). Чтобы минимизировать средний квадрат ошибки, ограничиваемый этим значением, выберем β таким, что (123) удовлетворяется со знаком равенства. Подставляя р0 в левую часть (123), решая относительно σαβΓ и подставляя результат в (121), получим 1Ж Оа2 = σ: >о2 п*\Е ) *- Ε IN, (124)2> Функция, обратная зависимости нормированного среднего квадрата ошибки от E/N0 для типичных значений р0 изображена на рис. 4 34. По причинам, которые Х) Эту вероятность иногда называют вероятностью аномалии или неоднозначности. 2) Выражение (124) является аппроксимацией, так как (123) есть граница и в представляющем интерес случае больших βΓ можно пренебречь единицей в круглых скобках. δ 24
вскоре станут очевидными, ограничение, налагаемое выражением (123), называется пороговым ограничением. Результат (123) указывает на одно последствие увеличения (5. Второе последствие нетрудно усмотреть непосредственно из (115). Каждое значение А сдвигает частоту передаваемого сигнала с сос до ω0 + βΛ. Поэтому мы должны располагать каналом с полосой пропускания достаточной, чтобы учесть максимально возможный уход частоты. Ширина спектра импульса приближенно равна 2п/Т рад/сек. Максимальный сдвиг частоты составляет ± j/З βσα. Следовательно, требуемая ширина полосы пропускания при средней частоте сос приближенно равна 2π 2nWch s 2 V3 βσα+ у = = γ(2/3"βσαΓ + 2π). (125а) При больших σαρτ можно пренебрегать 2π и пользоваться приближенным выражением 2π№0ίΐ^2]/Τβσα. (1256) Во многих представляющих интерес систе- мах мы располагаем вполне определенной полосой пропускания. (Указанное ограничение полосы может вызываться либо административной регламентацией, либо физической природой рассматриваемого канала.) Если считать ElN0 достаточно боль- Рис. 4.34. Величина, обратная среднему квадрату ошибки при ограничениях по порогу и ширине полосы. шим для обеспечения приемлемой вероятности ошибки Ρ(εχ), то (1256) характеризует ограничение системы. Мы просто увеличиваем β до тех пор, пока не будет занята имеющаяся полоса. Для отыскания среднего квадрата ошибки, используя указанную процедуру расчета, подставим выражение дляβσαв (121) и получим в [4] 1 = σ' * Ε (WchT)* π (ограничение полосы). (126) Видно, что величинами, определяющими средний квадрат ошибки, являются: E/N0r— отношение сигнал/шум и WChT — произведение ширины спектра на длительность передаваемого импульса. Величина, обратная нормированному среднему квадрату ошибки, представлена графически на рис. 4.34 для типичных значений WChT- Два семейства ограничительных линий обеспечивают нас законченной процедурой построения ЧИМ системы. При малых значениях E/N0 доминирует ограничение за счет порога. По мере возрастания E/N0 поведение наименьшего среднего квадрата ошибки определяется линией фиксированной р0 до тех пор, пока не достигается значения, когда ограничивающим фактором становится располагаемая полоса частот. При дальнейшем возрастании E/N0 наименьший средний квадрат ошибки будет следовать линии фиксированного β. Такой подход, когда два вида ошибок рассматриваются отдельно, является полезным и способствует более ясному пониманию проблемы. Для сравнения результатов, полученных для различных систем, часто бывает удобно выражать их в виде одного числа — полного среднего квадрата ошибки. 325
Для среднего квадрата ошибки можно написать Ε (α|) = σΐ = -Б [α| | интерв. ошибка] Ρ [интерв. ошибка]+ + £[а2|нет интерв. ошибки] Ρ [нет интерв. ошибки]. (127) Приближенное выражение для Ρ(ε;) получено путем объединения всех частных областей изменения параметра А в единое значение А%. При такой аппроксимации на других выходах.коррелятора рис. 4.31 не будет компонентов сигнала. Таким образом, если делается ошибка в определении интервала, то она с равной вероятностью происходит в каком угодно ошибочном интервале. Следовательно, результирующая оценка а будет нгкоррели- * рованиой с а. £ Tag I интерв. ошибка] = = £JYa— a)2 I интерв. ошибка] = = Ε [а2 I интерв. ошибка] + + £ [а2 | интерв. ошибка] — — 2£ [аа | интерв. ошибка]. АИМ (вфункции *аФо) 2 3 4 56 8 10 20 то (128) Сделанное выше приближение приводит к тому, что последний член в (128) оказывается равным нулю. Каждый из первых двух членов равен σα2. Поэтому Ε [α2 I интерв. ошибка] =2σ2. (129) Рис. 4.35. Величина, ^обратная среднему квадрату ошибки. Если предположить, что р0 — фиксирована, то тогда, используя в (127) выражения (124) и (129), получим °гТп = Оа2 = 2р0 + (1-Ро) π3Ρο2 ^V*/"· (130) В этом случае по мере изменения Ε/Ν0 индекс модуляции β необходимо изменять При фиксированном β, используя (121) и (123), получим 12 *т« (σββΓ)« 2£ [ /3σαβΓ/πβ_Ε/2Λ/ Υ2πΕ/Ν0 J Vo ■ V2nE/N0 (131) Результат (131) показан графически на рис. 4.35. Видно, что в поведении среднего квадрата ошибки четко проявляется явление порога. Величина, обратная нормированному среднему квадрату ошибки для системы АИМ, также показана на 326
рис. 4.35 (на основе (96)). Величину выигрыша можно получить путем деления (121) на (96) σαεη/4ΗΜ 12 2о1Е т2 " β2 Γ2 Ν0 »1. Таким образом, выигрыш при использовании системы ЧИМ по сравнению с системой АИМ пропорционален квадрату β7\ Следует еще раз подчеркнуть, что этот результат справедлив лишь в предположении, что Ε/Ν0 лежит выше порога системы. Если уровень шума будет возрастать, то помехоустойчивость системы ЧИМ может резко ухудшиться. Наш подход в данном конкретном примере вполне достоверен. Мы видим, однако, что он основывается на двухэтапной процедуре оценки. При дискретной частотной модуляции выбор этой процедуры был вполне естественным, поскольку она была целесообразной и с точки зрения практической реализации системы. В первом примере в подобной двухэтапной процедуре оценки необходимости не было. Тем не менее, чтобы получить параллельный ряд результатов для примера 1, можно привести аналогичный двухэтапный анализ и прийти к сходным выражениям. Экспериментальные исследования систем обоих типов свидетельствуют о том, что аналитические результаты точно характеризуют помехоустойчивость систем. Вместе с тем было бы желательно пронести более строгий анализ. В примере 2 мы кратко обсудим другой подход, когда непосредственно ограничен средний квадрат ошибки. Из (115) видно, что s(tt A) является аналитической функцией параметра А. Поэтому существуют π могут быть выражены в простой форме все ее производные: дп s (t, Л) дАп \ (у)1/2(^)я(-1)(я-,)/2со8(0с* + рЛ)| η—нечетно, пз2) (—Ι W)n( —i)n/* sin (a>ct+$ At), п —четно. Из этого следует, что обобщение границы Баттачария, развитое нами в § 2.9, позволяет получить сколь угодно точные оценки ошибок. По своей идее это обобщение получается довольно просто (Ван- Трис [24]). При η = 2 ответ остается все еще простым. Однако при η ^ 3 необходимое обращение матрицы оказывается весьма громоздким и проще провести решение численным методом. Подробные вычисления приведены в [29]. В этом частном случае ряд сходится недостаточно быстро, чтобы можно было получить хорошее приближение к действительной ошибке в области больших уровней помех. Необходимо сделать одно последнее замечание. Существует несколько представляющих интерес случаев, когда сигнал не является дифференцируемым по параметру. Простым примером сигнала такого типа может служить ситуация, когда в радиолокационной системе излучаемый сигнал приближенно заменяется прямоугольным импуль- 327
сом и требуется оценить время появления отраженного импульса. При малом уровне шумов формулы для данных случаем можно вывести довольно легко (см. например, [25], [13], [26], [27]). Для произвольного уровня шума можно использовать метод, примененный в примере 2, или граничное выражение Баранкина (см., например, [28]), которые не требуют дифференцируемое™. 4.2.4. Сводка основных результатов Детерминированные сигналы на фоне белого гауссова шума. Целесообразно подвести итог некоторых наиболее важных результатов, полученных при обсуждении задач обнаружения и оценки сигналов на фоне аддитивного белого нормального шума. Обнаружение. 1. В случае простого бинарного обнаружения оптимальный приемник может быть реализован в виде согласованного фильтра или корреляционного приемника, как это показано на рис. 4.11 и 4.12 соответственно. 2. В общем бинарном случае оптимальный приемник можно реализовать путем использования одного или двух согласованных фильтров. 3. В обоих случаях достоверность полностью определяется нормированным расстоянием d между сигнальными точками в пространстве решений tf2= i- (El+E0-2pVE^W0). (133) Получающиеся вероятности ложной тревоги и пропуска цели равны Р„ = егЦМ+|), (134) P„=erq^-|). (135) Для равновероятных гипотез и критерия минимальной вероятности ошибки полная вероятность ошибки раЕна Р(е)=егк*(±^^у,2е-*У*. (136) 4. Помехоустойчивость оптимального приемника не зависит от малых вариаций параметров сигнала. 5. В многоальтернативном случае (Λί гипотез) для реализации оптимального приемника необходимо не более Μ — 1 согласованных фильтров, хотя часто Μ фильтров позволяют более простую реализацию. При Μ ортогональных сигналах граничное выражение для вероятности ошибки имеет простой вид />(е)< М~1 ехр(-А). (137) 328
6. Понятие о пропускной способности канала было проиллюстрировано нами на простом примере передачи последовательности цифр. При скорости передачи ниже пропускной способности канала вероятность Р(г) ошибки стремится к нулю, если длина кодированной последовательности стремится к бесконечности. В виду того, что для передачи ортогональных сигналов требуется широкая полоса частот, этот метод оказывается неэффективным. Оценка. 1. Процедура линейной оценки является очевидным видоизменением процедуры обнаружения. Оптимальное устройство оценки есть простой коррелятор или согласованный фильтр, за которым следует усилительное звено. 2. Задача нелинейной оценки потребовала введения ряда новых идей. Точная реализация оптимального приемника иногда бывает затруднительна, в связи с чем необходима аппроксимация. Как было установлено, при отношении энергии сигнала к шуму выше некоторого значения ошибку оценки можно сделать значительно меньше, чем в случае линейной оценки при той же энергии сигнала, а именно: σ2 [а-А] « — ^ . (138) о Однако по мере увеличения уровня шума в приемнике наблюдается явление порога и дисперсия ошибки быстро возрастает. В надпоро- говой области, как было показано, при проектировании системы необходимо считаться с проблемой ограничения полосы пропускания. Теперь целесообразно распространить полученную модель на более общий случай. Следующий шаг в направлении общности заключается в рассмотрении случая известных сигналов на фоне небелого аддитивного гауссова шума. 4.3. Обнаружение и оценка на фоне небелого гауссова шума Представляет интерес рассмотреть ряд ситуаций, в которых может иметь место небелая гауссова помеха. 1. Между собственно источником шума и демодулирующей частью приемника находятся элементы как, например, антенна и высокочастотные фильтры, которые придают спектру шума форму своей частотной характеристики. 2. Помимо полезного сигнала, в приемнике могут присутствовать мешающие сигналы, которые можно рассматривать как гауссовы процессы. В радио- и гидролокации мешающим сигналом являются отражения от целей. Исходя из этого, сформулируем и решим задачу обнаружения и оценки. Как уже было показано в предыдущем параграфе, между обнаружением и оценкой существует тесная связь. По существу решение задачи в обоих случаях включает один и тот же момент — построе- 329
ние отношения (функции) правдоподобия. Рассмотрим подробно простой бинарный случай, а затем укажем, как полученные результаты распространяются на другие интересующие нас случаи. Прежде всего необходимо задаться моделью. При наличии «окрашенной» помехи необходимо проявлять большую осторожность в отношении модели. Предполагается, что передаваемый сигнал по гипотезе 1 равен YEs(t)b\Y /W ^ ^ (139) [ О при других t. Заметим, что s(t) определен на всей оси времени. В среде распространения сигнал подвергается воздействию аддитивного гауссова шума n(t). Принятое колебание r(t) наблюдается на интервале Tt ^ ^ t ^ Tf. Таким образом r(t) = \ w f (140) \n(t)9 Tt^t^Tf:H0. Иногда Ti бывает равным нулю, a Tf = Т. Однако, в общем случае будем считать, что Гг( <Ό) и Tf(^T) имеют произвольные значения. В частности, мы будем часто исследовать задачу, когда Тг = —оо, a Tf = +оо. Возникает вопрос, зачем наблюдать принимаемое колебание, когда сигнальная компонента в смеси равна нулю?. Это объясняется тем, что шум вне интервала коррелирован с шумом внутри интервала, и чем больше данных о шуме в пределах интервала имеется в нашем распоряжении, тем успешнее можно с ним бороться и тем значительнее можно улучшить достоверность приема. Для пояснения этой мысли можно использовать простейший пример. Пример. Пусть VEs(t)=\ ' (141) ( 0 при других / , и /ι(ί) = я, 0<*<2, (142) где η — нормальная случайная величина. Решение о том, какая гипотеза является истинной, следует из выражения 1 2 / /= \r(t)dt — $r(t)dt. (143) Если ( 0, то утверждаем Я0, =£0, то утверждаем Η χ. Ясно, что решения могут быть безошибочными. Здесь мы использовали расширенный интервал для оценки шума внутри интервала, на котором сигнал был отличен от нуля. К сожалению, реальная ситуация не бывает столь простой, однако идея использования удлиненного интервала наблюдения подводит к решению задач, более близких к реальным. 330
Прежде всего целесообразно полагать, что шум всегда содержит независимую белую компоненту, так что n(t)~w(t) + ne(t), (144) где nc(t) — компонента коррелированного (окрашенного, небелого) шума. Тогда Kn(t,u)=!£b(t-u) + Ke(t.u)· О45) Предположим, что средний квадрат nc(t) имеет конечное значение, т. е E(nc2(t)) < 00 для всех Tt <: t ^ Tfy так что /Сс(^ и) — функция, интегрируемая в квадрате на интервале [Tiy Tf]. Допущение о белом шуме включено здесь по двум соображениям. 1. Физическая причина: независимо от используемого диапазона частот уровень помех будет отличным от нуля. Продление этого уровня до бесконечности есть только вопрос удобства. 2. Математическая причина выявится логичным образом по ходу изложения. Компонента белого шума позволит гарантировать, что наши операции будут иметь смысл. Существуют и другие пути достижения этой цели, но способ, основанный на допущении в модели белого шума, является простейшим. Можно указать следующие логичные подходы к решению задачи с небелым шумом. 1. Выбираем такие координаты для ортонормированного разложения r(t)y чтобы коэффициенты были статистически независимыми. Это дает возможность осуществлять построение отношения правдоподобия прямым методом. Как выполнять эту процедуру, известно из материалов гл. 3. 2. Обрабатываем r(t) с целью получения достаточной статистики, а затем используем ее для выполнения операции обнаружения. 3. Выполняем предварительную обработку r(t) с целью преобразования данной задачи в задачу с белым гауссовым шумом, а затем используем соответствующее решение, полученное в предыдущем параграфе. Очевидно, что если предварительная обработка обратима, то она может не оказывать никакого влияния на помехоустойчивость системы. Ввиду того, что идея обратимости используется нами неоднократно, целесообразно остановиться хотя бы на простом ее доказательстве. Обратимость. Требуемый результат легко продемонстрировать в общей постановке задачи. На рис. 4.36, а показана система, которая осуществляет над г(и) такие операции, чтобы на выходе получить оптимальную величину в соответствии с некоторым желательным критерием (интересующая нас задача может быть связана с обнаружением или оценкой) В системе 2, изображенной на рис. 4.36 б, над г(и) сначала осуществляется обратимая операция k[t,r(u)] с целью получения z(t). Затем мы строим систему, которая будет выполнять над z(t) такую операцию, чтобы получить оптимальный выход в соответствии с тем же критерием, что и в системе 1. Мы утверждаем, что помехоустойчивость обеих систем одинакова. Очевидно, система 2 не может обладать более высокой помехоустойчивостью, чем система 1, так как это противоречило бы нашему утверждению о том, что система 1 осуществляет оптимальную обработку г(и). Теперь по- 331
кажем что система 2 не может быть хуже, чем система 1. Допустим, что система 2 хуже системы 1. Если бы это было так, то можно было бы построить систему, показанную на рис. 4.36, *, которая осуществляет над 2(0 операцию, обратную kit гЫ],сцелью получения г(и), а затем пропускает г(и) через систему 1. Такая совокупная система будет работать так же хорошо, как система 1 (они идентичны по входу и выходу). Так как результат рис. 4.36, в получается путем операции над гШ, он не может быть лучше, чем в системе 2, иначе это будет противоречить утверждению о том, что вторая операция в системе 2 является оптимальной. Поэтому система 2 не может быть хуже, чем система 1. rfu) 4*"*Tf Оптимальная' операция над г (и) {Система 1 Выход 1 «) г(и) 4-u-Tf k[t,r(u)} Z® * Оптимальная операция над z(t) Выход Ζ S) z(t) k'Lu,z(t)] r(u) ?-"-'£ Система 1 Выходу Ь) Рис. 4.36. Доказательство обратимости: а—система /; б—система 2; β—система 3. Следовательно, для облегчения решения задачи можно вводить любую обоатимую операцию. Отметим, что вопрос линейности здесь не имеет значения, важно только, чтобы существовала обратная операция. Условие обратимости является достаточным, но не необходимым. (Это очевидно из рассмотрения достаточной статистики в гл. 2). Вернемся теперь к интересующей нас проблеме. Первые два из указанных методов сопряжены с гораздо меньшим объемом работы и, кроме этого, позволяют довольно легко переходить к более общим случаям. Однако третий метод, основывающийся на использовании обратимости операций, представляется интуитивно более привлекательным, поэтому мы рассмотрим его первым. 4.3.1. Метод выбеливания Сначала синтезируем структуру оптимального обнаружителя и оптимального устройства оценки. В этом параграфе предусматривается требование, чтобы уровень .белого шума был отличен от нуля. 332
Структуры. В качестве предварительной операции пропустим r(f) через линейный фильтр с изменяющимися во времени параметрами, импульсная характеристика которого есть hw(t9 и) (рис. 4.37). Импульсная характеристика считается равной нулю при любом t или и вне интервала [Ть Tf]. Пока не будем беспокоиться о реализуемости r(t) Рис. 4.37. «Выбеливающий» * фильтр. фильгра и о том, что характеристика hw(t, и) может быть отличной от нуля при и >t. Позднее в конкретных примерах мы рассмотрим также и реализуемые выбеливающие фильтры. Выход равен Tf Tj г* (О Δ $ К (/, и) г (и) du= \hw (/, и) VEs (и) du + Ti Ti Tf + \hw(t,u)n(u)dubSb(f)+n*(t), rr<i<ry, (146) Ti когда истинна гипотеза Hl9 и МО =*·(<)■ Tt^t^Tfy (147> когда истинна гипотеза Я0. Требуется выбрать hw (/, и) так, чтобы Кп* (t,u)=E [n* (t) n* (и)] = = δ(ί—α), rf<i, и<7у (148) Заметим, что мы произвольно задались единичной спектральной плотностью шума на выходе выбеливающего фильтра. Это ограничение является просто удобным приемом нормировки. В связи с изложенным возникает ряд вопросов. Какие ограничения должны быть наложены на /С7г(£ и), чтобы гарантировать существование обратимого выбеливающего фильтра? Поскольку выбеливающий фильтр является линейным, его обратимость можно показать путем отыскания фильтра с такой характеристикой KZl(t, и), что Tf ξ hZl {t,z)hw{zyu)dz = b{t — u)y T,<f, u^Tf. (149)" Ti Предположим пока, что мы можем найти соответствующую систему условий, и продолжим наше рассуждение далее. Так как шум n*(t) является «белым», можно использовать (22) и (23) непосредственно (No = 2): Tf Tf In Λ [г* (/)] = I rι (и) s* (и) du — -f $ V (и) du. (150) т. * Ti 333 /if*),
Это можно также записать непосредственно через исходные колебания и hw(t, и): Tf Tf Tf In Л [r (t)]= § du \hzAu>z)r {z)dz\)hw{u,v)YEs(v)dv — Tf Tf Tf —~ 5 du \ hw(u, z) YEs(z)dz J hw(u, v)Y-Es{v)dv. (151) i i i Данное выражение можно формально упростить, вводя новую функцию Tf Qn(z,v)=\hw(u,z)hw(u,v)du, Ti<z,v<TJ. (152)11 Пока можно рассматривать ее как функцию, на которую мы случайно наткнулись, стремясь упростить уравнение. Позднее мы увидим, что она играет фундаментальнудю роль во многих наших рассуждениях. Переписав (151), получим г, т, 1пЛ[г(0]= \ r(z)dz \ Qn(z, v) YEs(v)dv — --f- ) s (z) dz $ Qn (ζ, Ό) s (v) dv. (153) 2 τ, Выражение (153) можно упростить, записав Tf g{z)=\ Qn(z9 ν) \'Es{v)duy Tt<z<Tf. (154) *t В (154) мы использовали строгое неравенство. В (153) g(z) появляется только под знаком интеграла. Поэтому, если g(z) не содержит сингу- лярностей на концах интервала, то можно приписать g(z) любое конечное значение в концевой точке и In Л[г(/)] сохранит свое значение. Если имеется компонента белого шума, то можно показать, что функция g(z) интегрируема в квадрате (и, следовательно, не содержит син- *) В данном параграфе необходимо быть внимательным с концевыми точками интервала. Затруднение связано с коэффициентом 2, появляющимся/из-за наличия дельта-функции в выражении для ковариационной функции шума. Этого можно избежать, если использовать открытый интервал, а затем доказать, что-концевые точки интервала не существенны в условиях данной задачи. Предполагается, что читатель не обращает внимание на эти замечания относительно концевых точек, пока не дойдет до § 4 3.3. Этот авторский прием делает рас* сматриваемые параграфы более удобочитаемыми. 334
гулярностей). Ради ^удобства сделаем ^(г) непрерывной на концах интервала: g(Tf) = lim g(z)\ £(7\) = lim g(z). z-*Tf- Ζ-+ΤΛ Видно, что построение функции правдоподобия связано с операцией вычисления корреляции между фактически принимаемым колебанием и функцией g(z). Поэтому с точки зрения синтеза приемника не- r(t)^ \r(t.*) Порогобое устройство r(t) 9(t) r(t) 4n(t,u) dt Jes(t) S) хЫГ« « Порогодое устройство Пороговое устройство Рис. 4.38. Различные варианты построения блок-схемы приемника в задаче с небелым шумом. обходимой является только функция g(z). Заметим, что вычисление корреляции между r(t) и g(t) есть просто сведение пространства наблюдений к одной достаточной статистике. Три канонические схемы приемника для простого бинарного обнаружения представлены на рис. 4.38. Первые две схемы, как будет показано, являются практическими реализациями, тогда как третья допускает весьма интересную интерпретацию. Модификация рис. 4.38, б для получения реализации в виде согласованного фильтра является очевидной. Для реализации указанных приемников необходимо решить (149), (152) и (154). Вместо того, чтобы искать решения этих уравнений в замкнутой форме, в этом параграфе мы займемся отысканием решений в виде рядов собственных функций и собственных значений ядра Kc{t* и). Такой подход преследует две цели: 1. Этим самым демонстрируется, что решения существуют. 335
2. Такие решения полезны в некоторых задачах оптимизации. После получения указанных решений, мы определим помехоустойчивость приемника и распространим их на общие случаи задачи бинарного обнаружения, многоальтернативной задачи обнаружения и задачи оценки. Затем рассмотрим вопрос о решениях в замкнутой форме. Преимущество такого подхода заключается в том, что он позволяет получить полное представление о проблеме, связанной с наличием коррелированного шума, и установить многие ее важные особенности, не входя в утомительные подробности решения интегральных уравнений. Построение Qn(t, и) и g(t). Прежде всего необходимо выразить Qn(t, и) непосредственно через Kn{U и). Вспомним определение hw(t9 и). Это линейный фильтр с изменяющимися во времени параметрами, выбранный так, что когда на его вход воздействует n(t), на выходе будет n*(t) — выборочная функция процесса типа ^белого гауссова шума. ^Гаким образом, «·(<)= S hw(t,x)n(x)dx, T^t^Tf (155) E[n.(t)nm(u)]=KnAt,")=b(! — u). Tt^t^Tf. (156) Подставляя (155) в (156), имеем Tf b(t—и) = E}\)hw(t, x)hw(u, z)n(x)n{z)dxdz. (157) Вводя математическое ожидание под знак интеграла, получим Tf b(t—u) = \\hw (t, x)hw(и, ζ) Κη (χ, ζ) dxdz, Τι <t, и < Tt. (158) Чтобы получить (158) в такой форме, чтобы можно было ввести Qn(.t,u), умножим обе части на hw(t,v) и проинтегрируем по t. Это дает Tf Tf TJ К (и, ν) = 5 dzhw {и, ζ) Ι Κη (χ, ζ) dx I hw (t, v) hw (t, χ) dt. (159) Tt Ti Tt Как видно из (152), последний интеграл есть просто Qn(v, x). Следовательно, Tf Tt hw (и, ν) = J dzhw (и, ζ) Ι Κη (х, ζ) Qn (ν, χ) dx. (160) 336 Ti
Из этого следует, что внутренний интеграл должен соответствовать импульсу на открытом интервале Tt Ь(г—и) = lKn(x,z)Qn(v,x)dx, Тг<г, v<Tf. (161) Ti Это и есть требуемый результат, связывающий Qn(o, χ) непосредственно с исходной ковариационной функцией. Ввиду того, что Кп(х> ζ) является ядром многих представляющих интерес интегральных уравнений, Qn(v, x) часто называют обратным ядром. В предположении, что истинна гипотеза. Н0 ' r(t)-nc(t)+w(t) 14dt г Нереализуемый фильтр №±) 1 Рис. 4.39. Реализация устройства обнаружения, использующего оптимальный линейный фильтр. Из (145) известно, что /Сп(*> ζ) состоит № импульса и члена с хорошей асимптотикой. Логично было бы выразить в аналогичной форме и Qn(vy jc). Будем искать решение (161) в виде Qn(vt x)=^-[8(v-x)—h0(v,x)], Tt<v, x<Tf. (162) Подставляя (145) и (162) в (161) и производя перегруппировку членов, получим уравнение, которому должна удовлетворять функция h0(v9 x): Tf ^h0(u,z) + 1к0(и,х)Кс(х^)с1х = Кс&,2), Τ,<ζ9 v<Tf. (163) 2 Ti Это уравнение известно нам из § 3.4.5, посвященного оптимальным линейным фильтрам [в частности формула (144) гл. 3]. Смысл этого сходства легко усматривается, если перечертить блок-схему рис. 4.38, β так, как показано на рис. 4.39. Функция Qn(t> и) разбивается на две части. Нетрудно заметить, что выход фильтра в нижней ветви блок- схемы есть оценка по минимуму среднеквадратической ошибки компоненты коррелированного шума в предположении, что истинна гипотеза #0. Если бы nc(t) было нам известно, то совершенно очевидно, что оптимальная обработка заключалась бы в вычитании η c(t) из r(t) и пропускании результата через согласованный фильтр или корреляцион- 337
ный приемник. Оптимальный приемник осуществляет именно эти операции, но только при неизвестном nc(t): он дает оценку nc(t) по минимуму среднеквадратической ошибки, т. е. η0(ή, и затем использует ее. Интуитивно этот результат является желательным и будет часто встречаться при дальнейшем изложении1*. Из результатов гл. 3 (3.154) можно записать формальное решение для h0(tf и) через собственные значения KC{U ")· Используя (3.154), получим оо ho(t, u)= 2 Г7Т1^ф^)Фг-(«), Г|<*. "<Tt, (164) где %ic и Φι(ή — соответственно собственные значения и собственные функции ядра /Сс(^ и). Можно записать полное обратное ядро в виде "»<'■">-£[·*-■*-,|i?^w·'<*·■<·>]· <165) Следует еще раз подчеркнуть, что возможность записать Qn(t, и) в виде суммы импульсной функции и функции с хорошей асимптотикой опирается в основном на наше предположение, что уровень белого шума на интервале отличен от нуля. Это математическое объясняение необходимости такого допущения. Можно также записать Qn(t, и) в виде одного ряда. Выразим импульс через ряд, используя (3.128). В результате получим оо оо Qn(t,u) = 2 (^+ν)"ΙΦι(/)Φ,(«)= 2-^*1(0*1 ("). (166) где #0 λ/Δίϋ+λ,' (167) («Г» обозначает «полный»). Ряд (166) не сходится. Однако в большинстве случаев Qn(t> и) находится под интегралом и все выражение будет сходиться. Х) Читатель может удивиться, почему мы придаем значение тому, представляется ли данный результат интуитивно желательным, если известно, что он является оптимальным. Это объясняется двумя причинами. I. Этот результат позволяет избежать грубой ошибки. Для задач интересующего нас типа, когда мы получаем математический результат, который интуитивно не просматривается, обычно необходимо вернуться к формулировке модели и последующим выкладкам с тем, чтобы убедиться: либо модель не учитывает какую-тр существенную особенность задачи, либо нас подводит интуиция. 2. Во многих случаях решение для оптимального приемника может быть математически недоступно. Возможность интуитивной интерпретации решений для различных гауссовых задач позволяет. построить хороший приемник на основе наших интуитивных соображений в тех случаях, когда нам не удается получить математического решения. 338
В качестве конечного результата нам необходимо найти уравнение, которое будет определять g(t) непосредственно через Kn{U ζ). Начнем с соотношения (154): g(z) = lQn(*>v)VEs(u)dv9 Tt<z<Tf. (168) Используемый нами метод основывается на обратной зависимости между Kn(t, ζ) и Qn(t, г), описываемой выражением (161). Чтобы избавиться от Qn(z, v)t умножим (168) на Kn{U ζ), проинтегрируем по ζ и используем (161). После этого получим Tf lKn(i,z)g(z)dz = VEs(t)t Tt<t<Tf. (169a) Ti Подставив (145) в (169а), получим уравнение для открытого интервала (Ть Tf). Сделанное нами после (154) допущение о непрерывности позволяет обобщить результат на закрытый интервал [Ти 7^]. Окончательный результат имеет вид Tf ^g(t)+ lKAt,z)g(z)dz = YEs(t)9 Tf</<7,. (1696) 1 Ti Для реализации приемника, как показано на рис. 4.38, б, необходимо решить непосредственно уравнение (1696). Метод получения решений в замкнутой форме будет изложен в § 4.3.6. Решение в виде ряда без труда можно записать, если использовать (168) и (165): la-iVE.n-i^jgfaw. ото» где Tf sf= $l/£s (*)<&,(*) Л. (171) Первый член нам знаком по случаю белого шума. Второй член учитывает влияние небелого шума. Заметим, что g(f) всегда является интегрируемой в квадрате на интервале (Гг·, Tf)> когда присутствует компонента белого шума. Проверку поведения g(/) на концах интервала отложим до § 4.3.3. Краткие итоги. В этом параграфе получено решение для оптимального приемника применительно к задаче простого бинарного обнаружения известного сигнала на фоне небелого гауссова шума. Оптимальный приемник может быть реализован в виде одного из трех вариантов. 339
1. Выбеливающий фильтр (рис.4.38, а). 2. Коррелятор (рис. 4.38, б). 3. Оценивающе-вычитающее устройство (рис. 4.39). С каждой из указанных реализаций связано соответствующее интегральное уравнение, которое необходимо решить, чтобы синтезировать приемник [(158), (169) и (163)]. Было доказано, что решения в виде ряда можно получать в терминах собственных значений и собственных функций, однако фактическое отыскание решения в замкнутой форме было отложено до более поздних разделов. Было введено понятие «обратного ядра» и показан простой случай его приложения. Остались открытыми следующие вопросы: 1. Насколько хорошо работает система? 2. Как найти решение интересующих интегральных уравнений в замкнутой форме? 3. Каковы аналогичные результаты для задачи оценки? Прежде чем ответить на эти вопросы, выведем упомянутые результаты, не прибегая к идее выбеливания. Ввиду указанных альтернативных выводов доказательство того, что hw(t, и) является обратимым оператором, оставим в качестве упражнения для читателей (задача 4.3.1). 4.3.2. Непосредственный вывод на основе разложения Карунена—Лоэва1* В этом параграфе рассмотрим более фундаментальный метод. Он не только является более непосредственным для данной конкретной задачи, но и легко распространим на общий случай. Приводимый вывод аналогичен выводу, сделанному на стр. 297—299. Простота решения задачи обнаружения на фоне белого шума в § 4.2 объясняется тем, что несмотря на выбранный нами ортонорми- рованный ряд, получающиеся наблюдаемые величины rl9 r2,..., г/с были условно независимыми. Из материалов гл. 3 известно, что такой же простоты можно достигнуть, если выбрать.ортогональный ряд так, чтобы его ортогональные функции были собственными функциями интегрального уравнения (3.46): V*i(0= \КЛии)Ф1(и)аи9 7\<г<7> (172) Тг Заметим, что λ^ являются собственными значениями только процесса коррелированного шума. (Если KC{U и) не является положительно определенным, то можно довести ряд до полного.) Затем мы разложим r(f) в этой координатной системе: *> Этот метод решения задачи разработан Гренандером [30]. (См. также [31]). 340
r(f) = I.i.m. Σ Γ,Φ,(ί) = к к = l.i.m. Σ s,0«(i) + l.i.m. Σ Λ|Φ|(<)» ^</<Г/э (173) где гг=$г(г)Фг(')Л, s,= $/£β(ΟΦ|(ΟΛ, И яг= ξ n(t)0t(t)dt. ι Из (3.42) известно, что £(Л|)=0, Ε(ηιηί) = λΐδυ, где 1 - 2 (174) (175) (176) (177) (178) Точно так же, как на стр. 298 (20), рассмотрим первые К координат. Отношение правдоподобия равно Π ι ΓΙ (Ri-sj)4 Л [rK(t)\ = к : 77— . (179) 1' =г ехР - Τ ΊΤΊ i= 1 V7 2πλ[ Приведя подобные члены, полагая /С^-оо и логарифмируя, получим 5? 1ηΛ[Γ(ί)]= Σ^Γ-J Σ^- (18°) Используя (174) и (175), имеем Tf Т, lnA[r(/)]= S Л S Air (/) S^W^^/Estu)- г= ι 'ч -Mdt^dus(t)2^S^s(u). (181) 341
Из (166) нетрудно усмотреть, что сумма под интегралом равна Qn (t, и). Поэтому г/ Tf In Л [г (t)]= Idt \dur{t)Qn{t,u)iEs(u) — F Ί Tf ——)dt\dus(t)Qn(t,u)s(u). (182)J> 2 T Ti Это выражение тождественно (153). Заметим, что если бы не использовался метод выбеливания, то необходимо было бы просто задать Qn(t> и) в соответствии с нашими условиями, когда мы подошли к этому моменту данного вывода. Позднее при рассмотрении более общих задач обнаружения (в частности в гл. 3 второго тома) этот непосредственный вывод можно будет легко продолжить. 4.3.3. Непосредственный вывод на основе достаточной статистики2* Для удобства интересующую нас задачу обнаружения (140) перепишем в виде I л(0. { VEs{t)+n{t)y Tt^t^Tf:Hl9 Г|</<Г/:Я0. В этом параграфе не будем требовать, чтобы шум содержал белую компоненту. Из материалов гл. 2 и § 2. 4 известно, что если можно записать r(t)=rlS(t)+y(t)9 T.^t^Tf. (184) где Гл — случайная величина, полученная посредством операции над r(t), и показать, что а) гх и y(t) — статически независимы по обеим гипотезам, б) статистика y(t) не зависит от того, какая из гипотез справедлива, то гг является достаточной статистикой. Далее можно основывать наше решение исключительно на гг , на считаясь cy(t). [Заметим, что Х) Для строгого перехода от (181) к (182) согласно [30, 31] необходимо по- оо требовать, чтобы 2 (S//^J2) < °°· Это условие всегда справедливо, когда при ί=1 сутствует белый шум. Позднее при снятии предположения о том, что присутствует белый шум, мы увидим, что расходимость этого ряда приводит к неустойчивому критерию. 2) Данный метод решения задачи с небелым шумом разработан независимо несколькими авторами ([32, [39]). Хотя оба вывода по существу одинаковы, мы следуем второму. 342
условия а) и б) являются достаточными, но не необходимыми для того, чтобы гг была достаточной статистикой (см. стр. 48—49)]. Для этого предположим, что гг можно получить посредством операции Tf ri=^r(u)g(u)dut (185) Tt и попытаемся найти функцию g(u)> которая обладала бы требуемыми свойствами. Используя (185), можно переписать (184) в виде /А i(si + n1)s(t)+y(i) :Нг Γ(ΗΐΜ<0+*(0 '-"ο, (186) где TJ slbL\YEs(u)g(u)du (187) τ, Tf n1b\n{u)g{u)du. (188) Ti Поскольку достаточную статистику можно умножить на любую постоянную величину, отличную от нуля, с сохранением достаточности, можно ввести ограничение V \s(u)g(u)du=*l. (189а) Используя (189а) в (187), будем иметь 81=УЁ. (1896) Очевидно, что пг — случайная величина с нулевым средним и n(f) = nls(t) + y(f), 7\<г<Г,. (190) Это придает задаче удобную форму; остается только найти условие, которому должна удовлетворять g(u), чтобы Ε [ПгУ (/)]= 0, Гг<г<Г„ (191) или, что эквивалентно, E{n1[n(t) — n1s{t)]}=0, T^t^Tf, (192) или £[n1-n(i)]=5[n18]s(i), Гг<г<7у (193) 343
Используя (188), получим lKn(t, u)g(u)du = Ti Tf = s(f)llg(o)Kn(a,P)g(fi)dadfi, T^t^Tf. (J94) Tt Уравнения (189а) и (194) будут удовлетворяться, если Tcf )Kn(t,u)g(u)du = VEs(t), 7*,<*<7у (195) Ti [Нужно подставить (195) в правую часть (194) и использовать (189а).] Достаточная статистика гх получается посредством коррелирования г(и) с g(u). После получения гх мы используем ее для построения критерия отношения правдоподобия, с тем чтобы решить, какая из гипотез является истинной. Заметим, что (195) выполняется на закрытом интервале [Ti9 Tf], тогда как (169а) выполняется на открытом интервале (Ti9 Tf). Это различие^объясняется тем, что в отсутствии белого шума g(u) может иметь сингулярности на концах интервала. Эти сингулярности изменяют отношение правдоподобия, поэтому нельзя произвольно выбирать значения на концах интервала. Преимущество последнего нашего вывода заключается в том, что он правильно учитывает условия на концах интервала. Следует также отметить, что если имеется компонента белого шума, то (195) и (199а) дадут для g(Tt) ng(Tf) различные значения. Однако, поскольку оба множества значений являются конечными, то отношение правдоподобия остается тем же. В последних двух параграфах были изложены два различных вывода структуры оптимального приемника. Известны и другие выводы (математически подготовленный читатель может обратиться к [40], [41], [43] или [45]). Вернемся теперь к вопросам, обсуждение которых было прервано нами на стр. 339. 4.3.4. Достоверность обнаружения Следующий интересующий нас вопрос — как влияет наличие коррелированного шума на достоверность (качество) обнаружения? В процессе его изложения возникает ряд интересных аспектов. Рассмотрим сначала случай простого бинарного обнаружения. Достоверность в задаче простого бинарного обнаружения. Рассматривая структуру приемника на рис. 4.38, а, нетрудно убедиться, что по помехоустойчивости он тождествен приемнику, у которого 344
входной сигнал равен s* (ή, а помеха — белый шум со спектральной плотностью, равной 2. Используя (10) и (11), имеем #2= JmO]1*· (196) Тг Таким образом, показатель достоверности (качества) d2 просто равен энергии «выбеленного сигнала». Этот показатель можно также выразить через исходный сигнал Tf rTf _ ] YTf _ d2=]dt\ ) hw (t, и) ΫΕ s (и) du\ \hw(t, ζ)γΕ s(z)dz .(197) Для выполнения интегрирования по t используем определение Qn(u, ζ). Получим d2 = Ε 55 du dzs (и) Qn (и, ζ) s (г), Ti Tf (198) d2 = \/E J dus(u)g(u). Ti Отсюда видно, что достоверность обнаружения уже не является независимой от формы сигнала. Поэтому логично найти наилучшую возможную форму сигнала. Представляют интерес три случая. 1. Ti = 0, Tf = Τ: интервал сигнала и интервал наблюдения совпадают. 2. Ti < 0, Tf > Τ: интервал наблюдения выходит за пределы интервала сигнала в одном или обоих направлениях оси времени, оставаясь, однако, конечным. 3. Ti = — оо, Tf = оо: интервал наблюдения бесконечен в обоих направлениях. Мы рассмотрим только первый случай. Оптимальная форма сигнала. Совпадающие интервалы. Задача состоит в ограничении энергии сигнала Ε и определении того, как влияет на достоверность обнаружения тонкая структура сигнала s(t). Ответ получается сразу. Запишем Тогда где «»(<^)=2("Τ + ·λίβ) 1ф|С>Ф|(и)· О") оо d* = у _!ί , (200) _Si< τ sf = S/Es (0 Ф| (0 Л. (201) о 345
Заметим, что 2sf2=£, (202) так как функции являются нормированными. Из (200) видно, что d2 есть просто взвешенная сумма s*2. Поскольку (202) ограничивает сумму яД нам необходимо распределить энергию сигнала таким образом, чтобы st с большими весами обладали и большей энергией. Если существует наименьшее собственное значение, скажем λ/ = λ^ΐη* то d2 можно максимизировать, положив sj = = У Ε, а все остальные st = 0. Представляют интерес два случая. 1. Если функция Kc(t, и) является положительно определенной, то число собственных значений бесконечно. Наименьшего собственного значения не существует. Полагаем Sj = У Ε, а все прочие st = 0. Тогда при условии, что собственные значения расположены в порядке убывания их величины, Ко при увеличении /. Для многих видов небелых (коррелированных) помех, встречающихся на практике (например, однополюсный спектр, показанный на рис. 3.9), частота собственной функции возрастает по мере уменьшения собственных значений. Иначе говоря, мы увеличиваем частоту сигнала до тех пор, пока коррелированный шум не станет пренебрежимо малым. В этих случаях более реалистичную постановку задачи построения сигнала мы получим введением ограничения ширины спектра. 2. Если Kc{U и) является только неотрицательно определенной, то будут иметь место нулевые собственные значения. Если s(t) — собственная функция, соответствующая какому-либо из них, то No Видно, что качество (достоверность) обнаружения наилучшего сигнала ограничивается белым шумом. Сингулярность. Влияние факта исключения из рассмотрения белого шума легко проследить, если в (200) положить N0 = 0. Если небелый шум является положительно определенным (случай 1), то все собственные значения отличны от нуля. Идеального обнаружения (d2 = = оо) можно достичь тогда и только тогда, когда сумма d2^2v (203) расходится. 346
Это условие может быть выполнено, если s(t) выбрать так, чтобы s2 были пропорциональны Xtc. Напомним, что оо Т/ ΣΚ*= [Kc(t9t)dt<M. Правая часть, согласно нашему предположению, сделанному после оо (145), является конечной. Поэтому энергия сигнала (Е = 2s/2) будет конечной. Если бы присутствовала компонента белого шума, то невозможно было бы достичь пропорциональности для всех i при конечной энергии сигнала. В случае 2 имеются нулевые собственные значения. Поэтому мы получим d2 = оо посредством выбора s(t) = Фь (ή для любого /, соответствующего нулевому собственному значению. Указанные два случая соответствуют так называемому вырожденному (сингулярному) обнаружению. Для произвольно малых интервалов времени и произвольно малых уровней энергии достигается идеальное обнаружение. Вполне понятно, такое качество обнаружения невозможно получить в реальной физической ситуации. Но поскольку нашу математическую модель мы ввели для оценки качества реальной системы, необходимо, чтобы она была достаточно реалистичной, с тем чтобы исключить возможность сингулярного обнаружения. Мы исключили такую возможность, введя требование наличия компоненты белого шума, учитывающей тепловой шум приемника. Часто такой шум оказывается несущественным. Если же, однако, мы синтезируем сигнал для устранения влияния всех прочих помех, то этот шум становится величиной, которая ограничивает достоверность обнаружения и не позволяет нашей математической модели предсказывать результаты, которые не будут иметь место на практике. Из (196) известно, что d2 — энергия' выбеленного сигнала. Следовательно, если выбеленный сигнал обладает конечной энергией, то критерий не является вырожденным. Когда пространство наблюдения бесконечно, а шумовой процесс стационарен и имеет рациональный спектр, в конечности энергии s (t) нетрудно убедиться. Сначала найдем передаточную функцию выбеливающего фильтра. Напомним, что оо М<)= S hw(u)n{t-u)du. (204) —оо Потребуем, чтобы помеха n#(t) была белым шумом с единичной спектральной плотностью. Из этого следует, что оо § dudzhw(u)hw(z)Kn{t — u + z — v) = —оо = δ(ί-^ν), —oo<t,v<oo. (205) 347
Произведя преобразование, получим Ι^(/ω)ρδη(ω) = 1 (206а) или Ι^.ϋω)Ί*=-Γτ^. (2066) Ьп (со) Теперь предположим, что Sn(co) обладает рациональным спектром Sn (со) = -Л 1л=1 I—ZJL . (207а) <yo2^Vi ω2'-2+ ·..+<*<> Обозначим разность между порядками знаменателя и числителя (как функций ω2) через г: rAp—q. (2076) Если мощность n(t) конечна,.то г^ 1. Однако, если шум содержит ком* поненту белого шума и компоненту небелого шума с конечной мощностью, то г = 0. Используя (207а) в (2066), легко заметить, что #φ(/ω) можно записать как отношение двух полиномов по степеням /со: Hw (/ω) =-- p * } ^ p~lW ' ——±-. (208a) Алгоритм отыскания коэффициентов этих полиномов будет выведен в гл. 6. Для нас сейчас их истинные значения не существенны. Поделив числитель на знаменатель, получим Hw (/ω) =fr Ο'ωΚ + fr-i (Mr~l +... + fe + , R (fo) Μ/ω)'+· ··+*<> ' (2086) где /г, ..., /0 — постоянные величины, а /?(/ω) — остаточный полином порядка ниже, чем q. Напомним, что (/со)г в частотной области соответствует взятию производной г-го порядка во временной области. Следовательно, для того чтобы критерий был невырожденным, производная г-го порядка должна иметь конечную энергию. Иначе говоря, если ί (^)2^<Λί· « —<х> то критерий является невырожденным. Например, если S„H=-^, (2Юа) ω2-|-α2 то р—q=r=l (2106) 348
и производная s'{f) должна иметь конечную энергию. Если бй мы моделировали сигнал в виде идеального прямоугольного импульса, то наша модель указала бы на идеальную обнаруживаемое^. Мы знаем, что указанная идеальная обнаруживаемое^ на практике не имеет места. Поэтому необходимо несколько видоизменить нашу модель, так чтобы она позволяла точно рассчитать помехоустойчивость системы. В данном случае вырожденный результат можно устранить, если допустить конечное время нарастания импульса или добавить к шуму белую компоненту. Очевидно, если имеется небелый шум конечной энергии плюс независимая компонента белого шума, то интеграл (209) есть просто энергия сигнала и вопроса о вырожденности не возникает. В наших рассуждениях мы исходили из предположения, что интервал наблюдения является бесконечным. Ясно, что если критерий является невырожденным на бесконечном интервале, то он будет невырожденным и на конечном интервале, поскольку зависимость качества обнаружения от длины интервала наблюдения имеет монотонный характер. Обратное утверждение несправедливо. Из вырожденности на бесконечном интервале не следует вырожденность на конечном интервале. В этом случае необходимо проверить (203) или прибегнуть к операции выбеливания на конечном отрезке времени. В большей части нашего изложения мы исходили из допущения о наличии белого шума, поэтому вырожденных критериев у нас никогда не было. Если это предположение снять, то необходимо проверить нашу модель с тем, чтобы убедиться, что она не соответствует вырожденному критерию. Приемники для общего бинарного случая. До сих пор рассматривались только задачи простого бинарного обнаружения. Результаты легко распространить на общий случай. Пусть r(i)=J/*i МО+*(*). Tt^t^Tf:Hl9 (211) {Y~E0s0(t) + n(t), 7\<*<7у.Я0, где s0(t) и Si(/) — нормированы на интервале (0, Т) и равны нулю вне его. Рассуждая точно таким же образом, как и в случае простого бинарного обнаружения, получим следующие результаты. Одна из блок- схем приемника изображена на рис. 4.40, а. Функция g^t) удовлетворяет уравнению sA(t)AVElSl(t)-VE0s0(t)=: Ti = J £Δ (и) Кп (U и) du, 7\ < t < Tf. (212) *ι Достоверность обнаружения характеризуется показателем Tf d2 = §sA(t)Qn(t,u)sA(u)dtdu. (213) 349
Функции Kn{U и) и Qn(ty и) определяются выражениями (145) и (161) соответственно. В качестве альтернативного варианта можно использовать выбеливающую реализацию, показанную на рис. 4.40, б. Здесь hw(U w) удовлетворяет уравнению (158) и **.(*) *lhwQ>") sA(u)du9 Tt^t^Tfu (214) Показатель достоверности определяется величиной энергии в выбеленном разностном сигнале d»=$s2.tt)<tt. (215) Ti Многоальтернативный случай обнаружения также представляет собой непосредственное развитие случая простого бинарного обнару- β/7*. Пороговое устройстбо Hf или. Ησ 9UW a) Ht) v^pkxH j ψ. Порогодое устройст6о\ H1 или И0 %/« ю Рис. 4.40. Варианты построения блок-схемы приемника для случая общей бинарной задачи при небелом шуме. жения (см. задачу 4.3.5). Из наших рассуждений для случая белого шума можно ожидать, что результаты для случая отыскания оценки получить столь же нетрудно. Этот случай кратко рассмотрен в следующем параграфе. 4.3.5. Отыскание оценок Модель принимаемого сигнала в задаче оценки параметра записывается в виде r(t)=s(t,A) + n(t), Г,<*<7у (216) Основная операция над принятым колебанием заключается в построении функции правдоподобия, для которой не представляет труда вы- 350
вести соответствующее выражение. Если проанализировать (98—101) и (146—153), то станет очевидным, что ответ можно записать в виде Tf Tf 1пЛ1[г(/),Л]= J r(z)dz\Qn(z,v)s(v,A)dv- т. т. Tf Tf L $ dzs (ζ, A) jj Qn (z, v) s (v9 A) dv. (217) Этот результат аналогичен (153) в задаче обнаружения. Если ввести g (z; A) = jj Qn (ζ, υ) s (v, A) dv, Tt<z< Tf9 (218) Ti или, в эквивалентной форме, Tf s(viA)=^Kn(viz)g(zfA)dz, Tt<v<Tfi (219) Ti то (217) сводится к соотношению Tt \nA1[r(t),A]=\r(z)g(ziA)dz- *ι Tf —1-J s(z,A)g(z,A)dz. (220) Наши рассуждения в § 4.2.2 и 4.2.3 очевидным образом привели нас к случаю небелого шума. Сделаем краткий обзор наиболее существенных результатов по задачам линейных и нелинейных оценок. Линейные оценки. Принятое колебание имеет вид г (t) = A VEs (0 + η (ί), Tt < t < Tf9 (221) где s(t) нормирован на интервале [0, Τ] и равен нулю вне интервала. Подставив (221) в (218), получим g(t9A)=Ag(t)9 (222) гДе g(t) — функция, полученная в случае простого бинарного обнаружения путем решения (169). Таким образом, задача линейной оценки практически эквивалентна задаче простого бинарного обнаружения. Блок-схема устройства оценки изображена на рис. 4.41. Она полностью определяется, если найти g(t). Если А — неслучайная (детерминированная) величина, то нормированная дисперсия равна ol.n = (A*d*)-l9 (223) 351
где d2 определяется выражением (198). Если А есть значение случайной величины а с нормальным распределением N(0, σα) априорной вероятности, то минимальный средний квадрат ошибки равен <„={i+aa2d2) —ι (224) (Эти результаты соответствуют (96) и (97) для случая белого шума.) Легко можно провести все аналогичные рассуждения относительно вырожденных критериев и оптимальных сигналов. Нелинейные оценки. При отыскании нелинейных оценок в присутствии небелого шума мы встречаемся с теми же трудностями, какие имеют место в случае белого шума. Кроме этого, требуется найти либо **^&-уУг\ Усиление ami ши атар (6 зависимости, от 6ыд~ора коэффициента, усиления) g(t) Рис. 4.41. Линейное оценивание при небелом шуме. Qn(i, м), либо^(/, А). Поскольку все результаты для этого случая являются очевидными модификациями выражений, полученных в § 4.2.3, приведем их краткую сводку. 1. Необходимое, но в то же время недостаточное условие существования ат: 0= $Л J du[r(t)—s(t,A)]Qn(t,u) τ, г. ds(u, А) дА (225) А—а. ml 2. Необходимое, но в то же время недостаточное условие существования атар (в предположении, что а имеет нормальное распределение априорной вероятности): flmap = *2 $ dt[r(t)—s(t,A)] $ duQn(t,u) τ · τ · ds(и, А) ~дА . (226) А=а, тар 3. Нижняя граница дисперсии любой несмещенной оценки неслучайной величины А: σ2(α-Α)^ CCds(t,A) ds(u,A) J J ^4—Qn(Uu)—^—dtdu r или, что эквивалентно, σ2(α-Λ)> '/ ds(t, A) dg(t, A) dA 352 dA dt r (227a) (2276)
4. Нижняя граница среднего квадрата ошибки при оценивании нормальной случайной величины а, имеющей нулевое среднее, равна Ε [(α—α)2]> — 1 (228) 5. Нижняя граница дисперсии любой несмещенной оценки неслучайной величины в частном случае бесконечного интервала наблюдения и стационарной помехи равна о2 (а-А) > ] ^1^-5- И -1—1 as (/ω, Л) Λω дЛ 2π • (229) где оо S(j(u,A)A jj s (ί, Α) e-ι»' at. —oo Как было показано в § 4.2.3, результаты такого типа всегда справедливы, но для оценки их полезности всегда необходимо проверить общую функцию правдоподобия. Иначе говоря, нельзя игнорировать проблему порога. Единственным нерассмотренным вопросом для случая небелой помехи является отыскание решения для Qn(t, и) или g(t) в замкнутой форме. Эту задачу рассмотрим в следующем параграфе. 4.3.6. Методы решения интегральных уравнений Как было показано выше, для полного задания структуры приемника необходимо решить интегральное уравнение для g(t) или Qn(t, и). В настоящем параграфе мы рассмотрим три представляющих интерес "случая: 1. Бесконечный интервал наблюдения, стационарная помеха. 2. Конечный интервал наблюдения, разложимое ядро. 3. Конечный интервал наблюдения, стационарная помеха. Бесконечный интервал наблюдения, стационарная помеха. В этом частном случае Ть = —оо, Т1 = оо и ковариационная функция шума является функцией только разности аргументов. Поэтому уравнение (161) имеет вид оо δ(ζ—ό) = I Qn(x—z)Kn(v—x)dx, —οο<υ,ζ<οο, (230) —оо где предполагается, что можно найти Qn(x, z) такой формы. Обозначив преобразование Фурье Кп(ъ) через Sn(a)), а преобразование Фурье 12 За к. 693 353
QnW — через Sq(co) и преобразовав обе части (230) относительно τ — = ζ — υ, получим 5qH=—l—. (231) sn (ω) Нетрудно заметить, что Sq(co) есть просто величина, обратная спектру шума. Далее, в случае стационарного шума, (152) можно записать в виде оо Qn(z—O)=l hw (и - ζ) hw (и -v)du. (232) —оо Обозначив преобразование Фурье функции hw(%) через Hw(j(u), найдем, что из (232) вытекает Sn(CD) = Μω)4^(/ω)|2· (233) Наконец, для случая обнаружения и линейной оценки является полезным выражение (154). Произведя преобразование, получим Ос (/ω) =VESQ (ω) S (/ω) = S{^E , (234) Sn (ω) где подстрочный индекс «оо» означает, что речь идет о бесконечном интервале. Для иллюстрации различных результатов рассмотрим ряд конкретных примеров. Пример 1 Допустим, что небелая компонента шума имеет рациональный спектр. Типичным является случай, когда 2ka 2 Sc (ω) = о п о (235) к ' со2 + /е2 ' N0 2kon* Sn (ω) = — + — . (236) ηκ ' 2 co2 + /e2 ' Тогда со2 + /г2 SQ (ω) = - ί f (237) где Л = 4ап2//гУУ0. Перепишем (237) в виде S0 (ω) = nzn :zzzz~ · (238) V (^0/2)(/ω + Λ-Κΐ+Α)(-/ω + Λ/ΐ + Α) Нам необходимо выбрать Hw(j(u) так, чтобы удовлетворялось уравнение (233). Для получения реализуемого выбеливающего фильтра члену (/ω + k(\ + Л)1/2) доставим в соответствие #ц,(/(о), а сопряженному с ним члену — H*w(j(u). Члену т
(/ω + k) в числителе можно поставить в соответствие Hw(j(u) или Hw*(j(u). Следо. вательно, для выбеливающего фильтра имеются два равноценных варианта1). 2 \ 1/2 Н, -an Нтг (/ω) = _2_V/2 1 — 1/2 /(o + fe(l+A)'/2 ft(/l+A-l) (*)' — /ω + fe /со + /е(1+Л)1/2 *(/ί + Α+ΐ) (239) (240) -1+ , Таким образом, оптимальный приемник (обнаружитель) может быть реализован в сопряженных формах выбеливающего фильтра, изображенных на рис. 4.42. Здесь также показана эпюра колебаний для случая, когда s(t) является прямоугольным импульсом. В связи с изложенным можно отметить три обстоятельства H*r9tj*>) f) r(t) а) Рис. 4.42. Варианты «выбеливающей» реализации оптимального приемника. I. Выбеливающий фильтр обладает бесконечной памятью. Поэтому для выработки входного напряжения коррелятора он полностью использует все прошлое процесса r(t). *> Фактически их имеется бесконечное число, так как фильтр Hw (/ω) можно включать последовательно с любым фильтром, имеющим единичную передаточную функцию. Заметим, .что мы выбрали реализуемый фильтр, который можно построить. В математической модели реализуемости фильтра, вообще говоря, не требуется. 12* 355
5. Сигнал на входе перемНожитёЛя будет появляться в момент времени t = 0 и будет продолжаться даже после времени t = Т. 3. Фактическими пределами интегрирования являются (0, оо), так как сигнал на одном из входов перемножителя до момента времени t = О равен нулю. Можно убедиться, что эти выводы справедливы во всех случаях, когда шум состоит из белого (некоррелированного) и независимого от него небелого (коррелированного) шума с рациональным спектром. Они справедливы также, когда коррелированный шум имеет нерациональный спектр, хотя это непосредственно проверить и труднее. Поэтому можно сделать вывод, что при указанных выше условиях увеличение интервала наблюдения всегда влечет за собой повышение достоверности обнаружения. Следует отметить, что если в качестве декоррелиру- 0 I 5~н JL щ& sit) Jv* > ■ \гт \ι Ю Рис. 4.43. Интерпретация оптимального приемника в виде комбинации устройств оценки и вычитания. ющего фильтра используется Hwl(j(u), то выходной величиной фильтра в нижней ветви будет пс (t) — реализуемая точечная оценка пс (t) по минимуму среднего квадрата ошибки. Впоследствии, при исследовании реализуемых устройств оценки в гл. 6, мы будем иметь возможность убедиться, что этот результат справедлив всегда. Отметим, что столь же просто (во всяком случае, по идее) можно оперировать непосредственно с Sq(cu). В данном конкретном случае это практически нецелесообразно, однако такой подход приводит к интересной интерпретации оптимального приемника. Заметим, что Sq((u) соответствует нереализуемому фильтру. Нетрудно видеть, что можно пропустить r(t) через этот фильтр, а затем взять функцию взаимной корреляции между выходным сигналом фильтра и s(t), как показано на рис. 4.43, а. Обратим внимание на то, что интегрирование осуществляется только в пределах [О, Т], так как s(t) = 0 вне этого интервала. Однако на r^(t)t О < t < Τ, оказывает влияние г(/), — оо < t < оо. Отметим, что структура приемника на рис. 4.43, б совпадает с блок-схемой приемника, изображенной на рис. 4.39. Следовательно, сигнал на выходе нижней ветви должен быть равен яСиМ — нереализуемой оценке nc(t) по минимуму среднего квадрата ошибки. В этом можно убедиться непосредственно подстановкой (235) и (236) в (3.239). Впоследствии мы убедимся, что точно такой же результат получается в общей задаче обнаружения при наличии коррелированного (небелого) шума. Из сравнения блок-схем рис. 4.42 и 4.43 следует, что обе они содержат устройства оценки коррелированного шума, но используют полученные оценки по-разному. 356
В качестве второго примера рассмотрим случай, когда отсутствует компонента белого шума. Пример 2. Пусть Тогда 5η(ω) = SQ(v) = о2 + /е2 со2 + /е2 (241) (242) 2kon* Если используется декоррелирующая (выбеливающая) реализация, то одним из вариантов декоррелирующего фильтра является Hw (/ω) = ]_ (/ω + fc). (243) V2kon* Таким образом, декоррелирующий фильтр представляет собой параллельно включенные дифференцирующее и~усилительное звенья (рис. 4.44, а). С другой стороны, используя (234), видим, что ото (/'<■>)= VES (/ω) ΥΈ 5»(ω) 2Л»а' (<o*+fe*)S(/<o). (244 Учитывая, что /ω в частотной области соответствует дифференцированию во временной области, получим (рис. 4.44, б) §оо (0 = уГЁ [-*» (<)+**« (01- (245) Заметим, что функция s(t) должна быть дифференцируемой на всем интервале — оо < t < оо. Но так как мы считаем, что s(t) = 0 при /<0и при t > > Τ, tos(O) и s(T) также должны быть равны нулю. Это ограничение представ- •r(t) 7Ш(^к) r(?Hi^J а) Ш![ф)'кф)] r(t) -f- Wn Ж 2кб. j[-s"(t)<k*s(t)] Рис. 4.44. Оптимальный приемник при отсутствии компоненты белого шума. ляется интуитивно вполне логичным. Вспомним рассуждение, приведенное нами ранее: если бы сигнал содержал перепад, который был бы формально дифференцируемым, то в результате у нас был бы импульс плюс белый шум, что привело бы к идеальному обнаружителю. Однако очевидно, что это не соответствует условиям реальной физической ситуации. Придавая импульсу конечное время нарастания или включая в модель некоторый уровень белого шума, можно избежать этого положения. 357
Мы видим, что приемник не использует ни одного из принятых колебаний вне интервала 0 < t < Τ, несмотря на то, что они имеются. Поэтому следует ожидать, что решение для Т\ = 0 и Г/ = Τ должно быть одинаковым. Вскоре мы убедимся в этом. Данный результат будет соблюдаться при условии, если спектр шума имеет только полюса, поскольку декоррелирующий фильтр соответствует взвешенной сумме операторов взятия производной. Когда общий спектр шума имеет нули, повышению достоверности обнаружения будет способствовать увеличение времени наблюдения. Заметим, что при наличии независимого белого шума общий спектр шума будет всегда иметь нули. Заканчивая данный параграф, целесообразно выделить некоторые важные результаты. 1. Для рациональных спектров коррелированного шума и ненулевого независимого белого шума достоверность обнаружения при бесконечном интервале наблюдения выше, чем при любом конечном интервале наблюдения. Поэтому достоверность обнаружения при бесконечном интервале наблюдения, характеризуемая показателем doo2, обеспечивает простую границу достоверности обнаружения при конечном интервале наблюдения. Для конкретного однополюсного спектра, приведенного в примере 1, можно найти реализуемый устойчивый декоррелирующий фильтр, причем этот фильтр является не единственным. В гл. 6 мы вновь встретимся с декоррелирующими фильтрами для рациональных спектров. Там будет показано, как отыскивать декоррелирующие фильтры для произвольных рациональных спектров. 2. Для рациональных спектров коррелированного шума без нулей и в отсутствие белого шума имеет значение только интервал, в пределах которого сигнал отличен от нуля. В этом случае декоррелирующий фильтр является реализуемым, но неустойчивым (он содержит дифференцирующие звенья). Рассмотрим теперь стационарные шумовые процессы и конечный интервал наблюдения. Конечный интервал наблюдения. Рациональные спектры1). Рассмотрим некоторые свойства интегральных уравнений на конечном интервале. Большая часть этих свойств доказывается в стандартных руководствах по интегральным уравнениям (например, [33] и [34]). Четкое изложение свойств интегральных уравнений применительно к теории обнаружения можно также найти у Хелстрома [14]. Здесь мы укажем простые свойства, которые будут полезны при дальнейшем изложении материала, и приведем некоторые типичные примеры. Первым представляющим интерес уравнением является (195): Tf YEs (*) = J * (и) Кп (t, и) du; Tt^t^ Tf, (246) Ti 1} Интегральные уравнения, рассмотренные в § 3.4, представляют частные случаи уравнений, исследуемых в настоящем параграфе. Если, наоборот, уравнение, определяющее собственные функции и собственные значения, уже было решено в § 3.4, то найти решения уравнений данного параграфа не представляет труда. 358
где s(t) и Kn{U и) —^ известны. Требуется решить (246) относительно g(t). Рассмотрим раздельно два частных случая. Случай 1. Ядро Kn{U и) не содержит сингулярностей. С физической точки зрения это означает, что в системе отсутствует белый шум. В данном случае (246) есть уравнение Фредгольма первого рода. Можно показать [33], что если интервал (Ти Tf) конечен, то непрерывного интегрируемого в квадрате решения не существует вообще. В дальнейшем будет показано, что решение всегда можно получить, если допустить наличие сингулярных функций (импульсов и их производных) в составе функции g(u) на концах интервала наблюдения. В § 4.3.7 показано, что если функция g(t) не интегрируема в квадрате, то критерий неусточив по отношению к малым отклонениям в принятой модели. Мы намеренно (из физических соображений) случай 1 подробно не рассматриваем. В этом параграфе мы приведем специальное упражнение, чтобы выяснить, что произойдет, если устремить уровень белого шума к нулю. Будет показано, что для получения результатов, имеющих физический смысл в отсутствие белого шума, необходимо наложить на s(t) дополнительные ограничения. Случай 2. Шум содержит ненулевую компоненту белого шума. Тогда можно записать Kn(ttu)=^-8(t-u)+Kc(t,u)t (247) где Kc(t> w) — непрерывная интегрируемая в квадрате функция. В этом случае представляет интерес уравнение (1696), которое перепишем в виде Tf YEs(t)=^g(t)+ ξ Kc(t,u)g(u)du, T^t^Tf. (248) Тг Это уравнение называется уравнением Фредгольма второго рода. Непрерывное интегрируемое в квадрате решение для g(t) существует всегда, если Kc(t> и) — непрерывная интегрируемая в квадрате функция. Рассмотрим теперь два типа ядер, при которых возможны простые процедуры решения (246) и (248). Тип А. Рациональные ядра. Шум nc(t) есть отклик стационарной линейной пассивной цепи ς сосредоточенными параметрами, возбуждаемой белым гаусссовым шумом. Здесь ковариационная функция зависит только от (t — и) и поэтому можно написать Kc(t,u)=Kc(t-u)=KcW. (249) Преобразование имеет вид ? Ν (ω2) Sc (ω) = \ Кс (τ) ег-М ΛΔ ^ (250) —оо ' и является отношением двух полиномов по переменной ω2. Числитель и знаменатель имеют относительно ω2 порядки q и ρ соответственно, 359
Предполагается, что nc(t) обладает конечной мощностью, так что ρ— <7^1. Ядра, преобразования которых удовлетворяют уравнению (250), называются рациональными ядрами. Интегральные уравнения с ядром такого типа подробно рассмотрены в [35—37, 47, 54, 62]. Позже будет рассмотрен пример, который иллюстрирует относящиеся к этому вопросу методы и проблемы. Тип В. Разложимые ядра. Ковариационную функцию шума можно записать в виде к ^с(Л")=2^Ф,(0Ф|(и), Г|<Ли<Г/| (251) / = 1 где К — конечно. Ядро этого типа часто встречается в задачах радиолокации при наличии нескольких целей. Как будет показано в следующем параграфе, решение уравнения (246) получается непосредственно. Ядра такого типа называются разложимыми. Заметим, что если положить К = оо, то все ядра считались бы разложимыми, так как всегда можно записать Кс (t9 и) = 2 λ, Φ, (t) Φι (и), Γ, < t, и < Tfi (252) где Xt и Фг(0 — собственные значения и собственные функции. Такой метод решения не практичен, поскольку для отыскания Ф*(/) необходимо решить еще одно интегральное уравнение. Рассмотрим в этом параграфе рациональные ядра, а в следующем — разложимые ядра. Уравнение Фредгольма первого рода с рациональными ядрами. Основной метод сводится к отысканию дифференциального уравнения, соответствующего интегральному уравнению. Для ядра рассматриваемой формы это будет дифференциальное уравнение с постоянными коэффициентами, получить решение которого не представляет труда. В самом деле, частное решение этого дифференциального уравнения есть как раз функция g<x>(t), полученная нами выше [см. (234)]. Интегральное уравнение с рациональным ядром соответствует дифференциальному уравнению в сочетании с системой граничных условий. Для учета граничных условий нужно подставить найденное частное решение вместе со взвешенной суммой однородных решений обратно в интегральное уравнение и подобрать веса таким образом, чтобы удовлетворялось интегральное уравнение. Именно в этом пункте могут возникнуть затруднения. Для иллюстрации данного метода и возможных затруднений, с которыми мы можем встретиться, рассмотрим один простой пример. Прежде всего покажем, как функция &»(/) вписывается в общую схему решения. Предположим, что Sn(*)=JlS!*L. (253) Напомним, что άω (* α(ύ δ(/_И)= ) е'»('-»> —, (254) 360
Дифференцирование по t дает pb{t—u)= ) /W<» ('-«)—, (255) —oo где pAd/dt. В более общем виде N(—p*)6(t—u)= \ JV (ω2) e/°>«-«) — . (256) —oo Аналогичным образом D(-p*)Kn(t-u)= \ ϋ(ω')5η(ω)β/»«-">^. (257) OO Из (253) видно, что правые части (256) и (257) тождественны. Следовательно, ядро удовлетворяет дифференциальному уравнению, полученному путем приравнивания левых частей уравнений (256) и (257): N(-p2)8(t-u)^D(-p*)Kn(t-u). (258) Теперь интересующее нас интегральное уравнение можно записать в виде YEs{t) =\Kn{t—u)g(и)du, Ть< t < Tf. (259) Ti Умножая обе части уравнения на D(—ρ2), получим Tf D{-p*)YEs{t)= \D{-p*)Kn{t-u)g{u)du, 7\<г<7> (260) Используя уравнение (258) в правой части уравнения (260), имеем D(-p*)VEs(t)=N(-p*)g(t), 7\<*<7> (261) Но из наших предыдущих результатов [см. (234)] известно, что если бы интервал наблюдения был бесконечным, то D (ω2) YES (/ω) = Ν (ω2) G^ (/ω) (262) или D{—p2)YEs{t)=N{—p2)goo{t), —oo<t<oo. (263) Таким образом, функция goo(t) есть частное решение уравнения (261). Однородные решения уравнения (261) находятся из 0 = Л/(-р2)£/г.(/), / = 1,2—, 2q. (264) Теперь прибавим частное решение goo(t) к взвешенной сумме 2q однородных решений gh-(t)t подставим результат обратно в интегральное 361
уравнение и подберем весовые коэффициенты так, чтобы оно удовлетворялось. Дальнейший ход рассуждений будет более понятен, если рассмотреть конкретный пример. Пример. Рассмотрим (246) и ради упрощения алгебраических выкладок возьмем пределы [О, Т]. Kn{t-u) = Кп(т) = о2пе~к^^ -со <τ< οο (265) или s^=^- (266) Таким образом, Ν(ω*) = 21ιση* (267) и £>(со2) = со2 + /г2. (268) Дифференциальное уравнение (261) приобретает вид ΥΈ (-s" (0 + W s (0) = 2fcon2 g (t). (269) Частное решение (261) имеет вид 8°>{t) = ш^ l~s"(t)+k2 s(0b (270) а однородного решения не существует, так как <7 = 0. (271) Подставив (270) обратно в интегральное уравнение, получим __ τ l/Es(0=an2J exp(-k\t—u\)g{u)du, 0<t<T. (272) о Чтобы функция g (t) была решением, должно выполняться соотношение .(o-..-H.+-[-'£;r-w]*+ У 0 Поскольку однородных решений не существует, нет и весовых коэффициентов, которые надо подбирать. Интегрируя по частям, получим эквивалентное условие 0 = e-*'J^[s'(0)-*s(0)]J- __е+ k (t-T) LL [s' p) + ks (Τ)] J , 0<t<T. (274) Очевидно, чтобы функция g^it) удовлетворяла интегральному уравнению, оба члена в квадратных скобках должны исчезать независимо. Если это условие выполняется, то данное решение является полным. К сожалению, поведение сигнала на концах интервала зачастую приводит к тому, что члены в квадратных скобках отличны от нуля. Чтобы члены e~kt и ek^~т) уничтожались, необ-
ходимо к g^t) прибавить еще некоторую величину. Обозначим этот дополнительный член через g6 (t) и выберем его так, чтобы τ , ! ση*$ exp(-k\t-u\)g6(u)du=- — [s'(0)-ks(0)]e-kt + о zn + -^[s'(T) + ks(T)]e + k«-TK 0<t<T. (275) Для того чтобы получить член z~~kt> g§(u) должен содержать импульс с^и), а для получения е~^^—:Г) необходимо, чтобы в составе g$(u) был импульс с2б(гг — Т). Следовательно, gb(u) = cx6{u) + c26(u-T). (276) Чтобы удовлетворялось уравнение (274)1), постоянные сг и с2 в (276) должны быть равны ks(0)-8'(0) ks(T) + s'(T) Ci=—i^—· С2=~~^—· (277) Таким образом, полное решение интегрального уравнения имеет вид *(') = £» (0+*Л (0, 0<*<7\ (278) Из (153) и (154) видно, что выходная величина устройства обработки равна г l^lr(t)g(t)dt=^r{0)+^r(T) + о о Следовательно, оптимальное устройство обработки состоит из фильтра и дискретизатора. Заметим, что функция g(t) будет интегрируемой в квадрате только тогда, когда сх = с2 = 0. Смысл этого условия будет обсужден в § 4. 3.7. Когда спектр содержит несколько полюсов, на концах интервала необходимо добавлять сингулярности более высокого порядка. Когда спектр содержит нули, будут существовать однородные решения, которые обозначим через gh.(t). Можно показать, что обще решение в этом случае имеет вид g(t)=g»(t) + £aighi(t)+P Σ Mw (')+'*«( (t-T)]t (280) где 2/? — порядок полинома D(co2) как функции ω, a 2q — порядок полинома Ν(ω2) как функции ω (см., например, [35]). Функция δ^(ί) — производная fe-ro порядка от δ(/). Много усилий было посвящено отысканию эффективных методов получения коэффициентов решения (280) [63, 3]. Х) Предполагается, что импульс имеет симметричную форму, поэтому в интервал включена только половина его площади. 363
Как уже указывалось, при наличии белого шума результирующее интегральное уравнение будет уравнением Фредгольма второго рода. Для рациональных спектров методы решения его аналогичны, однако характер решения заметно отличается. Уравнение Фредгольма второго рода с рациональными ядрами. Интересующее нас уравнение имеет вид (248) YEs(t)^g(t) + + $ Kc(t9u)g(u)du9 Tf<i<7y (281) Предполагается, что шум стационарен и имеет спектр Sn (ω) = -°- + Sc (ω) Δ JU^L. (282) η ν ' 2 c ν — D (ω2) Заметим, что многочлены Ν(ω2) и D(co2) — одного порядка. (Это объясняется тем, что S c(cu) имеет конечную мощность.) Поступая так же, как в предыдущем параграфе, получим дифференциальное уравнение, которое имеет частное решение £«>(/) и однородные решения ght(t)· Подставив g(t) = goo(t)+Σaighi(t) (283) в интегральное уравнение, придем к выводу, что путем надлежащего выбора at всегда можно получить решение интегрального уравнения. (В функции gc(f) нет необходимости, мы располагаем достаточным количеством весов (или степеней свободы) для удовлетворения граничным условиям.) Проиллюстрируем этот метод простым примером. Пример. Пусть Kc(t, «) = ас2ехр ( —*|*—и|). (284) Соответствующий спектр имеет вид П 2 Oh 50(ω)= t \ . (285) cv ' <о2 + /е2 Тогда ^0 oc*2k (Ν0/2)[& + &(\+4σο%/Ι*Νο)]ΑΝ(ώ*) η{(ύ) 2 + co2 + fc2 co2 + /e2 -£>(ω2)' Интегральное уравнение (используя ради простоты интервал (0,Т)) можно записать в виде τ VEs(t)=^g{t) + oc* \ e-k\t-u\g(u)du, 0<t<T. (287) 2 Ό 64
Соответствующее дифференциальное уравнение нетрудно получить из (286): VE(~8'{t) + k*s(t))= γ [-**(*) +Vе£(0Ь (288) где72Д/г2(1+4а2с//гЛ^0). Частное решение есть просто g^tf). Его можно получить путем непосредственного решения дифференциального уравнения или методами преобразования *.(')= \ е/<0< 0.0'ω) ^ , 0<<<7\ (289) ОО *~(/) ~ * J е/ {·*&)s('ω) 5Г · ° <' < г· (290) — ОО Однородные решения имеют вид *ftl(0 = e* arA.(i) = e-1". (291) Поэтому g(t) = goo(t) + ale'*i + a2e-vt9 0<t<T. (292) Подстановка (292) в (287) дает систему двух уравнений, которым должны удовлетворять постоянные αλ и а2. Решая ее относительно ах и а2 в явном виде, получим полное решение. Ряд типичных случаев вынесен в задачи. Интересной особенностью является то, что решение всегда можно найти, избежав необходимости вводить сингулярные функции. Таким образом, допущение о наличии белого шума гарантирует нам интегрируемое в квадрате решение. (Сходимость рядов в (164) и (170) предполагает, что решение интегрируемо в квадрате.) Последним интересующим нас интегральным уравнением является уравнение (163), определяющее й0(/, и). Переписав его для интервала [О, Г], будем иметь г К (Л ζ) +— \ Кс (/, и) Н0 {и, z) du = = -rp/(c(*,z), 0</,z<7\ (293) Видно, что оно совпадает с уравнением (281), полученным в предыдущей задаче, за исключением того, что в каждом выражении имеется лишняя переменная. Поэтому можно считать t фиксированным параметром, a ζ — переменным, или наоборот. В любом случае получается ,уравнение Фредгольма второго рода. Для рациональных ядер процедура носит такой же характер. Проиллюстрируем это простым примером. 365
Пример. Кс(и, z) = Gs2exp( — k\u-z\), (294) τ 2 С ho (ί, *) + — \ Λο (ί, «)σ/βχρ( — k\u—ζ\ )du = VO = -^as2exp(-fc|*-*|), 0 < t, ζ < Г. (295) "О Используя оператор fe2 —р2 и результаты (258) и (286), будем иметь ('^)· ИЛИ 2σ 2 2σ2 (ft· -ρ2) Λ» (<, г) + -f- 2ftA0 (/, г) = _£ 2 kb (t -ζ) (296) (1 + Λ) Λ0 (ί, ζ)-η^Ηο (*. *) = Λδ (*-*). (297) где 4σ52 Λ=^· <298> Пусть β2 = β2(1+Λ). Частное решение имеет вид h0P(t,z)=^-yf==-^{-kVY+K\t-z\), 0<t,z<T. (299) Прибавим теперь к частному решению (299) однородные решения ах (<) e^z и а2(<)е—^ и подставим результат в (295). Получим 2ftof (β—ft) [(β + ft) ер/ + (β-ft) e-P'] е-"7" "l(i)= АГв β [(β + fe)» e«»r— (β—Λ)* е-ЭП (Ш) 2*σ| (β-ft) [(β+ ft) eP (Γ-<> + (β-ft) e-P <г~'>] "2 (0 = Λ^0β [(β + ^ββΓ_(β_Λ)2β-βη · (301) Полное решение имеет вид 2kc; [(β + ft) β + β* + (β-6)β-β*] [(β + Ze) е+Р*7^» + (β-*) е-*<г-'>] О < zt t <T. (302) Найденное решение симметрично относительно ζ и t. Ясно, что это выражение мало привлекательно для практических вычислений. Важным частным случаем, с которым нам придется встречаться позднее, является случай, когда компонента коррелированного шума мала. Тогда β — k и Mz, Т)^-?г-ехр (—β|'—*|), 0 < г, t < 7\ (303) 366
Следует отметить одно важное свойство (293). Оно заключается ё том, что наличие лишней переменной усложняет алгебраические выкладки, но основная техника решения остается вполне пригодной. Этим завершается наше рассмотрение интегральных уравнений с рациональными ядарами на конечных интервалах времени. Можно сделать ряд выводов. 1. Процедура отыскания решения является простой по своей идее и прямо ведет к цели, однако сопряжена с утомительными выкладками. 2. При отсутствии компоненты белого шума на сигнал s(t) необходимо налагать некоторые ограничения, чтобы гарантировать интегрируемость функции g(t) в квадрате. 3. При наличии белого шума увеличение интервала наблюдения всегда повышает достоверность обнаружения. 4. Процедура решения для h0(t> и) при произвольных уровнях коррелированного шума представляется чрезмерно сложной в реализации. В качестве основы для сравнения более простых процедур решения можно использовать выражение для d2, полученное из (198). [В § 6.7 будет рассмотрен более легкий путь отыскания решения для h0(t> и).] Конечное время наблюдения, разложимые ядра. В качестве последнего вопроса рассмотрим интегральные уравнения с разложимыми ядрами. В противоположность сложности предыдущего параграфа решения в случае разложимых ядер можно получить почти без выкладок. В данном случае 7,</, и<Г,, (304) где λ^ и Φι(ί) — собственные значения и собственные функции Kc{t, и). Выражение (304) показывает, что шум имеет только К ненулевых собственных значений. Поэтому, если в модель не включить компоненту белого шума, то может возникнуть сингулярный (вырожденный) случай. Если же предусмотреть в модели компоненту белого шума, то, как нетрудно заметить, решение для h0(t> и) есть просто усеченный вариант бесконечного ряда (164). Таким образом, к и 0V ; £ tfo/2 + λι lW гУ " Тг < Л и < Tf. (305) Решение уравнения (154) не встречает трудностей. Используя (305) б (162), а результат — в (154), получим Ti<t<Ti. (306) 367
Вспоминая определение sb даваемое выражением (201), и то, что функция g(t) непрерывна на концах интервала, будем иметь g(t) = l±\ YEs(t)-y s<\ Ф,(/)1. (307) 1 0 при других t. Соответствующая структура приемника изображена на рис. 4.45. Задача с разложимыми ядрами, имея простое решение, часто встречается на практике. &f( &Ц Рис. 4.45. Оптимальный приемник для случая разложимой помехи. -<й%»*ю Типичный случай иллюстрируется рис. 4.46. Здесь ставится задача обнаружения цели в присутствии мешающей цели и белого шума [38]. Пусть r{t). 'YEs(t) + atSt(t) + w(t)> T^t^TfiH^ a/SiW+wit), T^t^TfiHo. (308) Если предположить, что α/ и si(t) известны, то задача становится тривиальной. Простейшая нетривиальная модель соответствует предположению, что si(t) — известное нормированное колебание, а а/ — нормальная случайная величина с нулевым средним, N(0, σ/). Тогда Kn(t9u)=aj*Si(t)silu) + ·^6(t—и) Ti^t9u^Tf. (309) Но это частный случай только что решенной задачи. Соответствующая блок-схема приемника представлена на рис. 4.47. Функция g(t) получается из (307). Бл"ок-схему можно перечертить так, как показано на 368
Мешающая Передатчик Рис. 4.46. Обнаружение при наличии мешающей цели. рис. 4.47, б, дающем интерпретацию приемника как оценивающего — вычитающего устройства (такая реализация, очевидно, является неэффективной). Показатель качества обнаружения получим из (198): 2σ72/ΛΌ d2 = - 2£ 1—- 1+2σ;2/ΛΑ0 Ρ/ ■)■ где ρ/ Δ jj s (t) si (t) dt. Переписав (310), будем иметь IE l+2a/»/jy,(l-p/«) (310) (311) (312a) при pi -> 0, d? -*- 2E/N0. Этот результат интуитивно предугадывает" ся. Если мешающий сигнал является ортогональным с сигналом s(t), r(t) ~®—у> I № а) Устройстбо задержки на Τ Наилучшая оценка мешающего сигналь, задержанная на Τ сен ■А) !l<1-J}\ Устройстбо оценки *) Рис. 4.47. Оптимальный приемник для случая наличия мешающих целей. 369
То независимо от его уровня он не может ухудшить Достоверность обнаружения. С другой стороны, при р/ -> 1 Л2 . 2Е/"о 1+2σ;2/^0 (3126) Теперь сигналы по обеим гипотезам одинаковы и единственное основание для вынесения решения — различие в их амплитудах. Этот пример был приведен по двум причинам. 1. Он иллюстрирует важный случай небелого шума, когда обратные ядра особенно просто вычислять. 2. Он показывает все идеи, но не детали, необходимые для решения задачи обнаружения (или оценки) при наличии многократных отражений (радиолокация) или реверберации (гидролокация). В гл. 4 второго тома, после того, как будет построена подробная модель для задачи реверберации, мы покажем, как эти результаты можно использовать при решении реальных задач. Краткие итоги по интегральным уравнениям. В изложенном пара* графе были рассмотрены методы решения нескольких типов интегральных уравнений, встречающихся в задачах обнаружения сигнала и оценки его параметров при наличии белого шума. Характер решения определяется наличием или отсутствием компоненты белого шума. Следует обратить внимание на простоту решения в случае стационарного процесса на бесконечном интервале. Поскольку качество обнаружения в этом случае всегда служит границей для случая стационарного процесса на конечном интервале, его полезно вычислять в качестве предварительного результата. В качестве последнего вопроса задачи с коррелированным шумом рассмотрим степень зависимости полученного результата от отклонений от первоначальных допущений, сделанных в модели задачи. 4.3.7. Устойчивость результатов к отклонениям от принятой модели До сих пор предполагалось, что все величины, необходимые для синтеза оптимального приемника, точно известны. Теперь желательно исследовать влияние на качество обнаружения неполноты знания этих величин. Чтобы получить в явном виде некоторые результаты, обсудим этот вопрос для простой бинарной задачи на принятие решения, изложенной в §4.3.1. Применительно к условиям данной задачи принятая модель характеризуется соотношениями: r(i)"l n{t), Τ^ί^Τ,-.Η», (313) где сигнал s(t) и ковариационная функция шума Kn(ty и) считаются известными. Точно так же, как в случае белого шума, существует два метода исследования устойчивости результатов к отклонениям от выбранной модели: вариационно-параметрический и вариационно- функциональный. В случае белого шума изменению подвергался толь- 370
ко сигнал. Теперь изменения могут быть связаны как с сигналом, так и с шумом. Типичные примеры на метод изменения параметра сформулированы ниже. 1. Пусть выбранное аналитическое представление сигнала имеет вид 2 \ 1/2 s(t)=\1' О при других/, ( ( 2 \1/2 I — sincoc/, 0</<7\ (314) а фактический сигнал равен [( — V/2 sin (ω. + Δω) *, 0</<7\ sa(t)=\\T ) ^ c-r J ^ ^ , (315) ( 0 при других/. Найти зависимость Ad/d от Δω. 2. Пусть принятая в модели задачи ковариационная функция шума равна Kn(t9u)^-^6(t-u) + Ke(t9u)t (316) а фактическая ковариационная функция имеет вид Kna(tiu) = (^1^±^y(t-u) + KAtiti). (317) Найти зависимость Ad/d от AN0. 3. Пусть в примере с мешающей целью в предыдущем параграфе (308) предполагаемый мешающий сигнал будет Sl(t) = s(t — τ). (318; Иначе говоря, он является задержанной копией полезного сигнала. Пусть действительный мешающий сигнал равен sIa(t)=s(t — τ — Δτ). (319) Найти зависимость Ad/d от Δτ. Приведенные примеры иллюстрируют типичные задачи на изменение параметра. Очевидно, что соответствующие вариации параметров зависят от конкретной интересующей нас физической проблемы. Почти во всех случаях последующие вычисления прямо приводят к цели. Ряд характерных примеров вынесен в задачи. Вариационно-функциональный подход является более интересным. Как и прежде, анализ ведется «на худший случай». Приведем два примера. 371
где 1. Пусть действительный сигнал равен sa(t) = YEs(t) + YEest(t), 7\<г<7>, Tf I se2(t)dt = l. (320) (321) Для отыскания наихудшего случая выберем s£(t) так, чтобы сделать Ad как можно более отрицательным. 2. Пусть действительный шум равен na(t)=n(t) + nBKt), (322а) а его ковариационная функция К па (U и)=Кп (/, и) + Кпг (/, и). (3226) Предполагается, что ne(t) имеет конечную энергию на интервале Tt^t^Tft т. е. Ε Ι ηβ·(/)Λ<Δη. Ti Отсюда следует, что (323а) (3236) Для отыскания наихудшего случая выбераем /Cn8(i, и) так, чтобы сделать Ad как можно более отрицательным. Возможны также различные другие отклонения и ограничения. Рассмотрим теперь простой вариант первой задачи. Вторая задача подробно изложена в [42]. Предполагается, что шумовой процесс стационарен и имеет спектр Sn(co), а интервал наблюдения бесконечен. Оптимальный приемник, использующий декоррелирующий фильтр (см. рис. 4.38, a),f показан на рис. 4.48, а. Соответствующее пространство решений изображено на рис. 4.48, б. Номинальное качество обнаружения равно Ε{1\Ηλ)-Ε{1\Η0) [σ*(Π//ο)]1/2 J sS(t)dt J sj{t)dt 1/2 (324) или L—oc $S(t)dt 372 1/2 (325)
Пусть действительный сигнал равен (326) где s (t) и se(/) имеют единичную энергию. Выход декоррелирующего фильтра будет равен r*a(t)bst(t) + stt(t)+n,(t), —°o<t<oo, (327) а пространство решений имеет вид, представленный на рис. 4.48, в. Единственной величиной, претерпевшей изменение, является Е(1а\Н^). r(t) н».(М Номинальная выходная I величина \f~dt <fl VFs(t) 1 * Ч * "г W) Линия решений V ezU\H0]°dz Е(Щ) е(Щ) ■& у Линия решений £(1аЩ) ·*</*) *) Рис. 4.48. Анализ «чувствительности»: а—фильтр при номинальной входной величине; б —номинальное пространство решений; в— фактическое пространство решений. Дисперсия остается прежней, поскольку ковариационная функция шума не изменилась. Таким образом, Αά = γ] s*e(t)s*(t)dt. (328) Для исследования устойчивости результатов к малым отклонениям от принятой модели необходимо сделать Ad как можно отрицательнее. 373
Если можно сделать Ad = —d, то действительной рабочей характеристикой будет линия PD = Pf, эквивалентная случайному критерию испытания. Если Ad <—d, то действительный критерий будет хуже случайного (см. рис. 2.9, а). Следует отметить, что ограничение налагается на энергию сигнала s8(Y), а не s*8(0- Используя теорему Парсеваля, запишем (328) в виде Ad = ±-] S„(/W)S,(/ffl) -^. (329) Это уравнение можно переписать через исходные величины, если учесть, что S*e (/ω) = γΈ% Hw (/ω) S8 (/ω) (330) и St(jv) = YEHw(j<*)S(i<i>). (331 Итак, Условие Ad = -Υ-Ψ1 —οο ~ d ίίω οο —οο (321) можно записать в ΟΟ S |5ε(/α (/ω)Ι#, S* виде ίίω AMI2 (/ω) ίίω (ω) 2π = 1. (332) (333) Для проведения анализа в расчете на наихудший случай минимизируем Ad при ограничении (333) методом коэффициентов Лагранжа. Пусть Г °° d 1 F = Ad+K\ $ |S,(/«>)|»J^-1 . (334) Минимизируя относительно Se(/cu), получим 4(/ω) = _^. ^ да) °и 2λά Sn(<o) ν у 374
(подстрочный индекс «О» означает «оптимальное»). Для вычисления λ подставим (335) в (333), в результате чего получим ЕЕ, г- \ d* о | S (/со) |2 άω Если этот интеграл существует, то = 1. 2λ = · [Ί1/2 С |S(/a>)jMa> _J Sn2H 2rcJ (336) (337) Подставляя в (335), а затем в (332), будем иметь д,__(^У'г[]А^^Г. (338) \ & ) I J S„*(<o) 2π| (Заметим, что (338) можно было бы получить и путем использования в (332) неравенства Буняковского — Шварца.) Используя эквивалентное выражение (325) для частотной области, будем иметь Ad_ _/^eV d - (ε) Γ Γ |3(/ω)|»£*ω1% Ы ν(ω) dn\ Ι Γ Γ |S(/co)|*<fco~| LISn(co) 2jtJ (339) В случае белого шума выражение в фигурных скобках обращается в единицу и получаемый результат совпадает с (82). Когда же шум не является белым, можно сделать несколько важных замечаний. 1. Если имеется компонента белого шума, то существуют оба интеграла, а выражение в фигурных скобках больше или равно единице. (Для доказательства этого свойства достаточно использовать в знаменателе неравенство Буняковского — Щварца.) Следовательно, в случае коррелированного шума малое отклонение параметров сигнала может вызывать существенное изменение качества обнаружения. 2. Если компонента белого шума отсутствует, а номинальный критерий не является сингулярным, то интеграл в знаменателе существует. Без дополнительных ограничений, налагаемых на спектры 5(/ω) и Sn (/ω), интеграла в числителе может не существовать. Если он не существует, то сделанный выше вывод оказывается несправедливым. В этом случае можно найти такой спектр Se(/cu), что Ad будет меньше любого заданного Adx. Выберем (kS(j<u) Sb(M = \ Sn(<*)9 { О, ω не в Ω, ω в Ω, (340) 375
где Ω есть такая область, что a k выбрано так, чтобы удовлетворялось условие ограниченности энергии, налагаемое на сигнал sz(f). Нетрудно видеть, что в отсутствие белого шума существует такое отклонение сигнала от номинала, какое делает качество критерия сколь-угодно малым. Подобные критерии называются неустойчивыми (или бесконечно чувствительными к отклонениям). Таким образом, требование устойчивости является более строгим, чем требование несингулярности, и предположение о наличии белого шума гарантирует несингулярный, устойчивый критерий. Очевидно, что несмотря на свою устойчивость, критерий может оказаться чрезмерно чувствительным к отклонениям. 3. Аналогичные результаты можно получить для конечного интервала времени и нестационарных процессов в терминах собственных значений. В частности, можно показать (см., например, [42]), что условие оо 2 /-ι Ч есть необходимое и достаточное условие устойчивости. Оно сходно с условием интегрируемости в квадрате для функции g(t). В этом параграфе были проанализированы некоторые идеи, связанные с исследованием' чувствительности процедуры оптимального обнаружения. Хотя в силу допущения о наличии белого шума неустойчивые критерии из рассмотрения исключаются, возможность существования чувствительных критериев не отрицается. В любой практической задаче весьма важно проверить чувствительность критерия к возможным вариациям параметров и функций. Можно найти случаи, когда критерий настолько чувствителен к отклонениям параметров или функций, что не имеет какой-либо практической ценности. В этих случаях целесообразно попытаться построить критерий, который номинально был бы субоптимальным, но вместе с тем менее чувствителен. Метрды отыскания подобных критериев зависят от характера рассматриваемой задачи. Прежде чем закончить рассмотрение задачи с коррелированным шумом, кратко обсудим тесно с ней связанную задачу передачи сигналов по каналу с известными параметрами. 4.3.8. Линейные каналы с известными параметрами Между задачей с коррелированным аддитивным шумом и задачей передачи сигналов по известному линейному каналу с памятью существует почти полная аналогия (рис. 4.49, а). 376
Принимаемое колебание в простой бинарной задаче при гипотезе Нх записывается в виде т, '(*)=$ hh(t. и)VEs{u)du+w(t), TtKt<Tf. (342) s(t) *\hch(t,u) w(t) I—1Ж*®~ ■r(t) «) r(t) sj*) r J4 dt -*-ί Рис. 4.49. Известный дисперсный канал. По форме оно идентично (146). Поэтому hch(t, и) играет роль, аналогичную декоррелирующему фильтру. Оптимальный приемник показан на рис. 4.49, б. Показатель качества приемника равен Tf &=\ J sUt)dt = = — j dt \\hch(t% u)s(u)du \hch(t, v)s(v)dv (343) где пределы интегрирования (a, b) зависят от импульсной характеристики канала и длительности входного сигнала. Предполагается, что Ti ^ a^. b <! Tf. Можно записать (348) в знакомой нам квадратичной форме 2Е г? d2 = η^ )) du dv s(u)Qch(ut v) s(o), (344) 377
если ввести Qc/z (и. ν) = J ЛсД (/, w) АсЛ (/, ι>) Λ, α < 4ι ϋ < 6. (345) Единственное отличие заключается в том, что теперь Qch(u, υ) обладает свойствами ковариационной функции, а не обратного ядра. Интересующая нас задача заключается в таком выборе сигнала s(t), чтобы показатель d2 был максимальным. Решение следует непосредственно из наших более ранних результатов по синтезу сигналов (стр. 345). Показатель d2 можно выразить через собственные значения и собственные функции *=Т- 2 ^*s?, (346) i = 1 где ь Si Δ j ]/"£ s (и) Фг (и) du, (347) а a KCih и Φι (и) соответствуют ядру Qch(u, v). Чтобы максимизировать d2, выберем s± = V~E (348) а так как Xf определяется как наибольшее собственное значение канального ядра Qch(ut v). Некоторые типичные каналы и соответствующие им оптимальные сигналы характеризуются в задачах. При попытке передавать последовательности сигналов по каналам с памятью возникает другая проблема. Рассматривая основную блок- схему системы связи (рис. 4.1), можно заметить, что внутри основного интервала 0 ^ t ^ Τ имеется помеха, обусловленная шумом, и последовательность предшествующих сигналов. Второй вид помехи называется межсимвольной интерференцией. Во многих представляющих интерес системах она оказывается основной причиной искажений. Эффективные методы борьбы с межсимвольной интерференцией будут рассмотрены в гл. 4 второго тома. 4.4. Сигналы с нежелательными параметрами: испытание сложных гипотез До сих пор в гл. 4 мы исходили из предположения, что интересующие нас сигналы полностью известны. Единственным источником неопределенности был аддитивный шум. Как было указано в начале этой главы, во многих представляющих интерес физических проблемах это допущение нереалистично. Один пример подобного рода встречается в радиолокационной задаче. Передаваемый сигнал представляет 378
собой высокочастотный импульс, который приобретает при отражении от цели случайный фазовый угол (а возможно, и случайную амплитуду). Другой пример встречается в задачах из области связи, когда имеется неопределенность фазы генератора. Обе задачи характеризуются наличием нежелательного параметра. Нежелательные параметры появляются как в задачах обнаружения, так и в задачах оценки. Ввиду внутреннего сходства между этими задачами пока достаточно ограничиться изложением задачи обнаружения. В этом случае сигналы при двух гипотезах можно записать в виде r(t) = lhV>*) + n(t), Tt<Ct<Tf:Hv 349) \so(t,b) + n(t), Tt<t<Tf:H0. Вектор θ соответствует нежелательному векторному параметру. Функции s0(tt θ) и s^t, θ) являются условно детерминированными (т. е., если бы значение θ было известно, то значения s0(^, θ) и %(f, Θ) были бы известны при всех t на интервале наблюдения). Нетрудно видеть, что эта задача есть просто аналог классической задачи проверки сложных гипотез, рассмотренной в § 2.5. Там указывалось, что возможны ситуации трех типов. 1. Θ — случайная величина с известной априорной плотностью; 2. Θ — случайная величина с неизвестной априорной плотностью; 3. Θ — неслучайная величина. Ограничимся здесь рассмотрением только первой ситуации. В конце этого параграфа будут кратко обсуждены остальные две ситуации. Внимание к первой ситуации объясняется тем, что две физические задачи, наиболее часто встречающиеся на практике, можно моделировать при помощи первого случая. Они подробно будут рассмотрены в § 4.4.1 и 4.4.2 соответственно. Метод решения задач первой категории прямо ведет к цели. Выберем конечное множество наблюдаемых величин и обозначим их /(-мерным вектором г. Построим отношение правдоподобия и затем положим /<*-> оо ЛИОИПт *i*t(Rltfi) я {350) Единственным новым моментом здесь является отыскание рт\нг (R | Н±) и рг\ н0 (R| #о) в присутствии Θ. Если бы Θ было известно, то тогда задача была бы знакомой. Поэтому очевидный подход к ее решению—это написать Рг |я, (R №=1 ρ,, Θ. я. (R10, HJ рь | я, (θ I Hj) db (351) Рг ι». (RIЯ0) = J pr, β. η. (RΙ β. Η0) ρΘ, h. (61 Ho) db. (352) 4 379
Подстановка (351) и (352) в (350) дает отношение правдоподобия. Возможность реализации данной процедуры зависит от формы подлежащих интегрированию функций. В следующих двух параграфах будут рассмотрены две физические проблемы, в которых эта процедура ведет к результатам, допускающим весьма простую интерпретацию. 4.4Л. Случайные фазовые углы В этом параграфе мы рассмотрим несколько физических задач, в которых неопределенность в принимаемых сигналах обусловлена случайной фазой. Первой интересующей нас задачей является радиолокационная задача. Передаваемый сигнал представляет узкополосное колебание, которое может быть модулировано как по амплитуде, так и по фазе. Его можно записать в виде St {t) = (УЩ f (t) cos [coc t + Φ (/)], 0 < t < Г, (353) 1 0 при других t. Два типичных сигнала показаны на рис. 4.50. Функция f(t) соответствует огибающей и нормирована так, что излучаемая энергия равна E(t). Функция Φ(ί) соответствует фазовой модуляции. Обе функции имеют низкую по сравнению сйс частоту. Для данного случая будем предполагать, что нам просто нужно решить, имеется ли цель на заданном расстоянии. Если цель присутствует, то сигнал будет отражаться. В простейшем случае неподвижной hf(V -*■« WW ^ h№ **t a) 6) Рис. 4.50. Типичные функции огибающей и фазы. точечной цели принятый сигнал будет ослабленной копией излученного сигнала, при этом к несущей прибавится случайный фазовый угол. Кроме этого, на входе приемника будет присутствовать компонента аддитивного белого шума w(t)> независимо от того, имеется цель или нет. Если через Нх обозначить гипотезу о наличии цели, а через Я0 — гипотезу о ее отсутствии, то получим следующую задачу обнаружения _ H1:r(t) = V2Erf(t—T)cos(<ae(t—x)-\-<D(t—x) + e)+w(t), τ<ί<τ + 7\ w{t), 7,,<i<t, x+T<t^Tf, (354a) sr(t—x,e)+w(t), Tt4^t<Tf. H0:r(t)=w(t); Гг</<Г,. (3546) 380
Поскольку шум является белым, то необходимо осуществлять наблюдение только на интервале τ^/^τ+Γ. В предположении, что мы интересуемся только заданным τ, модель будет такой же, как и при % = 0. Поэтому необходимо рассмотреть только задачу H1:r(t) = sr(t,d) + w(t), H0:r(t)=w(t), 0<ί<Τ, 0<ί<7\ (355a) (3556) Здесь мы имеем простую бинарную задачу, в которой неизвестный параметр присутствует только по одной гипотезе. Прежде чем перейти к ее решению, покажем, как сходная задача может возникнуть в области связи. Передитгчик '->'; ф^ргационны? сигналы Вспомогагпсль - ный сигнал {пи рою-сигнал) М,етекглор 'JcTvpu'lornBo Рис. 4.51. Система оценки фазы. В простой системе связи, работающей по принципу «да — нет», сигнал посылается, когда на выходе источника имеется «1», и ничего не посылается, когда на выходе источника имеется «0». Переданные сигналы по двум гипотезам имеют вид H0:st(t) = 0, 0</<7\ (356) Часто значение θα стремятся сообщить приемнику. Один из методов осуществления этого состоит в передаче вспомогательного сигнала, содержащего информацию относительно θα. Если бы этот сигнал передавался по каналу без шумов, то на приеме θα было известно точно и данная задача свелась бы к задаче с известным сигналом. Однако чаще вспомогательный сигнал бывает подвержен воздействию помех и приемник должен оценивать θα, обрабатывая смесь вспомогательного сигнала с шумом. Обозначим эту оценку через θα. Блок-схема системы оценки фазы показана на рис. 4.51. Детально работа устройства оценки (нижний блок) будет рассмотрена в гл. 2 второго тома. Здесь же лишь отметим, что если оценка θα равна θα, то задача сводится к уже известной нам задаче. Если θα и θα не совпадают, то неопределенность содержится в разности θ = θα — θα, являющейся случайной величиной. Поэтому задачу можно рассматривать в следующей формулировке Hi:r{t)= YWrf(t)cos(act+<£(t) + e)+w(t), 0<^<7\ (357) H^r{t)=w{t\ 0<ί<7, (358) ί81
где Er — энергия фактически принимаемого сигнала, а θ — ошибка измерения фазы. Как видно, радиолокационная и связная задачи приводят к одинаковой математической модели. Процедура отыскания отношения правдоподобия была изложена в начале § 4.4. В данном частном случае модель задачи нам настолько хорошо известна [см. (23)], что выражение при /(-> оо можно записать немедленно. Результирующее отношение правдоподобия равно π Γ Τ А [г (ί)]= $ Pe(Q)deexp\^-§r(t)sr(t,e)dt- -π L yV° 0 -ir\sr2(t>Q)dt\9 (359) N° о J где область изменения θ предполагается равной [—π, π]. Последний интеграл соответствует энергии принятого сигнала. В большинстве представляющих интерес случаев она не будет зависеть от фазы, поэтому мы отнесем ее к порогу. Чтобы оценить другой интеграл, разложим косинусный член в (357): cos [ω, t + Φ (t) + θ] =cos [coc t +Φ (/)] cos Θ — — sin [coc t + Φ (01 sin θ (360) и обозначим τ Ь«Л$ Υ~2r(t)f(t)cos[<oct + <I>(t)]dt (361) 0 и Τ Lsb\Y2r (t) f (t) sin [ω, ί + Φ (t)] dt. (362) о Таким образом, интересующий нас интеграл равен Л' [г (/)]= $ ρθ (θ) άθ ехр 2 ^Ъг (Ic cos θ — Ls sin θ) . (363) — π L ^o /J Для дальнейших выкладок нам нужно определить /?θ(Θ)· Вместо определения заданной плотности, определим семейство плотностей, обозначаемых единым параметром. Желательно выбрать такое семейство плотностей, которое позволяет моделировать возможно большее число представляющих интересов случаев. Семейство полезных распределений, определяемое уравнением (364), представлено графически на рис. 4.521), pe(e:AJ='*l[*mCosQ]·, -π<θ<π. (364) 2ji/0 (Лт) Х) Такое распределение было впервые использовано для этой цели Ви- терби [44]. 382
Здесь /0(Лт)— модифицированная функция Бесселя первого рода. Пока Лт можно рассматривать просто как параметр, определяющий рассеяние распределения. При исследовании устройств оценки фазы в гл. 2 второго тома мы убедимся, что этот параметр имеет важный физический смысл. Как видно из рис. 4.52, при Лш = О ρ»{θ)==ύ' -π<θ<π· (365) Распределение (365) целесообразно использовать при решении радиолокационной задачи. При увеличении Лт ~ это распределение становится более скон- :? 47 центрированным. Наконец, при Л^-^оо ^ мы приближаемся к случаю известного ^ 0,5 сигнала. Таким образом, варьируя величиной Лт, можно осуществить не- с,з Рис. 4.52. Семейство распределений вероятностей фазового угла. 0,1\ ,Лт=10 Симметрично относительно 0=0 О Ο,ϊπ Ο.βπ 0,5я 0,7Ж 0Ί9χ ж прерывный переход от задачи с известным сигналом через промежуточный случай, когда имеется лишь некоторая информация о фазе, к другому крайнему случаю — задаче, когда сигнал имеет равновероятную фазу. Подставив (364) в (363), получим π л'ио)= l ι 2π/0 (Лт) ехр Лт+ ■££&-LA cosQ- Ν» iVet L· sin θ άθ. (366) Этот интеграл является табличным [45]. Таким образом, найдем Л' [г (/)]=■ 1 Л> (Ат) f Лт + 2ΫΕΓ No •ϊ Lc) + чУег No \2ll 2) j\ )· (367) Поставляя (367) в (359), учитывая порог и беря логарифм, получим ч[(л«+^)г+т!П1'-+ + ^ + 1п/0(Лт). N0 (368) Формирование статистики испытания осуществляется прямым способом (рис 4.53). Функция /0(·) показана на рис. 4.54. При больших χ ш·- У2пх ' 383 *»1, (369)
л„ r(t) гФжп ZfEl Nn €H Усиление №f(t)ccs[cuct+<p(t)'] Уст рой cm do воздедения д кдадрат \!udt Шх. Устройство доэбеде^ая бкбадрз'п Устройство издлечения кдадратного корня Шо\ 4x>|j Τ Усиление Рис. 4.53. Оптимальный приемник при случайной фазе. тогда как при малых χ /0(х)-1+^, *«1 1п/0(*)~^-, *«1. (370а) (3706) Заметим,-что ввиду монотонности функции In /0(x) ее можно исключить путем изменения значения порога. Таким образом, получаем два критерия, эквивалентные (368): 2 / ЕТ ) н0 (371а) (П^у {Lc> + L>) + 2А> 2^ ^о Но (3716) V*) Перечертив блок-схему приемника так, как показано на рис. 4.55, приходим к заключению, что тракт оптимального приемника состоит из линейной и квадратичной частей. Как видно из (371а), область плоскости Lc, LSi соответствующая решению Я0, лежит внутри окружности с центром (—Ы0Ат/2Л/ЕГУ 0) и с радиусом γ1/2. Обозначим эту область через Ω0. Плотность вероятности L с и Ls по гипотезе Н0 обладает цетральный симметрией относительно начала координат. Следовательно, если γ . фиксировать, а Лт увеличивать, что Ω0 будет сдвигаться влево, а вероятность нахождения в области Ω0 по гипотезе Н0 будет уменьшаться. Поэтому для поддержа- 1 2 з ч 5 б χ ния рр постоянной при увеличении Лт не- Рис 4.54. График функции, обходимо увеличивать γ. Несколько обла- 384
стей решений показано на рис. 4.56. В пределе при Лт->оо граница области решений стремится к прямой линии и мы получаем знакомую нам по § 4.2 задачу с известным сигналом. Плот- Линейная компонента r(t)\ J Усиление 2А„ Усиление 2 VT^ J [ {Устройство ^"Уоэбедения В квадрат №f(t)cos[u>ct+0(t)] \foT(it zvrr Усиление Устройстдо возведения в кбадрат Рис. 4.55. Другая реализация оптимального приемника. ность вероятности по гипотезе Нх зависит от Θ. Типичный случай иллюстрируется на этом же рисунке. Значения PF и Pd для некоторых интересующих нас частных случаев будут вычислены позднее на стр.388, Критерий ^A^L^ +L2$p Линии рабнoil Вероятности to*PLr..Ls\H1te(bc>Ls\Hve) Центр круга решении Hi Ω1 = &0-овласть плоскости вне круга Рис. 4.56. Области решения для случая неполностью известной фазы. а также в задачах вне основного текста. Прежде чем сделать это, целесообразно разработать другую структуру приемника для случая, когда Лт = 0. Во многих случаях такая структура является более удобной в реализации. 13 Зак. 693 3S5
Структура оптимального приемника в виде согласованного фильтрасдетектором огибающей. Когда Λ т = 0, необходимо найти ]/Lc2 + Ls2. Это можно сделать путем использования узкополосного фильтра и включенного вслед за ним детектора огибающей, как r(t) fl(t) У ft) _ I Лете к то ρ х\ огид~ающ,ей Измерение 6 момент времени t~T фильтр Рис. 4.57. Согласованный фильтр с детектором огибающей для случая равномерно распределенной фазы. показано на рис. 4.57. Поскольку h(t) является импульсной реакцией узкополосного фильтра, удобно записать ее в виде h (t) =hL (t)cos [g)c t+HfL (Ob (372) где hL(t) и ipL(t) — функции нижних частот. На выходе в момент времени Τ будем иметь τ у(Т)= ^h{T—x)r(x)dx. (373) о Используя (372), это уравнение можно записать в виде . τ y(T)=lr(x)hL(T-x)cos[«>c(T-T) + yL(T-T)]dx = о τ = cosacT lr(x)hL(T — x)cos[(ocx—\pL(T—x)]dx + о τ + sincDcr \r(x)hL(T—τ)sin [ω,τ—tyL(T—x)]dx. (374) о Уравнение (374), в свою очередь, можно переписать иначе У (Π Δ Ус (Т) cos cocT + ys (T) sin coc Τ = = УУс2(Т)+УеЧТ) cos Lc Τ- arctg |^-1. (375) Замечая, что τ Ус (Τ) = Re $ r (χ) hL (Τ-χ) exp [/ω, x-ftL (Τ-χ)] dx ο τ ys (Τ) = lm I r (χ) hL (Τ-χ)exp [/<oc τ—/ψχ. (Τ—τ)] dxt ο 386 (376a) (3766)
приходим к заключению, что выход детектора огибающей равен Τ Ι \ r(x)hL(T-x)exp[—j^L(T—x) + /coct]tft . (377) о I Как видно из (361) и (362), требуемая статистика испытания равна \т VLC*+L* = 5г(т)/2/(т)е/ф(т)е/(°с^т (378) Очевидно, эти два выражения будут тождественными, если hL(T—x) = V2f(x) (379) и Ць(Т-х) = -Ф(х). (380) Этот узкополосный согласованный фильтр обеспечивает более простую реализацию для случая равновероятной фазы. Приемник в случае равномерно распределенной фазы часто называется некогерентным приемником, однако этот термин может ввести в заблуждение. Мы видим, что согласованный фильтр использует внутреннюю фазовую структуру сигнала. Единственное, чего здесь не хватает — абсолютного опорного значения фазы. Приемник для случая известного сигнала называется когерентным, поскольку в нем необходим гетеродин, когерентный с генератором передатчика. Общий случай, рассмотренный в настоящем параграфе, можно назвать частично-когерентным. В заключение рассмотрим качество обнаружения в некоторых простых случаях. Принципиальной трудности в оценке вероятностей ошибки нет, однако результирующие интегралы часто бывает невозможно оценить аналитическими методами. Поскольку различные модификации данной задачи часто встречаются как в области радиолокации, так и в области связи, отысканию удобных выражений в замкнутой форме и оценкам численными методами было посвящено много усилий. Для иллюстрации используемого метода рассмотрим два типичных примера. Прежде всего обсудим радиолокационную задачу, сформулированную в начале данного параграфа [(354), (355)]. Пример 1. (Равновероятная фаза). Так как данная модель соответствует радиолокационной задаче, предположение о равномерном распределении фазы является наиболее реалистичным. Для построения рабочей характеристики приемника нам необходимо вычислить ΡF и ΡD. (Напомним, что ΡF и PD — вероятности превышения порога γ, когда присутствует-только шум и сигнал плюс шум соответственно.) Как видно из рис. 4.55, статистика испытания равна / = LC2 + LS2, (381) где Lc и Ls — нормальные случайные величины. Область решений показана на рис. 4.56. 13* 387
Нетрудно убедиться, 4fo H0:E(Lc)=E(L8) = 0; σ2 (Lc)=a2 (Ls)=-^ , No Нг : Ε (Lc | θ) = VEr cos θ; Ε (Ls | θ) = VEr sin θ; σ2 (Lc) = σ2 (Ls) = -± . (382) Тогда ^ΔΡ[/ > у\Н0] = JJ(2jly)"lexp(- LC^L52) ^Λ·· (3δ3> Перейдя к полярным координатам и выполнив вычисления, получим ^ = ехр(-£)· (384) Аналогично, вероятность обнаружения для некоторого θ равна Ωο Положив Lc = /?cos3, Ls = -RsinP и проинтегрировав по β, получим /ν Как и следовало ожидать, Ρ D не зависит от Θ. Это выражение можно нормировать, положив ζ = V2/N0R, что дает PD= J zexp^-—^-- y0(zd)dz, (387) где d2 = 2Er/N0. Этот интеграл невозможно вычислить аналитически. Впервые он был табулирован Маркумом [46, 48] и получил название Q-функции Маркума: оо Q (α, β) Δ j г exp ( - *'*"') /о (ои) «te. (388) Эта функция широко исследовалась и была табулирована для различных значений α и β (см. например, [48, 49 и 50])1. Таким образом, ^И^Г)· (з89) Эту вероятность обнаружения PD можно выразить через вероятность ложной тревоги PF. Используя (384), имеем PD=Q(dtY-2\nPF). (390) г) См. также Барк Л. С, Большев Л. Н. и др. Таблицы распределения Ρ елея — Раиса, изд. ВЦ АН СССР, 1964. 388
Рабочая характеристика приемника показана на рис. 4.58. Эти результаты можно также представить графически в виде зависимости ΡD от d при фиксированных значениях ΡF, что и сделано на рис. 4.59. Как видно из рис. 4.14 и 4.59, при пе-- реходе от модели известного сигнала к модели с равновероятной фазой для поддержания PD постоянной при фиксированной PF и пределах изменения параметра, показанных на рис. 4.59, требуется лишь незначительное увеличение d. Рис. 4.58. Рабочая характеристика Рис. 4.59. Вероятность обнаружения приемника; случай равномерного в зависимости от d в случае равнораспределения фазы. мерного распределения фазы. Вторым представляющим интерес примером является бинарная система связи, в которой имеется некоторая информация о фазе. Пример 2. Частично-когерентная бинарная система связи. В качестве критерия возьмем минимальную вероятность ошибки. Допустим, что обе гипотезы одинаково правдоподобны, а сигналы согласно этим гипотезам можно записать в виде Нг : r(t)= V2Er fг (t) cos ((uct + Q)+w(t), 0 < t < T, H0 : r(0= VWrUit) QQs{pct + Q) + w (t), 0<t <7\ (391) где f0(t) и fi(t)—нормированные функции и τ jM0M0«tt = p; -ι <ρ< ι. (392) о Спектральная плотность шума равна Ν0/2, а вероятностное распределение фазы ρθ(θ) дает (364). Критерий отношения правдоподобия получается в результате очевидной модификации простой бинарной задачи, а структура премника изображена на рис. 4.60. Рассмотрим теперь Р(&) как функцию р, d2 и Лт. Интуитивно можно ожидать, что при Ат -+ оо мы будем приближаться к задаче с известным сигналом, а при ρ = —1 [равные и противоположные сигналы (39)], получим наилучший 389
результат. С другой стороны, при Ат -*- 0 фаза становится равновероятной Теперь любая корреляция (положительная или отрицательная) будет сдвигать сигнальные точки ближе друг к другу. Поэтому можно ожидать, что при ρ = О получится наибольшая достоверность. При переходе от первого крайнего значения ко второму оптимальное значение ρ должно смещаться от —1 к 0. Подробно рассмотрим только простой случай, когда ρ = —I; случай ρ = 0 рассмотрен в задаче 4.4.9. Вычисление вероятности ошибки для произвольного ρ выполнено в [44]. Линейная компонента I 1 r(t) r(t) 2VE1 2Ап Устройство возведения в квадрат Усиление γ\ ■ί'" 2VTr «0 У [?/77/?0 *tf,(t)1sin(u>et) # + Устройство возведения в квадрат + П κχή/> 1 4x)f '//" &-г®> 2{f0(t)]siv,(wct) Устройство возВедения в квадрат Рис. 4.60. Приемник бинарной системы связи. При ρ ='—1, как можно убедиться, выход квадратичной части приемного тракта одинаков по обеим гипотезам. Таким образом, приемник является линейным. Влияние фазовой ошибки сводится к вращению сигнальных точек в пространстве решений, как показано на рис. 4.61. Используя результаты параграфа 4.2.1 (стр. 302), получим Ρ(β|θ), и И2" МЛ-1/2 ехр (х—YErcosbY Nn dx (393) 390
или г, / . лч Г ^2^ /Jocose 1 / г2 \ OO Используя (394), будем иметь (394) (395) Интеграл (395) можно вычислить численными методами. Результаты для двух значений d? показаны на рис. 4.62 и 4.631). Результаты для других ρ также были оценены в [44] и приведены на указанных рисунках. Видно, что при Ат больше, У\ Рис. 4.61. Влияние фазовых ошибок в пространстве решений. -К \1 \TrcosB ντ» чем примерно 2 отрицательно коррелированные сигналы становятся более эффективными, чем ортогональные сигналы. При Лт > Ю это различие весьма существенно. Физический смысл Лт станет для нас яснее при исследовании систем оценки фазы в гл. 2 второго тома. ш 4П~1 10 Рг(€) ю2 <п-з (d^ 3,098) 1. /Р—1 / =-®β / =-0,8 / =-0,7 / =-о,б / —0,5 / =-ом I Л '-0,2 0.1 10. 100 Рис. 4.62. Вероятность ошибки бинарной системы в случае неполностью известной фазы (10~~3 — асимптотическое значение) [44]. х) Значения d2 были выбраны с таким расчетом, чтобы при Лт = оо Ρ(ε)= = Ю-3 и 10~~5 соответственно. 391
В этом параграфе был рассмотрен частный случай нежелательного параметра — случайный фазовый угол. Используя семейство распределений, мы получили возможность продемонстрировать плавный переход от случая с известным сигналом к случаю с равновероятной фазой сигнала. Структура приемника соответствует взвешенной сумме 0,1 1 10 100 Рис. 4.63. Вероятность ошибки бинарной системы в случае неполностью извест- ной фазы (10-5 — асимптотическое значение) [44]. линейной и квадратичной операций. Следует заметить, что конкретная структура приемника обусловливается точной формой выбранного распределения. Во многих случаях плотность вероятности для фазового угла не будет соответствовать ни одному из этих распределений. Интуитивно можно ожидать, что синтезированный здесь приемник должен быть «почти» оптимальным для любого распределения данного семейства, под которое он рассчитан. Обратимся теперь к более важному случаю, когда изменяются как амплитуда, так и фаза принимаемого сигнала. 392
4.4.2. Случайные амплитуда и фаза Как указывалось в § 4.1, существуют случаи, когда изменяются и амплитуда, и фаза принимаемого сигнала. В области связи такая ситуация встречается в линиях, использующих ионосферный механизм распространения и работающих на частотах выше МПЧ (см., например, [51]) и на некоторых линиях тропосферного рассеяния (см., например, [52]). В области радиолокации она возникает, когда ракурс цели или ее эффективное радиолокационное поперечное сечение изменяется от импульса к импульсу (см., например, [53]). *J * V/d Рис. 4.(64. Узкополосный процесс на выходе канала и распределение его огибающей. Экспериментальные результаты для ряда физических проблем указывают на то, что когда на входе системы действует синусоидальный сигнал Υ2 sin (octt на ее выходе (в отсутствие аддитивного шума) имеется сигнал r(t) = vch(t)sm[<*ct + ech(t)]. (396) Такой сигнал представлен на рис. 4.64, а. Огибающая и фаза изменяются непрерывно. Огибающая vCh(t) имеет релеевское распределение, представленное на рис. 4.64, б. Фазовый угол 9ch(i) распределен равномерно — с постоянной плотностью. Существует несколько способов моделирования подобного канала. Простейший метод заключается в замещении реальных функций канала кусочно-линейными функциями, причем в пределах каждого отрезка прямой аппроксимирующая функция остается постоянной (рис. 4.65). Такое приближение будет справедливым,.когда параметры канала в течение интервала времени Τ секунд меняются не существенно. При такой модели «с медленными замирариями» возможны два метода обработки. Можно обрабатывать сигнал на каждом интервале независимо или, учитывая непрерывность канала, измерять его параметры и использовать результаты измерений в приемнике. Исследуем пока первый вариант. Для простой бинарной задачи обнаружения на фоне аддитивного белого гауссова шума сигнал по обеим гипотезам можно записать так!) г) Ради простоты будем полагать, что передаваемый сигнал имеет единичную энергию и что значение энергии принимаемого сигнала регулируется путем изменения характеристик величины υ. 393
H1:r(t) = OVbf(t)cQs[toGt+<l>(t) + B]+w(t), 0</<Γ, H0:r(t)=w(t), 0<*<7\ (397) где υ — случайная величина, распределенная по Релею, а θ — равномерно распределенная случайная величина. *V(t) №(*) **t *t *) Г) Рис. 4.65. Кусочная аппроксимация отрезками прямых (постоянными функциями): а—действительная огибающая; б—кусочно·линейная модель. Сигнальную компоненту можно также записать и через ее квадратурные составляющие y2vf(t)cos[(uj+0(t) + e]=aiy2f(t)cosltoj + 0(t)] + + а2 V2 / (t) sin [<ос t + Φ (t)], 0 < t < 7\ (398) где ах и а2 — независимые нормальные случайные величины с нулевыми средними и с дисперсией σ2 (Ε[ν2] = 2σ2; см. [2] стр. 188). Заметим также, что два члена в (398) ортогональны. Таким образом, сигнал на выходе канала с релеевскими замираниями можно рассматривать как сумму двух ортогональных сигналов, каждый из которых умножается на независимую нормальную случайную величину. Такой подход к рассмотрению задачи представляется более простым. Фактически, столь же легко решается и более общая задача, в которой принятое колебание по гипотезе Нх равно м r(t)= 'Σ aiSi(t)+w(t), 0<f<7\ (399) где at — независимые нормальные величины с распределениями W(°>%) и \sl(t)sJ(t)dt=6u. О 394 (400)
Отношение правдоподобия равно оо оо Л [г (ί)] = j · · · j ραι (Л) Ра, (Л) · · · PaM (Am) Χ — оо —оо X ехр Τ Μ Μ Μ Τ Μ ^ο 0 /=ι 2 4-52 2^·μομολ ^ϋ 0ί·=ι /=ι dAx...dAM. (401) Полагая τ Ъ=\гу)8^)Ш, (402) о используя ортогональность сигналов Si(t) и дополняя до полного квадрата в каждом из Μ интегралов, найдем, что испытание сводится к Соответствующие выражению (403) две блок-схемы приемника, показанные на рис. 4.66, обычно называют соответственно корреляционным приемником с квадратичным детектором и фильтровым приемником с квадратичным детектором. Выражение (403) можно переписать в виде м ( σ2 L \ м Структуру, показанную на рис. 4.67, можно интерпретировать как приемник типа «устройство оценки — коррелятор» (т. е. производится вычисление корреляции колебания r(t) с оценкой принятого сигнала). Отождествление выражения, стоящего в скобках, с аь вытекает из нашего обсуждения процедуры оценки в § 4.2. Она одновременно является оценкой по минимуму среднеквадратической ошибки и оценкой по максимуму апостериорной вероятности. На рис. 4.67, а показана практическая реализация приемника. Реализация рис. 4.67, б показы- г) Заметим, что (403) можно также получить, учитывая, что L/—совместно- нормальные по обеим гипотезам и являются достаточными статистиками. Поэтому непосредственно применимы результаты § 2.6, в частности (2.326). Если Li имеют ненулевые средние или коррелированы, то использование (2.326) является простейшим методом (см., например, задачу 4.4.21). 395
вает, что оценку сигнальной компоненты можно было бы фактически получить как колебание на выходе оптимального приемника. Такая интерпретация является довольно важной для последующих приложений. r(t) Отсчет (Выборка) в момент времени Τ ^(τ-τ) Отсчет (Выборка) В момент Времени Τ ^Κ^ττΘΗ^ t) Рис. 4.66. Приемники для сигналов с нормальным распределением амплитуд: а—корреляционный приемник с квадратичным детектором; б—фильтровой приемник с квадратичным детектором. KB—устройство возведения в квадрат. Применим теперь полученные результаты к исходной задаче (397). Если сопоставить Lx с Lc и L2 cLs, то станет очевидным, что приемник реализует критерий я, ^c + Ll^y Но (405) (где Lc и Ls были определены в примере со случайной фазой). Этот алгоритм можно реализовать, как показано в предыдущем параграфе, при помощи узкополосного согласованного фильтра и включенного последовательное ним°детектора огибающей. Другие возможные реализации приемника показаны на рис. 4.68, а, б. Далее необходимо оценить качество оценки. Заметим, что L с и Ls являются нормальными случайными величинами с одинаковыми распределениями. Поэтому релеевский канал соответствует точно примеру 2 на стр. 52 гл. 2. Там было показано, что [см. (2.80)] Pd={Pf)°^\ 396 (2.80)
rft) \(dt ч * V Ι <*> 1 •ί** *Η -Я-1 ο> Ι ·) Ш • 27* Оценка сигнальной компоненты по минимуму среднего квадрата ошибки *м(*~Т) Рис. 4.67. Приемник в виде устройства оценки и коррелятора. rft) ι—KSb^jfo pMgh ^Дг)со5[шсг+ф(г)] S2f(t)3in[wct + <p(t)] <§>-J^h@J Φ- Пороговое устройство Выборка (отсчет) а) в момент времени Τ rft) Полосовой согласованный фильтр Квадратичный детектор огибающей Пороговое Устройства hft) = ifZffT-r)w\u)cr-<p{T-X)'\ Ю Рис. 4.68. Оптимальные приемники для релеевского канала: з—реализация в виде квадратичного детектора; б—реализация в виде комбинации сог. ванного фильтра с детектором огибающей. KB —устройство возведения в квадрат. 397
где σ02 — дисперсия Le по гипотезе Н0, а σχ2 — дисперсия Lc по гипотезе Ях. Из рис. 4.68, а видно, что σ0=- Νη (406) 1 2 *~ 2 (407) где Ег & 2σ2£,/ — средняя энергия принятого сигнала. Подставив (406) и (407) в (2.80), получим PF = (PD)1+V^·. (408) Рабочая характеристика приемника приведена на рис. 4.69. 0.93 Г 5 10 30 50 100 V Рис. 4.69. а — рабочая характеристика приемника для релеевского канала; б — вероятность обнаружения в зависимости от 2Er/N0. Решение аналогичной бинарной задачи из области связи для произвольных сигналов получается сходным образом (см., например [55 и 56]). Рассмотрим кратко типичную систему. Напомним, что фазовый угол θ имеет равномерное распределение. Из результатов предыдущего параграфа (рис. 4.62 и 4.63) следует ожидать, что ортогональные сигналы должны быть оптимальными. Обсудим кратко простую систему ЧТ, использующую ортогональные сигналы. Принимаемые сигналы по двум гипотезам можно записать в виде Нг'.гУ) = Y2vf(t)cos[(>>1t + <b(t) + e]+w(t), 0<ί<7\ H0:r(t) = Y2Of(t)cQs[<o0t+<I>(t) + e]+w(t)9 0</<7\ (409) Частоты ω2 и ω0 разнесены настолько, что сигналы ортогональны. В предположении равных априорных вероятностей и критерия мини- 398
мальной вероятности ошибки η = 1. Критерий отношения правдоподобия следует немедленно (см. задачу 4.4.24) Lc\ + Ls\ Η, Н0 Lco+L, so· (410) Соответствующая структура приемника показана на рис. 4.70. Вероятность ошибки можно оценить аналитически (см. задачу 4.4.24): Р(г) = - 1 + 2 N0\ (411) На рис. 4.71 построена зависимость Р(&) от Er/N0. Здесь же для сравнения показана также Ρ(ε) для случая известного сигнала и случая равновероятной фазы. Видно, что в обоих случаях, соответствующих отсутствию замираний, вероятность ошибки спадает экспоненциально при· больших Er/N0i тогда как в случае с замираниями она спадает линейно. Интуитивно это и понятно. Независимо от того, насколько большой становится средняя энергия принятого сигнала, во время глубокого замирания вероятность ошибки равна или почти равна 0,5. Несмотря на то, что это происходит не часто, наличие глубоких fit) Полосодой ^Асогласо банный фильтр ШадратичныиХ W детектор к*И (отсчет) огибающей Выборка 6 момент бремени Τ Полосодой L*J согласоданный\-*\ фильтр Щадратичныи\ детектор огибающей Выборка (отсчет) в момент дремени Τ co s0 Рис. 4.70. Оптимальный приемник бинарной системы связи, использующей ортогональные сигналы. замираний не позволяет вероятности ошибки уменьшаться экспоненциально. В гл. 3 второго тома будет показано, что путем использования разнесения (например, передавая сигнал по нескольким независимым релеевским каналам параллельно) можно достигнуть экспоненциального уменьшения вероятности ошибки. Как уже указывалось, другой подход к данной проблеме заключается в измерении характеристик канала и использовании результатов измерения в структуре приемника. Можно легко получить оценку возможного выигрыша в предположении, что измерения канала производятся идеально. Если измерение идеально, можно использовать 399
когерентный приемник. Получающуюся вероятность ошибки оценить нетрудно. Сначала запишем условную вероятность ошибки, зависящую от того, что переменный параметр канала ν равен V. Затем необходимо усреднить результат с релеевской плотностью (рис. 4.64, б). При использовании когерентного приема (приема известного сигнала) 0,5 /?"' Рг(е) 103 -*t 10 1*5 >^ : I I I I I I I I I I L J_L_ О 2 * 6 В 10 12 Рис. 4.71. Вероятность ошибки при использовании бинарных ортогональных сигналов в ре- леевском канале. 0,5 W1 Рг(е) 103 №* ,ns ^> X ^М X . I..I 1 1 1 1 1 1 1. 1 U.1...J-J О 2 Ь 6 8 Ю 12 Рис. 4.72. Вероятность ошибки в релеевском канале для идеального наблюдателя. и ортогональных сигналов, вероятность ошибки для данного значения V определяется уравнениями .(36) и (40): Ρ(ε|1/)= J PAV) V Vl/No σ2 0, ΥΈι e-y*/*dy, ~ (V>0) e-V*/2G2 v>o, V<0. Таким образом, σο σο Ρ (ε) = j dV 4- e~ ν2/2σ2 J —^r e-*2/2 dy. о °2 vYYJnI У2п Переходя к полярным координатам и интегрируя, получим Р (8) = 1 1 — ErIN0 У/2 l+Er/No Результат показан на рис. 4.72. (412) (413) (414) (415) 400
Сравнивая (415) и (411) или рассматривая рис. 4.72, можно прий - ти к выводу, что идеальное измерение дает выигрыш около 3 дб при больших значениях Er/N0 и ортогональных сигналах. Кроме этого, если бы производилось измерение параметров канала, то можно было использовать равные и противоположные сигналы и получить выигрыш еще 3 дб. Райсовский канал. Во многих физических каналах помимо реле- евской компоненты существует фиксированная (или регулярная) компонента. Типичным примером может служить коротковолновая линия радиосвязи с использованием отражения от ионосферы, работающая на частоте ниже максимально применимой частоты (МПЧ) (см., например, [57—59]). Такие каналы называются райсовскими. Проиллюстрируем теперь поведение канала этого типа в случае бинарной системы связи, использующей ортогональные сигналы. Принимаемые сигналы по двум гипотезам имеют вид Hy.r(t)=Y~2af1(t)cas[<oct+<I>1(t)+6] + + Y2Of1(t)cos[<oGt+<I>1(t) + e]+w(t)9 0<f<7\ (416) #0 : r(t) = Υ2 α/0 (/) cos [ω J+Φ0(ί)+δ] + ]/ 2 vf0 (t) cos [<oci+ + Φο(0 + θ]+ »(/), 0<f<7\ где α и δ — амплитуда и фаза фиксированной компоненты. Передаваемые сигналы являются ортонормированными. В простейшем случае α и δ предполагаются известными (см. задачу 4.5.26 для неизвестного δ). При таком допущении можно, не теряя общности, положить δ = = 0. Теперь можно записать сигнальную компоненту по гипотезе Hi в виде a1{Y2fi(t)cos^ct+Oi(t)]} + + а2 \У2 U (Ζ) sin [ωβ ί + Φ, (/)]}, (/ = 0,1>. (417) И на этот раз аг и а2 — независимые нормальные случайные величины Ε (ах) = α, Ε (а2) = 0, σ2 (аг) = σ2 (α2) = σ2.] (418) Ожидаемое значение энергии принимаемого сигнала по любой из гипотез равно Ε (Ег) = 2σ2 + α2 Δ σ2 (2 + γ*), (419) где γ2 — удвоенное отношение энергии регулярной компоненты к средней энергии случайной компоненты. Обозначим полную амплитуду и фазовый угол принимаемого сигнала через ν'= Υ a\ + al, G' = arctg-^-. (420) Плотность вероятности нормированной огибающей (Vnf = ==ν/σ)ρΌ'η(Χ) и плотность вероятности фазового угла рв'Ф') показаны на рис. 4.73 ([56, 60]). Как и следовало ожидать, пик плотности вероятности фазового угла становится весьма узким по мере возрастания у. 401
Структуру приемника можно синтезировать путем прямой модификации уравнения (398) в (405). Критерий отношения правдоподобия имеет вид ν 2 ^ ι +i42+(i41(a+i42+(i4 Ι2σ* N0 (421) υ,/ 0,5 ? »л *■ о,г 0,1 - /~χ*' - It / l^_ 1 - •0 ^ Λ T**^>-*-J-_ >V^ ^>^—Α. 1^ J Ц- χ PJ9') Рис. 4.73. α — плотность вероятности огибающей в райсовском канале; б — плотность вероятности фазы в райсовском канале. ОМ OJjc 0,5π 0J% 0,9я 0' Структура приемника показана на рис. 4.74. Вычисление вероятности ошибки утомительно (см., например, [56]), поэтому запишем окончательный результат P(z) = Q τ(Ρ+ΐ) [(β+γ)Ι/2β1/2' (β + 2)1/2β,/2 U+2/ *Ч 2\ β* + 2β )\ °V β(β + 2) J* V ' 402
где β Δ_ 2σ2/Ν0 — ожидаемое значение энергии принимаемого сигнала в случайной компоненте, поделенное на Ν0. Вероятность ошибки представлена графически на рис. 4.75 для типичных значений γ. Заметим, что γ = 0 соответствует релеевскому каналу, а γ = оо — полностью известному сигналу. Таким образом, даже когда мощность фиксированной компоненты в два раза превышает мощность случайной компоненты, помехоустойчивость системы лежит ближе к релеевскому гбг рЦхН гг ' Ntt ' УстроистВо бозВедения |—ι 6 кбадрат W 4· VFff(t)cos[<oct+<t>f(t)] N0J0 Τ dt СЩ] /2yfW*in[«ct^ft)] ос 26* Устройство Возведения |-J В квадрат Фи * + HfH Τ Hdt уЫ устройство ι Воэоедения I—j В кбадрат а + наибольшего сигнала. Wf0(t)c*s[coct+<t>0(t)] irXdt No Устройство возведения В квадрат е^ t + Ри*. 4.74 Оптимальный приемник бинарной системы связи в райсовском канале. каналу. Ввиду того, что райсовский канал имеет большое практическое значение, исследованию поведения вероятности ошибки в этом канале при различных условиях посвящено большое число работ (см., например, [56]). Краткие итоги § 4.4. Как следовало ожидать, формулировка М- альтернативной задачи передачи информации следует непосредственно из предыдущих результатов и сопряжена с вычислением вероятности ошибок (см., например, [61] или [153). В главе 3 второго тома будет показано, что релеевский и райсовский каналы представляют частные случаи общей гауссовой задачи. В настоящем параграфе подробно рассматривались два важных случая, когда компоненты сигнала содержат нежелательные случайные параметры. 403
Поскольку плотность вероятности считалась известной, оптимальная процедура испытания следовала непосредственно из нашей общей формулировки критерия отношения правдоподобия. Рассмотренные конкретные примеры распределений привели нас к интегралам, которые можно оценить аналитически, а затем — к развернутым структурам приемников. Даже в тех случаях, когда оценить эти интегралы было невозможно, метод построения отношения правдоподобия был для нас ясен. Когда плотность вероятности угла θ неизвестна, оптимальная процедура совсем неочевидна. Существует две логических возможности: 1. Можно задаться распределением и пользоваться им так, как если бы оно было правильным. Затем можно исследовать зависимость качества оценки от принятой плотности, используя методы анализа устойчивости критериев и оценок, аналогичные тем, которые были продемонстрированы при решении других задач. 2. Можно использовать правило минимакса. В принципе этот путь наиболее прямо ведет' к цели. Например, в бинарной задаче из области связи находят Ρ(ε) как функцию от /?θ(θ), а затем выбирают Ρθ(θ), максимизирующую Ρ(ε), и синтезируют приемник для этого случая. Однако у этой процедуры есть два существенных недостатка — ее сложность и заниженные оценки. ^ Наконец, ^возможен случай, когда фаза θ является неслучайной величиной. Для решения этой задачи достаточно распространить методы испытания гипотез, развитые в § 2.5, на случай обработки результатов измерений сигналов. Эти методы прямо приводят к конечным результатам. Во многих практически важных случаях либо существует равномерно наиболее мощный критерий, либо удовлетворительные результаты дает обобщенный критерий отношения правдоподобия. Некоторые интересные примеры разобраны в задачах вне основного текста. Хелстром [14] рассмотрел вопросы приложения обобщенных критериев отношения правдоподобия к радиолокационной задаче обнаружения сигналов с неизвестным временем появления. Рис. 4.75. Вероятность ошибки при использовании бинарных ортогональных сигналов в райсов- ском канале. 4.5. . Многоканальные системы В гл. 3 было введено понятие векторного случайного процесса. Теперь необходимо решить задачи обнаружения и оценки для случая, когда принимаемое колебание является выборочной функцией векторного случайного процесса. 404
В простой задаче бинарного обнаружения принимаемые сигналы записываются в виде H1:r(t) = s(t) + n(t), Τ^ί^Τ;, H0:r(t) = n(t)t Г,<*<7у В случае оценки принимаемый сигнал есть г(/) = 8(ЛЛ) + п(0, Г,</<7у Изложение векторного случая охватывает две группы вопросов. 1. Компактная формулировка задачи. Используя векторное разложение Карунена — Лоэва со скалярными коэффициентами, введенное в гл. 3, было показано, что построение отношения правдоподобия в векторном случае есть лишь тривиальное развитие скалярного случая. (Эта задача весьма подробно была рассмотрена Вольфом [63], а также Томасом и Вонгом [64].) 2. Исследование помехоустойчивости синтезированных структур приемника с тем, чтобы выяснить, не возникают ли в данном случае проблем, которых не было в скалярном случае. В этом параграфе будет рассмотрено лишь несколько простых примеров. В гл. 5 второго тома мы вновь обратимся к многомерной задаче и исследуем некоторые ее аспекты. 4.5.1. Формулировка задачи Допустим, что s(/) — известный векторный сигнал, а аддитивный шум η(ή — выборочная функция Λί-мерного нормального случайного процесса. Предположим, что помеха содержит компоненту белого шума n(0*=w(i)+ne(/), (425) где Ε [w (t) wT (и)] = ^ Ι δ (/ — и), (426а) а в более общем случае Ε [w (t) wT {и)] = Νδ (t — и). (4266) Матрица N содержит только числа. Допустим, что она положительно определена. Физически это означает, что все компоненты колебания или любое его линейное преобразование будут содержать компоненту белого шума. Общий случай рассмотрен в задаче 4.5.2. В основном же тексте разберем случай, описываемый уравнением (426а). Матрицу ковариационных функций коррелированного шума запишем в виде £[ηβ(/)η?(α)]ΔΚβ(ί,α). (427) J> В скалярном случае мы записывали энергию сигналов раздельно и пользовались исключительно нормированными сигналами. В векторном случае, чтобы без особой нужды не усложнять форму записи, будем пользоваться ненормированными сигналами. (423)'> (424) 405
Предполагается, что каждый элемент матрицы Кс(^> ") интегрируем в квадрате, а белая и небелая компоненты шума независимы. Используя выражения (425)—(427), получим К„(t, u) = ^lb(t—u) + Kc(t, и). (428) Для построения отношения правдоподобия поступим так же, как и в скалярном случае. По гипотезе Нг т, Tf ,Δ $г*-(0Ф,(*)Л= 5вГ(/)Ф,(0Л + Ti Tt + lnr(t)Ot(i)dt=st + nt. (429) Заметим, что все коэффициенты уравнения (429) являются скалярными величинами. Поэтому здесь непосредственно применимо уравнение (180): lnA[r(/)]e2^-L2f <430) ί=ι κι £ ;=ι Аг Подставив (429) в (430), будем иметь Й ^,Ф,(0ФГ(«) 1пЛ[г(0] = Йгг(0 2л^—^ s(u)dtdu — Ti 1=1 1 Введя ~ Ф,(0ФГ|(и) Qn(/, «) = 2ί~^Γ , Tt<t, u<T„ (432) i=l l получим Г/ In Л [г (*)]= jj rT(t)Qn(t,u)s(u)dtdu— — ft's7" (f) Qn (/, «) s (u) Λ rfu. (433) 2 rf Используя векторную форму теоремы Мерсера (2.253) и (432), приходим к заключению, что J Kn(f, «) Q»(и, z)du=b(t—z) I, Tt<t, z<Tf. (434) 406
По аналогии со скалярным случаем запишем Qn(t,u)=^-l[b(t-u)-h0(t,u)] (435) "о и покажем, что h0(i, и) можно представить сходящимся рядом. Подробности можно найти в задаче 4.5.1. Как и в скалярном случае, упростим уравнение (433), введя обозначение g(0 = j Qa(t,u)s(u)du, Tt<t<rf. - (436) Оптимальный приемник, как показано на рис. 4.76, является просто векторным коррелятором или векторным согласованным фильтром. r(t) S0 « Порогсбое устройство //f или Н0 з» g(t) r(t) о) Измерение 6 момент бремени. тг'Г) 1^1 Пороговое ^\устройство Н, или Н0 в) Рис. 4.76. Векторные приемники: а—матричный коррелятор; б—матричный согласованный фильтр. Двойными линиями на блок-схеме обозначены векторные операции, а символом Θ — скалярное произведение двух входных векторов. Можно показать, что показатель качества равен d* = 55 sT (t) Qn (t,u)s (u) dtdu = 5 s^ (t) g (t) dt. (437) 4.5.2. Прикладные вопросы Рассмотрим простой пример. Пример. Ь/^ sM (t) J где сигналы Si(t) — ортонормальны. 407 о < t < τ, (438)
Предположим, что шумы каналов являются независимыми и белыми No 2 Ά. ° 2 Ε [w (t) wT (и)] = Us. 2 Тогда δ (t—u). (439) g(0 = ■У ДМ Νη Si (О **(') (440) Синтезированный для данного случая приемник—векторный коррелятор, изображенный на рис. 4.77; показатель качества равен Этот приемник обычно называют устройством сложения (комбинирования) по максимуму отношения сигнал/шум [65], поскольку сигналы, поступающие на его Τ » *,<*) г«а®- : г'Щ 1 Но Усиление | г]/Гм 1 «<7 Vh / ^ί I Усиление sM(t) Рис. 4.77. Схема комбинирования по максимуму отношения сигнал/шум. вход, взвешиваются с целью получения максимального отношения сигнал/шум на выходе. Соответствующие схемы сложения для случая коррелированного шума рассмотрены в задачах. Большинство методов, развитых для скалярного случая, можно перенести и на векторный случай, однако это сопряжено с соответствующим усложнением алгебраических преобразований. Некоторые из этих методов проиллюстрированы в задачах, а более подробное их изложение можно найти в главе пятой второй части. Основные резуль- 408
таты для линейных и нелинейных оценок применительно к векторному случак> получаются прямой модификацией результатов, полученных для скалярного случая (см. задачи 4.5.4 и 4.5.5), Результаты, полученные для нежелательных параметров, также можно распространить на векторный случай. Формулировки задач для случая Μ каналов со случайными фазами, а также для каналов релеевского и райсовского типов приведены в задачах. 4.6. Оценка нескольких~параметров В этом параграфе мы рассмотрим задачу оценки конечного множества параметров alt α2, ..., ат. Обозначим эти параметры вектором а. Рассмотрим только канал с аддитивным белым шумом. Конечные результаты получим путем комбинирования результатов классической оценки нескольких параметров (гл. 2) с результатами § 4.2. Целесообразность исследования данной задачи обоснована двумя соображениями. Первое соображение очевидно и заключается в том, что задачи на оценку нескольких параметров встречаются во многих физических ситуациях, представляющих интерес. Распространенным примером из области радиолокации может служить задача определения дальности и скорости цели путем оценки запаздывания (задержки) и допплеровского сдвига отраженного импульса. Второе соображение менее очевидно. В гл. 5 будет рассмотрена процедура оценки непрерывного сигнала и мы увидим, что посредством разложения сигнала в ряд можно оценить коэффициенты ряда и использовать их для формирования оценки сигнала. Таким образом, оценивание нескольких параметров служит в качестве метода перехода от оценки одного параметра к оценке сигнала. 4.6.1. Канал с аддитивным белым гауссовым шумом Совместные оценки по максимуму апостериорной вероятности. Предположим, что сигнал зависит от значений параметров Аъ Л2, ..., ..., Ам. Тогда для аддитивного канала принимаемый сигнал можно записать в виде r(t)^s{t, Α)+αι(Ζ), Τ^ί*ζΤ/9 (442) где А—матрица-столбец: : . (443) Необходимо выразить апостериорную плотность вероятности через соответствующее множество наблюдаемых величин, которое мы обозначим /С-мерным вектором г. Затем мы найдем оценку а, максимизи- 409
рующую апостериорную плотность вероятности, и полагаем /С-* <*>, чтобы получить требуемый результат. Параметры аъ а2, ..., ам могут быть взаимосвязанными либо в структуре сигнала, либо в силу своей априорной статистической зависимости. Эту статистическую зависимость можно классифицировать следующим образом: 1. Параметры а19 а2,..., ам являются совместно-нормальными. 2. Параметры аъ α2,..., ам являются статистически независимыми и нормальными. 3. Параметры аъ а2,..., ам являются статистически независимыми, но не нормальными. 4. Параметры αΐ9 α2, ...,α^ не являются ни статистически независимыми, ни совместно-нормальными. Прежде всего следует отметить, что случай 1 путем преобразований может быть сведен к случаю 2. Напомним, что в гл. 2 было доказано следующее свойство (2.237). Свойство. Если b — несингулярное линейное преобразование над а (т. е. b = La), то Ьщар = Lamap и атар= L~ l bmap. (444) Известно, что существует несингулярное линейное преобразование, посредством которого любое множество зависимых· нормальных величин преобразуется в множество независимых нормальных величин (гл. 2, стр. ПО—114). Таким образом, если at —зависимые величины, то вместо них можно оценивать bt. Следовательно, предположение о том, что м Ра (Α) Δ ρΗ Η ,там(А19...9 Ам) = Π ра. (Л,)э (445) г=1 фактически охватывает случаи 1, 2 и 3. Случай 4, гораздо более сложный в деталях (но не по идее), не имеет значения для последующего изложения и поэтому здесь не рассматривается. Полагая, что шум является белым и что справедливо соотношение (445), аналогична "скалярному случаю приходим к заключению, что оценки по максимуму апостериорной плотности вероятности суть решения следующей системы Μ уравнений: ( 2 / ds(t,A) , Л , d\npal{Ai) N0 ft dAi dAi (446) A — amap (/ = 1,2, ... , Μ). Если at — нормальные случайные величины с нулевыми средними и дисперсией σ2αζ·, то эти уравнения сводятся к простой форме 2σ~ J ds{t,A) ,-^-J-=^H0-.«.*)l« N0 J дА, A=s (i=I,2 Λ4). (447) 410
Полученная система уравнений формулирует систему необходимых условий, которым должны удовлетворять оценки по максимуму апостериорной плотности вероятности. Предполагается, что максимум является внутренним по отношению к разрешенной области изменения и что указанные производные существуют в точке максимума. Вторым представляющим интерес результатом является граничная матрица. Из § 2.4.3. известно, что прежде всего необходимо найти информационную матрицу. Из уравнения (2.289) следует, что 3T = 3D + 3Pi (448) ^/aMnA^N (449) а для нормальной априорной плотности вероятности 3Р = АГ1У (450) где Ла — ковариационная матрица. Выражение (449) аналогично (104) в § 4.2. Поэтому от (449) легко перейти к соотношению *°"=ТшЕш TJ 4i J ds{t,A) ds(t, , , , — -dt l· (451) dAi дА ■ У } Напомним, что (451) является границей по отношению к корреляционной матрице Re в том смысле, что Зт — RI1 (452) является неотрицательно-определенной. Если апостериорная плотность вероятности гауссова, то R71 = Зт. Аналогичный результат получается для несмещенных оценок неслучайных величин, если положить 3Р = 0. Условия существования эффективной оценки выявляются непосредственно. Равенство будет соблюдаться для /-го параметра лишь тогда и только тогда, когда к Tf ах [г (t)\ -A, = ^kj (А) Г [г (t)-s (f, A)] as^A) dt. (453) Для иллюстрации применения данного результата рассмотрим простой пример. Пример. Предположим, что одновременно осуществляется амплитудная и частотная модуляция синусоидального колебания с двумя независимыми гауссовыми параметрами a, N(0, σα) и b, N(0, σ^). Тогда r(t) = 8(t9A, B) + w(t) = 2£\ι/2 Τ Τ Bsm((uct + $At) + w(t), _ — <*< — (454) 411 (f)
Функция правдоподобия имеет вид Т/2 \nA[r(t)\AfB]=Y Г Г2г(0-^)1/2^5Ш(шс/ + РЛо1х Следовательно, -7/2 /2£\1/2 χ ( — J Bsin(o>c/+P40#. ^^=(f)*'Vco.(.M + M0 ал as(/, Л, В) ,2Е\Ч2 # ^ = (у J 8ΐη(<Μ+βΛ*). Так как переменные независимы, матрица Jp является диагональной. Элементы матрицы JT равны: Т/2 9 f* 9F" 1 -772 . Г2 2£ fte 1 1 2£ 1 2 f 2£ -Τ/ 2 2 Г гр а»«, л, в) · a»«, а, в) 1 /ΐ2=^τ£α·Μ J —^ ϋ—dt\ = ]■■ N0 ta> b Г — BfU sin (<uct + pAt) cos ((uct + pAt)dt L—T/2 Таким образом, матрица Jr также диагональная. Это означает, что Τ2 2Е \-1 (455) (456) (457) (458) (459) (460) (461) (462) Следовательно, можно сделать вывод, что границы оценок параметров а и Ь не- коррелированы. Можно показать, что при больших E/N0 действительные дисперсии стремятся к указанным границам. Эти результаты можно интерпретировать следующим образом. Если при каждом проведении эксперимента приемнику сообщалось бы значение параметра bt то качество оценки параметра а по сравнению со случаем, когда приемник должен оценивать 6, не улучшалось бы (в предположении больших E/N0). 412
Таким образом, существует два случая, когда J12 может равняться нулю. Если Γ<'*('.ι,β)*('.ι..Β)Λ_0 (463) ί дЛ дВ —Т/2 до взятия математического ожидания, то это означает, что для любого значения А или В частные производные ортогональны. Это условие необходимо для того, чтобы оценки максимального правдоподобия были независимыми. Но даже если левая часть (463) была бы отлична от нуля, то ее значение после взятия математического ожидания может стать равным нулю, что даст независимые оценки по максимуму апостериорной вероятности. Ряд интересных примеров на оценивание нескольких параметров включен в задачи вне основного текста. 4.6.2. Обобщения результатов Полученные результаты можно прямым методом обобщить так, чтобы они охватывали и другие представляющие интерес случаи: 1. Неслучайные величины, оценивание по максимуму правдоподобия. 2. Аддитивный коррелированный шум. 3. Каналы со случайной фазой. 4. Релеевские и райсовские каналы. 5. Разнесенный прием. Некоторые из этих случаев рассматриваются в задачах. Один из них, который будет использоваться в последующем, — случай аддитивного коррелированного шума, рассмотрен в задаче 4.6.7. Конечные результаты получаются путем очевидной модификации уравнения (447), вытекающего из (226) Tf ^Й^Ч ~ lrg(z)-g(z)]dz9 < = 1, 2,...,М, (464) Mi lA=amap где Tf rg (z) —g (г) Δ ξ Qn (ζ, и) [r (u)-s (и, атар)] du, Tt < ζ < Tf. (465) -ч 4.7. Краткие итоги главы 4 и нерассмотренные вопросы 4.7.1. Краткие итоги главы В этой главе был рассмотрен широкий круг проблем. Центральным моментом, который связывает их изложение воедино, является вопрос об аддитивной компоненте белого гауссова шума. Используя его в качестве исходного, мы рассмотрели задачи различного типа, иссле- 413
довали их решения, а также смысл и значение последних. Формальное решение оказалось самой легкой частью проблемы; уяснению значения полученных результатов была посвящена большая часть наших усилий. Подводя итоги, целесообразно остановиться на некоторых результатах общего характера. Простейшей задачей обнаружения является задача бинарного обнаружения на фоне белого гауссова шума. Оптимальный приемник для этого случая может быть реализован в виде согласованного фильтра или корреляционного приемника. Достоверность обнаружения зависит от нормированного расстояния между двумя сигнальными точками в пространстве решений. Это расстояние характеризуется энергиями сигналов, их коэффициентом корреляции и спектральной плотностью аддитивного шума. При одинаковых энергиях сигналов оптимальный коэффициент корреляции равен —1. Во всех случаях форма сигнала не имеет значения. Достоверность обнаружения практически не зависит от допущений, касающихся подробностей выбранной модели. На основе результатов бинарной задачи легко получить решение многоальтернативной задачи для Μ сигналов. Структура приемника содержит не более Μ — 1 согласованных фильтров или корреляторов. За исключением нескольких частных случаев, вычисление достоверности обнаружения при произвольных распределениях стоимостей и априорных вероятностей весьма громоздко. Поэтому основное внимание было обращено на достижение минимальной вероятности ошибочных решений. Для произвольных систем сигналов вычисление вероятности ошибки оказывается весьма утомительным. Для ортогональных и неортогональных равнокоррелированных сигналов могут быть.найдены простые выражения для вероятностей ошибок и вычислены численными методами. Были также выведены простые выражения для границ вероятности ошибки, полезные при определенных пределах изменения значений параметра. Вопрос об оптимальной системе сигналов был кратко обсужден в основном тексте и несколько более подробно — при рассмотрении задач. Было установлено, что при больших Μ ортогональные сигналы являются практически оптимальными. Простая задача обнаружения была затем обобщена путем допущения небелой аддитивной гауссовой компоненты шума. Это обобщение охватывает также и известные линейные каналы. Формальное распространение результатов бинарной задачи методом «выбеливания» или введения соответствующей системы доступных наблюдению координат не встречает каких-либо затруднений. При исследовании полученного результата был разработан ряд вопросов, которые ранее нам не встречались. Включением в выбранную модель ненулевой компоненты белого шума обеспечивается гарантия того, что согласованный фильтр будет иметь интегрируемую в квадрате импульсную характеристику и что идеальное-или сингулярное обнаружение будет невозможно. Выработанный в конечном итоге критерий является устойчивым, однако его чувствительность зависит от уровня белого шума. В присутствии компоненты белого шума достоверность обнаружения всегда можно улучшить путем удлинения интервала наблюдения. 414
В радиолокации такой путь легко реализуем ввиду относительно большого интервала времени между соседними импульсами. Далее было исследовано влияние изъятия из модели компоненты белого шума и показано, что если не ввести дополнительные ограничения на «гладкость» формы сигнала, выбранная математическая модель может привести к вырожденным или неустойчивым испытаниям (критериям). Далее был сделан переход к следующей ступени обобщения, а именно, чтобы допускались некоторые неопределенности сигнала даже в отсутствие шума. Для случая, когда эти неопределенности можно параметрически представить случайными величинами с известными плотностями, отыскание необходимой процедуры не вызывает трудностей. Подробно был рассмотрен случай, когда фаза случайна, а также случай, когда случайны и амплитуда и фаза. В задаче со случайной фазой было введено понятие простой системы оценки, которая измеряет фазовый угол и использует результаты измерения в обнаружителе. Это дает нам метод перехода от случая известного сигнала к таким ситуациям, как например, в радиолокации, когда фаза имеет равномерное распределение. Для бинарных сигналов было установлено, что оптимальная система сигналов зависит от качества измерения фазы. Как и следовало ожидать, значения оптимального коэффициента корреляции лежат в пределах от ρ = —1 для идеального измерения до ρ = 0 при равномерном распределении. Случай, когда случайны амплитуда и фаза, позволяет моделировать ряд линий связи, которым свойственны релеевские или райсовские замирания. Применительно к этому случаю были исследованы приемники, в которых не используются измерения фазы, и приемники с идеальным измерением. Было установлено, что идеальное измерение позволяет получить выигрыш в 6 дб. Однако даже при идеальном измерении из-за наличия замираний в канале закон уменьшения вероятности ошибки при увеличении отношения Er/N0 носит линейный, а не экспоненциальный характер. Далее были рассмотрены многоканальные системы (разнесенный прием). Векторное разложение Карунена — Лоэва позволило нам легко получить критерий отношения правдоподобия. За исключением одного простого примера подробное обсуждение векторных систем было отложено до последующих глав. Основные идеи при рассмотрении задачи оценки аналогичны, да и вся формулировка задачи при помощи функции правдоподобия носит тождественный характер. Синтезируемые для линейной оценки структуры приемников тождественны структурам, получаемым в простой бинарной задаче. Средний квадрат ошибки при оценивании на фоне белого шума зависит только от отношения E/N0. Задача нелинейной оценки связана с рядом вопросов. Первая трудность заключается в том, что не существует достаточной статистики, а это означает, что отображение из пространства наблюдения в пространство оценок зависит от самого оцениваемого параметра. В некоторых случаях это затруднение можно легко преодолеть, в других приходится прибегать к методам приближений. Результирующая функция в пространстве оценок имеет ряд локальных максимумов, ввиду чего 415
приходится выбирать абсолютный максимум. При условии, что точка выбрана вблизи истинного максимума, вычисление среднего квадрата ошибки не вызывает затруднений. Ошибку можно значительно уменьшить по сравнению с ошибкой при линейной оценке выбором соответствующего метода модуляции. Однако при попытке уменьшить ошибку до чрезвычайно низкого уровня обнаруживается новое явление, именуемое порогом. При последовательном приближении к оптимальному устройству оценки физическая трактовка явления порога довольно прозрачна. Первый каскад выбирает ошибочный интервал, на котором производится локальная оценка. В случае непрерывной реализации (например, при оценке дальности) механизм порога ясен, однако количественное описание этого явления является более сложным. Поскольку действительный уровень порога зависит от структуры сигнала, количественные результаты, полученные для того или иного конкретного примера, менее существенны, чем уяснение того обстоятельства, что раз мы достигаем уменьшения ошибки без увеличения энергии сигнала или уменьшения уровня шума, то явление порога будет наблюдаться при некотором значении отношения сигнал/шум. Последней из числа рассмотренных в гл. 4 задач была задача оценки нескольких параметров. В нашем изложении она служит одновременно и как завершающий момент в обсуждении оценок параметров сигналов, и как отправной пункт для рассмотрения задачи оценки сигналов. Здесь были получены полезные соотношения, показывающие, как через структуру сигнала и априорные плотности вероятности возникает связь между ошибками оценивания. Помимо подведения итогов по вопросам, охваченным в гл. 4, не менее важно указать некоторые связанные с ними вопросы, которые не рассматривались. 4.7.2. Нерассмотренные вопросы Цифровая связь. Мы изложили значительное количество исходных сведений и основных положений, необходимых для изучения современных цифровых систем. Однако, за исключением нескольких случаев, рассматривалась лишь передача одноразрядного цифрового сигнала. (В литературе эта задача часто называется задачей передачи одиночного импульса.) Из простого примера § 4.2 ясно, что достоверность обнаружения можно повышать путем передачи и обнаружения блоков цифр (многоразрядных последовательностей). Исследование эффективных методов передачи цифровой информации является одной из центральных проблем теории кодирования. Соответствующие материалы по этому вопросу можно найти в [66, 18]. Данное замечание не означает, что во всех цифровых системах связи целесообразно применять кодирование, но имеет в виду, что кодирование всегда необходимо рассматривать как одну из возможных альтернатив при проектировании всей системы связи в целом. Негауссовы помехи. Вполне очевидно, что во многих прикладных вопросах основным видом помех являются негауссовы помехи. Про- 416
стыми примерами служат различные промышленные помехи на низких частотах, импульсные помехи, шумы Галактики, помехи от Солнца, атмосферные помехи и др. То обстоятельство, что случай негауссовой помехи при изложении был опущен, объясняется не отсутствием к нему интереса или недооценкой его важности. Не объясняется это и нашей неспособностью решить ту или иную конкретную негауссову задачу. Представляется вероятным, что если мы можем адекватно смоделировать или измерить соответствующую статистику, то приемник, близкий к оптимальному, может быть синтезирован (см., например, [67, 68]). Причина заключается в том, что чрезвычайно трудно получить полезные результаты, которые были бы одновременно достаточно общими. При рассмотрении негауссовой задачи мы преследуем довольно скромную цель. Во-первых, помочь читателю осознать, что в любой данной ситуации нам необходимо проверить, не проходит ли гауссова модель — либо как вполне справедливая, либо в качестве достаточного приближения для получения полезных результатов. Во-вторых, если гауссова модель не проходит, то нам не следует отказываться от попыток решить актуальную задачу (хотя бы и приближенно) и цепляться за гауссово решение ввиду его точности. В этой главе мы занимались решением задач обнаружения сигналов и оценки конечного числа их параметров. Теперь мы обратимся к оценкам непрерывных сигналов. 4.8. Задачи Задачи разбиты в соответствии с разделами текста главы. Если это специально не оговорено, во всех задачах используется модель из соответствующего раздела основного текста; например, сигналы принимаются на фоне аддитивного гауссова шума с нулевым средним, который не зависит от соответствующих гипотез. Задачи к § 4.2. Аддитивный белый нормальный шум Бинарное обнаружение Задача 4.2.1. Вывести выражение для вероятности обнаружения Р£ через d и Ρ ρ для известного сигнала на фоне аддитивного белого гауссова шума [см. (37) и (38)]. ' Задача 4.2.2. В бинарной системе частотного телеграфирования передается одно из двух синусоидальных колебаний различных частот, например: Sl (t) = f (t) cos 2jx/c t, 0 < t < T, s2 (0 = /(0 cos 2n(fc + Af)t, 0<t<T, где/с > \/T и Δ/. Коэффициент корреляции равен Τ J /2 (t) cos (2π Δ/0 at о Р= г * J P(t)dt о 14 Зак. 693 417
Передаваемый сигнал принимается на фоне аддитивного белого гауссова шума со спектральной плотностью NJ2. 1. Вычислить ρ для импульса прямоугольной формы, т. е. f(t)=\ \т) { о /2 О < t < Г, при других t. Представить результат графически в виде функции от Δ/Τ. 2. Допустим, что требуемая вероятность ошибки Р(е) = 0,01. Какое необходимо значение E/N0 для получения такой вероятности, если Δ/ = оо? Начертить график зависимости требуемого для достижения такой Р(г) превышения EINQ над асимптотическим значением от AfT. Задача 4.2.3. Сопряженный с некоторым экспериментом риск равен M=CF PF Р0+См Рм Рх. Применимая в данном случае рабочая характеристика приемника представлена на рис. 2.9. Дано: а) См = 2; б) CF = 1; в) Рг может изменяться между 0 и I. Построить линию на рабочей характеристике приемника, которая минимизировала бы максимально возможный риск (т. е., считая Рг выбранной, сделать R как можно больше. Эта линия должна быть геометрическим местом пороговых точек, благодаря чему максимум будет минимальным). Задача 4.2.4. Рассмотрим линейную систему с обратной связью, изображенную на рис. 4.1*. Функция x(t) — известная детерминированная функция, равная нулю при t < 0. По гипотезе ΗχΑι = А1у по гипотезе H0At = А0. Помеха w(t) — вы- ш-П) 1 + ^Кт-гФ г(И7 Рис. 4.1* борочная функция белого гауссова процесса со спектральной плотностью N0/2. Величина r(t) наблюдается на интервале (0, Т). Все начальные условия в системе обратной связи нулевые. 1. Найти критерий отношения правдоподобия. 2. Найти выражение для PD и PF в частном случае, когда x(t) — d(t) (им* пульс) и Τ = оо . Задача 4.2.5. Тремя общераспространенными методами передачи бинарных сигналов по каналу с аддитивным гауссовым щумом являются: амплитудное телеграфирование (AT), частотное телеграфирование (ЧТ) и фазовое телеграфирование (ФТ): Н0 : r(t) = s0(t) + w(t), 0<t<T, Нг : r(t) = s1(t) + w(t), 0<t<T, где w(t) — выборочная функция из белого гауссова процесса, имеющего спектральную плотность W0/2 Сигналы для трех этих случаев записываются в виде ι 418
AT 1 se(0 I mo 0 V2E/fsin<u1t ЧТ l^E/rsinco^ V2£/rsin0oi ΦΤ 1^2£/rsin(D0* Y2EjTsin((uot + n) где ω0 — ωχ = 2лп/Т для некоторого ненулевого целого η и ш0 = 2ятГ — для некоторого ненулевого целого т. 1. Построить соответствующие пространства сигналов для трех указанных методов. 2. Найти d2 и получающуюся вероятность ошибки для этих трех методов (считая обе гипотезы равновероятными). 3. Высказать суждение о сравнительной эффективности этих трех методов передачи: а) с точки зрения использования мощности передатчика; б) с точки зрения простоты реализации. 4.· Привести пример, когда модель данной задачи не точно описывает реальную физическую ситуацию. Задача 4.2.6. Субоптимальные приемники. В данной задаче мы исследуем ухудшение помехоустойчивости, обусловленное использованием в приемнике' фильтра, отличного от оптимального. Целесообразно сравнивать помехоустойчивость по увеличению энергии передаваемого сигнала, требуемому для компенсации уменьшения d2, которое вызывается рассогласованием фильтра. Мы полагаем, что во многих практических случаях упрощение аппаратуры, достигаемое благодаря использованию несогласованных фильтров, вполне оправдывает необходимое увеличение мощности передачи. Интересующая нас система показана на рис. 4.2*, где [s2(t)dt=l и E[w(t)w(x))=^d(t-x). HD:0 Г ar(t) f -Φ h(t) Отсчет nput ^s. Решить ■»Г \н1или.Нд Суйоптпимальный приемник Рис. 4.2*. Принимаемое колебание имеет вид Нг :r(t) = VEs(t) + w(t), —оо < t < оо, #о : r(t) = w(t)> —°° <t <оо. Известно, что (s(T-t)t 0<t<T, *optm-[ о при других* dopt-##· 419
Допустим, что ~—att h(t) = e-aT u_{(t), —*j<t < ос, (1/Γ)Ι/2, 0<*<7\ О при других t. S(t): 1. Выбрать параметр а так, чтобы выходное отношение сигнал/шум dY было максимальным. 2. Вычислить полученное d2 и сравнить его с d\ t. На сколько децибел необходимо увеличить мощность передатчика, чтобы получить ту же помех о устойчивость. Многопозиционные сигналы Задача 4.2.7. Процедура Грама—Шмидта. В этой задаче мы подробно рассмотрим геометрическое представление системы Μ сигналов посредством Ν(Ν < Μ) ортогональных сигналов. Рассмотрим Μ сигналов sx (t), ..., sM(t), которые либо линейно независимы, либо линейно зависимы. Если они линейно зависимы, то можно записать (по определению): Μ 2 fl|sf(o=o. 1. Показать, что если Μ сигналов линейно зависимы, то sM(t) можно выразить через si(t): i =1, ..., Μ — 1. 2. Продолжить эту процедуру пока не получится N линейно независимых сигналов и Μ — N сигналов, выраженных через первые. Тогда N будет размерностью системы сигналов. 3. Провести подробный анализ метода Грама — Шмидта, описанного на стр. 303—304 Задача 4.2.8. Преобразование сигналов. Симплексные сигналы [18]. Вероятность ошибки при приеме по максимуму апостериорной вероятности не зависит от линейного преобразования сигналов в пространстве решений; например, два Ji ~^% о) Рис.4.3*. пространства решений, изображенные на рис. 4.3*, а и 4.3,* б, имеют одинаковую Ρ(ε). Очевидно, что данные системы не требуют одинаковой мощности передачи. Обозначим среднюю энергию системы сигналов через _ Μ Μ Т Е± Σ P(Hi)\si\*= S Ρ (Я,) Μ si» (0 Я. ί=1 ί=1 0 420
1. Найти линейное преобразование, минимизирующее среднюю энергию преобразованной системы сигналов, т. е. минимизирующие _ м Е ± Σ P(Hi)\si-m\*. г=1 2. Объяснить геометрический смысл результата по п. 1. 3. Применить результат п. 1 к случаю Μ ортогональных сигналов одинаковой энергии, представляющих равновероятные гипотезы. Полученные таким способом сигналы называются симплексными сигналами. Изобразить сигнальные векторы для Μ = 2, 3, 4. 4. Какая энергия необходима для передачи каждого сигнала симплексной системы? 5. Рассмотреть возможность уменьшения энергии при переходе от ортогональной системы к симплексной системе при сохранении одной и той же вероятности ошибки. Задача 4.2.9. Одинаково коррелированные сигналы. Рассмотрим Μ одинаково коррелированных сигналов: 1. Доказать, что — < ρ < 1. 2. Проверить, что левое неравенство получается при использовании симплексной системы. 3. Доказать, что система одинаково коррелированных сигналов, имеющих энергию £, имеет такую же вероятность ошибки Ρ(ε), как ортогональная система сигналов с энергией £orth = £"(1 — ρ). 4. Выразить Ρ(ε) для симплексных сигналов через Р(е) для ортогональных сигналов и М. Задача 4.2.10. Μ сигналов при произвольной корреляции. Рассмотрим систему сигналов, используемых для передачи равновероятных сообщений. Сигналы имеют одинаковую энергию и могут быть коррелированы: τ lPij=$ Si(t)sj(t)dt, U /=1, 2, ..., Λ*, о В канале к сигналам аддитивно добавляется белый гауссов шум со спектральной плотностью Ν0/2. Таким образом, r(t)=YEsi(t) + w(t)i 0<t<T:Hu /=1, ..., Λί. 1. Начертить блок-схему оптимального приемника, содержащего Μ согласованных фильтров. Какое минимальное число согласованных фильтров может быть использовано? 2. Пусть ρ — корреляционная матрица сигналов, а ее ij-ът элемент равен pij. Если ρ — несингулярная матрица, то какова размерность пространства сигналов? 3. Найти выражение для P(e\Hi) — вероятности ошибки при условии, что верна гипотеза Нг. Считать, что ρ — матрица несигулярная. 4. Найти выражение для Ρ(ε). 5. Справедливо ли это выражение для симплексных сигналов? (является ли матрица ρ сингулярной?). 421
Задача 4.2.11. (продолжение). Вероятность ошибки [69]. В данной задаче получим другое выражение вероятности ошибки Ρ(ε) для системы, рассмотренной в задаче 4.2.10. Требуемое выражение имеет вид X Р(е)=^ехр(-^) jeXp[g)l/%]x —оо ί·Γ(~ _d_ dx τ — ι У Ρ У (2n)M'2\9\l<2 -оо —оо dy I dx. (1*) Выполнить следующие операции: 1. Переписать выражение для помехоустойчивости приемника через Μ op. тонормированных функций Ф/ (t). Введем функции Μ Si(t)= 2 *»«M0. ί = 1, 2, ..., Μ, k=\ /•(0= ЦглфЛ(о. Доказать, что оптимальный приемник формирует статистики Τ Μ h= J r(t)Si(t)dt= 2 sikRk 0 As=l и выбирает из них наибольшую. 2. Пусть передается sm(t). Показать, что P(s|m)A/>(R BZm) = / Λί Λί \ = Ρ Ι Σ s™& ^ft = max 2 sjfc #fc · \fc=l / Лг= 1 У 3. Проверить, что Λί оо оо '«-±«4-£)ΣΗ ехр —(1/iVo) Λί Ί Σ Μ ГЯ= 1 —оо —оо (πΝ0)Μ>2 Χ (* 4 \ Хехр —max > i?ft s# . (2*) 4. Введем функцию f (R) = exp {max {щ)"° £>:»«]} и заметим, что (2*) можно рассматривать как математическое ожидание /(R) по некоторой системе статистически независимых нормальных случайных ве- 422
личин /?ft с нулевыми средними и дисперсией N0I2. Для вычисления этого математического ожидания введем м •>*Ш" Σ ·»*·· k= 1 /=1, 2, ..., Αί Найти /?2(ζ). Введем *2 *Λί x = maxzj. i ' Найти рх(х). 5. Используя результаты п. 4, имеем -P(e) = ^exp(_|-) Jexp [(^)"Χ]Λ(Χ)«. Использовать рх(Х) из п. 4 для получения требуемого результата. Задача 4.2.12 (продолжение) 1. Используя выражение (1*) в задаче 4.2.11, показать, что дР(е)/др12 >0 Соблюдается ли этот вывод, если 1 -* ί и 2 -* /? 2. Использовать результаты п. 1 задачи 4.2.9 для развития интуитивного обоснования того, что симплексная система сигналов является локально оптимальной. Примечание, Доказательсто локальной оптимальности содержится в [70]. Доказательство глобальной оптимальности можно найти в [71]. Задача 4.2.13. Рассмотрим систему сигналов, приведенную в задаче 4.2.10. Введем Ртах = max pij. 1. Доказать, что Р(е) для любой системы сигналов меньше, чем Р(е) для системы одинаково коррелированных сигналов с коэффициентом корреляции Ртах· 2. Выразить этот результат через вероятность ошибки для системы ортогональных сигналов. 3. Показать, что Р(е) ограничена сверху выражением Р(г)<(М—l)ierfc, Ν, О— Ртах) П Задача 4.2.14. [72]. Рассмотрим систему сигналов, приведенную в задаче 4. 2. 10. Введем ά% — расстояние между точкой ί-го сообщения и ближайшей соседней точкой. Заметим, что di Доказать, что 1 ·-»)»*j/o-m^. ^jl/ь dmin=niincij. erfc*(<0 < Ρ (ε) < (Μ— 1) erfc* (dmin), 423
Заметим, что этот результат очевидным образом распространяется на случай сигналов с неравными энергиями. Задача 4.2.15. В (68) основного текста был использован предел In erf* \y + lim Λί^οο f2PTlogzM\% N№ π 1/(M-1) Применяя правило Лопиталя, проверить пределы, указанные в (69) и (70) Задача 4.2.16. Вероятность ошибки в (66) есть вероятность ошибки при принятии решения, какой из сигналов был послан. Каждый сигнал соответствует последовательности цифр; например, если Μ = 8, то 000->s0(0 ooi->Sl(o 010->s2(0 011->s3(0 100 -> s4 (t) 101->s5(0 110-*se(O 1Π - s7 (0 Поэтому ошибка в определении сигнала не обязательно означает, что все цифры приняты ошибочно. Часто представляет интерес вероятность ошибки по разрядам (битам или элементам) — Ρβ(ε)- 1. Проверить, что если допускается ошибка, то равновероятен выбор любого из остальных Μ — 1 сигналов. 2. Проверить, что ожидаемое число ошибочно принятых разрядов при условии, что сигнал принят ошибочно, равно lo^M.(log2M 1%М ,log2M (\og2M)M : 2(М—1) 3. Проверить, что вероятность ошибок по элементам равна Μ РВ(*) = 2(М —1) Ρ (ε). 4. Построить зависимость вероятности ошибок по элементам для Μ = 2, 4 и 8 (использовать рис. 4.25). Задача 4.2.17. Биортогональные сигналы. Доказать, что для системы из Μ биортогональных сигналов с энергией Ε при равновероятных гипотезах ™-Чущ-'1-ъ^™] X X —=гехр ( —тг) dy Μ/2— 1 dx. Проверить, что эта вероятность стремится к вероятности ошибки для системы ортогональных сигналов при больших Μ и d2. В чем преимущество биорто- гональной системы? 424
Задача 4.2.18. Рассмотрим следующую цифровую систему связи. Имеются четыре равновероятных гипотезы. Сигналы, передаваемые согласно соответствующим гипотезам, можно записать в виде: f 2 \Vt иАтУ 1 / 2 V/ я* т(т) A sincoc*, 0 < t < Τ, У. Л sin сос t, 0 < t < Τ, Ηζ: —— ( — \ * Asintuct, 0 < t<T, "•■-{if 2πη 0< i < Τ. Сигнал принимается в смеси с аддитивным белым гауссовым шумом w{t), имеющим спектральную плотность N0/2. 1. Начертить блок-схему приемника, реализующего минимальную вероятность ошибки, и пространство решений, а также вычислить получаемую вероятность ошибки. 2. Как ведет себя вероятность ошибки при больших A2/N0? Задача 4.2.19. Многопозиционная система AT [72]. Система AT используется для передачи равновероятных сообщений 8i(t) = VTi Φ (0, i=l, 2,..., Μ, где τ V£f = (i —1)Δ, J Φ2 (t)dt = l. О Принимаемый сигнал согласно t-ой гипотезе равен r(t) = Si(t) + w(t), 0<t<T:Hi, /=1, 2,..., Μ, где ш(0 — белый шум со спектральной плотностью Ν0Ι2. 1. Построить блок-схему оптимального приемника. 2. Изобразить пространство решений и вычислить Ρ(ε). 3. Какова средняя мощность передачи? п "^ -2 (я-1)я(2«-1) Примечание. У, /2= . j=l 6 4. Посредством какого преобразования системы сигналов в пространстве решений можно сохранять вероятность ошибки фиксированной при минимизации средней мощности передачи? Задача 4.2.20. (продолжение). Используем модель передачи последовательности (стр. 308—310) системой AT (п. 4 задачи 4.2.19). Рассмотрим частный случай, когда Μ = 4. Каким образом следует отобразить цифровую последователь ность в сигналы, чтобы минимизировать вероятность ошибки по элементам? Вы числить вероятность ошибки по знакам и вероятность ошибки по элементам. Задача 4.2.21 Ж-позиционная система ФТ [72]. Передатчик системы связи посылает одно из Μ сообщений по каналу с аддитивным белым гауссовым шумом, имеющим спектральную плотность NJ2y посредством сигналов 5,(0 = 2Е\У» / η 2πΓ ~zr I cos ~ / η 2ni \ T j „*[2nTt+-ju;)> °<*<τ> / = 0, 1, 2,..., M —1, при других t, 425
где п — целое число. Все сообщения равновероятны. Система этого типа называется М-позиционной системой фазового телеграфирования (ФТ). 1. Построить блок-схему оптимального приемника, используя минимальное число фильтров. 2. Начертить пространство и линии решений для различных М. 3. Доказать, что α < Ρ (г) < 2α, где a=erfc*(©%sini")· Задача 4.2.22. (продолжение). Оптимальная система ФТ [73]. Основная система показана на рис. 4.24. Возможны следующие стратегии передачи: 1. Использовать двоичную систему сигналов ФТ с энергией каждого сигнала, равной РТ. 2. Использовать М-позиционную систему сигналов ФТ с энергией каждого сигнала, равной РТ log2M. Обсудить вопрос о выборе Μ с целью минимизации вероятности ошибки по символам. Сравнить на этой основе двухфазную и четырехфазную системы ФТ. Задача4.2.23. (продолжение). Для М-позиционной системы ФТ качественно рассмотреть эффект неточного знания опорной фазы. Другими словами, номинальная система сигналов дана в задаче 4.2.22 и на этой основе строится приемник. Реальная же система сигналов имеет вид / 2Е \ У» (2лп 2Ш л \ m л i—J cos(-7~'+^r-beJ» о<*<7\ i=u 2 м, О при других t, η—целое, где θ—случайный фазовый угол. Как изменяется значимость фазовой ошибки при увеличении М? Оценивание Задача 4.2.24. Граница Баттачария. Пусть r(t) = s(t, A) + w(t), 0<t<T, где функция s(t, А) дифференцируема к раз по А. Спектральная плотность шума равна NJ2. 1. Распространить метод границы Баттачарьи, развитый в задаче 4.2.23, на сигнал при η = 2. Считать А детерминированной величиной. 2. Повторить задание по п. 1 для случая, когда А — нормальная случайная величина, W(0, σα). 3. Распространить результаты п. 1 и 2 на случай η = 3. Задача 4.2.25. Рассмотрим задачу примера 1 (стр. 320). Помимо того, что неизвестно время поступления импульса, неизвестна также его амплитуда. Таким образом, r(t) = bs (t — a) + w (t), —T<t<T, где а — равномерно распределенная случайная величина (см. рис. 4.29, б), а Ь — нормальная случайная величина, W(0, σ^). Начертить блок-схему приемника, дающего совместные оценки ύ£,αρ и £шар по максимуму апостериорной вероятности. 426 Si (0 =
Задача 4.2.26. Известный сигнал s(t), О < t < Т., передается по каналу с неизвестным неотрицательным коэффициентом передачи и аддитивным гауссовым шумом n(t): /\s*(t)dt=Et Kn(t, τ)=^δ(ί-τ). ο Δ 1. Какова оценка величины А по максимуму правдоподобия? 2. Каково смещение этой оценки? 3. Является ли данная оценка асимптотически несмещенной? Задача 4.2.27. Рассмотрим стационарный пуассоновский случайный процесс x{t). Типичная выборочная функция его показана на рис. 4.4*. Вероятность η событий на любом интервале τ равна п\ Параметр к процесса является неизвестной детерминированной переменной, которую нужно оценить; x{t) наблюдается на интервале (О, Т). Моменты событии -*-х—у* х-х- о г Рис.4.4*. 1. Необходимо ли регистрировать моменты времени событий или достаточно вести счет числа событий, происходящих на заданном интервале. Доказать, что п* — число событий, происходящих на интервале (О, Т), является достаточной статистикой. 2. Найти неравенство Крамера —Рао для любой несмещенной оценки параметра к. 3. Найти оценку параметра к по максимуму правдоподобия. Обозначить эту оценку через к. 4. Доказать, что к — несмещенная оценка. 5. Найти <j2(£ _fe). 6. Является ли оценка по максимуму правдоподобия эффективной? Задача 4. 2. 28. При передаче сигнала через данную среду его амплитуда на выходе обратно пропорциональна «непрозрачности» среды. Выходной сигнал наблюдается на фоне аддитивного белого гауссова шума (спектральная плотность N0I2, спектр двухсторонний). Таким образом. r(t) = -^f(t) + w(t), 0<t<T, где /(f) — известный сигнал и т $P(t)dt = E. о Необходимо построить оптимальный измеритель «непрозрачности». 1. Предположим, что Μ — детерминированная величина. Синтезировать блок-схему системы, выход которой является оценкой величины Μ (обозначаемой через 7nmi) по максимуму правдоподобия. 427
2. Теперь предположим, что Μ — нормальная случайная величина с нулевым средним и дисперсией σ2^. Найти уравнение, определяющее оценку величины Μ по максимуму апостериорной вероятности (гатар). 3. Показать, что ттар->^тг при Задачи к § 4.3. Небелый аддитивный нормальный шум Вводные математические упражнения Задача 4. 3.1. Обратимость. Доказать, что hw(t, и), определяемая выражением (157), есть обратимая операция, показав, что h~^l(t, и) такова, что Tf J hw(t, u)h-l(u, z)du = b(t—z). Ti Какие ограничения необходимо наложить на шум? Задача 4.3.2. Из (163) следует, что интегральное уравнение N Tf -£-h0(z, v) +J h0(v, х)Кс(х> z)dx== = /Cc(z, ν), Ti<z, v<Tf определяет обратное ядро Qn(*> τ) = -^-[δ(/-τ)-Μ*, τ)]. Показать, что -±h0(z, v) + \ ho (z, v)Kc(x> v)dx = Kc(z> ό)9 Tt<z, v^Tf Ti является эквивалентным уравнением. Задача 4.3.3. [74]. В задаче 4.3.2 было показано, что обратное ядро Qn(ty τ) можно получить путем решения интегрального уравнения N Т1 -ITfhV* τ)+\ Μ*. u)Kc(u, T)du = Kc(t, τ), Tt<t, τ<Τ/, где QnV, τ)=-~ρ[6(*-τ)-Μ'. τ)]. Допустим, что конечная точка интервала Tf является переменной. Обозначим это, записав h0(t, τ: Tf) вместо h0(t, τ): Ν Tf -^-h0(t, τ: T/) + f h0(t, u:Tf)Kc(u, r)du = 2 «r. = Kc(t, τ), Ti<t, τ < Tf. 428
Путем дифференцирования по Tf показать, что dh0{t,x:Tf) dTf -h0(t, TfiTf)h0(Tf9 τ-.Tf). Указание. tj f(x)Kc(t, x)dx = Xf(t), Tt<t<Tf i не имеет решения для λ < 0. Задача 4.3.4. Реализуемые выбеливающие фильтры [91]. 6 основном тексте на рис. 4.38, а и б были приведены две эквивалентные реализации оптимального приемника для задачи с коррелированным шумом. Было также показано, что Qn(t, и) соответствует нереализуемому фильтру, определяемому уравнениями (162) и (163). Кроме этого, было найдено одно решение для hw(t, τ) (выбеливающий фильтр) через собственные функции, которые соответствуют нереализуемому фильтру. Необходимо исследовать возможность отыскания реализуемого выбеливающего фильтра. Напомним, что нам удалось показать это на простом примере (стр. 354). 1. Записать логарифм отношения правдоподобия через Η,0(ί,τ) = h0(t,%:Tf) (см.гзадачу 4.3.3). 2. Записать In Л (г (0) = j" dt I $\hwr (t, и) VEs (и) du TJ X X Ti .. fhwr(i, z)r(z)dz Uz,(7V)= j* ^J~-dt. dL(t) Дополнительный подстрочный индекс г указывает на реализуемость. 3. Используя результат задачи 4.3.3 dh0(u, υ : t) -, L=-h0(t, ult)h0(t, v:t), 01 показать, что hwr(t, и) = ^У*[Ьу-и)~Н0у, u:t)].' Заметим, что h0(tt u:t) соответствует реализуемому .фильтру. 4. Выписать интегральное уравнение, которому удовлетворяет h0(t, τ : t). B[Wi. 6 рассмотрен метод решения данного уравнения. Задача 4.3.5. Μ-позиционные сигналы, коррелированный шум. Пусть принятый сигнал по ί-ой гипотезе есть r(t) = VTiSi(t)+nc(t) + w(t), Ti<t<Tf:Hi, i=\, 2,..., Μ, где w(t) — белый гауссов шум с нулевым средним и спектральной плотностью N0/2, a nc(t) — независимый коррелированный шум с нулевым средним и ковариационной функцией Kc(t, и). Сигналы Si(t) нормированы на интервале (0, Т) и равны нулю за пределами этого интервала. Допустим, что гипотезы равновероятны и принятый критерий — минимальная вероятность ошибки Р(г). Начертить блок-схему оптимального приемника. 429
Оценивание Задача 4.3.6. Рассмотрим следующую задачу оценки з r(t) = As(t) + 2 hsi (t)+w (0, 0 < t < Г, /=ι где Л—детерминированная величина, bi—независимые нормальные случайные величины с нулевым средним, [Е (bi2) = oi2]9 w(t)— белый шум (N0/2), s(0 = з = 2 с, si (О, Τ Τ §Si(t)Sj(t)dt = 6ij И jV(0<tt=l. О О 1. Начертить блок-схему приемника для оценки величины Л по максимуму правдоподобия. 2. Выбрать cl9 c2, с3 так, чтобы дисперсия оценки была минимальной. Решения интегральных J уравнений Задача 4.3.7. Решим простое уравнение Фредгольма второго рода: N Т* VEs{t) = -fg(f) + $ ltc(*. u)g(u)du, Ti<t<Tf, где Ke(t, м) = ас2ехр[— k \t—u\], s(t) = ——9 0<t<T, ут T/ = 0, Tf = T. 1. Найти g(t). 2. Вычислить показатель помехоустойчивости d2. Задача 4.3.8. (продолжение). Решить задачу 4.3. 7 для случая, когда Ti = = — оо и Tf = оо . Сравнить найденное значение d2 со значением, полученным в предыдущей задаче. Задача 4.3.9. Решить уравнение Фредгольма первого рода τ §K(t, u)g(u)du=s(t)i 0<t<T, о для треугольного ядра (1— \t—u\ при \t—u\ < 1, (О при других 11—и \. Допустим, 4tos(0 является дважды дифференцируемым и что Τ < 1. Теперь применим этот результат к задаче обнаружения известного сигнала s(t), 0 < t < Ту наблюдаемого на фоне аддитивного гауссова шума с ковариационной функцией [1—| t—u\ при | t—u\ < 1, (θ при других \t—и\. 1. Что представляет собой оптимальный приемник? Укажем, что мы не можем физически генерировать импульсы, поэтому корреляция с g(t) не является удовлетворительным ответом. 2. Вычислить d2. Каково необходимое и достаточное условие для сингулярного обнаружения в данной задаче, если сигнал s(t) ограничен? 430 *<*.«)-{; *п(*. «)={J
Задача 4.3.10. 1. Вычислить d2 для примера, приведенного на стр. 362. 2. Если сигнал s(t) ограничен и имеет конечную энергию, то каково необходимое и достаточное условие для невырожденного испытания ? Задача 4.3.11. (продолжение). Оптимальный приемник для задачи 4.3.10 содержит согласованный фильтр и устройство для взятия дискретных отсчетов (дискретизатор). Найти d2 для субоптимального приемника, который имеет согласованный фильтр, но не содержит дискретизатора. Задача 4.3.12. Противник использует бинарную систему связи для передачи данных. Применяемые сигналы имеют вид 2π s1(t)^=s\n2 — t, 0<t <7\ 2π s0 (t) = —sin2 — t9 0 < t < T. Принимаемый сигнал по соответствующим гипотезам можно записать в виде H1:r(t) = s1(t) + n(t), 0<t<T, HQ : г(0 = s0(t)+n(t), 0<t<T, где n(t) — выборочная функция гауссова случайного процесса, имеющего нулевое среднее и ковариационную функцию Допустим, что он знает а и строит приемник, реализующий минимальную Р(г). Выбрать α так,чтобы помехоустойчивость приемника противника была минимальной. Чувствительность и сингулярность Задача 4.3.13. Сингулярность [2].. Рассмотрим задачу простого бинарного обнаружения, показанную на рис. 4.5*. По гипотезе Н1 переданный сигнал является сигналом x(t) конечной энергии. По гипотезе Н0 сигнал не передается. ι n(t)/>*t*T:H9 Рис. 4.5*. Аддитивная помеха w(t) есть выборочная функция белого шума со спектральной плотностью 1-В2/Гц. Принятое колебание г (ή пропускается через фильтр с передаточной функцией H(jw). Выходное напряжение фильтра y(t), 0 < t < Г, является сигналом, доступным для обработки Пусть λ^ и φ^ (t)—соответственно собственные значения и собственные функции помехи n(t), 0 < t < Т. Для сингулярного обнаружения потребуем, чтобы оо 2 Необходимо доказать, что в данном случае этого не может быть. 431
1. На основании τ efc = J<M0e(0«K о показать, что где где sk= \ X(f)H(j2nf)Ok*(f)df, — оо оо Хф= J x(t)e-i2*f*dt ' —оо оо Τ — оо О 2. Показать, что f [Η* (/2я/) Фт (f)] [Я (;2π/) <Dft* ф] df = f λ*' 6СЛИ Ш = *' j;^ ( 0, если т Φ k. 3. Из п. 2 следует, что для некоторого множества чисел с& 00 с х (f) = 2 ΊΓ я*(/2π/) % (/)+"(/) · f U(f)H(j2nf)Q>k*(f)df = 0. — оо 4. Используя результаты по пунктам 1, 2 и 3 показать, что S 2 Σι* J-»* £=1 и, следовательно, идеальное обнаружение в данной ситуации невозможно. Задача 4.3.14. Рассмотрим следующую систему #! : г (0 = sx (ί) + /ι(ί), 0 < t < Τ, H0:r(t) = n(t), 0<t<T. Известно, что β 2π "(0= 2 attc°srt— '» η=1 где αΛ — случайные величины с нулевыми средними значениями. Энергия сигнала равна Τ j s11(i)di = £. о Выбрать сигнал 5Х(0 и соответствующий ему приемник так, чтобы можно'было принимать точные решения с вероятностью, равной 1. 432
Задача 4.3.15. Поскольку белый шум является математической абстракцией (он имеет бесконечную энергию, что физически невозможно), то иногда говорят о белом шуме с ограниченной полосой, т. е. имеющем спектр 0 при ωχ < | со | < ω2, при других | со |. Предположим, что необходимо обнаружить строго ограниченный по длительности сигнал г / F \ 1/2 О < t < Г, при других t. Является ли это хорошей математической моделью физической задачи? Обосновать ответ. Задача 4.3.16. Чувствительность к уровню белого шума. Принимаемые согласно двум гипотезам колебания имеют вид r(t) = s(t) + nc(t) + w(t). —ею <t<oo:Hlt r(t) = nc(t) + w(t), — оо < t < оо : #0. Сигнал s(t) и спектр Sn(co) коррелированного шума известны точно. Уровень белого шума равен где Nq/2 — номинальное значение, а х — малое отклонение. Допустим, что приемник строится на основе номинального уровня белого шума. dlnd ι о - dd'dx 1. Найти выражение для —-— а 2. Допустим, что дх ΔΔ. *=0 — s(t)JV2kPe-k*, t>0, 10, t<0 2koc2 5ηβ(ω) = " ω2 + £2 Вычислить Δ как функцию A&4oc2/kN0. Задача 4.3.17. Чувствительность к спектру шума. Примем ту же номинальную модель, что и в задаче 4.3.16. I. Пусть 2 2 \ 2/га On2 Sn (co) = 9l-±- » \це ka=k(\ + y), аа2 = ас2(1+г). Найти dd/ду I A dd/dz —-— ΔΔ^ и —-— d 2=o- A ΔΔΖ. |2=0- у=0 у=0 2. Вычислить А у и Δζ для формы сигнала, указанной к задаче 4.3.1^ 433
Задача 4.3.18. Чувствительность к задержке и коэффициенту передачи. Принимаемые колебания по двум гипотезам соответственно равны г (t) = Yl s (t) + bj s (t—%)+w(t)y —oo<t<oo:Hly r(t) = bjs(t—x) + w(t), — oo < t < oo : #o, где bj — нормальная величина, //(0,σ7), и w(t) — белый шум со спектральной плотностью Nq/2. Сигнал равен · ί ί-^г) при 0< t < Τ, s(t) = l\T) ' 0 при других t. I. Построить оптимальный приемник, полагая τ известным. 2. Вычислить d2 как функцию τ и σ/# 3. Предположим, что τα = τ(Ι + χ). Найти выражение для а2 номинального приемника в виде функции от х. Обсудить смысл полученных результатов. 4. Теперь необходимо исследовать влияние изменения σ7. Пусть σ?« = σ#(Ί+*). Найти выражение для d2 в функции от у. Линейные каналы Задача 4.3.19. Оптимальные сигналы. Рассмотрим систему, показанную на рис. 4.49, а. Предположим, что канал имеет постоянные во времени параметры и импульсную характеристику /ι(τ) [или передаточную функцию #(/)]. Пусть я П, Ш<г, - 1 0 при других /. Интервал наблюдения выходного напряжения бесконечен. Входной сигнал s(t), 0 < t < Ту нормирован и имеет единичную энергию. Аддитивный белый гауссов шум имеет спектральную плотность NJ2. I. Найти оптимальный приемник. 2. Выбрать s(0, 0 < t < Г, чтобы получить максимальное значение d2. Задача 4.3.20. Повторить задачу 4.3.19 для h(t, τ), заданной ниже ЗГ 4 h(t,%) = 6(t— τ), 0 < τ < — , τ < , — οο < t < oo, Τ_ 4 ' 2 Ι 0 при других τ. Задача 4.3.21. Интересующая нас система показана на рис. 4.6*. Синтезировать оптимальную двоичную систему передачи при следующих ограничениях: τ 1. J s2(t)dt = Eu о 2. s(f) = 0, t < 0, ί < Τ, 3. h(τ) fe-*T, τ>0, Ιθ, τ < 0. Источник Шо1тЬод Передатчик Ри ±s(t) ^ с.4.6*. 434 Канал I 0S.t£7
Задачи к § 4.4. Сигналы с нежелательными параметрами Предварительные математические упражнения Некоторые необходимые формулы. Некоторые из задач данного раздела требуют действий с бесселевыми и Q-функциями Маркума. Ряд удобных формул приведен ниже. Другие соотношения можно найти в [75] и в приложениях к [47 и 92]. 1. Модифицированные функции Бесселя: 2π U (2)Δ— ехр (± /ηθ) exp (z cos θ) <ίθ, (1.1) о In{z) = l_n(z), (1.2) (τ·)' 7»(Ζ)~ νι -L.il ' ν^-1,-2 ζ«1, (1.3) Γ(ν+1) w*mll—*-y г>>и (1.4) 1 dk J ZJ {*~"'*Ю)='~°~к1*+ьЮ' (ί·5) ζ* <£г* 2. Q-функции Маркума [92]: oo Q(V%i, /2ft )=§ exp(—a+x)I0(2V^c)dx9 (2.1) b Q{a, a) = y[l+/0(a2)exp(-a2)], (2.2) ft2_a2 r> ( 2abx \ l+Q(ayb)_Qpta)=—— j ex?{_x)Io^——jdXt b>a>0, (2.3) a2+b2 2 0 Q(a, ft)-erfc*^-я), ft»l, ft » ft — β. (2.5). 435
3. Райсовские величины [76]. Рассмотрим две статистически независимые райсовские величины Х\ и х2 с распределениями Χ/ο xh ι v + V\ О < ak < oo, 0<Xft<oo, k=l, 2. (3.1) Интересующая нас вероятность равна Введем постоянные а2а , * = ■ σι Тогда или σι2 + σ22 ' " σ!2 + σ22 ' σ2 P^-^d-QlA /5)] + —^-Q(/a, /S), 1 + c* 1 + c* Ρ,=γ[ΐ-(2(Κ6. Va) + Q(Ya, Vb)\- (3.2) (3.3) (3.4) Задача 4.4.1. Свойства Q-функций. Q-функции часто встречаются при вычислении вероятности ошибок: 00 Q (α, β) = Г χ ехр Г- ~ (*» + «2)1 Л> (ах) ах. . β Проверить следующие свойства: 1. Q(a, 0) = 1. 2. Q(0, β) = β~^/2. 'r,aW2il(j)"M«?), α<β, Q(a.P) = 1 л=0 l_e-<a. + P.)/2 ν(^η/η(αβ)> β<α. 4. «(a, »)+«», а) = |+(е-<"-+в'''!)/„(с,й. 6' «'«•^-eir(ir<«-<i-''''>)· '>«>' 436
Задача 4.4.2. Пусть.*—нормальная случайная величина, N(тх, ах). 1. Доказать, что ехр[/от«»/(1-2/1«тх«)] МхШ (jv) Δ Ε [ехр (ρ2)] = Указание. ΛΙ,· (/σ) = [Αίχ. (/о) A*,, (jo)]'/2 . где у — независимая нормальная случайная величина с такой же статистикой. 2. Пусть ζ—комплексное число. Модифицируя вывод п. I, показать, что ехр [гтж2/( 1-220^)] 1 Ε [ехр (где2)] = -— , Re (г) < · 3. Пусть 2М </2= Σ МЛ г = 1 где Xi — статистически независимые нормальные величины, N(trii, σ^). Найти (My2)(jv) и £[ехр (zy2)]. Какое условие необходимо наложить на Re(z) для того, чтобы указанное выше математическое ожидание существовало. 4. Рассмотрим частный случай, когда λ$ = 1, а ο2ι = σ2. Убедиться, что плотность вероятности величины у2 равна ( М-\ ! О при других Y, ом где S= 2 mi2 (см* [?5D ί = 1 Задача 4.4.3. Пусть Q(x) —квадратичная форма коррелированных нормальных случайных величин, т. е. Q (χ) Δ χ7 Αχ. 1. Показать, что характеристическая функция Q равна ехр [— — ml Λ-1 [Ι—(Ι—2/ϋΛΑ)-1] mx MQ(jv)AE(e^)= \ 11— 2/ϋΛΑ|Ι/2 2. Рассмотреть частный случай, когда Λ_1=Α и mx = 0. Какова получающаяся при этом плотность вероятности? 3. Распространить результат п. I для отыскания E(ez®), где ζ — комплексное число. Какие ограничения необходимо наложить на Re*2)? Задача АЛЛ. [76]. Пусть хъ х2, хд, х4 — статистически независимые нормальные случайные величины с одинаковыми дисперсиями. Доказать, что Ρ (*ι2 + *22 > *з2 + *42) = у [1—Q (β, a)+Q(a, β)] , где ,= i *ι2 + *; a = ·-·-*-· )"\ Uji+*A1'2 2σ2 437
Каналы со случайной фазой Задача 4.4.5. Амплитудная телеграфия, канал с неполностью известной фазой. Рассмотрим задачу испытания гипотез (357) и (358), когда плотность вероятности задана формулой (364). Из (371) следует, что статистика эквивалентного критерия есть tf + IcP + V^T. #0 1. Выразить ΡF через Q-функцию. 2. Выразить Ρ D в виде интеграла от Q-функции. Задача 4.4.6. Μ ортогональных сигналов, канал с неполностью известной фазой. Допустим, что все Μ гипотез равновероятны. Принимаемые сигналы на выходе канала со случайной фазой имеют вид: Γ(0==|/2ζ/ί(0οο8[ωβί + Φ|(0 + θ] + ω(0, 0<t<T:Hr ί=1, 2 Λί, где ρρ(θ) дается формулой (364), a w(i) — белый шум со спектральной плотностью N0/2. Записать критерий отношения правдоподобия и построить блок-схему приемника, осуществляющего прием с минимальной вероятностью ошибки. Задача 4.4.7 (продолжение). Вероятность ошибки, случай равномерно распределенной фазы [18]. Рассмотрим частный случай приведенной выше модели, когда сигналы ортогональны, а фаза θ имеет равномерное распределение. 1. Показать, что P(«,e,„-E{[,-eSp(-^±ii)f-' где χ и у — статистически независимые нормальные случайные величины с еди~ ничной дисперсией, Ε [χ | θ] = V2Er/N0 cos θ, Ε [у | θ] = V2Er/N0 sin θ. Математические ожидания берутся по χ и у при фиксированном Θ. 2. Показать, что М~1 '"' " 'e*Pl-(Er/No)k/(k+l)] k= 1 ч ' ч k+l Задача 4.4.8. В задаче, посвященной системе связи (стр.389—391), предполагалось, что сигналы по обеим гипотезам не являются модулированными по фазе. Общую бинарную задачу в присутствии белого шума можно записать в виде г {t) = VWrf1(t) cos [«Μ+Φ^Ο + ΘΙ + α^*), 0<t<T:Hlt r(t) = VWrf0 (t) cos [сосг + Ф0 (*)+θ]+α> (0, 0<t<T:H0f где Er — энергия принятой компоненты сигнала. Помеха — белый шум со спектральной плотностью N0/2, а распределение /?θ(θ) —описывается формулой (364). Убедиться, что структура оптимального приемника совпадает с блок-схемой
"(t) "*? Щ^)СОБ (Wrt*Pj(t)) **Z: Щ№"(Ч**Ъ<*)) κέ-устройство . 603ведения θ кВадрссгп Рис. 4.7*. изображенной на рис. 4.7* при i = 0, 1, и что критерий минимальной вероятности ошибки имеет вид Я0 211 ^ ^О2· Задача 4.4.9 (продолжение) [44]. Допустим, что компоненты сигнала по двум гипотезам ортогональны. 1. Полагая истинной гипотезу #0, проверить, что E(x'o) = Am + d2cosQ, E(y0)==d2sinQ, Е(х1') = Ат, Е(У!) = 0, где ά*Δ2ΕΓ/Ν0 и σ2 (Хо') = Ь* (Уо) = ^ (Χχ) = ο* (i/i) = d2. 2. Доказать, что V + Лт2 -f с*4 + 2Лт d2 cos θ (, / [(Лт2 + d* + 2Лт d2 cos θ)1/2 ZQ] Μ р,,я,,.№|я.«^«р(-^)/.(^4 3. Показать, что Р(8) = Р(е|Я0) = Р(г0<г1|Я0) = π <х> <χ> = J Ре W ^ 5 Р2о, я§§ θ (Ζο I Я0, θ) <*Ζ0 ξ ρΖι, Я1§ θ (Ζι I Яь θ) dZle — π ο ^ο 4. Доказать, что два внутренних интеграла можно записать в виде X ρ(8|θ) = ρ(α, *)_±βχρ(·^-^)/β(α*), 1 / a2 + &2 \ _ехр/ \ 439
где К2Л„ а = . Ь = d [2(Am2 + rf* + 2Amd2cos6)]1/2 5. Проверить результат для двух частных случаев, когда Лт -> 0 и Лт-*оо. Сравнить получающиеся в этих двух случаях вероятности ошибок в области больших d. Задача 4.4.10. (продолжение). Вероятность ошибки в случае бинарных неортогональных сигналов [77]. Когда полосные сигналы не ортогональны, их корреляцию удобно определить следующим образом: 7Ό(0Δ/ο(0β/φ·(/), pb\T*(t)7i*(t)dt, где ρ — комплексное число. 1. Выразить действительные сигналы через f έ(ί), 2. Выразить действительный коэффициент корреляции двух сигналов через р>. 3. Положим Ат = 0 (это соответствует равномерной плотности) и введем величину λ=(ι-|ρ|»)'/2. Показать, что P(8) = q({/T=X, |уТ+х)-|ехр(—γ)ΐο(^-\ΐ\). Задача 4.4.11 (продолжение). Когда распределение ρθ(θ) неравномерно и сигналы неортогональны, вычисления оказываются гораздо более трудоемкими. Сформулировать задачу. Подробные выкладки можно найти в [44]. Задача 4.4.12. Многопозиционная система ФТ. Рассмотрим М-позиционную систему связи с фазовой манипуляцией, указанную в задаче 4.2.21. Пусть ехр (Лт cos θ) Ρ»(θ)= 2ЯЫЛ.) ' -»<«<«· 1. Найти оптимальный приемник. 2. Записать выражение для Р(г). Задача 4.4.13. Система AT, некогерентный канал [72]. В системе AT передаются равновероятные сообщения s.(/) = -j/r2F./(/)coscuc/, ί=1, 2, ..., Μ, 0 < t < Τ, где • _ τ /£* = (* —1) Δ, $f2(t)dt=l и (Μ—1)ΔΔΕ. ο 440
Принятый сигнал'по /-й гипотезе равен г (0 = \fWi f (t) cos (coc t + Θ) + w (0, 0<t <T: Hit i=l, 2, ...,M, где ш(0 — белый шум со спектральной плотностью W0/2. Фаза θ — случайная величина с равномерным распределением на интервале (0,2π). 1. Найти приемник, работающий по критерию минимальной вероятности ошибки Р(г). 2. Начертить пространство решений и вычислить вероятность ошибки Р(г). Задача 4.4.14. Асимптотика некогерентных многопозиционных систем [78]. В основном тексте было показано, что вероятность ошибки в системе связи, использующей Μ ортогональных сигналов, стремится к нулю при Μ -+ оо, если скорость передачи информации в символах/сек не превышает Ρ/Ν0\η 2— пропускной способности канала (см. стр. 308—310). Используем точно такую же модель, как в примере 4 на стр. 308—310. Предположим, однако, что канал вносит случайный фазовый угол. Доказать, что в этом случае получаются точно такие же результаты. (Примечание. Вывод оказывается несколько более сложным. Результат был впервые получен Турином [78]. Подробный вывод приведен в [69], § 8.10) Задача 4.4.15 [79]. Вычислить производящую функцию моментов, среднее значение и дисперсию статистики критерия G = L2C + L2$ для задачи со случайной фазой § 4.4.1 по гипотезе Нх. Задача 4.4.16 (продолжение) [79]. Можно показать, что при d > 3 (гати- стика эквивалентного критерия является приближенно гауссовой (см. рис. 4.73, а). Считая, что это так, найти среднее значение и дисперсию R. Задача 4.4.17 (продолжение) [79]. Используем результат задачи 4.4.16 для вывода приближенного выражения для вероятности обнаружения. Выразить этот результат через d и PF и показать, что график зависимости ΡD от d есть примерно прямая линия. Сравнить несколько точек с рис. 4.59. Вычислить увеличение d по сравнению со случаем известного сигнала, которое необходимо для достижения такой же помехоустойчивости. Задача 4.4.18. Оценка амплитуды. Рассмотрим простую задачу оценки при наличии нежелательного параметра. Принимаемый сигнал имеет вид r(t) = AVls(t, θ) + α>(0, где А — детерминированный параметр, который необходимо оценит (предполагается, что он неотрицателен): s(t, Q) = f(t)cos[(uct + Q>(t) + e]. Здесь /(/) и Φ(ί) — медленно изменяющиеся известные функции времени, θ — случайная величина с плотностью вероятности Г 1/?я, -π <θ<π, Ρθ () { 0 при других θ и w(t) — белый гауссов шум со спектральной плотностью N0/2. Найти трансцендентное уравнение, которому удовлетворяет оценка величины А по максимуму правдоподобия. Задача 4.4.19. Оценка частоты в канале со случайной фазой. Принимаемый сигнал имеет вид г (t) = V2Ef (t) cos (coc t + Φ (0 + ωί+ θ) + α> (f), 0 < t < Г, 441
τ где \p(f)dt = 1, a /(/), Φ(ί) и £—известны. Помеха w(t) является выборочной о функцией процесса типа белого гауссова шума со спектральной плотностью Nq/2. Частотный сдвиг ω есть неизвестная детерминированная величина. 1. Найти Л[г(0|со]. 2. Найти выражение функции правдоподобия. 3. Построить приемник, выход которого является хорошим приближением KCDmZ. Задача 4.4.20 (продолжение). Ошибки оценки. 1. Вычислить границу дисперсии любой несмещенной оценки величины о*. 2. Сравнить дисперсию comz в предположении малой ошибки. Сравнить результат с границей, полученной в п. 1. 3. Сравнить результат этой задачи с примером 2, стр. 321. Случайные амплитуда и фаза Задача 4.4.21. Рассмотрим задачу обнаружения, когда 1м SaiMO + MO, 0<t<T:Hlt л(0, 0<t<T:Ho. Коэффициенты a% — совместно-нормальные случайные величины, которые обозначим вектором а. Сигналы обозначим вектором s(/). £W4, £[(а-та)(аг-т£)]АЛа, и p = \s(t)sT(t)dt, E[n(t)n(u)] = ^6(t-u). о z 1. Найти структуру оптимального приемника. Начертить различные интерпретации, аналогичные рис. 4.66 и 4.67. Указание. Найти систему достаточных статистик и использовать выражение (2.326). 2. Найти μφ для данной системы (см. § 2.7 гл. 2). Задача 4.4.22 (продолжение). Распространить предыдущую задачу на случай, когда E[n(t)n(u)] = ^b(t-u) + Kc(t, и). Задача 4.4.23. Рассмотрим упомянутую в задаче 4.4.13 систему AT, работающую по релеевскому каналу. Принимаемый сигнал по fc-й гипотезе равен r(t) = V2E~kv f(t) cos {(*ct+Q) + w(t), 0<t<T:Hk, /e=l, 2,..., Af. Все относящиеся к данной задаче величины, за исключением ν, описаны в задаче 4.4.13. Величина ν имеет распределение: мю=(Уехр(-Т>- ν>°· [ 0 при других V и не зависит от #&. Все гипотезы равновероятны/ 1. Построить приемник, работающий по минимуму Ρ (ε). 2. Найти Ρ (ε). 442
Задача 4.4.24. Μ ортогональных сигналов, релеевский канал [80]. Один из Μ ортогональных сигналов используется для передачи равновероятных гипотез ло релеевскому каналу. Принятый сигнал по i-й гипотезе равен г (t)=y2vf (t) cos (<oit + Q)^w (t)t 0<t<T:Hi, ί=1,2,..., Μ, где ό—имеет релеевское распределение с дисперсией Ег, фаза θ распределена равномерно, w (t)—белый шум со спектральной плотностью N0/2 и /(^—нормированная функция. 1. Начертить блок-схему приемника, осуществляющего прием с минимальной вероятностью ошибки. 2. Показать, что где Задача 4.4.25 [90]. Исследуем выигрыш, получаемый за счет использования Μ ортогональных сигналов вместо двух ортогональных сигналов для передачи информации по релеевскому каналу. 1. Показать, что Р(г)=г_ш»±})±шт W Γ[1/(β4·1) + Μ] Указание. Использовать известное выражение Γ(ζ)Γ(α+1) _Пу1(_1Г aifi-\)...(a-n) 2. Рассмотрим случай, когда β > 1. Использовать разложение в ряд Тей- Г' (х) лора и свойства функции Ψ (*)Д. для получения приближенного выра- жения Ρω~±(ΐηΜ-±+ο.6π). Напомним, что ^(1) = 0,577, lty(z) = \nz— — φθ(ζ). ΔΖ 3. Теперь допустим, что Μ гипотез имеют место в простой системе кодирования, изображенной на рис. 4.24. Убедиться, что вероятность ошибки по элементам равна 4. Найти выражение для отношения вероятности ошибки в бинарной системе к вероятности ошибки Рв(в) в М-позиционной системе. 5. Показать, что при М-»оо выигрыш по мощности благодаря использованию Μ ортогональных сигналов стремится к 2/1п 2 = 4,6 дБ. 443
Задача 4.4.26. Μ ортогональных сигналов, райсовский канал. Рассмотрим такую же систему, как и в задаче 4.4.24, но будем считать величину υ распределенной по закону Раиса. 1. Начертить блок-схему приемника, имеющего минимальную вероятность ошибки Ρ (ε). 2. Найти вероятность ошибки Ρ(ε). Задача 4.4.27. Бинарные ортогональные сигналы, квадратичный приемник [18]. Рассмотрим задачу передачи двух равновероятных полосных ортогональных сигналов с энергией Et по райсовскому каналу, определенному в (416). Вместо оптимального приемника, показанного на рис. 4 74, будем использовать приемник, предназначенный для релеевского канала (т. е. положим на рис. 4.74 α = 0). Показать, что Задача 4.4.28. Повторить задачу 4.4.27 для случая Μ ортогональных сигналов. Испытание сложных гипотез Задача 4.4.29. Обнаружение одного из Μ ортогональных сигналов. Рассмотрим следующую бинарную задачу на испытание гипотез. По гипотезе Ηχ сигнал является одним из Μ ортогональных сигналов VE1s1(i)t У Е2 s2 (t),..., τ VEmsM{t)\ $si(t)sj(t)dt = biJ, ι, /=1, 2,..., Μ. о Μ При гипотезе Нх /-й сигнал появляется с вероятностью ρг· (2pi = 1). При ги- ί=1 потезе Н0 компонента сигнала отсутствует. По обеим гипотезам имеется аддитивный белый гауссов шум со спектральной плотностью Ν0/2: r(t\=\Vfysi(t) + w(t)* 0<t<T с вероятностью Ρ/:#ι, U \w(t), 0<t<T:H0. 1. Найти критерий отношения правдоподобия. 2. Начертить блок-схему оптимального приемника. 1 Задача 4.4.30 (продолжение). Предположим теперь g что рг- = —— , ί=1, 2,.., Μ и Ei=E. Один из приближенных методов вычисления помехоустойчивости приемника был развит в задаче 2.2.14. Напомним, что для этого надо вычислить дисперсию Л(а не In Л) по гипотезе Н0 и использовать соотношение d* = ln(l+o*[A\H0]). (1*) Затем необходимо использовать это значение d на рабочей характеристике приемника в задаче с известным сигналом для отыскания ΡF и ΡD. 1. Найти дисперсию σ2[Λ|#0]. 2. Используя (I*), убедиться, что — = 1п(1-М + ^е^2). (2*) 3. Для 2E/N0 > 3 доказать, что (2)* можно аппроксимировать выражением of — «lnM + ln(erf*-l). (3*) N0 444
Смысл (3*) заключается в том, что если мы имеем некоторый уровень помехоустойчивости (PF, PD) для одного известного сигнала, то для обеспечения уровня помехоустойчивости, при котором сигнал с равной вероятностью может быть любым из Μ ортогональных сигналов, требуется увеличить отношение сигнал/шум в In M раз. Это можно рассматривать как плату за неопределенность сигнала. 4. Снимем теперь условие равновероятности. Показать, что в этом случае (3*) принимает вид м |U-ln(JipfiVln(e<·-!). При каком распределении вероятностей первый член будет максимальным? Является ли полученный результат интуитивно логичным? Задача 4.4.31 (другой вариант продолжения). Рассмотрим частный случай задачи 4.4.29, когда Μ = 2, Ελ = Е2 = Ε и рх = р2 = V2. Введем hlr (t)\ = \%^- \ dr(t) st(t)- ^- /=1,2. (4*) 1. Начертить границу области оптимального решения на плоскости lltl2 для различных значений η. 2. Проверить, что граница области решения асимптотически приближается к 1Х = 2η и /2 = 2η. 3. При каких условиях указанный ниже критерий будет близким к оптимальному. Критерий. Если 1г или /2 больше или равно 2η, то говорят, что верна гипотеза #!*, в противном случае справедлива гипотеза Н0. 4. Найти PD и Рр-яля субоптимального критерия в п. 3. Задача 4.4.32 (продолжение). Рассмотрим частный случай задачи 4.4.29, когда Et = Ε, i = 1, 2, ..., Μ и ρ·τ = 1/Μ, / = 1,2, ...., Μ. Распространив определение li\r(t)] в (4*) на/ =1, 2, ...., Μ, рассмотрим субоптимальный критерий. Критерий. Если одна или более /ζ·> ΙπΜη, то говорят, что истинная гипотеза Нг. В противном случае справедлива гипотеза Н0. 1. Введем a = P[l1 > In Μη [ sx (t) отсутствует], β = Ρ [lx < In Μύ\ [ si if) присутствует]. Показать, что PF=\-(l-a)M н Р0 = 1-Э(1-а)м-Ё>. 2. Проверить, что ΡF < Μα и Когда эти границы являются наиболее точными? 3. Найти α и β. 4. Допустим, что при Μ = 1 и при заданном Ε/Ν0 получаются некоторые значения PF и PD. Насколько необходимо увеличить E/N0, чтобы обеспечить такую же помехоустойчивость при увеличении М?. (Считаем, что соотношения в п. 2 являются точными.) Сравнить эти результаты с результатами задачи 4.4.30. Задача 4.4.33. Аналогичная задача возникает, когда каждый из ортогональных сигналов имеет случайную фазу. 445
По гипотезе Η χ. r(t) = V2Efi(t)cos[(i>ct + Q>i(t) + ei]+w(t)t 0<t<T (с вероятностью pt). По гипотезе Н0 r(t) = w(t), 0<t<T. Компоненты сигнала ортогональны. Белый шум имеет спектральную плотность Nq/2. Вероятности pi равны 1/М, i— 1,2, 3,..., Μ. Фазовый угол Θ/ в каждом сигнале является независимой случайной величиной, равномерно распределенной на интервале (0, 2π). 1. Найти отношение правдоподобия и построить блоку-схему оптимального приемника. 2. Найти дисперсию σ2(Λ|#0). 3. Используя такой же метод аппроксимации, как и в задаче 4.4.30, показать, что точное значение d для использования на рабочей характеристике приемника в задаче с известным сигналом равно d-lnIl+a.(A|^]-In[l-^+^/.(^)]. Задача 4.4.34 (продолжение). Использовать те же соображения, что и в задаче 4.4.31 для вывода субоптимального критерия и отыскания выражения для его качества. Задача 4.4.35. Повторить задачи 4.4.33 (1) и 4.4.34 для случая, когда каждый из Μ ортогональных сигналов принимается в релеевском канале. Задача 4.4.36. В задаче 4.4.30 при рассмотрении случая «одного из Μ ортогональных сигналов» мы видели, что для получения той же помехоустойчивости необходимо увеличивать 2Ε/Ν0 в 1пМ раз. Предположим теперь, что по гипотезе Нг один из Ν(Ν > Μ) сигналов, имеющих одинаковую энергию, появляется с равной вероятностью, однако эти N сигналов лежат в Λί-мерном пространстве. Таким образом, если считать Фу(0» / = 1, 2, ..., М, системой ортонор- мированных функций на интервале (0, 71), то Μ Μ где 2 4=1' i=l> 2····· ^· Остальные допущения, сделанные в задаче 4.4.29, сохраняют силу. 1. Найти отношение правдоподобия. 2. Рассмотреть качественно (или, если угодно, количественно) цену неопределенности в условиях данной задачи. Приемники для измерения параметров канала Задача 4.4.37. Измерение параметров канала [18]. Рассмотрим следующий метод использования стабильности фазы в канале. Будем использовать первую половину временного интервала для передачи сигнала у2sm(0cos(0c t с энергией Emt предназначенного для измерения параметров канала. Другую половину будем использовать для передачи одного из двух равновероятных сигналов ±Y2 Sd (0cos(Dc t с энергией Еф Таким образом, /Λ ί l*m (t)+sd (t)] /Tcos (<DC t+Q)+w (t):Hlt 0<t<T9 I [sm (0 —sd (t)] V 2 cos (<dc t+B)+w (t) : #0, 0 < t < Τ и ρθ(θ) = 1/2π, 0<θ<2π. 446
1. Начертить блок-схему оптимального приемника и написать правила решения для случая, когда Ет = Ed- 2. Найти-оптимальный приемник и правило решения для случая п. 1. 3. Доказать, что оптимальный приемник может быть реализован и так, как показано на рис. 4.8*. 4. Какова вероятность ошибки Р(г) оптимального приемника? r(t) Vr> ЛолосоЗые согласованные фильтры Ь2(Г) Фа зобыИ детектор Если\Ф\<90,тоН1 ф(Т)\£сли\ф\?90°тоН0 \ h2(r) « yTsd (Τ-τ) cos ω0τ Рис.4.8*. Задача 4.4.38 (продолжение). Система «Кинеплекс» [81]. Рациональный способ использования преимущества, даваемого измерением параметров канала (см. задачу 4.4.437), реализован в системе «Кинеплекс». Информация в ней передается фазовым соотношением между соседними телеграфными посылками. Если на одном из интервалов передается сигнал +Sd{t), то для передачи информации на следующем интервале используется либо сигнал -j-Sd(t} (передача «1», что соответствует гипотезе Ях), либо сигнал—Sd(t) (передача «О», что соответствует гипотезе Н0). Типичная последовательность представлена на рис. 4.9*. На выходе источника Передаваемая последовательность ArSm (t) (исходный опорный сигнал) 1 ■fysm (t) 1 + 0 — 0 * 0 — 1 — 1 ! — Рис. 4.9*. 1. Полагая, что не происходит изменения фазы от посылки к посылке, приспособить приемник рис. 4.8* к условиям данной задачи. Показать, что получающаяся при этом ошибка равна ρ(ε) = "ΊΓ6ΧΡ К) (где Ε = Ed= Em — энергия элементарной посылки). 2. Сравнить помехоустойчивость этой системы с помехоустойчивостью оптимальной когерентной системы, описанной в основном тексте, при больших E/N0. Зависит ли ошибка решения в системе «Кинеплекс» при приеме данной элементарной посылки от решения по предыдущей посылке? 3. Сравнить помехоустойчивость системы «Кинеплекс» с помехоустойчивостью неполностью когерентной системы, показанной на рис. 4.62 и 4.63. 447
Задача 4.4.39 (продолжение). Рассмотрим систему сигналов, приведенную в задаче 4.4.37, и допустим, что Ет Φ Еа- I.Является ли оптимальным приемник рис. 4.8*, основанный на сравнении фаз? 2. Вычислить вероятность ошибки Р(г) оптимального приемника. Примечание. Очевидно, метод сравнения фаз можно распространить на многопозиционные системы. Системы этого типа рассмотрены в [72, 82, 83]. Задачисмешанноготипа Задача 4.4.40. Рассмотрим систему связи, описанную ниже. Передается известный сигнал s(t). Он поступает на приемник по одному из двух возможных каналов. Выходной сигнал искажается аддитивным белым гауссовым шумом w(t). Если сигнал проходит через канал 1, то на входе приемника действует колебание r(t) = as(t) + w(t), 0<t<T> где а — на рассматриваемом интервале величина постоянная. Она является значением нормальной случайной величины N(0, σα). Если сигнал проходит по второму каналу, то на входе приемника присутствует колебание r(t) = s(t) + w(t), 0<t < Т. Известно, что τ §s2(t)dt = E. о Вероятность прохождения сигнала по первому каналу равна вероятности его прохождения по второму каналу (т. е. Ρλ = Р2 = V2)· 1. Синтезировать приемник, который решает, по какому каналу сигнал проходит с минимальной вероятностью ошибки. 2. Вычислить вероятность ошибки Р(е). Задача 4.4.41. Дипломнику задано спроектировать оптимальную систему обнаружения для следующей задачи #i : r (*) = s (*) + «> (0. Tt<t< Tft H0:r(t) = n(t), Ti<t<Tf. Сигнал s(t) известен. Чтобы найти подходящую ковариационную функцию Kn{U и) для помехи, он посоветовался с несколькими инженерами. Инженер Л сказал, что Kn{tt u) = -^b(t-u). Инженер Б сказал, что где Kc(t, и) — известная интегрируемая в квадрате положительно-определенная функция. Дипломнику необходимо теперь скомбинировать эти различные мнения с тем, чтобы спроектировать систему обнаружения сигналов. I. Он решает скомбинировать эти мнения вероятностным образом, а именно, Ρ (прав инженер A) = PAf Ρ (прав инженер Б) = РБу где РА + РБ = \. 448
а) Построить оптимальный байесовский критерий (порог равен η) для решения о том, какая из гипотез — Нх или Е0 — является истинной. б) Начертить блок-схему приемника. в) Проверить полученное решение для РА = 0 и РБ = 0. 2. Рассмотреть некоторые другие возможные способы учета этих различных точек зрения. Задача 4.4.42. Разрешающая способность. Данная задача обнаружения является грубой моделью простой радиолокационной задачи разрешения целей? #ι: г (t) = bdsd (t) + bl sj (t)+w (t), Tt < t < Tf9 H0 : r (0 = bj sj (t) + w (t), Ti < t < Tf. 1. J sd(t)Sl(t)dt = 9. Ti 2. Sd(t) и Sjit) — нормированы к единичной энергии. 3. Коэффициенты b^ и bl — независимые нормальные величины с нулевыми средними и дисперсиями σ2^ и σ27 соответственно. 4. Помеха w(t) — белый гауссов шум со спектральной плотностью NJ2, не зависящий от коэффициентов Ь^ и br Найти точное решение для оптимального приемника, работающего по кри терию отношения правдоподобия. Здесь нет необходимости определять порог. Задачи к § 4.5. Многоканальные системы Некоторые математические выводы Задача 4.5.1. Определение (4.434) обратного ядра матрицы имеет вид f KnC> и)<Ми· z)du = \b{t-z). Ti 1. Допустим, что к„е. ")=^i6('-")+Kc(*. ")· Показать, что можно записать QnC> «> = -|-[Ιδ('-«)-Μ*, ")Ь где h0(t, и) — интегрируемая в квадрате функция. Найти матричное интеграль ное уравнение, которому должна удовлетворять функция h0(t, и). 2. Рассмотрим задачу на матричный линейный фильтр, обрабатывающий шум п(0 d(0 = [ h(/, u)n\u)du, где n (t) = nc (t) + w (t) имеет ковариационную функцию, данную в п. 1. Мы хотим выбрать h(t, и) так, чтобы Tf %,LE\ [nc (t) -d (t)f [nc (0 -d (<)] dt Ti была минимальной. Показать, что линейный матричный фильтр, осуществляющий эту операцию, соответствует характеристике h0(t, «), найденной в п. 1. 15 зак. 69 3 449
Задача 4.5.2 (продолжение.) Рассмотрим вывод, сделанный в § 4.5, с учетом случая, когда Kn(f, u) = Nb(t-u) + Kc(t, и), Ti<t, u<Tf, где Ν — положительно определенная матрица чисел. Обозначим собственные значения матрицы N через λχ, λ^, ..., λ^ и введем диагональную матрицу 1*- "Ч ч _ 0 о 1 λΛί_| Для отыскания критерия отношения правдопобия выполним сначала два предварительных преобразования вектора г, как показано на рис. 4.10*. Матри- r(t) W T'(t) . V"(t) Рис.4.10*. ца W — ортогональная матрица, определяемая уравнением (2.369) и обладающая следующими свойствами W7 = W —ι N = W~4 W. 1. Убедиться, что r"(t) имеет матрицу ковариационных функций, которая удовлетворяет соотношению (428). 2. Выразить / через r"(0> Qn" (*» ") и s" (0· 3. Доказать, что ь / = f rT(t)Qn(t, u)s(u)dtdu, где Q„(*. u)&_N-l[6(t-u)-h0(t, и)], a h0(t, и) удовлетворяет уравнению Кс(*. u) = h0(t, w)N + + j h0(t, z)Kc(z, u)dz, Ti<t, u<Tf. Ti 4. Повторить п. 2 задачи 4.5.1. Задача 4.5.3. Рассмотрим задачу обнаружения векторной величины, сформулированную соотношениями (4.423). Предположим, что Кс(*. и) = 0, а N не является положительно определенной матрицей. Найти сигнальный вектор (t) с полной энергией Ε и приемник, обеспечивающие идеальное обнаружение. Задача 4.5.4. Пусть r(*) = s(*, A) + n(t), Ti<t<Tft где ковариационная функция шума n(t) задана выражениями (425)—(428), а Л — неслучайный параметр. 450
1. Найти уравнение, которому должна удовлетворять оценка параметра Л по максимуму правдоподобия. 2. Найти неравенство Крамера — Рао для несмещенной оценки а. 3. Теперь допустим, что а — нормальная величина, N(0, σα). Найти выражение для оценки по максимуму апостериорной вероятности и нижнюю границу среднеквадратической ошибки. Задача 4.5.5 (продолжение). Пусть L — несингулярное линейное преобразование гауссовой случайной величины а, имеющей нулевое среднее значение. 1. Показать, что эффективная оценка параметра Л существует, если s(t,A) = Li4s(0- 2. Найти явное решение для атар и выражение для получающегося среднего квадрата ошибки. Задача 4.5.6. Пусть k n(t) = 2 atjStjW + wtit), £ = 1, 2,..., M:Hl9 wi(f), i = l, 2,,.., Μ :Η0. Помеха в каждом канале является выборочной функцией белого гауссова случайного процесса, имеющего нулевое среднее значение E[w{t)wT<(u)] = ^-lb(t-u). Величины dij — совместно-нормальные случайные величины с нулевыми средними. Сигналы Sij(t) ортогональны. Найти выражение для оптимального байесовского приемника. Задача 4.5.7. Рассмотрим бинарную задачу обнаружения, когда принимаемый сигнал является М-мерным вектором: (ft feW + nc(0 + w(0. —оо <*<оо:Я1> \nc(*) + w(0, — оо <ϊ <οο:Η0. Полная энергия сигнала равна τ §sT{t)s(t)dt = ME. о Вне интервала (О, Т) сигналы равны нулю. 1. Начертить блок-схему оптимального приемника. 2. Убедиться, что d*= Js^s-'hso-co)^. Задача 4.5.8. Системы комбинирования по максимальному отношению сигнал/шум. Пусть r(0 = s(f) + w(0, 0< t<T. Принимаемый сигнал r(t) вводится в матричный фильтр с постоянными во времени параметрами, имеющий Μ входов и один выход y(t): τ y(t)=\h(t — T)r(T)dT. Ό Подстрочный индекс s означает, что выходное напряжение обусловлено сигналом. Индекс η означает выходное напряжение, вызванное помехой. Определим выход* ное отношение сигнал/шум как s \ . у$2 (Т) ' S \ Е [Уп2 (Т)} 451
1. Полагая, что ковариационная матрица помехи w(t) удовлетворяет (439), найти импульсную характеристику h(x) матричного фильтра, при которой выходное отношение сигнал/шум максимально. Сравнить результат с (440). 2. Повторить п. 1 для вектора шума с произвольной ковариационной матрицей Кс (t, и). Каналы со случайной фазой Задача 4;5.9 [14]. Пусть Μ /=ι где а-г—независимые случайные величины с плотностью вероятности А ( A2 + ai2\ r ( щА\ \ (ηιΑ\ при других А. Х±Р\ /УРХ\ -£γ)!μ-ι\—γ)- о<х<оо, при других X, /=1 Задача 4.5.10. Обобщенная Q-функция. Обобщенная Q-функция для Μ каналов имеет вид У ί χ \Μ~ι ( #24-α2 \ Qin(«. Ρ)-ί*( —) expj^-—— jlM_l(ax)dx. 1. Убедиться, что M—\ QAf(«. β) = <?(«· P) + exp(—^-^) 2 ("f)"/fe(ap)· 2. Найти QM(a, 0). 3. Найти QM(0, β). Задача 4.5.11. Амплитудное телеграфирование по некогерентным каналам. Рассмотрим систему связи с Л Г, в которой осуществляется передача сигналов с фиксированной амплитудой по N каналам со случайной фазой. Когда истинна гипотеза Ηλ — полосный сигнал передается по всем N каналам. При справедливости гипотезы Я0 сигнал не передается. Принимаемые колебания имеют вид П/Щ ft (0 cos (ω* t + Q>i (t) + Qi) + W{t), 0<t<T:Hlt ri(t)=\ 0 < t < Τ : #0, [w(t)t i = l, 2, ...,#. Несущие частоты колебаний достаточно разнесены, так что сигналы передаются в неперекрывающихся полосах частот, ft(t) и Φί(ί) — известные медленно изменяющиеся функции. Амплитуды ΥЕ% известны. Of — статистически независимые фазовые углы, имеющие равномерное распределение. Аддитивная помеха w(t) является выборочной функцией независимого от θζ· белого гауссова случайного процесса, имеющего спектральную плотность N0/2. 452
1. Показать, что критерий отношения правдоподобия имеет виД 2Е!" а-гы-*-)'-Ьгк+ч> 1/2 г = 1 Н% Но где Lc. и Ls. определены выражениями (361) и (362) соответственно. 2. Начертить блок-схему оптимального приемника, реализирующего критерий In Λ. 3. Используя (371), найти'достаточно хорошее приближение к оптимальному приемнику для случая, когда аргумент функции /0(.) мал. 4. Повторить для случая, когда этот аргумент велик. 5. Если Ei неизвестные, неслучайные величины, то существует ли равномерно наиболее мощный критерий? Задача 4.5.12 (продолжение). Проанализируем помехоустойчивость субоптимального приемника, разработанного в п. 3 предыдущей задачи. Статистика критерия имеет вид N Нх ,· ι * * и г=1 Но 1. Найти E[Lct\H0]9 E[Lst\H0]9 а2[Ч'|Я°Ь °*[L*i\H*\> Е1Щнь*\> Ε [Ls. I Hlf θ], σ2 [Lc. \ Hlt θ], σ* [Ls. \ Hlt θ]. 2. Используя результат задачи 2.6.4, показать, что Μ /|H1(W = (1- lvNo) exp Μ /|//0(^)=(1-Мо) — Ν 3. Что такое р„я (Х|#0)? Написать выражение для ΡF. Плотность ве- fюяτнocτи при гипотезе Нг можно получить из таблиц преобразования Фурье 75]. Она равна /W*l*i> = 1 / X \ 2 / Х + Ет\ 2γΧΕ7 X >0, при других Xt где 4±Σ 4. Выразить ΡD через обобщенную Q-функцию. Примечание. Эта задача была впервые рассмотрена Маркумом [46]. Задача 4.5.13 (продолжение). Использовать метод границ и аппроксимации, изложенный в § 2.7, для оценки помехоустойчивости квадратичного приемника в задаче 4.5.11. Отметим, что статистика критерия не равна In Λ, так что результаты § 2. 7 необходимо модифицировать. Задача 4.5.14. Импульсный радиолокатор, нефлуктуирующая цель. В обычной импульсной РЛС цель облучается последовательностью импульсов, как по- 453
казано на рис. 4.5. Если эффективное сечение цели в течение периода оалучения остается постоянным, то отраженный сигнал будет иметь вид Μ 4 r{t)=>V2E 2 /(*—τ— kTp) cos (<uct + Qi)+w(t), —oo<t<oD: Нъ где τ — время распространения сигнала до цели и обратно, которое предполагается известным, а Тр — интервал между импульсами, многр больший, чем длительность Τ импульса \f(t) = 0 : t < О, t > Τ]. Фазовые углы принимаемых импульсов являются статистически независимыми сл-учайными величинами 'с равномерным распределением. Помеха w(t) является выборочной функцией белого гауссова процесса, имеющего нулевое среднее и спектральную плотность NJ2. По гипотезе Я0 цель отсутствует и r(t) = w(t), —oo<t«x>: H0. 1. Показать, что критерий отношения правдоподобия для данной задачи идентичен критерию, рассмотренному в задаче 4.5. II (за исключением формы записи). Из этого следует, что результаты задач 4.5.II—4.5.13 также применимы к этой модели. 2. Начертить блок-схему оптимального приемника. Использовать не более одного полосового фильтра. Задача 4.5.15. Ортогональные сигналы, случай N некогерентных каналов. В системе связи, являющейся альтернативной по отношению к описанной в задаче 4.5.11, сигнал должен передаваться по обеим гипотезам, а именно: IVWifli (О COS [Of t + Фи (t) + Bi]+W (О, 0<t<T:Hlt * = 1, 2 N9 Ti (t) = { , V2Ee,/ei(Ocos[0ti + Ooi(O + ei] + w(O. I 0<t<T:H0, ί=1, 2 Ν. Все сделанные в задаче 4. 5. II допущения остаются в силе. Кроме этого, сигналы, передаваемые по двум гипотезам, ортогональны. 1. Найти критерий отношения правдоподобия в предположении равновероятности гипотез и критерия минимальной вероятности ошибки Ρ(ε). 2. Построить блок-схему субоптимального квадратичного приемника. 3. Допустим, что Ei = Ε. Найти выражение для вероятности ошибки квадратичного приемника. 4. Использовать метод, описанный в § 2.7, для отыскания границы вероятности ошибки и приближенного выражения для Ρ(ε). Задача 4.5.16 (продолжение). N неполностью когерентных каналов. 1. Рассмотрим модель, описанную в задаче 4.5.11. Предположим теперь, что фазовые углы являются независимыми случайными величинами, распределенными по закону exp(Amcos9) Λ . « Λ »«(9>- 2n/0(Am) ' -»<*<». <=1. 2. ···."· Выполнить пп. 1, 2 и 3 задачи 4.5.11, используя это предположение. 2. Повторить п. 1 для модели, описанной в задаче 4.5.15. Каналы со случайной амплитудой и фазой Задача 4.5.17. Райсовское распределение огибающей и фазы на выходе канала. Если узкополосный сигнал передается по райсовскому каналу, то выходной сигнал содержит регулярную и случайную компоненты. Часто бывает удобно использовать запись в комплексной форме. Пусть st (t) Δ У 2 Re [f (t) е" {i) e'"c'] 454
обозначает переданный сигнал. Тогда, используя (416), принятый сигнал (без аддитивной помехи) можно записать в виде sr(t)bVYRe{v'f(t)exp[j<p(t) + jQ' + j<>>ct]}, где ν' β;θ Δ. α е'б + ое^ для согласования с (416). 1. Показать, что V ( y/2-fa2 —2Vr/acos(e/— б) -ехр| )■ 2πσ2 V 2<*2 0< У'<оо, 0< θ'—δ<2π, О при других значениях. [0 при других V'. 3. Найти Ε (о') и Ε (υ'2). 4. Найти плотность вероятности ρθ, (θ')· Распределения для пп. 2 и 4 представлены графически на рис. 4.73. Задача 4.5.18. Амплитудное телеграфирование по релеевским каналам. В системе связи с AT сигнал передается по каждому из релеевских каналов, если справедлива гипотеза Нг. Принимаемые сигналы имеют вид #ι : т% (t) = Vi V~2 fi (t) cos [οι * + q>f (*) + в|] + ю, (t), 0<t <7\ i=l, 2, ..., #, H0:ri(t)=Wi(t), 0<t<T, t=l, 2, ..., W, где /f(^) и (pi(t) — известные колебания, υ ι — статистически независимые релеев- ские случайные величины с дисперсией Ей θί — статистически независимые случайные величины, равномерно распределенные на интервале 0 < θ < 2π, а Wi(t) — независимые помехи типа белого гауссова шума, имеющего спектральную плотность N0/2. 1. Найти критерий отношения правдоподобия. 2. Построить блок-схему оптимального приемника. Указать реализацию в виде полосового фильтра и реализацию в виде комбинации фильтра с устройством возведения в квадрат. Задача 4.5.19 (продолжение). Оптимальное разнесение. Предположим теперь, что Ei = Ε (i = 1,2...., Ν). 1. Убедиться, что эта задача математически тождественна со случаем 1А на стр. 117 в § 2.6. Найти соотношения между параметрами в двух указанных задачах. 2. Использовать отмеченную в п. 1 тождественность задач и результаты примера 2 на стр. 134— 136 для отыскания μφ и μ(δ) применительно к данной задаче. 3. Допустим, что гипотезы равновероятны и что критерием является минимальная вероятность ошибки. Найти верхнюю границу и приближенное выражение для вероятности ошибки Р(г). 4. Ограничим ΝΕ = Ет. Использовать приближенное выражение типа (2.508) для отыскания оптимального числа разнесенных каналов. Задача 4.5.20. Импульсный радиолокатор с N импульсами в пачке, случай флуктуирующей цели. Рассмотрим импульсную модель, описанную в задаче 4.5.14. Если цель флуктуирует, то амплитуда и фаза отраженного сигнала из- 455
меняются от импульса к импульсу. Хорошей моделью, учитывающей указанные флуктуации, является релеевское распределение. По гипотезе Нг принятый сигнал имеет вид __ N r(t) = V2 2 oif{t—t—bTp)cos{<i>ct + ei) + w{t), — оо<*<оо, где Of, θ* и w(t) определены в задаче 4.5.18. 1. Убедиться, что эта задача математически тождественна задаче 4.5.18. 2. Построить блок-схему оптимального приемника. 3. Убедиться, что результаты рис. 2.35 и 2.42 непосредственно применимы к данной задаче. 4. Если требуемая вероятность ложной тревоги PF = 10"~4, а полная средняя энергия принимаемого сигнала ограничена величиной Ε[Νν2ι] = 64, то какое оптимальное число импульсов необходимо излучать, чтобы вероятность обнаружения PD была максимальной? Задача 4.5.21. Бинарные ортогональные сигналы, N релеевских каналов. Рассмотрим бинарную систему связи, использующую ортогональные сигналы и работающую по N релеевским каналам. Гипотезы равновероятны, а критерий — минимальная вероятность ошибки. Принимаемые колебания имеют вид |У21>/ h (0 cos [e>lf t + Фг (f) + ef] + a>f (*), 0<*<7\ ί=1, 2, ...,N:Hl9 г ι (t) = _ ft/Tvi /о (0 cos [ωοί t+4>0 (θ + θιΐ+ю, (О, Ι 0<*<7\ ι=1, 2, ... , W:#0 Сигналы ортогональны. Величины υ%, θ/ и wt(t) описаны в задаче 4.5.18. Применяется частотное телеграфирование с разнесением. 1. Построить блок-схему оптимального приемника. 2. Допустим, что Ei = E> i = 1,2, ..., W. Убедиться, что эта модель математически тождественна случаю 2А стр. 122. Получающаяся вероятность ошибки Р(г) определяется уравнением (2.434). Выразить этот результат через Ε и Ν0. Задача 4.5.22 (продолжение). Границы ошибки при оптимальном разнесении. Предположим теперь, что Ei могут быть различными. 1. Вычислить μ(έ). (Использовать результат примера ЗА на стр. 136). 2. Найти значение s, которое соответствует порогу γ = μφ и оценить μ(έ) для этого значения. 3. Вычислить верхнюю границу вероятности ошибки, которая дается граничным выражением Чернова. 4. Выразить этот результат через вероятности ошибок отдельных каналов: Pi&_P (e в ί-й ветви разнесения), *:±[(ч-&П· 5. Найти приближенное выражение для вероятности ошибки Ρ(ε), используя центральную предельную теорему. 6. Предположим теперь, что Ει = Ε, i = 1, 2, 3, ...., N и ΝΕ= Ετ. Используя приближенное выражение типа (2.473), найти оптимальное число ветвей разнесения. Задача 4.5.23. Передача М-позиционных ортогональных сигналов по N релеевским каналам. Обобщением бинарной системы разнесения является М~ позиционная разнесенная система. Все Μ гипотез равновероятны. Принимаемые колебания имеют вид: П (0 =)/"2~ щ fk (t) cos [ωΜ t + <bk (t) + Bi] + wt (*), 0 < t < Τ : Hh, ί=1, 2, ...,Ν, k=\, 2, ...,Μ
Сигнала ортогональны. Величины Vf, θ$ и Wt (t) определены б задаче 4.5.10. Системы этого типа обычно называют многопозиционными системами частотного телеграфирования с разнесением. 1. Построить блок-схему оптимального приемника. 2. Найти выражение для вероятности ошибки при вынесении решения о том, какая из гипотез является верной. Примечание. Эта задача подробно рассмотрена в [84]; результаты для различных Μ и N представлены графически. Задача 4.5.24 (продолжение). Границы. 1. Скомбинировать метод границ § 2.7 с простыми границами (4.63)—(4.65) для того, чтобы получить границу вероятности ошибки для предыдущей задачи. 2. Использовать центральную предельную теорему с целью получения приближенного выражения. Задача 4.5.25. Передача М-ортогональных сигналов по N райсовским каналам. Рассмотрим систему с Μ сигналами, описанную в задаче 4.5.23. Все сделанные ранее допущения остаются в силе, за исключением того, что теперь каналы являются независимыми райсовскими, а не релеевскими (см. задачу 4.5.17). Амплитуда и фаза регулярной компоненты известны. 1. Найти критерий отношения правдоподобия и построить блок-схему оптимального приемника. 2. В чем заключаются некоторые трудности реализации оптимального приемника? Задача 4.5.26 (продолжение). Часто фаза регулярной компоненты точно не известна. Рассмотрим модель задачи 4.5.25 и допустим, что exp(AmcosX) „^γ^η %(Х)= 2nIo{Am) ' π<Χ<π и что $i не зависят друг от друга и от всех других случайных величин нашей модели. 1. Найти критерий отношения правдоподобия и построить блок-схему оптимального приемника. 2. Рассмотреть частный случай, когда Лт = 0. Начертить блок-схему оп* тимального приемника. Примечание. Рассмотрение приведенных выше задач показывает, что при оценке вероятностей ошибки в многоканальных системах встречаются вычислительные трудности. Существует два общих метода решения этой задачи. Прямой метод заключается в написании необходимых интегралов и попытке их выражения через Q-функции, вырожденные гипергеометрические функции, бесселевы функции или некоторые другие табулированные функции. В этом направлении получено большое количество результатов. Сводка решенных проблем и обширная библиография приведены в [89]. Второй метод заключается в попытке отыскать аналитически границы вероятности ошибки. Метод граничных оценок, развитый в § 2.7, как правило, оказывается наиболее плодотворным. В следующих двух задачах рассмотрено несколько полезных примеров. Задача 4.5.27. Райсовские каналы, оптимальное разнесение [86]. 1. Используя метод аппроксимации, рассмотренный в § 2.7, найти выражение для вероятностей ошибок при передаче бинарных ортогональных сигналов по N райсовским каналам. 2. Провести такой же анализ для субоптимального приемника, использующего квадратичное сложение. 3. Вопрос оптимального разнесения также правомерен в данном случае. Сопоставить выражения из пп. 1 и 2 с [86] и проверить результаты, связанные с оптимальным разнесением. Задача 4.5.28. В п. 3. задачи 4.5.27 было показано, что если отношение энергии регулярной компоненты к энергии случайной компоненты превосходит некоторое значение, то оптимальным является бесконечное разнесение. Этот результат не имеет практического значения, так как он предполагает идеальное знание фазы регулярной компоненты. При увеличении N влияние малых фазовых оши- 457
бок становится более существенным, и это должно всегда вести κ конечному'опти- мальному числу каналов. Используя распределение фазы из задачи 4. 5.26, исследовать влияние неполного знания фазы. Задачи к § 4. 6. Оценка нескольких параметров Задача 4.6.1. Принимаемый сигнал имеет вид: r(t) = s(t, A) + a>(f), 0<*<7\ Параметр а — нормальный случайный вектор с плотностью вероятности pa(A)=[(2n)^|Aa|1/2]-Iexp(--i-A^Aa-1A). 1. Использовать формулу записи производной матрицы, рассмотренную в гл. 2 стр. 87, для вывода интегрального уравнения для оценки параметра а по максимуму апостериорной плотности. 2. Использовать свойство (444) и результат (447) для отыскания атар. 3. Убедиться, что оба результата тождественны. Задача 4.6.2. Модифицировать результат задачи 4.6.1 с учетом случая, когда Ла является сингулярной. Задача 4.6.3. Обобщить результат по п. 1 задачи 4.6.1 на случай, когда £(а) = ша. Задача 4.6.4. Рассмотрим пример на стр 411. Показать, что фактические средние квадраты ошибок при увеличении E/N0 стремятся к границе. Задача 4.6.5. Пусть r(t) = s(t, a{t))+n(t), 0<t<T. Предположим, что a(f) — нормальный случайный процесс с нулевым средним и ковариационной функцией Ka(t, и). Рассмотрим функцию a*(t), получаемую путем дискретизации a(t) с интервалом Т/М сек и восстановления формы колебания по дискретным отсчетам: м sm[(nM/T)(t-tj)] T_ _2Т_ (пМ/Т) (t — U) ' * ' Μ ' Μ α (ί)β2 α(ω шмтн-м ' ti=0' лГ' 1. Введем определение U £, l*' (nMlT)(t-h) Найти уравнение для a*(t). 2. Исходя из формальных соображений показать, что при Μ -+ оо уравнение для оценки сообщения a(t) по максимуму апостериорной вероятности имеет вид: г 2 С г , - ^,ds (и, а (и)) a{t)=—~ [г(и)-в(и, а (и))] V J V " Ka(t, u) du, 0<t<T. No J da(u) Задача 4.6.6. Пусть r{t) = s(t, A) + n(t), 0<t <Tf где а — гауссов вектор с нулевым средним и диагональной ковариационной матрицей, a n(t) — выборочная функция нормального случайного процесса, имеющего нулевое среднее и ковариационную функцию Kn(t, и). Найти оценку параметра а по максимуму апостериорной вероятности. 458
Задача 4.6.7. Задачу оценки параметра сигнала при передаче по параллельным'каналам можно записать в виде r(0-s(f, A) + n(f), 0<*<7\ где r(t) — N-мерный вектор, а — М-мерный параметр. Допустим, что а —гауссов вектор с нулевым средним и диагональной ковариационной матрицей. Пусть E[n(t)nT(u)] = Kn(t, и), Найти уравнение, определяющее оценку параметра а по максимуму апостериорной вероятности. Задача 4. 6. 8. Пусть r(t)=y2vf(t, A)cosl<uct + O(t, Α) + ΘΙ + »(0, 0<t<T, где ν и θ — случайные величины, распределенные соответственно по Релею и равномерно. Аддитивная помеха w(f) представляет собой выборочную функцию белого гауссова процесса со спектральной плотностью N0/2. Параметр а является гауссовым вектором с диагональной ковариационной матрицей и нулевым средним; случайные величины а, α, θ и w(t) статистически независимы. Найти зависимость функции правдоподобия от параметра а. Задача 4.6.9. Пусть r(t)=V2vf{t— t)cos[cdc* + 9(*—%) + <i>t + Q] + w(t)9 —ос < t < оо, где w(t) — выборочная функция из белого гауссова шумового процесса, имеющего спектральную плотность N0/2 и нулевое среднее. Функции f(t) и φ(ή — детерминированные функции нижних частот, верхние частоты спектров которых лежат ниже сос. Случайные величины υ и θ распределены соответственно по Релею и равномерно. Параметры τ и ω неслучайны. 1. Найти функцию правдоподобия как функцию τ и ω. 2. Построить блок-схему приемника, обеспечивающего приближенную реализацию оценки по максимуму правдоподобия. Задача 4.6.10. Передается последовательность амплитудно-модулированных сигналов. Сигнал, передаваемый на k-м интервале, равен sh(t, A)=*Ahs(t), (k-l)T<t<kT^ fc=l, 2, ... Последовательность случайных величин является нормальной с нулевым средним; указанные величины связаны между собой следующим образом: αχ есть N (0, σα), α2 = Φαι+«ι, а=фа +uu . д k— ι k—ι Коэффициент Φ фиксирован. Величины u\ — независимые нормальные случайные величины, имеющие нулевые средние значения, W(0, au). Принимаемый на k-м интервале сигнал имеет вид r(t)=sh{t, A) + w(t), (k — l)T<t<kT, /г=1,2, ... Найти оценку а^, к = I, 2, ..., по максимуму апостериорной вероятности. (Обратить внимание на сходство данной задачи с задачей 2.6.15.) 459
Решение некоторых задач к главе 4 Решение задачи 4.2.4 1. Обозначим выходную величину системы обратной связи по гипотезе #о через y0(t), а по гипотезе Ηλ — через уг({). Поскольку функция x(t) — детерминированная, найдем у lit), используя методы преобразования. Передаточная функция замкнутой петли по ί-й гипотезе равна Ш!1 = _А_( ί=0>1. X (a) s+Ai Таким образом, или, во временной области, t yi(t)=x(t)®Aiu_l(t)e-Ait = § Aix(x)e~Ai{t~'t)dTt ί>0, / = 0,1. о Для отыскания критерия отношения правдоподобия используем результаты, полученные на стр. 300—302, непосредственно. Записав (4.31в) через функции времени, получим г«)[»1 (0 -Уо (01 ^ 4г 1п Ч + 4" h ^ W d< - \ *·* (<) di ' »· l l Lo о J что и требовалось найти. Качество критерия полностью определяется величиной d2. Из (2.36) d2=^- fo+fio- 2Р УадГ), где г г г Ei=\yi2(t)dt, E0=[ y<>*(t)dt, pVE1E0 = ^y0(t)y1(t)dt. 0 0 О 2. Если *(<) является импульсом yi(t) = A1e-Ati, <> 0, ^(0 = Лое-л·', />0, то £i = jj Д,«е-2Л|'Л = Лг ■г- 2 Г Л1+Л) - Л°Л1 1 AT0L 2 Аг + АоУ Для отыскания Р0 и Рр используем это значение d2 в (2.37) и (2.38). 460
Решение задачи 4.2.6 1. Выход фильтра в момент времени Τ равен /, где оо /= J τ(τ)ΚχΤ—τ)ά%. - (4.1*) — оо Из (2.334) d= о»1/|Я,] * ( > Используя заданные в условиях задачи сигнал и импульсную характеристику, получим Е[1\Н0] = 0, (4.3*) °° _ Т Г~Е Ъ\\\НХ\= \~VEs{T)h{T-%)dx=\y —e-a<T-Vdx = — оо О = ΐ/τ0^τ4· <4·4*> ίοο оо "J J h(T)w(T—T)d% J h(o)w(T—о) do\ = — оо —оо J = ί /ι (τ) dT — оо — Используя (4.3)* — d2: J ft (σ) d • OO -(4.5)* в Ail r Wo (4.2)* δ(τ- -σ) = , получим -e~aT)2 a? No 4a 2£ 3l 2 2 aT s — OO -a- ή2 (τ) ίίτ _е-аГ)2 _#0_ 4α или *-4..[-£(l-e-"J·]. Таким образом, необходимо максимизировать /(х)=-^-(1_е-*)3. Дифференцируя и приравнивая результат к нулю, получим 2e~*(l— e~*) /'(*) = ^2 [2*-е*+1] = 0. Максимум имеет место при 2*+1 = е* или * = 1,26. Следовательно, 1,26 а==.— # Τ 4 61 (4.5*)
2. Используя значение α, имеем d2 = 0,815 do2· Требуемое увеличение мощности передачи равно — 10 lgO,8I5=0,89 дБ. Мы встречаемся с результатом этого типа довольно часто. Субоптимальная система, оптимизированная в пределах располагаемых степеней свободы, работает почти столь же хорошо, как оптимальная система. Решение задачи 4.2.8 I. Обозначим t-й сигнал через вектор s/ 'sn si2 где N(<M) есть размерность пространства решений. Требуется минимизировать _ м E*L 2 PlHi]\Si-m\2- Раскрывая это выражение в виде м £ = 2 Ρ (Hi) UiT Si — 2SiT m -f mrm], дифференцируя и приравнивая результат к нулю, получим м VmE = 2 р№) [2mr-2sfn = 0 ί=1 или Μ m=2 P(**t)si, что и требовалось найти. 2. /-й компонент m есть ожидаемое значение /-го компонента системы сигналов м тДЯ^]=2 РШ*ц- Когда гипотезы равновероятны, это соответствует центру тяжести системы сигналов. 3. Для ортогональных сигналов s/ = " 0 0 =ущ Для равновероятных гипотез mj = — yEj , /—1, ..., Μ. 462
При Af=2 пространство сигналов сводится к одномерному. **■ 2 -Г т При Μ = 3 три сигнала лежат в плоскости, которая содержит начало координат. Это можно вычертить в новой координатной системе в виде •Л **, ♦*ί 52 При Λί = 4 преобразуемые сигналы суть четыре вершины тетраэдра с центром в начале координат 4. Поскольку все симплексные сигналы имеют равные энергии, I Ε Mi Γ Λί "1 /=ι 5. Симплексная система с энергией сигнала (--Ь) £ будет иметь такое же расстояние между сигналами, как ортогональные сигналы с энергией Е. В з'адаче 4.2.12 рассматривается оптимальность симплексной системы, когда не имеется ограничений на размерность системы сигналов. Можно сделать вывод, что,если симплексная система оптимальна, то ортогональная система будет практически оптимальной при больших М.
Решение задачи 4.2.9 ' I. По условиям задачи Μ сигналов имеют одинаковые энергии Ε и одинаково коррелированы. Используя неравенство Буняковского — Шварца, получим [[- (t)Sj{t)dt $Si*(t)dt\Usj*{t)dt] = E\ или J Si(t)sj(t)dt\^pE < Ε о I ρ < 1. Для вывода другой границы заметим, что Τ Γ Μ "12 / ал /лл t4 ч 0<| 2 Si (0 dt=E[M + 2 V 2 > р)=ЕМ(1 + 9[М-Ц) или откуда следует, что Поэтому 1+р(М-1)>0, 1 Р> М — \ 1 М— 1 < ρ **. 1. 2. Построим симплексную систему, как в задаче 4.2.8. Пусть Υ Ε Фг(£) — система ортогональных колебаний с энергиями Е. Тогда i-й сигнал симплексной системы есть Μ βι(0 = Φι(0-^-2φ^(0 с энергией Ε'. Коэффициент корреляции равен ГГ Λί 7 Г 1М 1 Г 1 ^ 1 PS' = $ Ui(0--77 2Фа(^ Фу(0—7Г2Ф*(0 Л== о L *=i J L *=»i J = ΐ|φ/(ΟΦ;(0-(Φί(0+ΦΠΟ)(^2%(θ|^+-^ = '-тг^' '-' -7Γ-^ '*'· Итак, ρ=- 1 Μ— 1 Μ — [ Μ -464
3. Любую систему равнокоррелированных сигналов можно получить из ортогональной системы при помощи линейного преобразования Μ / где ' »(Μ — 1) ι Г, ί/Λ+ρ(μ- Это преобразование не влияет на вероятность ошибки. Вероятность ошибки Ρ(ε) определяется расстоянием между сигналами. Для равнокоррелированной системы dij=Y2(l-9)E9. Для ортогональной системы dij=y2£0rth · Чтобы получить равную вероятность ошибки Ρ(ε), необходимо варьировать энергиями сигналов так, чтобы dij были равными что и требовалось доказать. 4. Для симплексной системы 1 М — 1 Таким образом, вероятность ошибки для симплексной системы с энергией сигналов Es равна вероятности ошибки для ортогональной системы с энергией сигналов ^orth = WW - l))Es. Решение задачи 4.2.16 1. Рассматривая пример 3 на стр. 306, особенно (4.59), видим, что вероятность ошибки Р(г) не зависит от того, какой сигнал был передан. 2. В качестве примера рассмотрим случай, когда Μ = 8, и допустим, что был* послан сигнал, соответствующий 000. Тогда имеются следующие возможные виды ошибок в элементах (двоичных разрядах) 000} 0 ошибок, 00Ц 010} ошибка в одном разряде, lOOj 011) 110} ошибка в двух разрядах, 101J 111} ошибка в трех разрядах. Если ошибка в сигнале происходит, то все остальные последовательности равновероятны и появляются с вероятностью \/(М — 1). Ожидаемое число ошибок в элементах при условии, что ошибка в сигнале имеется, равно 1(3) + 2(3) + 3(1) 7 465
В общем случае /C = log2M и Ε [число ошибочных элементов | ошибка в сигнале имеется] = !/(?) М — 1 Эта сумма равна (log2 Μ) —. Итак, Ε [число ошибочных элементов I ошибка в сигнале имеется] = _ (log2M)Ai "" 2(М_1) 3. _ t Ε [число ошибок в элементах I ошибка в сигнале имеется] ρ (ε) = —ι- ! ί-χ число элементов в последовательности Χ Ρ [ошибка в сигнале имеется] = — Ρ (ε) = —— Ρ (ε). log2M 2 (Μ — 1) ν ' 4. При Μ = 2, 4, 8 имеем: Μ ΡΒ(*) Ρ (ε) 2/3Ρ(ε) 4/7 Ρ (ε) Построение графика сводится к приведению к масштабу рис. 4. 25. Решение задачи 4.2.21 1. Сигнал по i-й гипотезе имеет вид -/■*[■ ■<ο-ι/τ-Ν*τ^)]- \ / 2mt \ ( 2т \ ι 2nnt \1 2ni cos I — /=1, 2, ..., Λί. Все М сигналов можно представить посредством двух ортогональных функций. Пусть ι / 2 / 2mi \ Φι(θ=|/ ycos(-T"j и τ / 2 . / 2nnt \ <M0=|/ "у sin (^—J· Тогда sf (0 = VS" [cos (-^-^Ф! (О-sin (-^■)φ·(θ]. '=1.2, ... , Μ. Принятое колебание по гипотезе Hi имеет вид r(t) = si(t) + w(t)1 0<t<T, * = 1, 2, ... , Μ. 466
Вычисление корреляции г (/) с <px(t) и φ2Γ(0 Дает Две достаточные статистики, необходимые для принятия решения. По гипотезе Hi \ + Wi П = jr (0 Φχ (t) dt = VE cos (-^jf-) - 0 r2= Г г (О Ф2 (0 <tf = - У £ sin (^) +wff 0 i = l, 2, ..., M, Согласно (4.45) оптимальный приемник вычисляет ! 2 lj=\nPj—— У (#*->"ί7·)2> /=1,2, ..., Μ, (4.1*) (4.2*) и выбирает наибольшее. Поскольку сообщения равновероятны, первый член является одинаковым по всем гипотезам. Используя (4.1*) и (4.2*), найдем оптимальный критерий в следующей формулировке: вычислить //A^-cos^^+^+sin^)]2, j=l,..., M, (4.3*) и выбрать наименьшее. Выполнив операции в (4.3*) и пренебрегая членами, которые равны между собой по всем гипотезам, получим критерий: вычислить 2я/\ Μ Γ lj" *L—RlCOS / 2π/ V Μ j+tf2sin (- /=1. ,Μ, (4.4*) и выбрать наименьшее. Более простая интерпретация получается, если записать точку, описываемую посредством Rx и R2 в полярных координатах: R1 = zcosQR, R2 = zs\nQR, 9^ = arctgi —— ). (4.5*) Используя (4.5*) в (4.4*), получаем //=-*со»(вЛ-·^·). Следовательно, необходимо вычислить 2π/ «J?—ГГ. /=1> ., Μ и выбрать наибольшее. Блок-схема приемника имеет вид ·(*)■ ](¥stn(-yr~) i τ dt\ Вычисление dR и принятие решения\ 467
2. Пространства решений для Μ = 2, 3 и 4 показаны ниже. Ίί »1 р "о k/ A 1 ь А° ι А, о "1 ////////////, о нг Л L· Г "о VF 'о % «, "г 5г Г н3 *г\ Ц ^ j/iF S0 R1 3. Поскольку пространство решений симметрично, Я (ε) = Ρ (ε | #г·) для любого *. Геометрическое построение для сегмента по гипотезе Н0 показано на рисунке *»R< •2VFsin(fi)' Введем 2 V£ sin (π/Μ) η , Γ 2£ . /' π V 1/ΛΌ/2 Для отыскания границы вероятности ошибки Ρ(ε) построим рисунок 468
Ρ[ε|#0] = Ρ [г оказывается за пределами области решений ] < Ρ [г оказывается выше линии а — а'] + Р[г оказывается ниже линии Ь — Ь'\. Теперь г по гипотезе #0 равен N(s0, NJ2X). Так как помеха обладает круговой симметрией относительно точки s0, приведенные выше два слагаемых равны вероятности того, что нормальная случайная величина с нулевым средним и единичной дисперсией будет превосходить d/2. Следовательно, Р[в|Я0,<2ег{с,(4) = 2ег!с^(-^),/2з1п(^-))л2а. Аналогично, Ρ [ε Ι Η0] > Ρ [г оказывается выше линии а—α"] = α, α < Ρ [ε Ι Но] < 2α. Этот результат был впервые получен в [72] и является хорошим примером отыскания граничных выражений, которые часто необходимы для получения оценок вероятности ошибки Ρ(ε). Решение задачи 4.2.23 Область решений для одного сигнала показана на рисунке Действительная точка \У сигнала Ρ(ε) = βΓίο,[ΐ/^3ίη(^+θ) \ Л Г 2Е ( π \ 1 π π +erfc4l/^rsinU^e)J· ~^-<θ<^ Если положить θ > 0, то rf4i/lrsin(i_( Ρ (ε) ~ег При М = 2 и малом θ 8ΐη(-^±θ)^(β1ηγ)-θ·α1. Таким образом, малые фазовые ошибки не изменяют помехоустойчивости системы в значительной степени. Для больших Μ и малых θ ■*(-?-·)«(£-·)■ Помехоустойчивость системы сильно зависит от Θ. 469
Решение задачи 4.2.25 Эта задача аналогична примеру I на стр. 320. Как в (112), 1η Αχ [г (0, Л, В] + \пра(Л) + \прь(В) = τ τ 2 С В2 Г В2 = — ^Bs(t-A)r(t)dt- — J s*(t-A)dt-—+k. (4.1*) — 7 —J Чтобы сделать это, заметим, что max max rmax A, BllnA^rit), А,В)]= А [В lnAl(r(f), Α, θ)] = max Λ = A llnA1(r{t)9A9bmAp(A))]. Таким образом, можно найти 6тар(Л), а затем максимизировать ее по Л. Прежде всего найдем необходимое условие существования Smap путем дифференцирования (4.1*) и приравнивания его результата к нулю τ , τ ί \\ -jj-j. {t-A) r it) dt-2B ^Ц S< it-A) di+ JL· j l Это уравнение можно решить относительно <?map: τ = 0. map —Τ A) r (t) at °ΤΆ2φ~ 2ES Nn + 1 •Lk0^s(t- A)r(t)dU (4.2*) —τ где Е — энергия сигнала. Поскольку решение является единственным, а вторая производная отрицательна, абсолютный максимум существует при любом значении А. Для отыскания"атар подставим (4.2*) в (4.1*): In Αχ [г (0, Л, + 1пр0(Л) + 1прь(?тар) = s(i—i4)r(i)^ #o #o 1 2σ62 + *. Заметим, что 1пра(Л) — величина постоянная. Величина ln/?5(&map) учитывается коэффициентом усиления — множителем первого члена. Для отыскания 2тар необходимо получить ее в виде функции А и выбрать максимальное значение. Оптимальный приемник показан на рисунке. Когда выходная величина принимает свое максимальное значение, мы наблюдаем выход усилительного звена k0 с тем, чтобы получить 6тар- Отсчет δ момент бремени t=amap \. Это значение раб но Ъ, тар Устройство \воз6едения 8 квадрат тшр 470
Решение задачи 4.2.26 1. Заметим, что эта задача весьма сходна с моделью на стр. Sl4—315. Здес известно, что параметр А неотрицателен. Принимаемое колебание равно r(t)=As(t) + n(t), 0<t<T. s(t) Вычисление корреляции с , /·■— дает достаточную статистику гг r1 = A~[/F+w1. Как в (4.91), Итак, ami= l Λ/Ε 1.0,. /?1<0. 2. Смещение равно Полагая имеем ί/ = Τ/Λ^ο/2 *^-w J _{VTy+AVE)vk^{-i)dy= -*Vfr _ E ^*ml^ = V2nd 6XP (~~Ad) + A erfc* (—Ad)' или, используя (4.11), L Смещение равно B(A) = E[aml-A]. 3. Из п. 2 5(Л)=у=уехр(-^) + Легк:!с(-^)-Л. Каждый член стремится к нулю при d -> оо . 471
Решение задачи 4.2.28 I. П. I задачи можно решить путем простого исследования без каких-либо выкладок. Из изложенного на стр. 80 известно, что операция оценки по наибольшему правдоподобию коммутативна с нелинейными операциями. В § 4.2.2 (стр. 314—316) была решена задача оценки амплитуды сигнала, а именно, если rV) = Af(f)+w{t), 0<*<7\ то τ Ri If /(0 где Ef—энергия колебания f(t). Поскольку М=1/Л; mmi= -^— =Efn r (t) f (t) dt =1/Э7 ЯГ!, ami (4.1*) что и является требуемым результатом. Блок-схема приемника имеет вид r(t) Решение этой задачи можно также получить непосредственно, не прибегая к свойству коммутативности. 2. Теперь рассматриваем Μ как значение нормальной случайной величины. Поскольку операция оценки по максимуму апостериорной вероятности не коммутативна, необходимо выполнить соответствующие выкладки и вывести уравнение оценки. Прежде всего отметим, что Rx по-прежнему является достаточной статистикой. Апостериорная плотность равна \npm]rt(M\R1) = \nprilm(R1\M) + \npM(M) + k1 = (R1 — \/M)2 \ Μ* No Продифференцировав (4.2*), получим d\npmlri(M\< ζστη +k2. дМ \Ri) 2 / El VEfR! Μ2 \ Μ (4.2*) (4.3*) Приравняв к нулю, получим уравнение оценки по максимуму апостериорной вероятности ^4 т, тар Ш] 2 /g/ Rx Щ тар No No = 0. 3. Приа2т имеет вид оо первое слагаемое в (4.3*) стремится к нулю и решение (4.4*) lim 2 YEf ттар — 0 — mml · Ri 472
Решение задачи 4.3.4 1. Согласно (4.153) In А (г (*)) Δ_ ι (Tf) = J fs (τ) Qn (τ, и) г (и) dxdu. Ti Мы положили Ε = I и исключили постоянный член в выражении для смещения. Из задачи 4.3.3 можно записать Tf L (7V) = — J $ s (τ) [δ (τ-α)-Λο (τ> ": Γ/)] r (") <*τ<*" или L{Tf) = T S s(T>r(T)dT -]7"$$ S(T)M*, u:Tf)r(u)dxdu. (4.1*) 2. Теперь запишем Г/ dL (t) (4.2") где L(t) получено из (4.1*) при Tf — ty L (t) =— § s (τ) г (τ) dt — — ^ s (τ) Λ0 (τ, и : 0 г («О dxda. (4.3*) Дифференцируя (4.3*) по t, получаем dL(t) dt t Γ < -$ <*τ s(t)/io(t, t:t)r(t) + ^ S(T) d/*0 (τ, и : Q di r (u) du Теперь, подставляя в (4.4*) dh0 (τ, и : t) dt = —Λ0(τ, t:t)h0(t, u:t), (4.4*) (4.5*) используя равенство Λ0 (τ> *: t) = h0 (t, τ : ί), вытекающее из свойства симметрии обратного ядра, получим dL (t) 2 dt ~~ N0 s (t) r(t) —s (t) ί h0 (t, u:t)r (u) du — t t t —r (t) [ h0 (t, u:t)s(u)du + j* h0 (t, и : t) r (u) du [ h0 (t,% : t) s(x)dx Tf T, T. ]- Nn t(t)—^h0(t, u:t)s(u)du r(0-$ h0(t, u:t)r(u )du\. (4.6*) 473
Используя (4.6*) в (4.2*), имеем О τ \ Ι τ Т. \L X r(0-J h0(t, и t) г (и) du dt. (4.7*) 3. Выражение (4.7*) можно переписать в виде т4 τ Tf x μν"01 d% [δ (/""τ) "Λ°(/> τ: 0I r (τ)Ι X (4.8*) 4 Последнее можно записать в виде L (Tf) = § dt § hwr (t, u) s (и) du § hWT (t, x)r (τ) dx, (4.9*) 4 4 Ti где мы ввели определение hwr(t, r)=—[b(t-x)-h0(t, x:t)]. "0 (4.10*) Фильтр, описываемый выражением (4.10*), называют реализуемым выбеливающим фильтром. Легко убедиться, что его выход является белым шумом, когда на его вход подается шум n(t). 4. Ясно, что интегральное уравнение для h0(t, τ: t) является точно таким же, как интегральное уравнение для h0(t, τ), когда концевая точка интервала Tf = t. Таким образом, t No h0 (t, τ : 0+ ξ Λ0 (t, u:t)Kc ("> τ) du = Kc (*, τ), Tt < τ < U Решение задачи 4.3.7 Ι. Это частный случай примера, приведенного на стр. 364. Поэтому g<x>(t) удовлетворяет (4.288) VF (-s* (t) + k*s (0) =^г- [-С (0 + V2^oo (0]. (4.1*) где Прежде всего необходимо решить (4.1*). Это выполнено подробно в задаче 4.3.8. На интервале [0, Т] это решение имеет вид £со(0 = γΔ*Ί/ΐ+Λ и A = 4oc*/kN0. ίο решить решение ι 2к2УЩт N0y* -Лсо^Ч^е-*, 0<t<T. (4.2*)i ι часто бывает труднее найти g^ (f)> чем решить (4.1*) прямо на интервале [О, Т]. В этом случае g9 (t) является просто первым членом в (4.2*). 474
Таким образом, полное решение имеет форму g(Q=g,(Q + *ie*+Bie-*- 2fc'(ff/2 +At«+B·-**. 0<ЫТ. Для определения Л и В подставим теперь последний результат обратно в интегральное уравнение t Τ (-^)"!_-|!-s(,) + ^e-»je"'i(«)i«+«=e"5«-"'s(«)J«- ΛΌγ2 < e<V+*M_i \ /e(ft-Y)'—1 У + k О k—y + A (· +^«"[^0^-(e-"-e--) + e(V-^)^_e(V-^)7- Λ; — γ + B e-(v+*W__e-(v+*) г * + γ )]■ Произведя перегруппировку членов, получим 0=1/J[^+i^i_1l+AeVi[ZiL V г|. γ» ^ W„V2 JT L 2 ΛΌγ2 y + k ^ k -1 -V 1 + k—у k <*c2 1 i + vJ" — oc"e ъ ~—kt Ά,/Ύ a 2 -k{T-t) с c ΛΌγ 2k y+k + V- A<?T ■4 k-y J Be-vT N0y* k—y fc + Y Теперь рассмотрим выражение в первых квадратных скобках ] (4.3*) fe2 4fegc2_, fe2 Л 4σ0» \ Υ2 + ΛΌγ2 Υ2 1 W„ft J -1 = 0. Вторые и третьи квадратные скобки исчезают аналогичным образом М, _v 2 + k-y* 2 V AO(fe4-Y2)/" 2 V ^ 1-(1+A) j ('4)= 0. 475
Таким образом, (4.3*) сводится к 0=е —ы 2k V' + е -k(T-t) No V2 ΛΌν2 A 1 k + y n AetT J k—y Ί В k—y J + Be~vT r k+y (4.4*) Два слагаемых в квадратных скобках должны исчезать раздельно. Это дает систему двух уравнений для А н~В. Решая ее, получим А-(„_& _A_ Л ill (k-y)-^(k+y) ( Ί) Ν,γ V Т\ е2*т(k+y)*-(k-y)* о,.* -ч 2fc 1/~Ё( (k + y)-e-vT(k-y) B~{k ~У > N0y* У Τ \ е-2УЧк-у)*-(к + у)* J · ^\/^+А*ут+в*-ут- ■(f)- 2. Переданный сигнал есть у Ε s(t). τ __ /— τ d* = ^VFs(t)g(t)dt=y —^g(t)dt = О * О =i/?tei/?+>r-"+f"-H= ~ t N0 (ft + U U у Τ е*т (k + y?-(k-y)* + .r, -yr,fe2-Y2 (fe + Y)-e~^ (fe-T) ) При больших уТ d> = ^-^-. N0 γ* Решение задачи 4.3.8 1. Это частный случай предыдущей задачи, когда Гг-=—оо и Т/ = оо оо 1/Fs (0 = -γ- ί (0 + Г iCc (<-«) £то (и) du, - оо < t < оо. — СХ) После преобразования имеем iH/f<- е-/»Г) = A. Goo (ω) + Sc (ω) Goo (ω)> Sc(cd) = 2feac* сог + /г2 ' (4.1*) 476
Решение (4.1*) Raet Ύ Go» = l/fO-e-'W) 2 N0 , 2fecc2 = _2_l/~-/'1 k2-y*)( l-e-ftl)f \ 2 ' u>2-fft2 (4.2*) Для отыскания g^ (f) произведем свертку временных функций, соответствующих двум членам в скобках. Графически i-bhhJr ® П Итак ^_£ντ.„+^/ί(ϋ=*).-..'-..Α о [-ι/: *«<<> = 2. eV'(l_e-Tr), <<0, оо / Г 0<t<Tt 2Е ( k2 /e2—γ2 2 No \У2 yT >-e-vr))· Решение задачи 4.3.12 Наиболее легкий путь решения этой задачи—использовать метод выбеливания (см. стр. 332 — 339). Спектр шума имеет вид Sn(<*) = 2α ω2+α2 Этот спектр идентичен спектру шума в (241). Характеристика выбеливающего фильтра имеет вид Заметим, что выбеливающий фильтр действует только в настоящем, так что ограничение насчет конечности интервала наблюдения несущественно (см. примечание 2 на стр 358). 477
есть Выход фильтра Hw(j(a), когда вход равен sin2 ( —— ], < 1 Г An ( 2nt \ ( 2nt \ ( 2nt \\ -уй[~—sin Ыcos (τ)+asin* {—)[ (4Л*> Кроме того, s+2(0=— s% (t). Далее, из (215) или τ о τ d* = A^slx{t)dt. (4.2*) о Подставляя (4.1*) в (4.2*) и производя интегрирование, получим ,. 2 ГЗГа2 , Τ / 2π \2] Это выражение минимизируется при условии, если 4π α= -/- . (4.3*) узт ν Поскольку Р(г) является монотонной функцией d2, значение α в (4.3*) максимизирует вероятность ошибки противника. Решение задачи 4.3.21 Для любого входного сигнала s (t) имеем τ t t £out== j* J j* s (u) e~k {t~u) s (z) e~k (f-2) dudzdt = ooo τ τ τ = j* j* J s (u) s (z) h (f, u) h (t, z) dtdudz, obo где h(t, u)=u_{ (t—u)e~k^^u). Можно ввести функцию Q(u, z)=\h(t, u)h(t, z)dt= J e-k(t-»)e dt = 0 (max u, z) _ _i_ (e-* I ti-z | _e-2kT Q-k {u + z) ^ после чего получим e — ku + kz e — 2kT + k(u+z) (4.1*) dQ (и, z) и > z, 2 2 — , « < Z, (4.2*) 2 2 d2Q (ц» z) _ JL [e-k\u-z\_e-2kT ek(u+z)]_ du2 2 — d(u—z) = k2Q(u, z) — 6(u—z). (4.3*) 478
Оптимальная система передачи сигналов будет передавать сигнал s(fj по гипотезе #о и сигнал—s(t) — по гипотезе Н1у где s(t) максимизирует τ τ τ £out = J f s (u) Q (и, z) s (z) dz = J g (u) s (u) du. (4.4*) 0 0 0 Можно найти s(«), который максимизирует (4.4*), путем решения уравнения Τ XiOi(u)=^^i(z)Q(ut z)dz (4.5*) о и выбора <&i(t) с наибольшим собственным значением. Для такого s(t) получаем g(t) = λιΦ#) и Eoui = ETXi. Чтобы решить (4.5*), продифференцируем его дважды по «, а результат подставим в (4.3*). Используя затем (4.5*) повторно, получим ^-Ф(0+(^-**)ф(0=о ИЛИ O(0 = i4e""Y'+Bevi, (4.6*) где -У*Ч- (4.7*) Для нахождения постоянных А и В можно использовать (4.1*), (4.5*) и (4.6*): " 1 K(Ae-vu + BeVu)=UAe-vz+BeVz)-±-(e-k{u-z)- 0 _e-2kTek(u+z))dz+ ^(Ае-Уг + Ве^): x — (eb(»-z)-e-2bTeb(»+z))dz. (4.8*) Из (4.7*) и (4.8*) получаем следующие соотношения: λ=1/(/ί!2—γ2) [эквивалентно (4.7*)]; (4.9*) (k + y)A + (k —у)В = 0; (4.10*) Ае-*т+Ве*т=0. (4.11*) Объединяя (4.10*) и (4.11*), имеем е-2*7'. (4.12*) k + У _p-2VT k — у Поскольку у < k, это уравнение не имеет решения при у > 0 [см. (4.7*)]. Это означает, что все собственные значения меньше -rj-. Пусть γ = jp. Тогда (4.12*) обращается в ktgpr= —β. (4.13*) 479
Это уравнение имеет бесконечное множество корней, каждый из которых определяет собой собственное значение уравнения (4.5*) Наибольшее решение ( — ) уравнения (4.13*) имеет место при β = 0; в этом случае Фо(0 = С0 + ^. Но это не собственная функция уравнения (4 5*). Следовательно, наибольшее собственное значение уравнения (4 5*) определяется первым ненулевым корнем уравнения (4.13*). Далее, если этот корень равен β, то имеем Ф1(0 = Ле-'Р'< +Ве<Ы = в\^=^ е-Л»'+еН = »ГЛ ■ /β-Μ е-Л» + е"" Л /β-fe \ e-^'-e^l = Β1(1+~Φ + ϊ) 2 -V-lfH) 2 Г ^DftiCOsPtt + kslnfct]. Величина D выбирается из условия нормировки τ ("ф12(0Л=1. Тогда βορΐ(0 = /^τ·Φι(Ο. Решение задачи 4.4.3 1. τ ι JvX1 AX l ν e rt 1 χ (2π)2|Λ|2 MQ(jv) = E[eM]= j — ос Xexp[--^-(X-mx)7'A-1(X-mx)jiiX = exP(--^mxA~lmx ) r , 4 I exp m^A^X- _ι_ .2 ι ж ι 2 (2π) ^ | Λ | —^-Хг(Л-1-2/ЪА)Х^ dX. (4.1*) Чтобы вычислить этот интеграл, придадим ему такую форму, что можно использовать соотношение (4.2*). Это аналогично дополнению до полного квадрата в скалярном случае оо 1= J -^ Гехр(-^-(Х-С)7'В-1(Х-С)^Х. (4.2*) -оо (2π)2 | В|2 Интеграл в (4.2*) справедлив во всех случаях, когда Re [собственные значения В] являются положительными. Из (4.1*) В-1 = Л-1-2/ЪА. (4.3*) 430
Действительные части собственных значений В""1 есть просто те собственные значения Л-1, которые положительны. Таким образом, этот интеграл всегда существует. Поэтому (4.1*) можно записать в виде ι ехр MQ(jv) = - (- —- тТ А 1 т. 2 х : )· В|' |Л •х X Г ^-exp[-^-(X3'-m^A-1B)B-1(X-BA-1mx)]ciXX -« (2л) 2 |В| 2 L Используя (4.3*), MQ(jv) = Из (4.3*) имеем Используя (4.5*) Хехр(— ш^Л"1 ВЛ-1 получим ] |В|Т ( ι ι τ /.-ι = гехР -тК (Л |А|Т 1 B = [I—2jvAA]-1 А. в (4.4*), получим MQ (ju) = е*р(--|"К(А-1[1-11-2^ААГ1])шж]) (4.4*) (4.5* (4.6*) \\—2jvAA\2 что и требовалось доказать. 2. Когда тх = 0, числитель в (4.6*) равен единице; Если, кроме этого, Л-1 =А, то ЩФ)= 1—ΊΓ· <4·7*) (1—2/о) Чтобы найти плотность вероятности, произведем обратное преобразование. При четных η эта операция не представляет труда Pq{L) = L2 e-L 22 Г (т L > О, L<0. (4.8*) Это просто распределение χ2 с η степенями свободы, с которым мы встречались на стр. 117. Этот результат справедлив также и при нечетных п. В этом случае обратное преобразование можно получить из таблиц или путем свертки плотностей соответственно для η = 1 и т = η — 1. 3. Все результаты по п. 1 справедливы, если ввести В-1 Δ (Λ""1— 2ζΑ). 481
Чтобы интеграл (4.2*) существовал, действительные части собственных значений В~~* должны быть положительными. Пусть Тогда собственные значения Л""1 — 2σΑ должны быть положительными. Это эквивалентно требованию, чтобы ' 1 σ < 2λη где λ^&χ — наибольшее собственное значение АЛ. Решение задачи 4.4.5 В основном тексте приведены следующие выражения: τ _ Lc Δ J У 2 г (0 / (0 cos [u)c t + Φ (01 di; (361) о τ _ Ls= f "j/2г (0 / (0 sin [й)с * + Ф (01 di; (362) Ό #o : r (t) =УШГ f (t) cos (g>c f+ Ф (9+θ) + α> (Ο, 0<*<Γ; (357) tf t : r (t) = w (0, 0 < * < Τ; (358) Ρβ(θ)= "^ΤΓ^ ' -»<0<«· (364) 1. Средние и среднеквадратические значения Lc и Ls приведены ниже: E(Lc\Ho) = 0, £(Lc<4#o) = -f-, £(Ls|W0) = 0, E(Ls*\H0)=-^. Используя статистику испытания (критерия), данную в условиях задачи, имеем со 2Я '- П4Ч-^-^)-°· ν1/20 где 2я vl/2 О Г 2# / Я* β2 \ , ,' 2β# \ jo J #0 ν W0 N0 J \ N0 J γι/2 - i_-(-T-if)'.(/^)- 482
Используя (§88), получим "-«(/£· ι/ϊ)-<Ό/&*- Yb\ 2. По гипотезе #ι I с=(],2"1/'Ё7/2 (0 cos2 (<uet + <l>(t))dt ) cos9 + Wc; —Ls=i ]2y%f*(t) sin2(0c^+O(O) <tf] sine+A^s- Проинтегрировав, имеем Ls= —VSTsine + ^s. Введем PD,e^^[(P+^c)2+V>V|e, Ηλ]. Таким образом, ^d. θ = * [(β + V^cos θ + Nc)2 + (yTrsinQ + Ns)2>y]. Поскольку Nc, Ns обладают круговой симметрией, последнее выражение мол переписать в виде где CQ δ ([β + Videos Q]2+Er sin2 θ) 2 . Используя результат п. 1, получим о Решение задачи 4.4.13 1. Принимаемое колебание равно г (0= Л/Щ f (0 cos (шс ^ + 0) 4- ш (*)&_ Δ. 5|Г (ί, B)+w(t), 0<t<T:Hi, ί=1, 2, ..., Μ, где VET=(i-i)A. Оптимальный приемник вычисляет 2я / τ Тогда 2π 0 \ ° 0 483 £| 1<*θ, * = i, ..., μ
и выбирает наибольшее. Поскольку распределение ρθ (θ) равномерно, 2π Ai=Uехр \~νΓ ^Έχ {Lc cos B+LsSin θ)]exp (~ IT)^ где Тогда ЧЧ-f Lc = JУТг (t) f (t) cos o)c Wi; 0 Ls = \~\/2r (t) f (t) sm<uctdt. 2VTi [Lc\+Ls^_\ No i= 1, 2, ..., M. (4.1*) Заметим, что Εχ = 0, поэтому Аг = I. Приемник, работающий по критерию минимальной вероятности ошибки Р(е) выбирает гипотезу Яг·, которая соответствует наибольшему Aj. Чтобы фактически реализовать это правило, необходимо вычислить /^lVV + V и использовать области решений, показанные ниже О Г, 42 "3 , 1 Ϊ/////// ££/А- ъ -**ь Для-отыскания этих значений необходимо решить систему уравнений. Например, Λι = Λ2, когда Итак, Аналогично, /=Υι / Δ2 \ / / 2Δ/ \ I / 4Δ2 \ / 4Δ/ \ /=γ2 В общем случае / /2Δ2Λ г / 2iAi 484 ; ί=2, ..., м—ι
U. Йространство решений показано выше. Сначала вычислим Ρ(ε|#ι): оо ρ(βι^=Ρα>γιι^)=|^-βχρ(-^)^=6χρ(-^). P(*\Hi) = l-P(yi_l<l<yi\Hi) = ОО ОО = 1- J Рцн. (L\Hi)dL+$ pt]HAL\Hi)dL. yi-i ' yi Эти интегралы идентичны интегралам в примере 1 на стр. 387—388. Я(.|Я,)-1-<г[У -^-(ί-Ι)Δ. 1/^,.,] + +<?Ιι/χ(ι'-,)Δ· _]АЫ· ί=2·-·Λί-1· /'(в|яЛ1)=.-д[|//^Г(1-1)Д> j/^-Vm-,]· Откуда 1 M Решение задачи 4.4.27 Приемник (рис. 4.74) используется приа = 0. Поэтому критерий имеет вид Li + I'.fi L^ + LJo (4.Ι*) или Я^^Яо2, (4.2*) я0 - где Rl±L*c0 + Ll и Λ?Δ^ι + ^.· Принимаемые колебания записываются в виде (4.416). Чтобы вычислить Ρ (ε), необходимо найти статистики Rx2 и R02 по двум гипотезам. Поскольку задача симметрична, Ρ(ε) = Ρ(ε\Ηί) = Ρ(ε\Η0). Таким образом, будем рассматривать только Н0. По гипотезе Н0 1с1 есть 1С0 есть N /so есть N\0, \/ -^- + a*Et 485
Тогда Плотность вероятности г\ равна Prt\H.1 Внутренний интеграл равен Таким образом, оо Г со (ε | Н0) = j рГо, Но (R0 \Н0)\ J ρ , Ηο (Λι I #„) dRt ти ri равна * Р,,я.№1^)=^-ехр(_^-). [ равен оо $ /V, | Я. (*ι I Я.) «ι = ехр ( - ^"). Ρ (ε I Н0) = 5 рГо, Но (Л, | Я,) ехр ί - -^ ] dtf0. Л \ 0 / dR0. (4.3*) Вспомнив, что можно записать (4.3*) в виде р2_ г 2 , г2 ^0— ьс0 ' ^sO» — оо [_ Ко-« L лг0 + 2σ*£<) ехр X ехр К17)2+А sO ο+2σ2£< ^-cO + ^sO j (ILqq(IL$o· Интеграл по Lso есть интеграл гауссовой плотности с нулевым, средним. Интеграл по Ьсо вычисляется путем дополнения до полного квадрата. В результате имеем Ρ (ε f Но) = —; z-T" exP I [■+*] 2 1 2ND где Er^2o2Et. Решение задачи 4.4.29 I. Сначала находим систему из Μ случайных величин путем вычисления взаимокорреляционной функции r(t) с Si(t), i = I, ..., Μ. Эта система является достаточной τ ri = $st(t)r(t)dt, 1=1,2, ..., Μ. Плотности вероятностей по двум гипотезам равны Μ Рг|Я0(^1^о)=^^ехр -^2 *,■), (4.1*) i=\ 1 М ϊ ί I М ^y-TiRidij+Eidij) (4.2*) 486
Используя МЛ*) и (4.2*), имеем '2-ГЁГ i-ш канал "о Модинаковых каналов 1ч Решение задачи 4.4.40 1. Достаточная статистика для настоящей задачи есть τ 1 0 (4.1*) Es — энергия сигнала. Мы определяем Н0 как гипотезу, по которой сигнал проходит по каналу 2 (аналогично, Нг соответствует прохождению сигнала по каналу /). По гипотезе Нг τ r = -^^[as(t)+w{t)]s{t)dtAaVTs + w. о Ясно, что это нормальная случайная величина с нулевым средним и дисперсией Oi2*LEsoa* + N0/2. (4.2*) По гипотезе Н0 r = y~Fs+w. Это нормальная случайная величина со средним у Es и дисперсией N0/2. Критерий наибольшего правдоподобия легко получается из (2.13) и (2.15): А (/?)=■ 1 / R2 \ 2πσι2 6ХР V 2σι2 ) "ι Υ2ησ1 VnN0 exp L fcODll Η° Из изложенного на стр. 51 известно, что η = 1. Беря логарифм, приводя общие члены и используя (4.1*), получим a2 Es 2 т/~£о Нг ι / 2оа2 Es \ Ее 2а, (Ν0 +2σ, Это выражение можно переписать в виде #0 487 (4.4*)
Структура приемника полностью определяется уравнениями (4.1*) и (4.4*) и показана на рисунке. ^адь^и *(*) Устройстве* воз бе д. ψ кВадрат е- 9г 2. Чтобы вычислить вероятность ошибки, сначала найдем два значения величины/?, при которых (4.4*) является равенством £i#o2+£2#o-V = 0; R0- 2ft (4.5*) Обозначим эти два корня через /?jj~ и R0. Таким образом, области решений на оси R имеют вид '/////////////////А У////////Л////////Л Вопросы. Откуда мы знаем, что эти корни являются действительными? Откуда нам известно, какие отрезки оси соответствуют каким гипотезам? Выражение для вероятности ошибки Ρ(ε) записать нетрудно: Ρ(β) = ^-Ρ(ε|^) + γΡ(6-^0), (4.6*) — 00 dR-l· R<,+ - j ткехр(-т)йг+ . ί wexp(-^)dz ΥΝ„Ι2 4-VBs VN„/2 -.«•>=Ч^Ы4#) (4.7*) Аналогично, о '<·'»- J 7fer"',(-^)',R-",-(4)-"··©· <4'8,) Используя (4.7*) и (4.8*) в (4.6*), получим Ρ(ε). 488
Решение задачи 4.4.42 Ясно, что пространство решений является двумерным. Простую систему достаточных статистик можно получить, как показано на рисунке. r(t) ffdt £'л* st(t) Для отыскания критерия отношения правдоподобия вычислим статистики гг и г2 по гипотезам Иг и Н0. Поскольку гг и г2 получаются в результате линейных операций над нормальным случайным процессом с нулевым средним, они являются нормальными случайными величинами с нулевыми средними и могут быть полностью заданы их ковариационной матрицей. По гипотезе Ηχ·. r1=bd+pbI + w1; r2 = pbd+bj + w2; Ковариационная матрица равна a ciNr ι. w\ f£iri2l^] \E[r1ri\H1n Αχ-Я{ [J Μ | Нг] = [1Т--,щ , F[">WJ * Аналогично по гипотезе #0: '•1=p&i+a'1; /·2=&/+α>2; £ИИо]=рЧ2 + ^; * tf|»o]-"?+!*-: Ковариационная матрица имеет вид л f ί IТЛ w г 11 н \ \ЛЫ МЬЦ ЕЬг* I **·] 1 eip(-JR'AT'R) ^ Введем обозначение Тогда РГ/Я, («!»!) "V'V Рг|1/.(К|Я.) <\- 1 2π| Λχ Ι1/2 1 2π\Λ0\1'2 489 exp Η V К я.
Беря логарифм от обеих частей и включая постоянные в порог, имеем Rr[A7'-A7I]R*V. /ίο Это полностью определяет структуру оптимального приемника. Решение задачи 4.6.6 Сначала необходимо найти In Рл\гц\ (А |/-(?)). По аналогии со скалярным случаем τ τ ln Pa I г (О (Д I Г (0) = j f Г (t) Qn (t, U) S (U, A) dt dll- 0 0 Τ Τ Ν 0 0 i = l Необходимое условие существования amap сводится к dlnpaIr(0(A|r(f)) дЛк А = а = 0, /=1, 2, ...Д. Таким образом, τ τ r(t)Qn(t, и) ds(«, A) dAi о о ds(u, A)1 Лг —s(f, A)Qn(f, и)—тт—L\dtdu- дА гЧ' = 0, ί=1,2, ...,W. А = а Это выражение можно переписать в виде τ Я/,тар = <7П] И0-*(*. amap)]Qn(*, и) тар да. Литература 1. Вэллей Г. Е., Уолмен Г. Ламповые усилители. Пер. с англ. Изд-во «Советское радио», 1950. 2. Д а в е н π ο ρ τ В. Б., Рут В. Л. Введение в теорию случайных сигналов и шумов. Пер. с англ., под ред. Р. Л. Добрушина. Изд-во иностранной литературы, I960. 3. Η els tr от С. Solution of the Detection Integral Equation for Stationary Filtered White Noise. Trans. IEEE, 1965, v. IT-11, July, p. 335—339. 4. N у q u i s t H. Certain Factors Affecting Telegraph Speed. Bell Syst. Tech. J., 1924, v. 3, N 2, p. 324—346. 5. Grenander U. Stochastic Processes and statistical Inference. ArkivMat-, 1950, v. 1, p. 295. 6. Л о у с ο η И. Л., Уленбек Г. Е. Пороговые сигналы. Пер. с англ., под ред. А. П. Сиверса. Изд-во «Советское радио», 1952. 7. В у д в о ρ τ Φ. Μ., Д э в и с И. Л. Принцип обратной вероятности в теории передачи сигналов. В сб. переводов «Теория передачи электрических сигналов при наличии помех» под ред. Н. А. Железнова. Изд-во иностранной литературы, 1953. 490
8. В у д в ο ρ τ Φ. Μ. Теория вероятностей и теория информации с применениями в радиолокации. Пер. с англ., под ред. Г. С. Горелика. Изд-во «Советское радио», 1955. 9. Π и τ е ρ с о н В. В., Б е ρ д с а л л Т. Г., Фокс В. К. Теория обнаружения сигналов. В сб. переводов «Теория информации и ее приложения», под ред. А. А. Харкевича. Физматгиз, 1959. Также в сб. переводов «Прием импульсных сигналов в присутствии шумов», под ред. А. Е. Башаринова и М. С. Александрова. Госэнергоиздат, I960. 10. Миддлтон Д., Ван-Метер Д. Обнаружение и воспроизведение сигналов, принятых на фоне шума, с точки зрения теории статистических решений. В сб. переводов «Прием импульсных сигналов в присутствии шумов», под ред. А. Е. Башаринова и М. С. Александрова. Госэнергоиздат, I960. 11. С л е π я н Д. Оценка параметров сигналов при наличии шума. В сб. переводов «Теория информации и ее приложения», под ред. А. А. Харкевича. Физматгиз, 1959. Также в сб. переводов «Определение параметров случайных процессов». Гостехиздат УССР, 1962. 12. К о τ е л ь н и к о в В. А. Теория потенциальной помехоустойчивости. Докторская диссертация, МЭИ, 1947. 13. К о τ е л ь н и к о в В. А. Теория потенциальной помехоустойчивости. Госэнергоиздат, 1956. 14. X е л с τ ρ о м К. Статистическая теория обнаружения сигналов. Пер. с англ., под ред. Ю. Б. Кобзарева. №д-во иностранной литературы, 1963. 15. Вайнштейн Л. Α., Зубаков В. Д. Выделение сигналов на фоне случайных помех. Изд-во «Советское радио», I960. 16. Η а г m a n W. W. Principles of the Statistical Theory of Communication. McGraw-Hill, New York, 1963. 17. Лекции по теории систем связи, под ред. Багдади Е. Дж. Пер. с англ., под ред. Б. Р. Левина. Изд-во «Мир», 1964. 18. Возенкрафт Дж., Джекобе И. Теоретические основы техники связи. Пер. с англ., под ред. Р. Л. Добрушина. Изд-во «Мир», 1969. 19. Golomb S. W., В a u m e r t L. D., Ε aster ling M. F., Suffer J. J., Viterbi A. J. Digital Communications. Prentice-Hall., Englewood Cliffs, New Jersey, 1964. 20. North D. O. Analysis of the Factors which Determine Signal/Noise Discrimination in Radar. RCA Laboratories, Princeton, New Jersey, Report PTR- 6C, June 1943; reprinted in Proc. IRE, 1963, v. 51, July, p. 1016—1028. 21. U r b a n о R. H. Analysis and Tabulation of the Μ Positions. Experiment Integral and Related Error Function Integrals. AFCRC, Bedford, Massachusetts, Tech. Rep. № AFCRC TR-55-100, April 1955. 22. HI e η η о н К-, У и в е ρ В. Математическая теория связи. Неполный пер. с англ. в сб. переводов «Теория передачи электрических сигналов при наличии помех» под ред. Н. А. Железнова. Изд-во иностранной литературы, 1953. Полный перевод в сб. Шеннон К. Работы по теории информации и кибернетике, под ред. Р. Л. Добрушина и О. В. Лупанова. Изд-во иностранной литературы, 1963. 23. Шеннон К. Э. Связь при наличии шума. Пер. с англ. в сб. «Теория информации и ее приложения» под ред. А. А. Харкевича. Физматгиз, 1959. Также в сб. Шеннон К-, «Работы по теории информации и кибернетике», под ред. Р. Л. Добрушина и О. В. Лупанова. Изд-во иностранной литературы, 1963. 24. Van Trees H. L. A Generalized Bhattacharyya Bound. MIT, Internal Memo., IM—VT—6, January, 15, 1966. 25. Μ a 1 1 i η с k г о d t A. J., S о 1 1 e η b e r g e г Т. Е. Optimum-Pulse- Time Determination. Trans. IRE, 1954, v. PGIT—3, March., p. 151 —159. 26. Manasse R. Range and Velocity Accuracy from Radar Measurements. MIT Lincoln Laboratory, February 1955. 27. С к о л η и к М. И. Введение в технику радиолокационных систем. Пер. с англ. Изд-во «Мир», 1965. 28. S w е г 1 i n g P. Parameter Estimation Accuracy Formulas. Trans. IEEE, 1964, v. IT—10, № 1 (October), p. 302—313. 29. Μ ο h a j e r i M. Application of Bhattacharyya Bounds to Discrete Angle Modulation. MIT, 6.681 Project, Dept. of Elec. Engr., May 1966. 491
30. Γ ρ е н а н д е р У. Случайные процессы и статистические выводы. Пер. с англ., под ред. А. М. Яглома. Изд-во иностранной литературы, 1961. 31. Kelly Ε. J., Reed I. S., Root W. L. The Detection of Radar Echoes in Noise. Pt. I. J. SIAM, I960, v. 8, September, p. 309—341. 32. К a i 1 a t h T. The Detection of Known Signals in Colored Gaussian Noise. Proc. National Electronics Conf., 1965, ν 21 33. Курант Р., Гильберт Д. Методы математической физики. Гостех- издат, т. 1, 1933, т. 2, 1951. 34. L о w i t t W. V. Linear Integral Equations. McGraw-Hill, New York. 35. Zadeh L. Α., Ragazzini J. R. Optimum Filters for the Detection of Signals in Noise. Proc. IRE, 1952, v. 40, p. 1223. 36. Μ i 1 1 e r K. S., Zadeh L. A. Solution oi an Integral Equation Occu- ring in the Theories of Prediction and Detection. Trans. *IRE, 1956, v. IT—2, № 2 (June), p. 72—75. 37. Υ ο u 1 a D. The Solution of a Homogeneous Wiener—Hopf Integral Equation Occuring in the Expansion of Second-Order Stationary Random Functions. Trans. IRE, 1957, v. IT—3, p. 187. 38. S i e b e r t W. M. Elements of High-Powered Radar Design. Ed. by Friedman. J. and Smullin L. 39. Υ u d k i η Η. A Derivation of the Likelihood Ratio for Additive Colored Noise. Unpublished note, 1966. 40. Ρ a r ζ e η Ε. Statistical Inference on Time Series by Hubert Space Methods. Tech. Rept. №23, Appl. Math, and Stat. Lab., Stanford University, 1959. An Approach to Time Series Analysis. Ann. Math. Stat., 1961, v. 32, December, p. 951—990. 41. Η a j e k J. On a Simple Linear Model in Gaussian Processes. Trans. 2nd Prague Conf., Information Theory, I960, p. 185—197. 42. R о о t W. L. Stability in Signal Detection Problems. Stochastic Processes in Mathematical Physics and Engineering, Proc. Symposia Appl. Math., 1964, v. 16. 43. G a 1 t i e r i С A. On the Characterization of Continuous Gaussian Processes. Electronics Research Laboratory, University of California, Berkeley, Internal Tech. Memo., № M-I7, July 1963. 44. V i t e r b i A. J. Optimum Detection and Signal Selection for Partially Coherent Binary Communication. Trans. IEEE, 1965, v. IT—11, № 2 (April), p. 239—246. 45. К a d о t а Т. Т. Optimum Reception of Λί-ary Gaussian Signals in Gaussian Noise. Bell Syst. Tech. J., 1965, November, p. 2187—2197. 46. Μ a r с u m J. I. A Statistical Theory of Target Detection by Pulsed Radar. Math. Appendix, Report RM—753, Rand Corporation, July 1, 1948. Reprinted in Trans. IEEE, 1960, v. IT—6, № 2 (April), p. 59—267. 47. Миддлтон Д. Введение в статистическую теорию связи. Пер. с англ., под ред. Б. Р. Левина. Изд-во «Советское радио», т. 1, 1961, т. 2, 1962. 48. Μ а г с u m J. I. Table of Q-Functions. Rand Corporation Rpt. RM—339, January, I, 1950. 49. Di D ο η a t о A. R., J a r η a g i η Μ. P. A Method for Computing the Circular Coverage Function. Math. Сотр., 1962, v. 16, July, p. 347—355. 50. J о h a n s e η D. Ε. New Techniques for Machine Computation of the Q-func- tions, Truncated Normal Deviates, and Matrix Eigenvalues. Sylvania ARL, Waltham, Mass., Sci. Rept. № 2, July 1961. 51. S i 1 ν e r m a n R. Α., Β a I s e r M. Statistics of Electromagnetic Radiation Scattered by a Turbulent Medium. Phys. Rev., 1954, v. 96, p. 560—563. 52. В ul 1 i ng t ο η Κ-, Inkster W. J., Durkee A. L. Results of Propagation Tests at 505 Mc and 4090 Mc on Beyond-Horizon Paths. Proc. IRE, 1955, v. 43, p. 1306^-1316. 53. S w e r 1 i η g P. Probability of Detection for Fluctuating Targets. Trans. IRE, I960, v. IT-6, № 2 (April), p. 269—308; reprinted from Rand Corp. Report RM—1217, March 17, 1954. 54. Л э η и н г Дж . X., Б э τ τ и н Р. Г. Случайные процессы в задачах автоматического регулирования. Пер. с англ., под ред. В. С. Пугачева. Изд-во иностранной литературы, 1958. 492
55. Μ a s ο η s ο η Μ. Binary Transmission Through Noise and Fading. 1956 IRE National Conv. Record, Pt. 2, p. 69—82. 56. Τ u r i η G. L. Error Probabilities for Binary Symmetric Ideal Reception through Non—Selective Slow Fading and Noise. Proc. IRE, 1958, v. 46, p. 1603 1619. 57. Μ с N i с о 1 R. W. E. The Fading of Radio Waves on Medium and High Frequencies. Proc. IEE, 1949, v. 96, Pt. 3, p. 517—524. 58. В r e η η a n D. G., Philips M. L. Phase and Amplitude Variability in Medium-Frequency Ionospheric Transmission. Tech. Rep. 93, MIT, Lincoln Laboratory, September 16, 1957. 59. Ρ r i с e R. The Autocorrelogram of a Complete Carrier Wave Received over the Ionosphere at Oblique Incidence. Proc. IRE, 1957, v. 45, p. 879—880. 60. Rice S. O. Mathematical Analysis of Random Noise. Bell Syst. Tech. J., 1944, v. 23, p. 283—332; 1945, v. 24, p. 46—156. Сокр. пер. в сб. «Теория передачи электрических сигналов при наличии помех». Изд-во иностранной литературы, 1953, стр. 88. 61. Ρ г о a k i s J. G. Optimum Pulse Transmissions for Multipath Channels. Group Report 64—G—3, MIT Lincoln Lab., August 16, 1963. 62. D a r 1 i η g t ο η S. Linear Least-Squares Smoothing and Prediction, with Applications. Bell Syst. Tech. J., 1958, v. 37, p. 1221 —1294. 63. W о 1 f J. K. On the Detection and Estimation Problem for Multiple Non- stationary Random Processes. Ph. D. Thesis, Princeton University, Princeton, New Jersey, 1959. 64. Τ h о m a s J. В., Wong E. On the Statistical Theory of Optimum Demodulation. Trans. IRE, I960, v. IT—6, September, p. 420—425. 65. В r e η η a n D. G. On the Maximum Signal-to-Noise Ratio Realizable from Several Noisy Signals. Proc. IRE, 1955, v. 43, p. 1530. 66. Φ а и о Р. М. Передача информации. Статистическая теория связи. Пер. с англ., под ред. Р. Л. Добрушина. Изд-во «Мир», 1965. 67. А 1 g а ζ i V. R., L е г η е г R. Μ. Optimum Binary Detection in Non-Gaussian Noise. Trans. IEEE, 1966, v. IT—12, № 2, p. 269; also Lincoln Laboratory Preprint, DS-2138, MIT, 1965 68. S h e r m a η Η., R e i f f e η Β. An Optimum Demodulator for Poisson Processes: Photon Source Detectors. Proc. IEEE, 1963, v. 51, October, p. 1316— 1320. 69. В и т е р б и А. Дж. Принципы когерентной связи. Пер. с англ., под ред. Б. Р. Левина. Изд-во «Советское радио», 1970. 70. В а 1 а к г i s h η a η Α. V. A Contribution to the Sphere Packing Problem of Communication Theory. J. Math. Anal. Appl., 1961, v. 3, December, p. 485— 506. 71. L a n d a u H. J., Slepian D. On the Opfimality of the Regular Simplex Code. Bell. Syst. Tech. J., 72. A r t h u r s E., D у m H. On the Optimum Defection of Digital Signals in the Presence of White Gaussian Noise — a Geometric Interpretation and a Study of Three Basic Data Transmission Systems. Trans. IRE, 1962, v. CS—10, December, p. 336—372. 73. С a h η С. R. Performance of Digital Phase-Modulation Systems. Trans. IRE, - 1959, v. CS-7, May, p. 3—6. dhJsj τ: t) 74 Collins L. An Expression for —1L-^ , Detection and Estimation Theo- y Group Internal Memo., IM-LDC-6, MIT. April 1966. 75. Er d e 1 у i A. et al., Higher Transcendental Functions. McGraw-Hill, New York, 1954. 76. S t e i η S. Unified Analysis of Certain Coherent and Non-Coherent Binary Communication Systems. Trans. IEEE, 1964, v. IT—10, January, p. 43—51, 77. Η e 1 s t г о m С W. The Resolution of Signals in White Gaussian Noisee Proc. IRE, 1955, v. 43, September, p. 1111—1118. 78. Τ u r i η G. L. The Asymptotic Behavior of Ideal Λί-ary Systems. Procc IRE, 1959, v. 47 (correspondence), p. 93, 94. 493
79. С о 1 1 i n s L. An Asymptotic Expression for the Error Probability for Signals with Random Phase. Detection and Estimation Theory Group Internal Nemo., IM-LDC—20, MIT, February 3, 1967. 80. Ρ i e г с e J. N. Theoretical Diversity Improvement in Frequency-Shift Keying. Proc. IRE, 1958, v. 46, May, p. 903—910. 81. D о e 1 ζ Μ., Η e a 1 d E., Martin D. Binary Data Transmission Techniques for Linear Systems. Proc. IRE, 1957, v. 45, May, p. 656—661. 82. В u s s g a n g J. J., L e i t e r M. Error Rate Approximation for Differential Phase-Shift Keying. Trans. IEEE, 1964, v. CS—12, March, p. 18—27. 83. Leiter M., Proakis J. The Equivalence of Two Test Statistics for an Optimum Differential Phase-Shift Keying Receiver. Trans. IEEE, 1964, v. COM^12, № 4 (December), p. 209—210. 84. Η a h η P. Theoretical Diversity Improvement in Multiple FSK. Trans. IRE, 1962, v. CS— 10, June, p. 177—184. 85. Hancock J. C, Lindsey W. С Optimum Performance of Self— Adaptive Systems Operating Through a Rayleigh-Fading Medium. Trans. IEEE, 1963, v. CS—11, December, p. 443—453. 86. Jacobs Irwin. Probability-of-Error Bounds for Binary Transmission on the Slowly Fading Rician Channel. Trans. IEEE, 1966, v. IT-12, № 4 (October), p. 431—441. 87. D a r 1 i η g t ο η S. Demodulation of Wideband, Low-Power FM Signals. Bell Syst. Tech. J., 1964, v. 43, № 1, Pt. 2, p. 339—374. 88. А к i m a H. Theoretical Studies on Signal-to-Noise Characteristics of an FM System. Trans. IEEE, 1963, v. SET—9, p. 101 — 108. 89. L i η d s e у W. С Error Probabilities for Incoherent Diversity Reception. Trans. IEEE, 1965, v. IT—11, №4 (October), p. 491—499. 90. S u s s m a n S. M. Simplified Relations for Bit and Character Error Probabilities for M-ary Transmission over Rayleigh Fading Channels. Trans. IEEE, 1964, v. COM-12, № 4 (December). 91. С о 1 1 i η s L. Realizable Likelihood Function Computers for Known Signals in Colored Noise. Detection and Estimation Theory Group Internal Memo., IM—LDC—7, MIT. April 1966. 92. Schwartz Μ., Β e η η e t t W. R., Stein S. Communication Systems and Techniques. McGraw-Hill, New York, 1966.
5. Оценка непрерывных сигналов 5.1. Введение До сих пор рассматривались задачи обнаружения и оценки параметров сигналов. Перейдем к рассмотрению задачи оценки непрерывного сигнала. Точно так же, как в задаче оценки параметра, целесообразно обсудить задачи оценки неслучайных сигналов и сигналов, являющихся выборочными функциями случайного процесса. Мы увидим, что процедура оценки для неслучайных сигналов является простой задачей. Напротив, когда сигнал представляет собой выборочную функцию случайного процесса, несмотря на простоту формулировки, решение задачи оказывается более сложным. Прежде чем перейти к решению задачи оценки, целесообразно рассмотреть некоторые физические проблемы, связанные с оценкой непрерывных колебаний. Начнем рассмотрение со случайного сигнала. Одним из важных случаев, когда перед нами возникает задача оценки случайного сигнала, являются системы аналоговой модуляции. В простейшем случае сообщение a(t) подается на вход безынерционного модулятора, выходом которого является сигнал s(t, a(t))f который затем передается, как показано на рис. 5.1. Передаваемый сигнал является Источник аналоговых I сообщений aft) \Ншлинеиныи. модулятор fej памяти £ r(t) s(t,a(it Приемник \щ Рис. 5.1. Непрерывная система модуляции без памяти. детерминированным в том смысле, что данная выборочная функция a(t) порождает однозначную выходную функцию s(/, α(ή). Приведем несколько распространенных примеров. s (/, а (/)) = ]/2Рa(t) sincoc/. (1) Эта запись соответствует двухполосной амплитудной модуляции с подавленной несущей (ДБП-АМ-ПН) s(t9 a{t))=Y2P [l +ma{t)] sincoci. (2) Выражение (2) соответствует обычной ОБП-АМ с остатком компоненты несущей. s{t,a(0) = Y2Psin [ω,/ + βα (t)]. (3) Выражение (3) соответствует случаю фазовой модуляции (ФМ). 495
На передаваемый сигнал налагается выборочная функция гауссова шумового процесса с нулевым средним, который независим от процесса сообщения. Шум полностью характеризуется ковариационной функцией Kn(ty и). Таким образом, для системы, показанной на рис. 5.1, принимаемый сигнал можно записать в виде г (Ζ) =s (/, a(t)) +n (t), 7\<ί <7> (4) Рассмотренная простейшая система не позволяет адекватно описать многие представляющие интерес практические задачи. Прежде всего необходимо снять требование безынерционное™ модулятора. Модуляционная система с памятью показана на рис. 5.2. Здесь h(t, и) отображает импульсную характеристику линейного фильтра, параметры которого необязательно постоянны во времени. Приведем примеры. Аналоговые источник a(t) Линейный, фильтр ' x(t) —а* \ИелинейныиЛ модулятору \5ез памяти] *(*,*(*)) Рис. 5.2. Система модуляции с памятью. 1. Линейная система — интегратор, а безынерционное устройство — фазовый модулятор. В этом случае передаваемый сигнал можно записать s(t,x(t))=/2Psin I(oci + § a(u)du (5) Эта запись соответствует частотной модуляции (ЧМ). 2. Линейная система — реализуемая схема с постоянными во времени параметрами, а безынерционное звено — фазовый модулятор. Передаваемый сигнал имеет вид s(f, x(t))=V2Psin \(oct + l h(t — u)a(u)du\ (6) Это угловая модуляция с предыскажениями. Рис. 5.1 и 5.2. характеризуют широкий класс систем аналоговой модуляции, которые мы рассмотрим несколько подробнее. Интересующее нас колебание a(t) будем называть сообщением. Сообщение может исходить от различных источников. В системах ЧМ вещания сообщением может быть музыка или речь. В спутниковой телеметрической системе оно может соответствовать аналоговой информации, поступающей от датчика (например, температуры или высоты). Задача оценки сигналов встречается в ряде других областей. Исключив модулятор в схеме рис. 5.1, получим r(t)=a(t)+n(t), T^t^Tf. (7) 496
Если a(t) отображает положение некоторого объекта, за которым нужно проследить в присутствии шумов измерения, то мы·имеем простейшую форму задачи контроля и управления. Под эту модель подходят также много более сложных систем. Три из них изображены на рис. 5.3. На рис. 5.3, а представлена система ЧМ-ЧМ. Система этого типа обычно используется в тех случаях, когда необходимо передавать одновременно несколько сообщений. Указанными сообщениями модулируются соответствующие поднесу- t t V2sin(<oft + JTa(u)du) tfzPsintyt +fT z(u)du) 1 ^ \ ι | . i Частотная модуляция \ a) Частотная модуляция *(t) Частотная модуляция z(t) h(t,u) n(t) 4 Избестный линейный, канал с изменяющимися во времени параметрами V sin(uct- a(t) г-е-— ■Н8)—Н*<*>1 r>(t) f θ-τ (t) Неизвестный канал В) Рис. 5.3. Типичные системы: а—система ЧМ—ЧМ; б —передача по каналу с изменяющимися во времени параметрами; в—измерение параметров канала. щие, имеющие различные частоты. Модулированные поднесущие затем суммируются в групповой сигнал, которым модулируется основная несущая. На рис. 5.3, а показаны операции, производимые в случае одного сообщения. На рис. 5.3, б изображена система частотной модуляции, передающая сигналы по линейному каналу с известными изменяющимися во времени параметрами. На рис. 5.3, в канал имеет импульсную характеристику, которая зависит от случайного процесса. α(ή. Вход является детерминированным сигналом. Требуется оценить импульсную реакцию (характеристику) канала. Измерительные задачи такого рода часто возникают в цифровых системах связи. Простой пример такого типа встретился нам при изучении релеевского канала в § 4.4. Другие примеры будут рассмотрены во второй и третьей главах второго тома. Заметим, что процесс в канале представляет собой «сообщение» в данном классе задач. 497
Мы видим, что все описанные Задачи соответствует первому уровню той иерархии, которая была намечена в гл. 1. Это задачи, которые характеризовались нами как «известный сигнал на фоне шума». Весьма важно понять смысл этого описания в связи с оценкой непрерывных сигналов. Если бы a(t) было известно, то и s(t, a(t)) было бы известно. Другими словами, если не учитывать аддитивного шума, то отображение a(t) в r(t) является полностью детерминированным. Для дальнейшего изложения целесообразно считать a(f) выборочной функцией нормального случайного процесса. Во многих случаях такое допущение является справедливым. В некоторых же случаях, например в случае музыки или речи, оно несправедливо. На основе экспериментальных данных будет показано, что если при проектировании системы мы будем исходить из допущения нормальности входного процесса, то система будет хорошо работать во многих случаях, когда процесс на входе является негауссовым. Материал данной главы организован следующим образом. В § 5.2 выведены уравнения, определяющие оптимальную оценку a(t). В § 5.3 установлены границы среднеквадратической ошибки оценки. В § 5.4 полученные ранее результаты распространены на векторные сообщения и векторные принимаемые сигналы. В § 5.5 изложено решение задачи оценки неслучайного сигнала. Цель настоящей главы — вывод необходимых уравнений и исследование некоторых из их свойств, которые можно установить, не прибегая к решению уравнений. Гораздо более полезными конечными результатами являются решения указанных уравнений и вытекающие из них структуры приемников. В гл. 6 задача линейной модуляции будет рассмотрена подробно. Во второй главе второй части будет также изложена проблема нелинейной модуляции. 5.2. Вывод уравнений оценки В данном параграфе требуется решить задачу оценки для системы, показанной на рис. 5.1. Общая категория интересующих нас систем определяется тем свойством, что отображение из a(t) в s(t, α(ή) является безынерционным преобразованием. Принимаемый сигнал имеет вид r(t)-^s{t,a(t))+n(t), 7\</<7у (8) Под безынерционным преобразованием понимается то, что передаваемый в некоторый момент времени t0 сигнал зависит только от a(t)Q и не зависит от прошлого течения процесса a(t). 5.2.1. Безынерционные системы модуляции Сделаем следующие допущения: 1. Сообщение а(0 и помеха η(ή — выборочные функции независимых непрерывных нормальных процессов с нулевыми средними и ковариационными функциями Ka(t, и) и Kn(t> и) соответственно. 498
2. Сигнал s(t, ά(ή) имеет производную по α(ή. Например, для ДБП- АМ-ПН сигнала (1) производная равна ds(t,a{f)) =V2psin f (9) da(t) f c W Разумеется, если преобразование s(t, α(ή) — линейное, то производная сигнала зависеть от a(t) уже не будет. Такие методы модуляции называются линейными. Для ФМ: а'Ц(0) = У2Р β cos (сос1 + βα (ί)). (10) Производная является функцией сообщения a(t). Это пример нелинейного метода модуляции. Указанные представления полностью аналогичны методам линейной и нелинейной модуляции в задаче оценки параметров сигнала. Как и в случае оценки параметра сигнала, мы выбираем подходящий критерий. Можно пользоваться одним из двух критериев — по минимуму среднеквадратической ошибки или по максимуму апостериорной вероятности. Оба эти критерия просты по своей идее и приводят к одинаковым результатам для линейных методов модуляции. В случае нелинейных методов модуляции эти критерии имеют свои преимущества и недостатки. При использовании критерия минимума среднеквадратической ошибки, если апостериорная плотность вероятности сообщения a(t) на интервале (Ти Tf) является квадратичной формой нормального типа, найти явное выражение для условного среднего затруднительно. С другой стороны, если α(ί) представляется нами как компонента векторного марковского процесса, то, как увидим позже, можно отыскать дифференциальное уравнение для условного среднего, которое формально дает явное решение рассматриваемой задачи. Однако такой подход к решению задачи требует дополнительных исходных сведений и аппарата, которые еще не изложены, и поэтому мы не обращаемся к нему до гл. 2 второго тома. В случае критерия максимума, апостериорной вероятности мы приходим к интегральному уравнению, решением которого является оценка по максимуму апостериорной вероятности. Это уравнение позволяет дать простую физическую интерпретацию приемника. Оценка по максимуму апостериорной вероятности, как будет показано, является асимптотически эффективной. Поскольку постановка вопроса при оценке по максимуму апостериорной вероятности более тесно связана с предшествующим изложением, то в дальнейшем мы будем придерживаться1* этого критерия. Чтобы облегчить решение задачи оценки непрерывного сигнала, вспомним из гл. 4 некоторые полезные сведения об оценке параметров. В (4.464) и (4.465) были получены интегральные уравнения, которые определяют оптимальные оценки ряда параметров. Повторим этот Х) После того как мы изучим данную проблему подробно, станет ясно, что в рассмотренных нами задачах оценки по минимуму среднеквадратической ошибки и по максимуму апостериорной вероятности совпадают. 499
результат. Если аъ а2, ..., αχ — независимые нормальные случайные величины с нулевыми средними, которые мы представляем вектором а, то оценки at по максимуму апостериорной вероятности даются решением системы уравнений Tf S tPas^H ^[r{z)-g{z)]dz9 ί = 1, 2 /С. (И) J OAi |A = a где σ»,Δσ»(α,), (12) Tf rg(z)^Qn(z,u)r(u)du, Т,<г<Ту, (13)·) rf £(z)*$Q„ (*.«)«(". a)d«, 7f<z<7,, (14) а принятое колебание имеет вид r(t)=s(t,A)+n(t), Tt^t^Tf. (15) Теперь применим полученный результат к решению нашей задачи. Из материала гл. 3 известно, что сообщение можно представить в виде ортонормированного разложения к 2 a(0=l.i.m. 2βι4>ί(0. Tt^t^Tf, (16) где ·ψί (0 — решения интегрального уравнения Tf \>t'bV)=lKaV,u)%(u)du, 7\<г<7> (17) (18) (19) (20) х> Точно так же, как при рассмотрении случая коррелированной помехи в гл. 4, необходимо осторожно обращаться с концевыми точками. В гл. 5 концевые точки считаются включенными в интервал. 500 а аг и τι Tf af= $α(ί)Ψ,(ί)Λ, —независимые нормальные случайные величины: £(а,)=0 E(aiai) = pibll.
Рассмотрим теперь подкласс процессов, которые могут быть представлены первыми К членами ортонормированного разложения. Таким образом, к ^(0=.Σα.ψ.(0, Γ.<ί<ΓΓ (21) Наша задача заключается в том, чтобы показать, в какой мере задача оценки aK{t) в (21) тождественна с уже решенной задачей оценки множества К независимых параметров. Полагая затем К ->■ <*>', по- Генератор образцов сигналоб Модулятор \s(t,aK(t))- О,* Система умножителей на ортогональные функции и сумматор (тдждестбенно части д~мк-схемы спраба от uimpuxodou линии) s(t,A) S) Рис. 5.4. Эквивалентность представления сигналов посредством функций времени и посредством параметров. лучим требуемый результат. Простой способ убедиться в том, что указанные задачи идентичны, иллюстрируется рис. 5.4, а. Если иметь в виду только модулятор, то передаваемый сигнал логично записать в виде :(Μκ(0)-δ(/,2^.ί|).(/))( (22) Группируя элементы, как показано на рис. 5.4, б, можно обоснованно записать выход как s{t, А). Совершенно ясно, что обе формы записи 501
являются эквивалентными: s(/,A)=s(f, J) Λ,ιΜο) (23) Определим оценку по максимуму апостериорной вероятности как к ак it) = Σ аг ψΓ (0, Γ, < ί < Γ,. (24) г=1 Видно, что ακ{ί) является интервальной оценкой. Другими словами, мы оцениваем сигнал αχ(ή на всем интервале Гг-^ ί ^ Τ ρ а не его значение в какой-либо момент времени в пределах указанного интервала. Для отыскания оценок коэффициентов можно использовать (11). Из (22) и (23) следует, что ds (ζ, A) ds (ζ, ак (z)) ds (ζ, ак (ζ)) дак (ζ) дЛг дЛг да^ (ζ) ds (ζ, ακ (ζ)) дЛг \ds(z,aK(z)) I [ аак(г) J Ψγ (^), δακ (г) где последнее равенство вытекает из (21). Из (11) имеем Tf - ds (ζ, ακ (ζ)) 7\· дак (ζ) ακ(ζ) = ακ(ζ) Χ Хг|)г(г)[^(г)-^(г)]^г, г = 1, 2, ...,/С. Подставляя (26) в (24), получим as (г, ак(г)) мо = 2^(/)^ί аак (2) X ακ(ζ) = ακ(ζ) X^r(z)[rg(z) — g(z)]dz или ds (ζ, ακ (г)) ^ as ιζ, α (г) а^ (ζ) = ακ(ζ) X (25) (26) (27) X Σ |*,4>rW*r(«) 7=1 [Mz)-g(z)3dz. (28) При такой форме записи теперь легко положить К-+оо. Согласно теореме Мерсера (гл. 3) имеем Jim Σ IV Ψγ (0 Ы*) =*«('.*)· /С-> оо г= 1 (29) 502
Теперь введем в рассмотрение a(t)=\A.m.aK(i), 7\<ί<7\. (30) Результирующее уравнение имеет вид Tf а (0 = Г д${Z: "(г)) КV, г) [r8(ζ)-g(ζ)] dz, T^t^Tf, (31)» 1 да (г) i где τί rg (*) = J Qn (г, w) r (u) du, Tx < г < Г, (32) 5rW = SQn(2,M)s(tt,a(a))da, 7\.<г<7у (33) Уравнения (31) — (33) определяют оценку сигнала a(t) по максимуму апостериорной вероятности. Эти уравнения и их обобщения образуют основу для нашего дальнейшего изучения теории аналоговой модуляции. В частном случае, когда аддитивный шум является белым, можно получить гораздо более простой результат. Если Kn(t,u)=l%-6(t-u)9 (34) то Qn(t,u)=-i-6(t-u). (35) Подставив (35) в (32) и (33), получим rg(z)=^-r(z) (36) И g(z) = -l-s(zfa(z)). (37) /v0 Подставив (36) и (37) в (31), имеем Tf a(t)=^\Ka(t9z)^^^-[r(z)-s{z9a(z))} dz, T^t^Tf. (38) Wo J da{z) X) Результаты (31)—(33) впервые были получены в [I]. Для упрощения записи нами сделана подстановка ds(z,a(z)) ds(z,a(z)) да (ζ) — да (ζ) 503 а (ζ)= а (г)
Теперь оценка определяется одним нелинейным интегральным уравнением. В случае оценки параметра мы видели, что было полезным интерпретировать интегральное уравнение, определяющее собой оценку по максимуму апостериорной вероятности, некоторой блок-схемой. Такое истолкование оказывается еще более целесообразным в данном случае. В качестве иллюстрации рассмотрим два простых примера. Пример 1. Предположим, .что Т/=— со, Г/ = оо, No (39) (40) (41) В этом случае пригодно (38)1). В результате подстановки в (38), имеем оо а (0 =-£- f Ка (t-z) ( а*(г;а(г)) [г (г) -в (г, а (г))) } dz, (42) #о J ( да (г) ) ОО — оо < tf < оо. Нетрудно усмотреть, что это просто свертка выражения, заключенного в фигурные скобки, при помощи линейного фильтра, импульсная функция которого есть /СаОО· Поэтому мы можем наглядно представить себе (42) в виде блок-схемы рис. 5.5. Заметим, что указанный линейный фильтр является нереализуемым. r(tH φΗΐΗχ) Усиление *ам Линейный нереализуемый фильтр\ ds(t£(t)) dl(t) s(t.a(t)) Генератор сигналов a(t) т Рис. 5.5. Блок-схема -нереализуемой системы для случая белого шума. Следует подчеркнуть, что приведенная блок-схема—всего лишь наглядное пособие в идейном осмысливании (42). Она ни в коей мере не может служить практическим решением (в представленном виде) нелинейного интегрального уравнения, поскольку нельзя построить нереализуемый фильтр. Одна из проблем, которой мы посвятим наше внимание в последующих главах, — это отыскание практической аппроксимации упомянутой блок-схемы. г) Для этого случая нам следовало бы вывести интегральное уравнение путем использования спектрального представления, основанного на интегральном преобразовании рассматриваемого процесса, вместо разложения Каруне- на — Лоэва. Модификации вывода весьма просты, а результат тот же самый. Поэтому мы переносим этот вывод в «задачи» (см. задачу 5.2.6). 504
Вторым простым примером может служить случай небелого шума. Пример 2. Предположим, что Г/=—оо, Г/ = оо, (43) KaV, u) = Ka(t—u), (44) Knit. u) = Kn(t-u). (45) Из (43) и (45) следует, что QnV, u) = Qn(t—u). (46) Как и в примере 1, можно интерпретировать интегралы (31), (32) и (33) как блок-схему, показанную на рис. 5.6. Здесь Qn(%) — нереализуемый фильтр с постоянными во времени параметрами. *(t) ♦ Г\ ~^\ I LV-J an(t) Н&-А I : ΚΛ(τ) ds(te(t)) dd(t) "Ψ,ά Ί*)) Генератор сигналов , aft) &(t) l*| V J Рис. 5.6. Блок-схема нереализуемой системы для случая небелого шума. Прежде чем перейти к дальнейшему изложению, вспомним, что мы сделали предположение о том, что модулятор является безынерционным звеном. Это допущение чрезмерно ограничивающее. Как указывалось в § 5.1, это допущение исключает такие распространенные методы модуляции, как, например, ЧМ. Пока еще вывод свеж в нашей памяти, его можно видоизменить с тем, чтобы снять данное ограничение. 5.2.2. Системы модуляции с памятью*> Система модуляции более общего типа показана на рис. 5.7. Линейная система описывается детерминированной импульсной характеристикой Щ, и). Она может быть изменяющейся во времени или нереализуемой. Таким образом, можно записать Tf * (f) = $ λ (t9 и) а (и) du, Т% < / < Г,. (47) х) Разработка данного вопроса с охватом случая ЧМ принадлежит Лоуто- ну [2, 31. Распространение на произвольные линейные операции сделано Ван Трисом [41. Аналогичные результаты были независимо получены Раухом в двух неопубликованных работах [5, 6]. 505
Модулятор выполняет безынерционную операцию над χ(ή: s(t9x(t))=sltt lh(t9u)a(u)du). (48) Например, для ЧМ t x(t)=df \a(u)du> (49) Ti где df — частотная девиация. Передаваемый сигнал имеет вид s (t9 χ (t)) = ]/"2Psin I ωβί + df jj a (u)du . (50) *(t) h(t,u) x(t\ Нелинейный модулятор fee памяти s(t,x(t)) Рис.* 5.7. Модулятор без памяти. Просматривая вновь наш вывод, нетрудно заметить, что справедливы все рассуждения до того момента, где требуется брать частную производную по АТ в выражении (25). Возобновляя вывод, имеем ds (г, A) ds (ζ, xK (z)) ds (ζ, хк (ζ)) дхк (ζ) дЛг дЛг дхк (ζ) дЛг (51) но дхк (ζ) дЛг — J h(z,y)aK(y)dy = Tf = ^ § h(z,y) 2АгЪ(У)*У= § Ь(*> y)*r(y)dy. (52) Введем обозначение для выхода линейной операции, когда входом является a(t): xK(t)= \h(tty)aK(y)dy. (53) т* Следует заметить, что χχ(ή не определяется нами в качестве оценки χκ(ί) по максимуму апостериорной вероятности. В свете наших результатов для конечного множества параметров мы подозреваем, что она 506
Является таковой. Однако в данном контексте это просто функция, определяемая (53). Из (11) имеем Tf ^ /Tf \ ar=^rf dS(Z:XK(Z)) ( <\h(z,y)%{y)dy\{rg(z)-g(z))dz. (54) Как и ранее, aK(t)= Σ АгФг('). (55) а из (54) следует, что ds{z,~xK{z)) т. ^М2) x[rg(z)—g(z)]dz. (56) Полагая K-+oot получим 7f a (t) = f f dt/ d* *k*<«>> Л (ζ, у) Κα (f, у) [г, (*) -ί (*)]> 7,<*<7>, (57) где /^(г) и g(z) были определены (32) и (33) [достаточно заменить а(и) на^ф*)]. Уравнение (57) по форме аналогично уравнению (31), соответствующему системе без памяти. При желании его можно сделать точно таким же, выполнив интегрирование по у в (57): Tf \h(г, y)Ka(t, У)dyΝτα{ζ, f)% (58) так что Ч ( ~ \ a(t)= (dz d8^*to> ha(z,t)(rg(z)-g(z))dz, Tt^t^Tf. (59) i dx (z) Блок-схема для представления указанного уравнения тождественна по структуре блок-схеме системы без памяти, приведенной на рис. 5.8. Это сходство в структуре окажется весьма полезным при дальнейшем изучении систем модуляции. 507
Йнтереснук) интерпретацию фильтра ha(z, ή можно сделать дли случая, когда Tt = —оо, Tf = 00, h(zt у) от времени не зависит, а a(t) — стационарный случайный процесс. При этих условиях М*,0= j h{z-y)Ka{t-y)dy = ha{z-t). (60) Нетрудно видеть, что ha(z — /) соответствует двум последовательно включенным фильтрам, как показано на рис. 5.9. Первый фильтр имеет r(t)+ /j "\ ρ- rgw ■*\чц(*.и)Г*0' s(t,S(t ■$(τ> 7\ J A /f ι/\ 9 Τ'"Ί < ds(t,x(t)) dx(t) )) Генератор сигналов _ "M Щ ■^— fi(ttU) f?m Рис. 5.8. Блок-схема модуляционной системы без памяти. импульсную реакцию, соответствующую реакции фильтра в модуляторе, обращенной во времени. Это обстоятельство знакомо нам из теории согласованных фильтров. Второй фильтр соответствует корреляционной функции. ЛГ-Г) *«Ю Г^^^Н W h(-r) Рис. 5.9. Интерпретация фильтра. Последним вопросом, представляющим интерес с точки зрения систем модуляции, обладающих памятью, является вопрос о совпадении x(t) и χ(ή, τ. е. x(t)=x(t)-> (61) Другими словами, совпадает ли линейная операция над оценкой по максимуму апостериорной вероятности непрерывного случайного процесса с оценкой по максимуму апостериорной вероятности выхода ли- 508
нейной операции? Докажем, что (61) справедливо Дли только что рассмотренного случая. Из (53) имеем Tf x(x)=lh(T,t)a(t)dt. (62) Подставив (57) в (62), получим Ь ί дх (ζ) л rTf X ^h(xit)h(ziy)Ka(t,y)dtdy Ti dz. (63) Теперь нам необходимо записать интегральное уравнение, определяющее χ(τ), и сравнить его с правой частью (63). Требуемое уравнение тождественно (31), если в последнем a(f) заменить на x(f). Таким образом, Ь х (τ) = f Щ№ KA%i z) [rg(z)-g(z)] dz. (64) ft дх(г) Нетрудно видеть, что *(τ)=.£(τ), если I) h(T,t)h(zty)Ka(t,y)dtdy = Kx(*>z)> Tt^xtz^Tf9 (65) HO Κχ(τ>ζ)±Ε[χ(τ)χ(ζ)] = Τ; Τ4 = E I h(xtt)a(t)dt I h(z,y)a(y)dy\ = Tf = g h (τ, t) h (z, у) Ка (f, у) dt dy, Tt < τ, ζ < Tt% (66) Ti что и является требуемым результатом. Итак, операции интервальной оценки по максимуму апостериорной вероятности и линейной фильтрации коммутативны. Такой же вывод мы могли бы сделать из аналогичных результатов гл. 4 для оценки параметра. Теперь можно перейти к рассмотрению характеристик оценок сигналов по максимуму апостериорной вероятности и структуры оптимальных алгоритмов оценки. Наиболее существенные результаты этого параграфа сводятся к (31), (38) и (57). Вывод этих уравнений при помощи вариационного метода сделан в задаче 5.2.1. 509
5.3. Нижняя граница среДнеквадратической ошибки оценки0 При рассмотрении вопросов оценки конечных множеств случайных величин было установлено, что чрезвычайно полезным результатом является выражение для нижней границы среднеквадратиче- ской ошибки, которую может иметь любая оценка. Впоследствии будет показано, что при оценке сигналов подобное выражение столь же полезно. В данном параграфе мы выведем выражение для нижней границы среднеквадратической ошибки, которую может иметь любая оценка случайного процесса. Прежде всего определим сигнал ошибки aB(t)=a(t) — a(t). (67) Tf Tf ei = ^V S ia(')-£(<)]2 dt = -f $ at (t)dt, (68) где T = Tf — 7Y Подстрочным индексом / отмечено то обстоятельство, что мы производим оценку на интервале. Теперь в[ — случайная величина. Нас интересует ее математическое ожидание: ITf оо оо λ $ Σ (α,-£,Ηι(0 Σ (aj-aj)ypj(t)dt\. (69) rt i = ι /= ι J Учитывая ортогональность собственных функций, имеем ЬТ= Σ Ε(ai-а,)2. (70) Нам необходимо найти нижнюю границу суммы, стоящей в правой час- ти (70). Рассмотрим сначала сумму 2 E(at — α^)2, а затем положим /С-^оо. Задача отыскания границы среднеквадратической ошибки при оценке К случайных величин знакома нам по гл. 4. Из материалов гл. 4 известно, что прежде всего необходимо написать информационную матрицу J^, где 3t = Jd + Jp, (71а) °Ч ~[ dAidAj J V ' Г,Чпра(Л)1 ·' [ dAidAj J V ; *> Этот параграф базируется на результатах работы Ван Триса [7]. 510
После отыскания матрицы Зт мы производим ее обращение с тем, чтобы получить Jf1-. Далее при изложении этой главы мы все время будем иметь дело с Jy. Поэтому для удобства подстрочный индекс «Г» опустим. Выражение для In Л(А) представляет собой векторный аналог выражения (4.217) Tf 1пЛ(А)= [{\r(t)—^s(t,k)\Qn(ttu)s(utK)dtdu (72а) или, если выразить через ακ(ί), Tf In A (aK(t)) = j ^[r(t)-js(t, aK(t))^Qn(tt u)s{u, aK(u)) dtdu. (726) Ti Из (19) и (20) следует к In Pa (A) = 2 [_^-γ1η(2π)]· (72Β) Складывая (726) и (72в) и дифференцируя сумму по At, получим а[1пр.(Л) + 1пА(ак(/))] dAt ds (t, aK (<)) ру д"К W J —s(«, aK(u))] du. (72r) Дифференцируя по А} и включая знаки минус, имеем Τ Sij п С С < . ds (t, aK (t)\ ds (и, ак(и)\ Ju= -А+Я \\dtdu^(t)^(u) V ?л Q»^' ") V f I + μί J J da^ (0 дак (и) (73) + члены с нулевым математическим ожиданием. Из (73) видно, что эффективная оценка будет существовать только тогда, когда модуляция линейна (см. стр. 94). Для интерпретации первого члена вспомним, что оо *«(*.«)= Σ μ* iMOΜ"). 7\</, «<7> (74) Так как мы используем только К членов, то определим к Как (f, и) Δ Σ μ, Ψ, (ί) ψ, (α), Tf < tt a < 7> (75) 5U Γ/ . τ4 --М**«^Ч$гЧ«-<'· ">['«-
Форма записи первого члена в (73) предполагает задание к QaK (Л и) = 2 — Ψι (0 Φι ("). 7!ι < U и < Г,. (76) к ί-ι μι Заметим, что И на этот раз QOJ<(/, «) оказывается обратным ядром, но поскольку сообщение α(ή не содержит компоненты белого шума, предела суммы в (76) при К ->■ оо вообще не будет существовать. Поэтому необходимо исключить QaK(t, и) из нашего решения, прежде чем полагать К-*-оо. Первый член можно записать в виде δ Tf —= 11 Q*k ('»") *« ο *j («) * d"> (78> И-i г. г так что если определить /«Л.>»<Ъя<*.«>+*[-^^<Ъ<». Μ)ΐΐ1ϊι^2)1, ,79) К L 0ακ(9 &!*(«) J то можно записать элементы матрицы J в виде Tf Jli=\\jK(t,u)^l{t)^j{u)dtdu, ί,/ = 1, 2 К. (80) Теперь найдем обратную матрицу J-1. Можно показать (см. задачу 5.3.6), что /v = S S J*' С» ") *» (0 *i (") * rf"· (81) где функция J^{t, и) удовлетворяет уравнению \ JKl(t,u)JK(u,z)du= 2 Ψι(0Ψΐ(ζ) Г. *=Ι (82) (Напомним, что надстрочными индексами ц обозначаются элементы матрицы J-1.) Теперь необходимо придать (82) более удобный вид. Если обозначить производную от s(t, aK(t)) no aK(t) через d8(t,aK(t))9 то ds (t, aK (t)) ds (u9 ак(и)) дак (0 дак (и) = £ [de(t, aK{t))ds{u, aK(u))\ *RdsK(t, и). 51? (83a)
Аналогично [ da{t) да {и) J =Е [ds {U a (t)) ds {и, а (и))] Δ Rd§ (t, и). (836) Поэтому J к (и, ζ) Δ QaK (и,г)+ Rds к (и, ζ) Qn (и, г). (84) Подставляя (84) в (82), ущюжая на К* (г, х), интегрируя по г и А полагая /С->оо, получим следующее интегральное уравнение для ^ (t9 χ): TJ TJ J-l(ttx)+ ) du ) dzJ-l(t,u)Rds(u,z)Qn(u,z)Ka(z>x) = Ti Ti ~Ka(t,x), T,<i,*<7y (85) Из (2.292) известно, что диагональные элементы J~l являются нижними границами среднеквадратических ошибок. Поэтому -Е[(*1 — "i)2]>Jil- (86а) Используя (81) в (86а), а результат—в (70), имеем к Tf П/>Нт Σ SS^!C. ")Ψι(0Φι(")ΛΛχ (866) или, используя (3.128), Tf Ь>±1 J-l(t,t)dt. (87) Следовательно, для того чтобы найти нижнюю границу, необходимо решить (85) для У-1^, х) и оценить ее поведение. По аналогии с классическим случаем J(t, x) называют информационным ядром. Теперь можно интерпретировать результат (85). Сначала рассмот= рим случай, когда присутствует только компонента белого шума, так что QnV, *) = -%-δ(t-u). (88) Тогда (85) принимает вид ? J-1 (t, x)+ J duj- J-' (t, и) Rds (и, и) Ка (и, χ) Ti о = Ka(t,x), Τ,<ί, *<Ty. (89) 513
Все последующие вычисления значительно упрощаются, если Rds(t, ή — величина постоянная. Достаточное, но не необходимое условие ее постоянства заключается в том, чтобы функция d$(t, α(ή) была выборочной функцией стационарного процесса. Мы часто встречаемся с задачами оценки, когда можно аппроксимировать Rds(t, t) постоянной величиной, не требуя стационарности ds(ty α(ή). Такая ситуация возникает, например, когда передаваемый сигнал является полосовым колебанием, спектр которого симметричен относительно несущей частоты ωс, например, при фазовой модуляции (ФМ): s(f, a(t))=V2Psinl<uct+fla(t)]. (90) Тогда <*.(*, α (*)) = as(\fl(0) =ν2Ρβ€05[ω^ + βα(θ] (91) σα (τ) И Rds(t,u)=pPEa{cos[<uc(t-u)+$a(t)-$a(u)] + + cos l<ue(t + u)+ βα (0 + βα (и)]}. (92) Полагая u — t, имеем Rds(t, t)=pP(\+Ea {cos[2<*ct+2V>a(t)]}). (93) Предполагается, что содержащиеся в a(t) частоты низки по сравнению с(ос. Чтобы получить приближенное выражение, зафиксируем t в (89). Тогда (89) можно представить как линейную систему с изменяющимися во времени параметрами, показанную на рис. 5.10. Входом ее служит \^^γα(χ,α) у+~^^—~ Ка (t.s) Фильтр Ι Τ нижних частого 7-Ь+ ^ Рис. 5.10. Интерпретация линейной системы. функция w, У~1(^, и). Так как /Са(м, х) соответствует фильтру нижних частот, a Ka{U х) — функция нижних частот (с ограниченным сверху спектром), то, как нетрудно заметить, J"~\tt х) также должна быть функцией нижних частот и членом с удвоенной частотой в выражении для Rds(u, и) можно пренебречь. Поэтому для решения интегрального уравнения можно сделать аппроксимацию Rds(t9f)<xpP**ti9(0)· (94) Функция Rds*(0) является просто стационарной компонентой Rds(tt t). В данном примере она является низкочастотной компонентой. [Заметим, что когда процесс ds(t> α(ή) является стационарным, Rd *(0) = 514
= /?ds(0)]. В тех случаях, когда справедливо (94), интегральное уравнение (89) обращается в W* (0) ?> Ti = Ka(t,x), Γ,<ί, x^Tf. (95) Решение этого уравнения дает требуемую функцию. С математической точки зрения (95) являетея вполне адекватным окончательным результатом. Можно, однако, получить весьма полезную физическую интерпретацию этого результата, если заметить, что (95) знакомр нам в другом контексте. Напомним следующую задачу линейной фильтрации (см. гл. 3, стр. 235) r(t)=a(t) + ni(t)9 T^t^Tf, (96) где a(t) — то же самое, что и наше сообщение, a n^t) — выборочная функция процесса белого шума (с двухсторонним спектром плотностью NJ2). Требуется построить линейный фильтр h(t, x)t выход которого был бы оценкой а(0, минимизирующей среднеквадратическую ошибку. Это как раз та задача, которая была решена в гл. 3. Уравнение, определяющее фильтр Α0(ί, χ), имеет вид г/ ^К(U x)+\hV, и)Ка(и, х)du = Ка(f, х). Tt <t, χ<Г,, (97) где NJ2 — спектральная плотность белого шума. Если положить #ι = -β— , (98) Rd (0) v то j-i (f, χ) = ^ h0 (t, x). (99) V ' 2Rd (0) 0V ' V Ошибка в задаче линейной фильтрации равна Tf Tf ξ/ = jr j γ Κ (χ, x)dx = jr j У-i (χ, χ) dx. (100) Наша граница для задачи нелинейной модуляции соответствует среднеквадратической ошибке в задаче линейной фильтрации, за исключением лишь того, что уровень шума снижается в Rds(0) раз. Величина Rds*(0) может быть больше или меньше единицы. Из примеров 1 и 2 будет видно, что в случае линейной модуляции Rds(0) можно увеличивать только путем увеличения мощности передачи. В примере 3 будет показано, что при нелинейном методе модуляции, как, 515
например, фазовая модуляция, #ds*(0) можно увеличить посредством повышения индекса модуляции. Этот результат соответствует общеизвестному выигрышу, даваемому фазовой модуляцией. Нетрудно привести аналогичную интерпретацию для случая коррелированного шума. Прежде всего введем эффективный шум, обратное ядро которого равно Qne(t,U)=Rdg(t9U)Qn(t9U). (101) Его ковариационная функция удовлетворяет уравнению ? ) Kne(t, u)Qne(u, z)du = 6(t—z), Ti<t,z<Tf. (102) τι Тогда можно показать, что J-l(u,z)= ) Кпе(и,х)к0{х,г)аху Tt^ut z^Tft (103) Ti где h0 (χ, ζ) также является решением уравнения \ [Ка (*, t) +Кпе (*> 01К(t9 ζ) dt = Ка (χ, ζ), Г, <χ, ζ < Tf. (104) Ti Это и есть аналог (95) для случая коррелированного шума. В двух важных частных случаях получаются более простые выражения. Случай 1. J"1 (t, u) = J-1 (t — и). Заметим, что когда i~l(t9 ^является функцией только разности двух своих аргументов, то /-ι (ttt) = J-i (t — t) =/-! (0). (105) Тогда (87) переходит в соотношение lt>J-l(0). (106) Если ввести функцию оо ^-ΐ(ω)= ξ /-> (τ) еН*Ч*г, (107) —ОО то оо ξ,= jV>(co)g-. (108) —оо Дальнейшего упрощения можно достигнуть, когда интервал наблюдения охватывает бесконечное прошлое и будущее. 516
Случай 2. Стационарные процессы на бесконечном интервале1*. В данном случае предполагается, что Гг = -оо, (109) Г, = оо, (ПО) Ka(t,u)=Ka(t-u), (111) Kn(t,u) = Kn(t-u), (112) R4s(t,u) = Rds(t-u). (113) Тогда J^l(t, и)=/-'^—и). (114) Преобразование J (τ) имеет вид оо f((d)= 5 J(x)e-i^dx. (115) Тогда из (82) и (85) следует, что #-'(©)= —— = Г_! f-sd (ω)®—Ι—Ι-' (116) (символом ® обозначена операция свертки2)) и результирующая ошибка равна \i> ff——+ Srf (ω)®-ί-1-1^. (117) —CX) Проиллюстрируем несколькими простыми примерами применение этого граничного выражения. Пример 1. Предположим, что применим случай 2. Кроме этого, допустим, что s(t,a(t)) = a(t). (118) Так как модуляция является линейной, то эффективная оценка существует. Несущая отсутствует, поэтому ds(t, a(t))/da(t) = 1 и 5^(ω) = 2πδ(ω). (119) Подставляя (119) в (117), получаем F S0(<o)Sn(g>) _άω_ S' J Sa(W)+Sn(W) 2π ι ' — ОО Выражение в правой части (120), как будет показано в гл. 6, оказывается минимальной среднеквадратической ошибкой для приемника с нереализуемым линейным фильтром. Таким образом, как и следовало ожидать, эффективная оценка получается путем обработки r(t) при помощи линейного фильтра. Х) См. сноску на стр. 504 и задачу 5.3.3. 2) Мы включаем 1/2π в операцию свертки, когда ω— переменная величина. 517
В качестве второго примера приведем линейную модуляцию синусоидального колебания. Пример 2. Предположим, что применим случай 2 и что несущая модулируется по амплитуде сообщением, т. е. s(t, a(t)) = V2Pa(t)sin(uct9 (121) где верхняя граничная частота спектра a(t) значительно ниже сос. Производная равна Ради простоты допустим, что шум имеет равномерный спектр, ширина которого много больше ширины спектра a(t). Отсюда следует, что ск. '-ί S0 (ω) άω_ !/= 1- l + S„(<D)(2P/tf,) ϋΓ 1/= ■ , , О Л,оп,„г ΊΓ~· (123) — οο Можно убедиться, что оценку с такой ошибкой можно получить путем умножения r(t) на -^2/PsincD^ и пропускания результата через такой же линейный фильтр, что и в примере 1. Таким образом, и на этот раз эффективная оценка существует и получают ее, используя в приемнике линейную систему. Пример 3. Рассмотрим фазо-модулированное синусоидальное колебание на фоне аддитивного белого шума. Предположим, что a(t) — стационарный процесс. Таким образом, s(t, a (tj) = V2P sin [(uct + fba(t)h (124) ds (t, a (t)) da(t) •■V2Pficoslfuct + fia(t)] (125) Kn(t,u) = -£- 6(t-u). (126) Используя далее (92), видим, что R*ds(0) = PP2. ' (127) По аналогии с примером 2 получим С Sa(a» _йш_ 7 " J 1Φ S„ (ω) (2ΡΡ/Ν,) 2π V ' ΟΟ При линейной модуляции ошибка является функцией только спектра сообщения, мощности передачи и уровня белого шума. При данном спектре и уровне шума единственным способом уменьшения среднеквадратической ошибки является повышение передаваемой мощности. В нелинейном случае мы видим, что границу среднеквадратической ошибки можно снизить путем увеличения индекса модуляции β. Позднее будет показано, что по мере увеличения Ρ/Ν0 среднеквадра- тическая ошибка оценки по максимуму апостериорной вероятности приближается к границе, определяемой (128). Таким образом, оценка по 518
максимуму апостериорной вероятности является асимптотически эффективной. С другой стороны, если β велико, a P/N0 понижается, то любая схема оценки будет обнаруживать явление «порога». В точке, соответствующей порогу, ошибка оценки быстро возрастает и граничное выражение становится бесполезным. Этот результат имеет прямую аналогию с результатом, полученным при оценке параметра (пример 2, § 4.2.3)г Напомним, что если пытаться сделать β чрезмерно большим, то результат, получаемый при рассмотрении локальной задачи оценки, не имеет смысла. В гл. 2 второй части, где нелинейная модуляция будет обсуждаться более подробно, будет показано, что имеет место аналогичное явление. Мы увидим, также, что при больших отношениях сигнал/шум среднеквадратическая ошибка стремится к значению,Ъпре- деляемому граничным выражением. Главные результаты данного параграфа сводятся к уравнениям (85), (95) и (97). Первое из них определяет матрицу /~1(ί, χ), обратную информационному ядру. След матрицы обратного ядра обеспечивает нижнюю границу интервальной среднеквадратической ошибки при оценке непрерывных сигналов. Это является обобщением классического неравенства Крамера — Рао на случайные процессы. Уравнение (95) есть частный случай уравнения (85), которое справедливо, когда аддитивный шум является белым, а компонента ds(t, α(ή), оказывающая влияние на интегральное уравнение, является стационарной. Уравнение (97) показывает, в какой мере граница среднеквадратической ошибки при интервальной оценке в нелинейной системе совпадает с действительной среднеквадратической ошибкой интервальной оценки в линейной системе, уровень белого шума которой делится на Rds*(0). При рассмотрении обнаружения и оценки мы видели, что приемнику часто приходится обрабатывать несколько входных процессов. Аналогичные ситуации встречаются в задаче оценки сигналов. 5.4. Оценка многомерных сигналов В § 4.5 задача обнаружения была распространена на случай Μ принимаемых сигналов. В задаче 4.5.4 гл. 4 было показано, что аналогично можно поступить при линейной и нелинейной оценке одного параметра. В задаче 4.&.7 гл. 4 сходное обобщение было получено для нескольких параметров. В настоящем параграфе мы займемся вопросами оценки N непрерывных сообщений при использовании Μ принимаемых сигналов. Как и следует ожидать, процедура вывода представляет простую комбинацию выкладок, приведенных в задаче 4.6.7 и §5.2. * Следует указать, что все одномерные представления непосредственно подводят к многомерному случаю. ^1ы можем почти догадаться о форме конкретных результатов. Наибольший интерес в многомерном случае представляет решение указанных выше уравнений применительно к реальным физическим проблемам. Оказывается, что в этом случае приходится исследовать много вопросов, не встречающихся в скалярном случае. Эти вопросы и их приложения будут подробно 519
изучаться в гл. 5 второй части. Пока же мы просто выведем уравнения, которые определяют оценки по максимуму апостериорной вероятности и указывают границу среднеквадратических ошибок. Прежде чем перейти к выводу этих уравнений, целесообразно обсудить ряд физических ситуаций, в которых встречается задача данного типа. 5.4.1. Примеры многомерных задач Случай 1. Многоуровневые (многопозиционные) системы связи. Во многих системах связи приходится передавать несколько сообщений одновременно. При использовании одного распространенного метода модуляция осуществляется в два этапа. Сначала каждым сообщением модулируют соответствующую поднесущую. Промодулиро- ванные поднесущие затем складываются и результирующим сигналом модулируется основная несущая, которая и передается по каналу. Типичной является система ЧМ—ЧМ, показанная на рис. 5.11, в которой аналоговый источник №1 · a,(t) Частотный модулятор * ' г Щг sin [w2t +<Lf /*аг (τ)άτ\ W Аналогобый источник №2 Частотный модулятор Аналоговый источник %М Частотный \ \модулятор WgNsinfcNt+dfHfTiaN(T)dv] Рис. 5.11. Система ЧМ — ЧМ. каждым сообщением α^ή, (i = 1, 2, ..., Ν) модулируется по частоте соответствующее синусоидальное колебание с частотой ωι. Частоты ω$ выбираются так, чтобы модулированные поднесущие находились в неперекрывающихся полосах частот. Модулированные поднесущие усиливаются, суммируются и результирующим групповым сигналом модулируется по частоте основная несущая, которая и передается в канал связи. ^ С точки зрения формы записи удобно обозначать N сообщений посредством матрицы-столбца: ~αλ (τ) α2(τ) а (τ) Δ [_αΝ (τ) J (129) 520
Используя эту систему обозначений, передаваемый сигнал можно записать в виде где s(t, а (τ)) =*|/2Ρ sin ζ (и) = Σ Y%g} sin ω, и + dfj $ α} (τ) dx . (130)" (131) В канале к переданному сигналу добавляется шум, так что принятое колебание можно записать в виде r(t) = s(t,a{r))+n{t). (132) В данном случае нужно оценить N сообщений одновременно. Поскольку имеется N сообщений и только одно принимаемое колебание, мы называем эту задачу (Ν Χ 1)-мерной. Система ЧМ—ЧМ является типичной из многих возможных многоуровневых систем модуляции, например: ОБП—ЧМ, AM—ЧМ и ФМ—ФМ. Количество возможных комбинаций различных методов модуляции практически неограниченно. Рассмотрение современных методов модуляции можно найти, например, в [8]. а(с) Частотный модулятор ^ 1 Аттенюатор Частотный модулятор ^sin^MUdfJ^a(T)dx)> 4 Аттенюатор Рис. 5.12. Многоканальная система. Случай 2. Многоканальные системы. В § 4.5 говорилось об использовании разнесенных систем для цифровых систем связи. Аналогичные системы могут применяться и при передаче аналоговых сообщений. На рис. 5.12 изображена типичная многоканальная система связи, в которой сообщением a{t) модулируется по частоте ряд несущих, имеющих различные частоты. Модулированные сигналы передаются по различным каналам, в каждом из которых сигнал подвер- х> Запись s (t, а (τ)) — сокращенное обозначение для s (t; а (τ), Τι < τ < < t). Указанием второй переменной подчеркивается то обстоятельство, что процесс модуляции обладает инерцией (памятью). 521
гается ослаблению и воздействию поме.х. Очевидно, в этом случае имеется Μ принимаемых колебаний rt(f) = st(t,a{x))+nt(t), (t = l, 2, ..., Μ), где Si(t,a (τ)) = gt γ2Ρι sin ω,, t + df. Jj a (u) du И здесь удобна матричная форма записи. Обозначим Siit, α (τ)) s(t,a(r))=: (133) (134) $2(t,a (τ)) _sM(t,a(x)) (135) η(0 = «2 (О _«Λί(0_| Тогда r(0 = s(i,a(T))+n(0· (136) (137) Здесь требуется оценить одно сообщение a(t) и для осуществления этого мы располагаем Μ принятыми колебаниями. Эту задачу называют (1 X М)-мерной. Рассмотренная система является частотно-разнесенной. Другими очевидными видами разнесения являются пространственное и поляризационное разнесение. Физическая проблема, которая, по существу, сводится к разнесенной системе, рассмотрена ниже. Случай 3. Пространственно-временная система. Во многих гидроакустических и радиолокационных задачах приемная система состоит из элементов, образующих решетку (рис. 5.13). Сигнал, принятый i-ы элементом, содержит сигнальную компоненту Si(tt α(<ή), член ηε^ή, обусловленный внешними помехами, и член π^.(ή9 определяемый собственными (внутренними) шумами приемного элемента. Таким образом, полное принятое колебание на /-м элементе равно Обозначим ni(t) = nRi(t) + nEi(t). (138) (139) 522
Видно, что это просто другая физическая ситуация, в которой для оценки одного сообщения мы располагаем Μ сигналами. Как и ранее, мы имеем здесь (1 X М)-мерную задачу. Случай 4. (Ν Χ М)-мерные задачи. Если взять любой из методов модуляции случая / и осуществлять передачу по каналу с разнесением, то, очевидно, мы будем иметь (Ν Χ М)-мерную задачу оценки. Рис. 5.13. Пространственно-временная система. В этом случае i-и принятый сигнал rt{{) имеет компоненту, зависящую от всех N сообщений аДО» (/ = 1» 2, ..., Ν). Поэтому г,(0 = М*, а(/))+я,(0. / = 1,2, ...,М. (140) В матричной записи r(0 = s(f,a(t))+n(/). (141) Перечисленные случаи служат иллюстрацией типов физических ситуаций, в которых встречаются многомерные задачи оценки. Теперь сформулируем модель задачи в общем виде. 5.4.2. Формулировка задачи" Прежде всего сделаем допущение о том, что сообщения аг(/) (i = 1, 2, ..., Ν) являются выборочными функциями непрерывных совместно-нормальных случайных процессов. Удобно представлять эту совокупность процессов одним векторным процессом a(t). (Как и ранее, будем пользоваться терминами вектор и матрица-столбец как понятиями взаимозаменяемыми.) Будем полагать, что векторный процесс имеет 1} Многомерная задача для безынерционных методов модуляции и аддитивных каналов была впервые решена в [9]. (См. также [10].) 523
нулевое среднее. Поэтому он полностью характеризуется ковариационной матрицей размерностью NX N, равной Kat^) Δ £[(a(i)ar (*/))] = 'КагаЛии)\КахаЛ^ ") | · · · j Яа^ (*, и)' mKaNal(t9U)\ I KaN aN (tf U) (142) Таким образом, //-й элемент представляет взаимно-ковариационную функцию ί-го и /-го сообщений. Передаваемый сигнал можно представить вектором s(t> а(т)). Этот векторный сигнал является детерминированным в том смысле, что если задана некоторая выборочная функция а(т), то s(t> a(<r)) будет определен однозначно. Сигнал" передается на фоне аддитивного гауссова шума n(t). На приеме сигнал представляет УИ-мерный векторный сигнал, равный r(f) = s(f,a(t))+n(f), Tt<t^Tf или LrAi(0J Si (t, a (τ)) s2(t9*(x)) [_SM(t, a(/))J Λ(0" «2 (<) ,ΛΑί (Ο J , TKt<Tf (143) (144) Общая модель изображена на рис. 5.14. (t) шточник ά(τ) Передатчик U*.«fr)j^ftfl Приемник Рис. 5.14. Модель оценки вектора. Мы полагаем, что Μ образцов смеси сигнала с шумами являются выборочными функциями совместно нормальных случайных процессов с нулевыми средними и что сообщения и помехи статистически независимы. (Зависимые сообщения и помехи можно легко учесть, ср. задачу 5.4.1.) Обозначим Μ шумов посредством векторного шумового процесса η(ή, который полностью характеризуется (Μ Χ Л1)-ковариацион- ной матрицей Kn(t9 и). 5.4.3. Вывод уравнений оценки Выведем теперь уравнения для оценки векторного процесса. Ради простоты рассмотрим здесь только случай модуляции без памяти. Другие случаи в общих чертах изложены в задачах вне основного текста. 524
Принимаемый сигнал записывается в виде г (0 = s (t, а (0) + η (О, Г, < ί < Тр (145) где s(i, a(i)) получается безынерционным преобразованием вектора а(^). Будем также полагать, что вектор s(t, a(/)) дифференцируем по каждому из α^ή. Прежде всего разложим а(/) по ортогональным векторам: к а(0 = l.i.m. 2 ar^r{t), Tt^t<Tfi (146) ИЛИ к a,(f) = l.i.m. 2α,ψΓ(/)(ί), Tt^t<Tf9 (147) где г|)г(0 — вектор собственных функций, соответствующих интегральному уравнению μ*%(О = 1 Ка (ί, и) *ft(")rf«, 7, < t < 7> (148) Данное разложение было подробно рассмотрено в § 3.7. Найдем далее аг и введем обозначение к a(f) = l.i.m. Σ artyr(t). (149) Задача оценки параметра ari однако, была решена ранее. По аналогии с (72 г) имеем a [In A (A) + In Ра (А)] = дАг ~ Tf = f *Т{!9*{г)) lrg(z)-u(*)]dz-A r =1,2, ..., (150) J oAr μΓ где TJ *AZ)± \ Qn(z9u)r(u)du (151) Ti и J/ g(z)A J Qn(z,u)s(u9&(u))du. (152) Левая матрица под интегралом в (150) равна t, a (Q) = Г as, (f t a алг [ алг dsr (f, a (Q) _ Г М*, а (0) I _ Ι^μ('' a (0) &дг | дАг | | алг 525 (-153)
Первый элемент этой матрицы можно записать в виде dsi (*> а (0) = dSj (t, а (0) . (1) ,^ , дАг д'аг (О ψΓ К) "Г ds^.affj) . (2) /,ч , , as! (f, а (О) (N) ,.. (154) Рассматривая другие элементы, видим, что если ввести матрицу производных ds^t, а (ρ) | _ j^M'» а(0) &МО I I dax{t) dsx (t, a (ρ") < ... I а?м(*, a(Q)" ^(0 , , da^f) то можно записать так что *rl'/(0W(<)D(f,a(0), oAr 0[1ηΛ(Α)+1ηρ.(Α)] дАг ~ 5 4VT(z) D (z, a(ζ)) [rg (z)-g(z)] cfe - Ar (155) (156) (157) Приравнивая правую часть нулю, получим необходимое условие, накладываемое на оценку величины Аг по максимуму апостериорной вероятности. Таким образом, Tf аг = μΓ I tf (г) D (ζ, a (ζ)) [rg (ζ) - g (г)] dz. (158) Подставляя (158) в (149), получим Tf Г оо 1 a(i)= J 2 Ш-Ч^(0+г(г) p(z,a(2))[re(e)-g(z)]£fe. (159) ι Но выражение в квадратных скобках представляет собой ковариационную матрицу. Поэтому а (0 = J Ка (ί, г) D (ζ, а (г)) [rg (г) -g (z)] dz, Гг < t < 7> (160) 526
Как и следовало ожидать, форма этих уравнений полностью аналогична соответствующим уравнениям одномерного случая. Далее нам необходимо найти нижнюю границу среднеквадратичес- кой ошибки при оценке векторного случайного процесса. 5.4.4. Нижняя граница матрицы ошибок В многомерном случае нам приходится иметь дело с оцениванием вектора а(/). Можно ввести вектор ошибки a(f)—a(f)=ae(f), (161) который состоит из N элементов: aEt(f), а&г (f), ..., α8Ν(ή. Требуется найти корреляционную матрицу ошибок. Запишем оо оо а(0-а(0= Σ («1-^)4»!(0Δ 2 aHb(t). (162) Затем, используя такой же подход, что и в § 5.3, формула (68), получим 7 Г, I ав(<)аГ(0Л Ъг±ТЕ Tf 'К К = -Г lim S dt Σ Σ*ι (0 Ε (αε. αε) $ (t). (163) Нижнюю границу матрицы ошибок можно задать граничной матрицей Rb в том смысле, что матрица Rej — R# является неотрицательно определенной. Диагональные элементы матрицы RB дают нижние границы среднеквадратической ошибки при оценивании a^f). Поступая также, как в одномерном случае, получим т/ Rs=V$ *~l(t.t)dt. (164) Ядро 3-~\t, х) обратно ядру 3(t, χ) информационной матрицы и определяется матричным интегральным уравнением Ϊ г' 3-l(t,x)+) du \ dzJ-l(t, и) [E[D(u, а (и)) X xQn(tt,z)D^(0,a(z))])Ka(2^)=Ka(U), Ti<^,x<r/. (165) Вывод уравнений (164) и (165) довольно утомителен и не вносит дополнительной ясности в понимание задачи, поэтому мы его опустим. Подробности можно найти в [11]. 527
В качестве последнего вопроса в задаче оценивания нескольких сигналов мы изложим интересную интерпретацию процедуры нелинейной оценки при наличии шума, содержащего две компоненты — коррелированный и белый шумы. 5.4.5. Оценивание при наличии коррелированного (небелого) шума Рассмотрим следующую задачу: r(t)=s{t, a(t))+w(t) + ne(t), T^t^Tf. (166) Здесь w(t) — компонента белого шума, имеющая спектральную плотность N0/2t a n c(t) — независимая компонента коррелированного шума с ковариационной функцией Kc(t, и). Тогда ^»('.") = γθ(ί—w)+/Cc(i,w). (167) Оценку α(ί) по максимуму апостериорной вероятности можно найти из (31) — (33): S(0=S Ka(t, u) ds{u: a{U)) [rg(a)-g(u)]du, r,</<Tff (168) Tt да (и) где ? r(t)-s{t,a(t))=) Kn(t,u)[rg(u)—g(u)]du9 T^t^Tf. (169) Ti Подставляя (167) в (169), получим Tf r(t)-s(t,a(t))= J ^8(t-u)+KAt>»)]lrg(u)-g(u)]du. (170) Теперь необходимо показать, что та же самая оценка a(f) получается, если мы будем оценивать a(f) и η c(t) совместно. В этом случае а(0АГа(/М (171) К (О J K,(t,u)=\K^^ ° 1. (172) Поскольку коррелированный шум включен в состав вектора сообщения, единственным аддитивным шумом является компонента белого шума Kn(t,u)=^6(t-u). (173) 528
Для использования (160) нам необходима матрица производных Г*('."('»1 (174) D(t, a(0)= da(t) . v ' Подставляя ее в (160), получим два скалярных уравнения Tf a(t) = \ -j-Ka(t,u) dsiu:Z^ [г(и)-s{u,a(и))-пе(и)] du, ту ^о да (и) T^t^Tf, (175) J 2 пс W = Ι Τ Κ* (*> u>> tr Μ - s (u> " Μ) — "с (и)] duy Τ, < ί < Tf. - -ν0 Ti (176) Рассматривая (168), (170) и (175), можно прийти к выводу, что оценка а(/) будет одинаковой в обоих случаях, если S 4-И")—*("»«("))—"с(«)1 χ г. ™о I x[-^6(i-w)+/Cc(i,ii)ldw = r(i)-s(i,fl(0)? (177) но (177) тождественно (176). На основании изложенного приходим к следующему заключению. Если имеются независимые компоненты коррелированного и белого шума, то коррелированный шум можно всегда рассматривать как сообщение и оценивать их совместно. Этот вывод объясняется тем, что сообщение и коррелированный шум независимы, а шум входит в r(t) линейным образом. Поэтому (Ν Χ 1)-мерная векторная задача с белым шумом охватывает и все скалярные задачи с коррелированным шумом, в которых имеется компонента белого шума. Прежде чем подытожить результаты данной главы, обсудим кратко задачу оценки детерминированных сигналов. 5.5. Оценивание неслучайных сигналов Иногда нереалистично считать сигнал, который нужно оценить, случайным колебанием. Например, мы можем знать, что каждый раз, когда происходит некоторое событие, переданное сообщение будет иметь определенные отличительные особенности. Если сообщение моделируется в виде выборочной функции случайного процесса, то при синтезе оптимального приемника существенные черты сообщения можно усреднить. Ситуации такого типа возникают в задачах классификации (опознавания) в области гидроакустики и сейсмологии. Здесь более целесо- 529
образно моделировать сообщение как неизвестное, но неслучайное колебание. Для построения оптимального устройства обработки мы обобщим процедуру оценки по максимуму правдоподобия для неслучайных величин на случай непрерывных колебаний. Соответствующая модель принимаемого сигнала имеет вид r(t)=s(t9a(t))+n(t)9 T^t^Tf, (178) где n(f) — нормальный процесс с нулевым средним. Чтобы найти оценку по максимуму правдоподобия, запишем логарифм функции правдоподобия, а затем выберем сигнал a(t)t который ее максимизирует. Логарифм функции правдоподобия равен пределу (726) при /С-^оо: г/ г/ 1ηΑ(α(ί)) = J *S dus(t9a(t))Qn(t9u)\r(u) -s(w, a(f))l, (179) τ- τ- L 2 J л г 1 г где Qn(t, и) — обратное ядро шума. Для произвольного s(t, a(t)) минимизация In A(a(t)) затруднительна. Однако в случае, представляющем для нас наибольший интерес, процедура ведет прямо к цели. Это случай, когда область изменения функции s(tt a(t)) включает все возможные значения r(t). Важным примером, где это справедливо, является случай r(t)=a(t) + n(t). (180) Примером, где это не справедливо, служит случай, когда r(t)=sin((uct+a(t))+n(t). (181) Здесь все функции в области изменения s (t, α(ή) имеют амплитуды меньше единицы, хотя возможные амплитуды r(f) не ограничены. Ограничимся случаем, когда область изменения s(tt α(ή) охватывает все возможные значения r(t). Необходимое условие минимизации 1η Α(α(ή) легко получить вариационным методом: rf ту $ αβ(0#(*(':^<θ) S Qn(t,u)[r(u)~s(u9aml(u))]du\ =0 (182) * ι ν ι для каждого αε(ή. Решение имеет вид r(u) = s (и9 ат1 (и)), Г, < и < Тр (183) поскольку для каждого г(и) существует по крайней мере одно а(и), которое может быть в нем отображено. Нет гарантии, однако, что существует единственное обратное отображение. И на этот раз полезный ответ можно получить путем сужения обсуждаемого вопроса. В частности, рассмотрим задачу, определяемую (180). В этом случае ami(u)=r(u). (184) 530
Таким образом, оценка по максимуму правдоподобия есть просто принятый сигнал. Это несмещенная оценка a(t). Легко показать, что оценка по максимуму правдоподобия является эффективной. Ее дисперсию можно получить из обобщенной границы Крамера — Рао или непосредственным вычислением. Используя последнюю процедуру, будем иметь lTf ) */** $ [aml(t)-a(t)]2dt\· (185) Ui J Часто бывает удобно нормировать дисперсию длиной интервала. Обозначим эту нормированную дисперсию (которая является просто средней ошибкой оценки по минимуму среднеквадратической ошибки) через Imi^-M [aml{t)-a{t)]2dt[ (186) [J Tt J Используя (180) и (184), получим Tf Smi = -H Kn{t,t)dt. (187) 1 Ti Отсюда нетрудно сделать ряд выводов. Если шум является белым, то ошибка бесконечна. Такой вывод представляется интуитивно логичным, если иметь в виду разложение a(t) в ряд. Мы пытаемся оценить бесконечное число составляющих, и поскольку считаем, что никакой априорной информации об их вкладе в формирование сигналов у нас нет, приписываем всем им равные веса. Но так как среднеквадратические ошибки всех составляющих равны, то равномерное весовое распределение приводит к бесконечной среднеквадратической ошибке. Чтобы задача имела смысл, необходимо сделать допущение, что энергия шума конечна на любом конечном интервале. Это допущение можно обосновать физически по крайней мере двумя путями: 1. Приемные элементы (антенна, гидрофон или сейсмометр) имеют конечную полосу пропускания. 2. Если предположить, что нам приближенно известна полоса частот, содержащая сигнал, то можно включить фильтр, пропускающий эти частоты без искажений и подавляющий все прочие частоты1). г) До этого момента мы считали, что модель с белым шумом имеет хорошую физическую основу. Наиболее существенным моментом обоснования ее было то, что если шум является широкополосным по сравнению с полосой пропускания устройств обработки, то его можно считать белым. Неявно мы предполагали, что приемные элементы, упомянутые в [1], обладают гораздо более широкой полосой пропускания, чем устройство обработки сигнала. Теперь же математическая модель сигнала не имеет удовлетворительной структуры, и чтобы получить результаты, имеющие смысл, нам необходимо наложить ограничение по полосе частот. 531
Если шумовой процесс стационарен, то т, Smi=ir$ -<n(0)dt = Kn(0)= j Sn(<*)^- (188) Может сложиться впечатление, что столь грубая процедура не может быть эффективной. Из задачи оценки параметра, однако, известно, что априорные сведения не имеют значения, когда шумы измерения малы. Такой же вывод сохраняет силу и в случае оценки сигнала. Этот результат можно проиллюстрировать простым примером. Пример. Пусть n'(t) — белый процесс со спектральной плотностью N0/2. Допустим, что ft = — сю, Tf = оо . Известно, что a(t) не имеет частотных составляющих выше Ψ Гц. Пропустим r(t) через фильтр с коэффициентом передачи, равным I в полосе частот от —W до -{-W Гц и нулю — вне этой полосы. На выходе фильтра будет смесь сообщения a(t) с шумом n(t), являющимся выбороч-* ной функцией процесса с равномерным ограниченным спектром. Оценка a(t) по максимуму правдоподобия есть выход данного фильтра и lml = N0W. (189) Теперь предположим, что a(i) действительно является выборочной функцией случайного процесса с ограниченной полосой (— W, W) и равномерным спектром плотностью Р. Если бы мы использовали оценку по максимуму апостериорной вероятности или по минимуму среднеквадратической ошибки, то она была бы эффективной и ошибка могла определяться (120) _ PN0W 6m.-Smap- p + N<)/2 (19υ) Нормированные ошибки для двух этих случаев равны соответственно г -2*1L поп bms : η~bmap: η"~ ρ \ ~* 2Ρ ) Таким образом, различие в ошибках при Ν0/2Ρ < 0,1 пренебрежимо мало. В данном примере в обеих процедурах оценки используются сведения о полосе сигнала для синтеза устройства обработки. Оценки по максимуму апостериорной вероятности и по минимуму среднеквадра- тической ошибки, однако, требуют знания спектральных плотностей. Другое основное различие двух указанных процедур приведенным примером не выявляется ввиду того, что были выбраны простые спектры. Оценки по максимуму апостериорной вероятности и по минимуму сред- неквадратической ошибки формируются путем ослабления различных частотных составляющих #ο(/ω)= Sq(? (193) 0U ; N0/2 + Sa(co) Поэтому, если спектр сообщения не равномерен в фиксированной полосе частот, то сообщение будет искаженным. Это искажение вносится с целью уменьшения полной среднеквадратической ошибки, равной сум- 532
ме искажений сообщения и шума. С другой стороны, устройство оценки по максимуму правдоподобия никогда не вносит каких-либо искажений сообщения; ошибка обусловливается исключительно шумом. (По этой причине устройства оценки по максимуму правдоподобия называются также неискажающими фильтрами.) В последующем мы сосредоточим наше внимание на процедуре оценки по максимуму апостериорной вероятности (важным исключением из этого является § 5.3 второй части). Следует помнить, однако, что во многих случаях оценивание по максимуму правдоподобия также оказывается полезным (см. задачу 5.5.2). 5.6. Краткие итоги В этой главе была сформулирована задача оценки непрерывного сигнала. Главная цель изложения состояла в том, чтобы вывести уравнения, которые определяют оценки. В случае одного случайного сигнала оценка по максимуму апостериорной вероятности определяется двумя уравнениями: «(0= S *«('»"> ds{u:a{u)) [rg(u)-g(u)]dut Tt<t^Tf, (194) Tt da («) где [rg(u)—g(u)] определяется уравнением Ь r(t)—s(t9a(t))=) Kn(t9u)[rg(u)—g(u)]du9 Γι<ί<Γ/. (195) Ti В частном случае белого шума уравнение оценки сводится к S(f)=-M Ka(t,u)[r(u)—s(u9a(u))]du9 7\<г<7у (196) "0 т. ι Затем была получена граница среднеквадратической ошибки, выраженная посредством следа информационного ядра: li>\\ J~l(t,t)dt. (197) Т Ti Для белого шума граница (197) имеет особенно простую интерпретацию: h > —-^ [ h0(t, t) dt% (198) 2R* (0) Т J 0У °s Ti 533.
где h0(tfu) удовлетворяет интегральному уравнению ΝΛ 7\ / Ка С·") = ^Б^Г h<> (Uu) + \ К (U г) Ка (г, и) dz, 7*,<*, «<7> 7* (199) Функция h0(ty t) точно соответствует оптимальному устройству обработки для родственной задачи линейной оценки. Было показано, что для линейной модуляции атаР(/) является эффективной. Для нелинейной модуляции, как мы увидим, оценка amap(i) является асимптотически эффективной. Эти, результаты были распространены далее на многомерный случай. Основные интегральные уравнения явились логическим развитием уравнений, полученных для скалярного случая. Было также отмечено, что компоненту коррелированного шума всегда можно рассматривать как дополнительное сообщение и в связи с этим производить их совместную оценку. Наконец, была рассмотрена задача оценки неслучайного сигнала. Интересующая нас задача допускает довольно простое решение, прямо ведущее к цели. На простом примере было показано, что в некоторых случаях оценка неслучайного сигнала не уступает оценке по максимуму апостериорной вероятности. В последующих главах мы будем подробно изучать уравнения оценки и вытекающие из них структуры приемника. В гл. 6 мы изучим линейную модуляцию, а в гл. 2 второй части — нелинейную модуляцию. 5.7. Задачи Задачи к § 5.2. Вывод уравнений Задача 5.2.1. Если аппроксимировать a(t) посредством /С-членной аппроксимации aK(t), то обратное ядро Qa^(t, и) будет иметь хорошую асимптотику. Логарифм функции правдоподобия равен ЫА(ак (0) + In ра (А) = j j [s (t, ακ (/))] Qn (t, и) \r (и) - -| β (и, ак (в)) J du - Tf — ~o"\l акУ)®а (*» u) aK (a) dt du-\- постоянные члены. 1. Использовать метод, аналогичный примененному в § 3. 4. 5, для отыскания ~aK(t) [например, положив aK(t) = α^(0 + εαε (t)]. 2. Исключить из результата Qa (t, и) и положить К -> °о для получения К окончательного ответа. Задача 5.2.2. Пусть r(t) = s(t,a(t))+n(t), T%<t<Th 534
где процессы такие же, как в основном тексте. Допустим, что E[a(t)]=ma(t). 1. Вывести интегральное уравнение, определяющее a(t) — оценку a(t) по максимуму апостериорной вероятности. 2. Рассмотреть частный случай, когда s(t,a(t))=a(t). Написать уравнения для этого случая. Задача 5.2.3. Рассмотрим случай, соответствующий модели в § 5.2.1, в котором 1. Что из этого следует применительно к a(t)? 2. Убедиться, что при этом условии (33) сводится к предыдущему результату. Задача 5.2.4. Рассмотрим систему амплитудной модуляции, показанную на рис. 5.1*. Нормальные процессы a(t) и n(t) являются стационарными и имеют спектры 5α(ω) и 5Λ(ω) соответственно. Пусть Τ ι = — <χ> , Г/ = оо. 1. Начертить блок-схему оптимального приемника. 2. Найти E[a\(t)] в виде функции от H(ja>), 5α(ω) и 5Λ(ω) a(t ЦТ) n(t) Рис. 5.1*. Задача 5.2.5. Рассмотрим систему связи, изображенную на рис. 5.2*. Построить блок-схему оптимального нереализуемого приемника для оценки a(t). Допустим, что требуется интервальная оценка по максимуму апостериорной вероятности. 2Ш \h(tylL) X(t) Линейная схема Нелинейный модулятор \6ез памяти ЩЬ) (дети шум) №Asin(a>cUx(t)) k(t,i >«)кф r(t) Линейный канал с изменяющимися 6о дреме ни параметрами, Рис. 5.2*. Задача 5.2.6. Пусть r(t) = s(t, a(t))+n(t), —oo<t<oo, гдеа(0 и n(t) — выборочные функции независимых стационарных нормальных случайных процессов-с нулевыми средними. Использовать метод интегрального преобразования Фурье для получения результатов, аналогичных (31) и (33) в основном тексте, для случая бесконечного времени. Задача 5.2.7. В гл. 4 (стр. 342—344) было выведено интегральное уравнение для задачи обнаружения на фоне коррелированного шума путем использования понятия достаточной статистики. Вывести (31)—(33) вновь путем соответствующего развития данного метода. 535
Задачи к § 5.3. Нижние границы Задача 5.3.1. В гл. 2 был рассмотрен случай, когда требовалось оценить линейную функцию вектора А dbgd(\) = GdA, и было доказано, что если d — несмещенная оценка, то El(i-dr]>GdJ~1GTd [см. (2.287) и (2.288)]. Аналогичный результат был получен для случайных величин. Использовать результаты для случайных величин, чтобы вывести (87). Задача 5.3.2. Пусть г (t) = s(t, a (t))+n (t), Tt < t < Τ ρ Допустим, что нам необходимо оценить a(Tf). Можно ли модифицировать результаты задачи 5.3.1 т^к, чтобы вывести границу среднеквадратической ошибки при точечной оценке? tpb.E{[S{Tf)-a(Tf)]2}. Какие трудности возникают при нелинейной точечной оценке? Задача 5.3.3. Пусть r(t) = s(t, a(t))+n(t), —оо < t <oo. Процессы a(t) и n(t) — статистически независимые стационарные нормальные случайные процессы с нулевыми средними и со спектрами 5α(ω) и 5Λ(ω) соответственно. Вывести границу ошибки среднеквадратической оценки, используя метод интегрального преобразования Фурье. Задача 5.3.4. Пусть r(f) = s(t,x(t)) + n(t) Ti<t<Tf, где Tf *(/)= {h(t,u)a(u)du, Ti<t<Tft Ti a a(t) и n(t) — статистически независимые нормальные случайные процессы с нулевыми средними. 1. Вывести границу среднеквадратической интервальной ошибки при оценке a(t), 2. Рассмотреть частный случай, когда s(f, *(*))=*(0. h(t, u) = h(t—u), Тг=—оо, Г/=<*о и процессы стационарны. Проверить, чтв оценка является эффективной и выразить ошибку через различные спектры. Задача 5.3.5. Объяснить, почему необходимое и достаточное условие существования эффективной оценки в случае оценки непрерывного сигнала заключается в том, чтобы модуляция была линейной [см. (73)]. Задача 5.3.6. Доказать результат, определяемый (81), начав с определения J-1 и использовав (80) и (82). Задачи к § 5.4. Многомерные сигналы Задача 5.4.1. Принимаемое колебание имеет вид r(t)=s(tsa(t))+n(l)t 0<t<T. 536
Сообщение a(f) и помеха n(t) — выборочные функции совместно-нормальных случайных процессов с нулевыми средними: E[a(t)a(u)]bKaa(t,u), Ela(t)n(u)]*_Kan(t,u), E[n(t)n(u)]b-^- 6(t-u) + Kc(t, и). Вывести интегральные уравнения, которые определяют оценку Ίι(ΐ) по максимуму апостериорной вероятности. Указание. Записать матричную ковариационную функцию Kx(t, и) для вектора x(f), где х(0 [n(t)\ Записать обратное ядро матрицы в виде τ ^ Qx (t, и) Кх («, z) du = \b (t-z). Написать X In Л (χ (0) - - \ j j [aK (t) \r(t)-s (t, aK (t))] Qx (t, u) χ о τ [ M ^ U) „ J dt du = - \ f f r (0 QX22 (*, и) г (и) at du = 7 = - γ J J «K (0"Qa Λ ") a/C (") <" <*"' 0 Применить вариационный метод задачи 5.2.1. Задача 5.4.2. Пусть r(t) = s(t, a(t), В)+л(0, Ti<t<Tf, где a(t) и л(£) — статистически независимые нормальные случайные процессы с нулевыми средними. Вектор В является гауссовым, W(0, Λβ), и независимым от a(t) и n(t). Вывести уравнение, определяющее совместные оценки a(f) и В по максимуму апостериорной вероятности. Задача 5.4.3. При использовании системы связи ФМ — ФМ поднесущие модулируются колебаниями по фазе и затем складываются N *(0 = Σ V2essin[(ojt + ^jaj(t)]. Суммой z(t) далее модулируют основную несущую: s(t9 n(t))=/2Psin[(uct + pcz(t)]. Принимаемый сигнал имеет вид r(t) = s(t, &(t))+w(t), —ОО < t < оо. 537
Сообщения ai(f) — статистически независимые процессы со спектром Sa((u) Шум не зависит от а(^) и является белым со спектральной плотностью N0/2. Вы1 вести интегральное уравнение, определяющее a(t), и начертить блок-схему нереализуемого приемника. Упростить блок-схему, используя различие по частоте между сообщениями и несущими. Задача 5.4.4. Пусть г(0 = а(0 + п(0, — оо < /<оо, где a(t) и n(t) — независимые нормальные процессы со спектральными матрицами Sa((D) и Sn((D) соответственно. 1. Записать (151), (152) и (160) в частотной области, используя интегральные преобразования. 2. Проверить, что &[Q„(t)] = S^"1 (ω). 3. Построить блок-схему оптимального приемника. Свести его к одномат- ричному фильтру. 4. Вывести аналоги (164) и (165) в частотной области и использовать их для записи выражения ошибки для этого случая. 5. Убедиться в том, что точно такие же результаты (п. п. 1, 3 и 4) можно получить эвристическим путем, используя обыкновенные преобразования Фурье. Задача 5.4.5. Пусть оо г(0= j* h (t—τ) α (τ) dx + n(t), — оо < t < оо, — оо где Ь(т) — матричный фильтр с одним входом и N выходами. Повторить задачу 5.4.4. Задача 5.4.6. Рассмотрим простую пятиэлементную линейную решетку с Равномерным шагом Δ (рис. 5.3*). Сообщение представляет плоскую волну, ·/ a(t) " 1r- Ζ a*» J Рис. 5.3*. угол прихода которой равен Θ, а скорость распространения равна с. Выходное колебание первого элемента равно /ι(0 = β(0 + Μ0. —°° < * < °°- Выходное колебание второго элемента г2 (t) = a (*-τΔ)+η2 (*), -оо < t < оо, где τΔ = Asin9/c. Другие выходы можно записать очевидным образом. Помехи статистически независимы и являются белым шумом со спектральной плотностью N0/2. Спектр сообщения есть 5α(ω). 1. Показать, что это частный случай задачи 5.4.5. 2. Дать интуитивную интерпретацию устройства оптимальной обработки. 3. Записать выражение для минимальной среднеквадратической ошибки интервальной оценки. 538
Задача 5.4.7. Рассмотрим стационарный нормальный случайный процесс a{t) с нулевым средним и ковариационной функцией Κ"α(τ). Процесс a(t) наблюдается на интервале (Г$, Tf). Требуется оценить a(t) на интервале (Га, То), где та>Ь. 1. Вывести интегральное уравнение, определяющее атар(0» Τа < t < Ц. 2. Рассмотреть частный случай, когда Ка (τ) = σα2 е-* · τ ', _оо < τ < оо. Проверить, что "тар (У = α <Т/> е~* (<Х_Г/) ПРИ Г« < Ί < ?V Указание. Модифицировать процедуру задачи 5.4.1. Задачи к § 5.5. Неслучайные сигналы Задача 5.5.1. Пусть r(t) = x(t) + n(t), —оо < t < оо, где n(t) — стационарный нормальный процесс с нулевым средним и спектральной матрицей Sn(co), a x(t) — векторный сигнал с конечной энергией. Обозначим векторные интегральные преобразования Фурье функций через ΖΓ(ω), Ζχ(ω) и Ζη(ω) соответственно [см. (2.222) и (2.223)]. Обозначим также преобразование Фурье функции x(t) через Х(/со). 1. Записать 1пЛ(х(0) через указанные величины. 2. Найти Хщ* (/<*>)· 3. Вывести Xmi (/ω) эвристическим путем, используя обыкновенные преобразования Фурье для процессов. Задача 5.5.2. Пусть оо г(*) = J h(t—τ) α (τ) dx + n(t), — оо < t < со, —оо где η(τ) — импульсная характеристика матричного фильтра с одним входом и N выходами и передаточной функцией Η(/ω). 1. Модифицировать результаты задачи 5.5.1 так, чтобы охватить данный случай. 2. Найти ami (t). 3. Убедиться, что оценка ami (i) несмещенная. 4. Оценить дисперсию σ2 [ami (t)—a {t)]· Решение некоторых задач к гл. 5 Решение задачи 5.2.1. 1. Нам необходимо найти максимум функции /Κ(0)^1ηΑ(β^(0)+1πρβ(Α) в зависимости от ак (t). Для этого положим ак(0 =aK{()+Bae{t)9 539
Продифференцируем По ε и потребуем, чтобы результат был равен нулю при ε — = 0 для всех at(t). Выполним теперь все указанные операции: Tf г f(aK (/) + βαβ (0)= J J [s (t, aK (t) + sae (/))] Qn (t, u) \r(u)- Ti L — 7s ("> *K (")+εαε (")) I dt du— γ $ I [<>K V) + Eae (0j X xQa (£, «) [a^ (u)-\-eae(u)] dt du-\-постоянные члены, К т4 д1 дв = С С ds (t, aK (Q) ^ ^ ^ , (м) _s ^ ^ ^ ^ ^ ^ ^ __ ί=0 Jrf aiKw r* —Jfee(0Qa (t, u)aK(u)dtdu = 0. (5.1*) Мы использовали свойство симметрии обратных ядер для получения (5.1*). Поскольку (5.1*) должно быть справедливым для всех ae(t), потребуем, чтобы τ / ds (i, aK (<)) \ Qn V, и) [г (и) - s (и, SK («))] dt = J да is (t) t ^к (0 = J Q^(/, u)aK(u)dt. (5.2*) 2. Для исключения Q- (/, к) умножим обе части (5.2*) на Ка„. (*> t) и проинтегрируем по t: f f [r (и) -s (и, ак («))] Q„ (t, и) д$ (*' "* (°) *а (*, х) dt = ί,J &к (t) = | Q0y< (i. ") KaK (t, x) aK («) <tt d« = */ = J δ (и— χ) ак (и) du = ак (дс). В пределе при К -»· оо имеем Tf- ds(t,S(t)) а (χ) = jj jj [г (и)-β (и, а (и))] Qn (<· и) Ч ~ #<* (*. *) dt du- (5·3*) Т. ^ \г) Результат (5.3*) совпадает с результатами (5.31)—(5.33). 540
Решение задачи 5.3.5. Необходимое и достаточное условие существования эффективной оценки заключается в том, чтобы ни одно J ij в (5.73) не являлось функцией a(t): ' ds (t, α (θ) If Ti L ds (u, a (u)) } ] \ XQn(*, U) da (и) >+^-^rx dt du. Если s(£, a(0) = a(^)c(i), то J ij не может быть функцией a(t). Если модуляция нелинейная, то ds(t, a(t))/da(t) есть функция a(t) и Уг*7-, в общем случае, будет функцией a(t) при некоторых значениях i и /. Литература Ι. Υ о и 1 a D. С. The Use of Maximum Likelihood in Estimating Continuously Modulated Intelligence Which Has Been Corrupted by Noise. Trans. IRE, 1954, v. IT-3, March, p. 90—105. 2. L a w t ο η J. G. Private communication, dated August 20, 1962. 3. L a w t ο η J. G., Chang Т. Т., Henrich С J. Maximum Likelihood Reception of FM Signals. Detection Memo № 25, Contract № AF 30 (602) — 2210, Cornell Aeronautical Laboratory Inc., January, 4, 1963. 4. Van Trees H. L. Analog Communication Over Randomly Time-Varying Channels. Presented at WESCON, August, 1964. 5. R a u с h L. L. Some Considerations on Demodulation of FM Signals. Unpublished memorandum, 1961. 6. R a u с h L. L. Improved Demodulation and Predetection Recording. Research Report, Instrumentation Engineering Program, University of Michigan, February 28, 1961. 7. V a n Trees H. L. Bounds on the Accuracy Attainable in the Estimation of Random Processes. Trans. IEEE, 1966, v. IT-12, № 3 (April), p. 298—304. 8. Никольс Η. X., Раух Я. Я. Радиотелеметрия. Пер. с англ. Изд-во иностранной литературы, 1958. 9. Τ h о m a s J. В., Wong E. On the Statistical Theory of Optimum Demodulation. Trans. IRE, I960, v. IT-6, Sept. p. 420—425. 10. W о 1 f J. K. On the Detection and Estimation Problem for Multiple Non- stationary Random Processes. Ph. D. Thesis, Princeton University, Princeton, Ney Jersey, 1959. 11. Van TreesH. L. Accuracy Bounds in Multiple Process Estimation. In- trrnal Memorandum, DET Group, MIT, April 1965.
6. Линейные оценки В этой главе подробно изучается задача линейной оценки. Напомним из гл. 5, что в задаче линейной модуляции принимаемый сигнал записывается в виде r(t) = c(t)a(t)+c0(t) + n(t), T^t^Tf, (l) где α (ή — сообщение, с (ή — детерминированная несущая, c0(t) — остаток несущей, a n(t) — аддитивный шум. Как указывалось в гл. 5, наличие остатка несущей не оказывает существенного влияния на логический ход наших рассуждений. Поэтому ради упрощения алгебраических выкладок можно считать c0(t) =0. Более общий вид линейной модуляции получается, если пропустить α(ή через линейный фильтр для получения χ(ή, а затем посредством χ(ή промодулировать c(t). В этом случае r(t)=c(t)x(t) + n(t), T^t^Tf. , (2) В гл. 5 линейная модуляция была определена через производную сигнала по сообщению. Эквивалентным определением будет следующее. Определение. Модулированный сигнал есть s(t, a(t)). Обозначим компоненту сигнала s(t, α(ή), которая не зависит от a(t), через c0(t). Если сигнал [s(t, a(t))— c0(f)\ подчиняется принципу сулерпозиции, то s(t, α(ή) соответствует линейной системе модуляции. Мы рассмотрели задачу отыскания оценки сообщения a(t) по максимуму апостериорной вероятности на интервале Tt ^ t ^ Tf В случае, описываемом (1), оценка a(f) определялась двумя интегральными уравнениями: Tf α (0 = $ Ка (t, и) с (и) [rg (u)—g (и)] du, Г, < ί < Г, (3) Ti и It r(t)—c (t) a(t)=) Kn (t, u) [rg (u)—g(u)\ du, Tt < / < Tf. (4) Ti Исследуем решение этих уравнений и свойства вытекающих из них алгоритмов (устройств) обработки. До сих пор рассматривалось только оценивание на интервале. В этой главе мы рассмотрим также алгоритмы точечной оценки и покажем связь между алгоритмами оценки двух типов. 542
В § 6.1 излагаются некоторые из упомянутых свойств, появляющиеся при наложении требования линейности модуляции. Будет исследована связь между предположением о нормальности (гауссовости), предположением о линейности модуляции, критерием ошибки и структурой результирующего устройства обработки. В § 6.2 будет рассмотрен частный случай, когда нам доступно бесконечное прошлое (т. е. Τχ = —оо), интересующие нас процессы стационарны и требуется произвести точечную оценку по минимуму среднего квадрата ошибки. Получен конструктивный метод решения и обсуждены его основные свойства. В § 6.3 исследуется другой подход к точечной оценке, результатом которого является решение для функциональной структуры устройства обработки в виде системы с обратной связью. В § 6.2 и 6.3 основное внимание уделяется случаю, когда c(f) постоянно. В § 6.4 рассматриваются обычные линейные системы модуляции, какими, например, являются амплитудная модуляция и однополосная модуляция. В двух последних параграфах подведены итоги и даны пояснения по ряду родственных задач. 6.1. Свойства оптимальных устройств обработки Как указывалось во введении, если ограничиться только линейной модуляцией, то возможны некоторые упрощения, которых не было в общем случае нелинейной модуляции. Наиболее важные из этих упрощений характеризуются свойством 1. Свойство 1. Интервальная оценка a(f) по максимуму апостериорной вероятности на интервале Tt ^ t ^ Tft где r(t)=c(t)a(t) + n(t), 7\</<Гу, (5) есть принятый сигнал, получается при помощи линейного устройства обработки. Доказательство. Простой путь убедиться в том, что линейное устройство обработки может давать a(f) — это найти такую импульсную характеристику h0(t, и), что - ? a(t)=\h0(t,u)r(u)du, T^t.^Tf. (6) Сначала умножим (3) на c{f) и прибавим полученный результат к (4), после чего получим I' r(t)= J [c(t) Ka(t,u)c(u)+Kn(t, u)][rg(u)-g(u)]du, Tt^t^Tf. (7) Видно, что выражение в первых квадратных скобках есть KT{t, ")· Перепишем (6), чтобы выразить KT{t, и) в явном виде. Заменим также t 543
на х-, чтобы избежать смешения переменных на следующем этапе наших рассуждений: r(x)=\KT(x,u)[rg(u)—g(u)\du .Г|<^<Г/. (8) Ti Теперь умножим обе части (8) на h(t, χ) и проинтегрируем результат по х: ? V ? § h (t, χ) г (χ) dx = § [rg (и) — g (и)] du\)h(t, χ) ΚΓ {х, и) dx. (9) Tt Ti Ti Мы видим, что левая часть (9) соответствует пропусканию входной величины r(x), Tt ^ t ^ Tft через линейный нереализуемый фильтр с изменяющимися во времени параметрами. Сравнивая (3) и (9), можно заметить, что выход фильтра будет равен a(t), если потребовать, чтобы внутренний интеграл в правой части (9) был равен Ka(t, u)c(u) на интервале Ti < и < Tft Tt ^ t ^ Tf. Это и дает уравнение оптимальной импульсной характеристики V Ka(t,u)c(u)=)h0(t,x)Kr(x,u)dx, Ti<u<Tft Tt^t^Tf. (10) Подстрочный индекс «0» означает, что h0(t, x) соответствует характеристике оптимального устройства обработки. В (10) мы испольаовали строгое неравенство по и. Если [rg(u) — g(u)] не содержит импульсов, то достаточно как строгого, так и нестрогого равенства. Однако, выбирая это неравенство строгим, мы можем найти непрерывное решение для h0(tt χ). (См. обсуждение в гл. 3.) Если r(t) содержит компоненту белого шума, то такое предположение справедливо. Как и ранее, мы задаем h0(tt x) на концах интервала посредством условий непрерывности h*(UTf)b Hm h0(t,x)t X-+T* h(t,Ti)b Hm h0(t,x). Часто бывает удобно вводить компоненту белого шума в явном виде. Тогда можно записать Кг(х, и) = с(х)Ка(х, и) с (и) + Ке(х, ") + -γ· δ (*—«). (12) и (10) сведется к Ка (t,u)c (и) = ^±h0(t,u)+^[c (χ) Ка (х, и) с (и) + Ь + Kc(x,u)]h0(t,x)dx, Tl<u<Tt, Г,<*<7>. (13) 544
ЕслиКаУ, "), Kc(t, и) и c(i) — непрерывные интегрируемые в квадрате функции, то наши результаты в гл. 4 гарантируют, что интегральное уравнение, определяющее h0(t, χ), будет иметь непрерывное интегрируемое в квадрате решение. При этих условиях (13) справедливо также при и = Tf и и = Ти ввиду нашего предположения о непрерывности. Важность свойства 1 заключается в том, что оно гарантирует, что структура устройства обработки является линейной и таким образом сводит задачу к отысканию правильной импульсной характеристики. Аналогичный результат легко вытекает для случая, описываемого (2). Свойство 1А. Оценка α(ή сообщения a(t) по максимуму апостериорной вероятности на интервале Tt ^ t ^ Tf на основе принятого сигнала r(t) = c(t)x(t) + n(t)9 Tt^t^Tf (14) получается при помощи линейного устройства обработки. Второе свойство — это то, что мы уже доказали в гл. 5 (см. стр. 511). Мы приводим его здесь ради полноты изложения. Свойство 2. Оценка a(t) по максимуму апостериорной вероятности в случае линейной модуляции является также интервальной оценкой по минимуму среднего квадрата ошибки. (Это следует из того, что оценка по максимуму апостериорной плотности является эффективной.) Ф)\ ι I L ! L I Требуемая линейная операция ~*d(t,v) I I .-ΤΙ .J d(t) •oo<V<oo Линейная операция kf(u,vj n(u) Ми) Ti^u^Tf Рис. 6.1. Типичная задача оценки. Прежде чем решать (10), обсудим родственную задачу, а именно, рассмотрим задачу оценки непрерывного сигнала в одной точке на оси времени. Модель точечной оценкя Рассмотрим типичную задачу оценки, иллюстрируемую рис. 6.1. Сигнал, подлежащий обработке в приемнике, есть г(и). Его формируют путем осуществления линейной операции над a(v) с целью получения х(и), которое затем умножают на известную модулирующую функцию. К выходу у(и) добавляется шум п(и). Штриховой линией показана некоторая линейная операция (необязательно инвариантная во времени или реализуемая), которую нам было бы желательно выполнить над a(v), если бы она была доступной (возможно все время). Выходом моде- 18 Зак. 693 545
ли является полезный сигнал d(t) в некоторый заданный момент времени t Момент времени t может быть или не быть включенным в заданный интервал наблюдения. Обычными примерами желательных сигналов служат: 1) ά(ή = α(ή. Здесь выходом является просто само сообщение. Очевидно, если бы t было включено в интервал наблюдения, х(и) — а(и), п(и) = 0, а с(и) было бы постоянной, то мы могли бы получить сигнал точно. Вообще говоря, такое условие обычно не выполняется. 2) d(t) = a(t+ 2а). Если α есть положительная величина, то нам требуется предсказать значение a(f) для некоторого момента времени в будущем. Теперь даже в отсутствие шума задача оценки является нетривиальной, если t + α > Tf. Если α — отрицательная величина, то нам необходимо значение a(f) для некоторого предшествующего момента времени. 3) d(t) = ±a(i). В этом случае полезный сигнал является производной сообщения. Могут встретиться операции и других типов. Мы будем полагать, что линейная операция такова, что d(t) определяется в среднеквадратическом смысле (т.е., если d(t) = a(t)> как в 3), то мы считаем, что α(ή — процесс, дифференцируемый в среднеквадратическом). Наше обсуждение велось в разрезе линейной системы модуляции, показанной на рис. 6.1. Мы еще не определили статистики случайных процессов. Будем исходить из следующего предположения. Гауссовость (нормальность) процессов. Сообщение a(t)t полезный сигнал ά(ή и принимаемый сигнал r(f) являются совместно нормальными процессами. Это предположение охватывает задачу линейной модуляции, которую мы уже обсуждали, но не затрагивает необходимости подробного' описания системы модуляции. Ради простоты алгебраических выкладок считаем, что все процессы имеют нулевые средние. Вернемся теперь к задаче оптимальной обработки. Необходимо осуществить такую операцию над r(u), Tt ^ и ^ Tft чтобы получить оценку d(t). Обозначим эту оценку через d{t) и выберем устройство обработки так, чтобы минимизировалась величина lp{t)bE[[d{t)-d{t)]2\=E[e*{t)}. (15) Прежде всего заметим, что это оценка точечная (поэтому и подстрочный индекс Р). Отметим далее, что минимизируется средний квадрат ошибки (отклонения) оценки d(t) от желаемого сигнала d(t). Отыщем теперь оптимальное устройство обработки. Подход здесь будет следующим: 1. Прежде всего ищем оптимальное линейное устройство обработки. Свойства 3, 4, 5 и 6 относятся именно к данной задаче. Мы увидим, что предположение о гауссовости не используется при выводе структуры оптимального линейного устройства обработки. 2. Далее, с учетом предположения о нормальности процессов, 546
из свойства 7 следует, что линейное устройство обработки является наилучшим из всех возможных устройств обработки для критерия среднего квадрата ошибки. 3. Из свойства 8 вытекает, что в предположении нормальности линейное устройство обработки является оптимальным для широкого класса критериев ошибки. 4. Наконец, свойства 9 и 10 показывают связь между алгоритмами точечной и интервальной оценок. Свойство 3. Линейная оценка по минимуму среднего квадрата ошибки является выходом линейного устройства обработки, импульсная характеристика которого есть решение интегрального уравнения: Tt Κ<ίΛί>")=\Κ(ί,τ)ΚΓ(τ,ιι)άτ, Tg<u<Tf. (16) Ti Доказательство этого свойства аналогично выводу в § 3.4.5. Выход линейного устройства обработки можно записать в виде г/ d(t)= ^h(ttx)r{x)dx. (17) Tt Полагаем, что h(tt τ) = 0, τ < Ti9 τ > Tf. Средний квадрат ошибки в момент времени t равен ( Г Т4 п2^ b(t) = {E[d(t)-d(t)]2}=E ν 1 d(t)— ]h(t,x)r(x)dx . (18) Τι J J Чтобы минимизировать lp(t), необходимо выполнить процедуру, изложенную в §3.4.5 (стр. 235—241). 1. Положим h(t, τ) = h0(tt τ) + ehe(t, τ). 2. Запишем ξρ(/) в виде суммы оптимальной ошибки ξρ0(ί) и приращения ошибки Δξ(/, ε). 3. Покажем, что необходимое и достаточное условие того, чтобы Δ|(^, ε) было положительно при ε Φ 0, определяется уравнением Ύ* Л r(a)}=0, T^iKTf. (19) El \d(t)—)h0(ttx)r(x)dx iL т. Внеся математическое ожидание под знак интеграла, получим Kdr (t, α) = J ft0(f, τ) Kr (τ. и) dx, Tt<u< Tfi (20) Ti что и является требуемым результатом. В свойстве 7А мы покажем, что решейие (20) является единственным, если функция Kr(U ti) положительно определена. Замечаем, что для построения (бинтеза) оптимального линейного устройства обработки, минимизирующего средний квадрат ошибки, необходимы только ковариационная функция Kr(t, и) принимаемого 18* 547
сигнала и взаимно ковариационная функция Rdr(t, и) между желаемым сигналом и принятым сигналом. Обратим внимание на то, что предположение о нормальности процессов еще не использовалось. . Имеется ряд частных случаев, достаточно важных, чтобы рассмотреть их в-развернутом виде. Свойство ЗА. Когда d(f) = α(ή и Tf = t, мы имеем задачу реализуемой фильтрации и (20) обращается в t Kar(t,u)= \h0(t,x)Kr(Vu)dxt Tt<u<t. (21) Ti Используем термин «реализуемый» фильтр, поскольку фильтр, определяемый (21), осуществляет операцию только над прошлой частью процесса [т. е. h0(t, τ) = 0 при τ >f]. Свойство ЗБ. Пусть r(t) = c(t)x(t) + η(ή Δ y{f) + η(ή. Если шум является белым со спектральной плотностью Ν0/2 и некоррелированным с α{ή, то (20) принимает вид К*у V, u)=-^h0(t,u)+§h0(tf τ)Ky(τ, и)dx, Tt<и<Tt. (22) Тг Свойство ЗВ. Когда выполняются условия ЗА и ЗБ и x(t) = α(ή9 (20) переходит в уравнение t + § К (t, τ) с (τ) Κα (τ, и) с (и) dx, Т% < и < /. (23) [Соотношения на концах интервала были рассмотрены после (13).] Обратимся вновь к общему случаю и выведем выражение для минимума среднего квадрата ошибки. Свойство 4. Минимум среднего квадрата ошибки оптимального линейного устройства обработки равен Ь0 (0 Δ£ К2 (01 = Kd (U t) - \h0 (t, τ) Kdr (t, τ) dx. (24) Ti Это выражение получается, если в (18) использовать (16). Далее мы опускаем подсрочный индекс «0» в выражении для оптимальной ошибки. Представляют интерес также выражения для ошибки в ряде частных случаев. Они получаются прямой подстановкой. Свойство 4А.' Если d(t) = a(t) и Tf = t, то минимальный средний квадрат ошибки равен t b(t) =Ka(t, t)- \ h0(t, x)Kar(t, x)dx. (25) Ti 548
Свойство 4Б. Если шум является белым и некоррелирован с α(ή, то минимальный средний квадрат ошибки равен Ь (0 = Kd (/, t)-\h0 (/, τ) Kdy (t, τ) dr. (26) Свойство 4B. Если соблюдаются условия 4А и 4Б и x(t) = a(t), то ho(t,t) = irc№P(t). (27) Если сг1 (/) существует, то (27) можно переписать в виде b(t)=^-^(t)ho(t9t). (28) Объем сведений, необходимых для отыскания оптимального линейного устройства обработки, можно кратко характеризовать следующим свойством. Свойство 5. Kr{t, и) и Kdr{t> и) — единственные величины, знание которых необходимо для отыскания точечной оценки по минимуму среднего квадрата ошибки, если класс устройств обработки ограничен линейными системами. Любая дополнительная статистическая информация относительно процессов является бесполезной. Все процессы, нормальные и не нормальные, имеющие одинаковые Kr(t, и) и Kdr{t, и), приводят к одному и тому же устройству обработки и к одинаковой сред- неквадратической ошибке, если требуется, чтобы обработка была линейной. Свойство 6. При испольаовании оптимального линейного устройства обработки ошибка в момент времени t некоррелирована с входным колебанием г(и) во всех точках интервала наблюдения. Это свойство вытекает непосредственно из (19), если усмотреть, что первый член есть ошибка при использовании оптимального фильтра. Поэтому Рис. 6.2. Геометрическая претация оптимального ного фильтра. интер- линей- E[eo(t)r(u)]=0, Тг<и<Тг. (29) Следует заметить, что (29) можно также получить путем простого эвристического рассуждения на основе геометрических представлений. На рис. 6.2 изображено геометрическое представление желаемого сигнала ά(ή в виде точки в векторном пространстве. Заштрихованная часть- плоскости χ представляет те точки, которые можно получить посредством линейной операции над данным входным колебанием г(и): Нам необходимо выбрать d,(t) как точку в области χ, ближайшую к d(t). Ин- 549
туитивно совершенно ясно, что мы должны выбрать эту точку непосредственно под d(t). Следовательно, вектор ошибки перпендикулярен к плоскости χ (или, что эквивалентно, к любому вектору в плоскости χ); иначе говоря, e0(t) J_ JA(i, u)r(u)du для всех h(tt и). Единственное затруднение заключается в том, что различные функции являются случайными. Удобной мерой квадрата модуля вектора служит его средний квадрат. Квадрат модуля вектора, отображающего ошибку, равен E[e\t)\. Поэтому условие перпендикулярности выражается как математическое ожидание = 0 (30) I ? I \e0(t) ^ h(tyu)r (u)du для всех непрерывных h(t, и). Отсюда следует, что E[eo(t)r(u)]=09 Tt<:u<Tfy (31) а это не что иное, как (29) [и, что эквивалентно, (i9D)]. Свойство 6А. Если рассматриваемые процессы d(t), r(f) и a(t) являются совместно нормальными, то ошибка при использовании оптимального линейного устройства обработки статистически не зависит от входного колебания г(и) в любой момент времени на интервале наблюдения. Это свойство вытекает непосредственно из того, что некоррелированные нормальные случайные величины являются статистически независимыми. Свойство 7. Если справедливо предположение о нормальности процесса, то оптимальное линейное устройство обработки для минимизации среднего квадрата ошибки является наилучшим среди устройств всех типов. Доказательство. Пусть d*(f) будет оценкой, создаваемой произвольным непрерывным устройством обработки, которое осуществляет операцию над г(и) на -интервале ΤΊ ^ и ^ Tf. Обозначим ее через dAt)=Hf:r(u)9 T^u^Tf). (32) Обозначим средний квадрат ошибки при использовании этой оценки через £*(/). Покажем, что lAt)>b{i)· (33) При этом знак равенства имеет место только в том случае, когда произвольным устройством обработки является оптимальный линейный фильтр: 6,(0 = £{[d^0-rfW]2}=fi{k(0-2(0+3(0-d(0]2l = = E[[dAt)-d\t)]2}+2E{[dAt)-d(t)]e0(t)\+lP(t). (34) 1у Наще рассуждение носит очевидный эвристический характер. Его нетрудно сделать строгим, введя несколько свойств линейных векторных' пространств, но для наших целей в этом нет необходимости. 550
Первый член (34) неотрицателен. Остается только показать, что второй член равен нулю. Используя (32) и (17), второй член можно записать в виде Ε\\f(t:r(u)9 T^u^T;)- \hQ{t,u)r{u)du\e0{t)\ (35) Он равен нулю ввиду того, что г(и) статистически не зависит от e0(i) в соответствующей области изменения, за исключением граничных точек и = Tfu и = 7У (Так как оба устройства являются устройствами непрерывной обработки, математическое ожидание на концах интервала равно нулю.) Поэтому оптимальное линейное устройство обработки не уступает любому другому устройству обработки. Последним интересующим нас вопросом является вопрос о единственности. Для доказательства единственности нам необходимо показать, что первый член есть величина существенно положительная, если оба устройства обработки не тождественны. Мы обсудим этот вопрос по частям. Свойство 7А. Предположим сначала, что f(t: r(u), Tt < и < 7» соответствует линейному устройству обработки, импульсная функция которого не равна h0(t, и). Таким образом, Tf f(t:r(u)9 Г,<и<Г/)= )(h0(t,u)+h*(t,u))r(u)du, (36) Ti где h*(t, и) представляет разность импульсных функции. Используя (36) для оценки первого члена (34), получим Ε {[<(t)-d(t)]2} = )ldudzh,(t9 u)Kr(u9 ζ)Κ(t9 z). (37) Ti Из (3.35) известно, что если /Сг(м, ζ) положительно определена, то правая часть будет положительной при всех h*(tt u)y тождественно не равных нулю. С другой стороны, если Kr{t, и) только неотрицательно определена, то из рассуждений на стр. 217 гл. 3 известно, что в этом случае существует такая h*(tt и), что If \ ft, (t9 и) КТ (и9 z) du =0, 7\ < z< Tf. (38) Ti Так как собственные функции ядра Kr{u, z) не образуют полной орто- нормированной системы, можно построить h*(tt и) из функций, которые ортогональны с Кг{и> г). Заметим, что в наших рассуждениях при изложении свойства 7А мы не исходили из предположения о нормальности процессов, а также что мы получили необходимое и достаточное условие единственности решения (20). Если /СГ(«, ζ) не является положительно определенной функцией, то к любому решению (20) можно 551
добавить h*(tt и), удовлетворяющую (38), и все-таки получить решение. Отметим, что оценка α(ή является единственной даже в том случае, если функция Кг{и, ζ) не является положительно определенной. Это объясняется тем, что любая h*(t, u)9 которую мы добавляем к h0(t9 и), должна удовлетворять (38), и, следовательно, не может обусловливать выходную велинину, когда на входе действует r(f). Свойство 7Б. Допустим теперь, что f(t: r(u)t Tt ^ и ^ Tf) есть непрерывный нелинейный функционал, не равный [ h0(t, n)r(u)du, т. е. f[t:r(u), Tg<u^Tf) = J' = ) h0 (t, и)г (и) du+f^tiriu), Tt < и < Tf). (39) Тогда E{[d,(t)-d(t)]2} = = Е [f. (t :r(u), Γ, < и < Tf) U(t:r (г), Τ, < ζ < Tf)]. (40) Ввиду того что г(и) является гауссовым, математическое ожидание в правой части (40) можно выразить посредством комбинаций Кг(и, ζ). Если произвести необходимые, но довольно громоздкие подробные выкладки, то можно прийти к выводу, что если Кг(и, ζ) является положи* тельно определенной, то математическое ожидание будет положительной величиной при условии, что fjjt: г(г), 7\· < ζ < Tf) тождественно не равна нулю. Чрезвычайная важность свойства 7 очевидна. Оно позволяет нам одновременно получать две группы результатов путем исследования задачи линейной обработки. 1. Если предположение о гауссовости соблюдается, то мы имеем дело с наилучшим возможным линейным устройством обработки. 2. Даже если предположение о гауссовости не соблюдается (или его нельзя обосновать), то мы обязательно найдем наилучшее возможное линейное устройство обработки. При рассмотрении вопросов оценки непрерывных сигналов мы обсудили только оценивание по минимуму среднеквадратической ошибки и по максимуму апостериорной плотности. Следующее свойство обобщает критерий оценки. Свойство 8А. Пусть e(t) означает ошибку оценивания d(f) при пользовании некоторой оценкой ά(ή: e(t)=d(t)—d(t). (41) Эта ошибка взвешивается с некоторой функцией стоимости C(e(t)). Риск равен математическому ожиданию a(d(t)f t)=E [C(e(t))] =E [С {d(t)-d(t))]. (42) Байесовский критерий точечной оценки обеспечивает оценку d>B(t)t которая минимизирует величину риска. Если предположить, что C(e(f)) — симметричная выпуклая функция и соблюдается допу- 552
щение о гауссовости, то байесовская оценка совпадает с оценкой по минимуму среднеквадратической ошибки, т. е. dB = d0(t). (43) Доказательство. Оно сводится к трем заключениям. 1. При соблюдении гауссовости точечная оценка по минимуму среднеквадратической ошибки в любой момент времени (скажем, ίχ) является условным средним апостериорного распределения Patl\r(u) lDtl\r(u) : Ti ίζ u^. Tfl. Заметим, что речь идет о единственной случайной величине ditf и поэтому указанное распределение является правомерным (см. задачу 6.1.1). 2. Апостериорное распределение является унимодальным и симметричным относительно своего условного среднего. 3. Следовательно, применимо свойство 1, стр. 70 гл. 2, что и позволяет сделать приведенное выше заключение. Свойство 8Б. Если ломимо предположений, сделанных в связи со свойством 8А, потребовать, чтобы функция стоимости была строго выпуклой, то dB(t) = d0(t) (44) является единственной байесовской точечной оценкой. Этот результат следует из (2.158). Свойство 8В. Если требование выпуклости функции стоимости заменить требованием, чтобы она была симметричной неубывающей функцией, так что Пт С(Х)р [Х\г(и):Т^и<Т;] = 0 (45) при всех интересующих нас значениях tx и г(^), то (44) сохраняет свою силу. Наконец, мы можем связать наши результаты по точечным оценкам с интервальными оценками по минимуму среднеквадратической ошибки и по максимуму апостериорной плотности. Свойство 9. Интервальная оценка по минимуму среднеквадратической ошибки является просто совокупностью точечных оценок. В частности, предположим", что мы наблюдаем колебание г(и) на интервале Tt ^ u^Tf и хотим оценить сигнал ά(ή на интервале Та ^ ^ ί ^ 7β так, чтобы среднеквадратическая ошибка, усредненная на заданном интервале, была минимальной g/A£K[rf(/)_rf>)]2rf/. (46) Очевидно, если можно минимизировать математическое ожидание выражения в скобках при всех t, то ξ/ будет минимизироваться. Именно это осуществляет устройство точечной оценки по минимуму среднеквадратической ошибки. Укажем, что устройство точечной оценки по 553
минимуму србднеквадратической ошибки использует г(и) на всем интервале наблюдения для создания d(t). (Отметим, что свойство 9 справедливо также и для нелинейной модуляции.) Свойство 10. При соблюдении условия гауссовости точечные оценки по минимуму среднеквадратической ошибки и по максимуму апостериорной плотности совпадают. Это свойство является лишь частным случаем свойства 8В. Ввиду того что интервальная оценка по максимуму апостериорной плотности является совокупностью точечных оценок по максимуму апостериорной плотности, интервальные оценки также совпадают. » ' __ *LdJl-L· ίA(t) ι ρ-Охот \ϊχ1 II ι σ-Выходов \ I! ' ' II II ajv)l p*1 mxp Рис. 6.3. Задача оценки вектора. Перечисленные десять свойств служат в качестве исходных положений при исследовании случая линейной модуляции. Свойство 7 позволяет сосредоточить наши усилия в настоящей главе на задаче оптимальной линейной обработки. При соблюдении условия гауссовости наши результаты будут соответствовать наилучшему возможному устройству (алгоритму) обработки (для описанного выше класса критериев). Для произвольных процессов эти результаты будут соответствовать наилучшему устройству (алгоритму) линейной обработки. Нетрудно заметить, что все результаты переносятся на векторный случай с очевидными модификациями. Однако, поскольку некоторые свойства будут использоваться в последующем, сформулируем их в развернутом виде. Типичная векторная задача иллюстрируется рис. 6.3. Сообщение a(t) представляет /7-мерный вектор. Мы оперируем над ним при помощи матричного линейного фильтра, имеющего ρ входов и η выходов: оо х(«)= 5 к, (и, о) а (о) dv, Tt^u<Tf. (47) —оо Вектор х(и) умножается на (т X л)-мерную матрицу модуляции с целью получения m-мерного вектора у(/), который и передается по каналу. Вектор у(/) мы сформировали путем последовательного осуществления линейных операций с памятью и без памяти. Причина указанной по- 554 bf(u,v) матричный фильтр ρ-входов /7- выходов х(и) /7Х/
следовательной двухэтапной процедуры станет очевидной ниже. Полезный сигнал ά(ή есть (д X 1)-мерный вектор, связанный с а(и) посредством функционала, соответствующего матричному фильтру с ρ входами и q выходами. Таким образом: оо d(/)= J kd(t,O)&(O)dv. (48) — оо С некоторыми типичными векторными задачами мы встретимся позднее. Размерности т, η, ρ и q различных векторов могут быть разными. Полезный сигнал ά(ή имеет q компонент. Обозначим оценку ί-й компоненты через di(t). Необходимо одновременно минимизировать Ь>1(*)*Е\Ы0-*Лф, * = 1, 2, ...,?. (49) Сообщение а(и) есть векторный нормальный процесс с нулевым средним, а помеха — m-мерный нормальный процесс. Вообще говори предполагается, что помеха содержит компоненту белого шума \ν(ή: Ε [w (t) wT (и)] AR (/) δ (t—u)% (50) где R(t) положительно определена. Предполагается, что необходимые ковариационные функции известны. Будем пользоваться той же нумерацией свойств, что и в скалярном случае, добавляя только букву V. Ради краткости повторять исходных допущений не будем. Свойство 3V. Ϊ' Kdr (Λ")= J Μ/, τ) Кг (τ, u)dx% Tl<u<Tf. (51) Ti Доказательство — см. задачу 6.1.2. Свойство 3A-V. Каг (Λи) == $ h0(t, τ) Кг (τ, и)dx, Tt<u<t. (52) Ti Свойство 4B-V. bo(t%t)=\p(t)CT(t)1Cx(t)t (53) где ξρ(0 — ковариационная матрица ошибок, элементы которой равны Ьи (0 ±Е [ [at (t) - α, (/)] [aj (/) - α, (t)]). (54) (Поскольку ошибки имеют нулевые средние, корреляционная и ковариационная функции совпадают.) Доказательство — см. задачу 6.1.3. Остальные свойства для векторного случая получаются путем простой модификации. Краткие итоги по § 6.1. В данном параграфе был исследован ряд свойств, появляющихся при наложении ограничений применительно 555
к случаю линейной модуляции. Хотя эта задача была рассмотрена лишь в контексте модуляции, вполне очевидно, что она имеет широкий круг приложений. Так, если положить c(t) = 1 в определенные моменты времени и c(t) = 0 — в остальное время, то получим дискре- тизированную модель наблюдения. Этот и другие, представляющие интерес случаи, иллюстрируются в задачах, вынесенных за пределы основного текста (см. задачи 6.1.4—6.1.9). До сих пор не вводилось никаких ограничений характера процессов и интервала наблюдений. Иначе говоря, процессы могли быть как стационарными, так и нестационарными, а моменты времени Tt и Т1 ( ^ Tt) — произвольными. Теперь будем рассматривать конкретные методы решений. Самый легкий путь решения — рассмотреть различные частные случаи. В остальной части данной главы рассмотрены линейные устройства обработки. Вообще говоря, мы не оговариваем в явном виде, что допущение о гауссовости соблюдается. Важно еще раз подчеркнуть, что если это допущение не выполняется, то мы ищем только наилучшее линейное устройство обработки (нелинейное устройство может быть лучше). Каждой обсуждаемой нами задаче соответствует другая задача, в которой процессы являются гауссовыми и для которой данное устройство обработки является оптимальным из всех устройств обработки по заданному критерию. Следует также заметить, что остальную часть главы можно было бы изучать непосредственно после гл. 1, если подходить к ней как к «структурной» задаче и не пользоваться допущением о гауссовости. Понятно, что это придает задаче неправильный акцент и что линейное устройство обработки следует рассматривать как некое устройство, вырабатывающее условное среднее. 6.2. Реализуемые линейные фильтры. Стационарные процессы с бесконечным прошлым. Винеровские фильтры Рассмотрим один важный случай, связанный с (20). Предположим, во-первых, что время последнего наблюдения соответствует моменту времени, когда желательно получить оценку, т. е. t = Tf и (20) обращается в Kdr (t, o) = lh0(/, и) Кг (и, σ) dut Ti<a<t. (55) Tt Во-вторых, будем полагать, что Tt = —оо. Это допущение означает, что для выработки оценки мы имеем в распоряжении все бесконечное прошлое процесса. С практической точки зрения это просто значит, что прошлая часть процесса доступна для обработки независимо от объема памяти нашего фильтра. В последующем параграфе, когда мы будем обсуждать случай конечного времени Ти будет сде- 556
лан ряд количественных утверждений относительно того, насколько велико должно быть t— Ти чтобы можно было считать его бесконечным. В-третьих, будем считать, что принимаемый сигнал является выборочной функцией стационарного процесса и что передаваемый и принимаемый сигналы совместно стационарны. (На рис. 6.1 это соответствует c(t) = const. Поэтому мы говорим, что данный процесс является смодулированным1*). Таким образом, можно записать t Kdr(t—o)= jj Αο(ί, u)Kr(u—G)dut — οο<σ<ί. (56) — oo Так как процессы стационарны, а интервал наблюдения бесконечен, попытаемся найти решение (56), не зависящее от времени: Karit—a)^ $ h0(t—u)Kr(u—G)dut — οο<σ</. (57) — oo Если можно найти решение (57), то оно будет также и решением (56). Если Кг(и — σ) положительно определена, то (56) имеет единственное решение. Поэтому, если (57) имеет решение, то оно будет единственным и вместе с тем единственным решением (56). Полагая τ = t — σ Ht) = / — и, получим уравнение oo Kdr CO = $ Κ{ν) ΚΓ(χ—υ) dv, 0<τ< oo, (58) ο обычно именуемое уравнением Винера—Хопфа. Оно было выведено и решено Винером Ш. (Задача линейной обработки независимо исследовалась Колмогоровым [2]). 6.2.1. Решение уравнения Винера-Хопфа Наше решение уравнения Винера—Хопфа аналогично методу Боде и Шеннона [3]. Хотя по необходимому объему выкладок этот метод не отличается от решения Винера, данная процедура носит более интуитивный характер. Ограничимся рассмотрением случая, когда преобразование Фурье входной корреляционной функции /Сг(т) является рациональной функцией. Практически это условие не является ограничением, так как большую часть интересующих нас спектров можно аппроксимировать рациональными функциями. Общий случай рассмотрен Винером [1], однако он не позволяет выработать практический метод решения. Х) Термин «немодударованный» употребляется здесь в смысле, противоположном общеупотребительному, согласно которому процесс сообщения модулирует несущую (переносчика). Прилагательное «смодулированный» представляется нам наиболее подходящим. 557
Прежде всего заметим, что если r(t) было бы белым шумом, то решение (58) оказалось бы тривиальным. Если *Γ(τ)=β(τ), (59) то (58) обращается в оо Kdr(x)^\K(v)b(x — v)dO% 0<τ<οο, (60) о и KdrCO, τ>0, . 0, τ<0 (значение й0(пг) при τ = 0 следует и& принятого нами условия непрерывности.) Вряд ли во многих интересующих нас задачах (59) будет удовлетворяться. Если бы, однако, мы могли осуществить над r(t) некоторую предварительную операцию для преобразования r(t) в белый процесс, как показано на рис. 6.4, то последующая задача фильтрации «выбеленного» процесса ζ^1 была бы тривиальной. Идея операции выбеливания знакома нам из § 4.3. В рассмотренном там случае сигнал был детерминиро- Рис 6.4. Выбеливающий ванным и мы выбеливали только помеху, фильтр. в данном же случае мы выбеливаем всю смесь, поступающую на вход. В § 4.3 было доказано, что любая обратимая операция не может ухудшить параметров всей системы. Теперь мы также хотим, чтобы все устройство обработки было реализуемым линейным фильтром. Ввиду этого укажем следующее свойство. Свойство выбеливания. Для всех рациональных спектров существует реализуемый линейный фильтр с постоянными во времени параметрами, выход z(t) которого является белым процессом, когда на входе действует r(f), и обратным которому является также реализуемый линейный фильтр. Если импульсную характеристику выбеливающего фильтра обозначить через w(t), а передаточную функцию — через Щ/ω), то данное свойство утверждает, что: оо 1) у^ w(u) w(v)Kr(t — w — v)dudv *= δ (τ), — оо <τ<οο — оо или 2) |U7(/<o)|2S,(co) = l. Если обозначить импульсную характеристику обратного фильтра через w-1^), то оо 3) \ wr-x(u — ν) w(v) dv = δ (и) h0(x) = n(t) ru(t) 558
или 4) f [ar-i (τ)] = —!— = W~l (/ω) ; L WJ W(j(*) u ' и υμ-1^) должна быть импульсной характеристикой реализуемого фильтра. Выведем это свойство путем демонстрации конструктивного метода на простом примере с последующим распространением его на произвольные рациональные спектры. Пример 1. Пусть Мы хотим выбрать передаточную функцию выбеливающего фильтра так, чтобы он был реализуемым, а спектр его выходного процесса z(t) удовлетворял уравнению 5ζ(ω) = 5Γ(ω)|^(/ω)|2=1. (63) Для выполнения этого разделим Sr (ω) на две части Первый сомножитель обозначен через G~t~(/co), ввиду того, что он равен нулю для отрицательного времени. Второй сомножитель комплексно сопряжен с первым. Очевидно, если положить 1 j(u-\-k r(/(u>=^a^=W· (65) то (63) будет удовлетворяться. Видно, что выбеливающий фильтр содержит включенные параллельно дифференцирующее и усилительное звенья. Так как W-' (/ω) = G+ (/ω) = 1^ , (66) то очевидно, что обратным функционалом является реализуемый линейный фильтр и, следовательно, W(j(u) — правомерная обратимая операция. Таким образом, можно оперировать над z(t) любым из двух способов, иллюстрируемых на рис. 6.5, и, как было доказано в § 4.3, если выбрать /*ο'(τ) оптимальным образом, то выходы обеих систем будут одинаковы и равны d(t). В данном конкретном случае выфор Щ/ω) был очевиден. Рассмотрим теперь более сложный случай. Пример 2. Пусть = >(/ω + «1)(-/ω+«1) ' (/ω + βΟί-Ζω + βΟ Необходимо выбрать W(j<o) так, чтобы Sr (ω) = I W-1 (/ω) |2 = IG+ (/ω) |2 (68) 659
и оба фильтра — W(j(u) и W~~l(j(u) [или, что эквивалентно, 0~*~(/ω) и W(j<u)] были реализуемыми. При обсуждении реализуемости удобно пользоваться комплексной s-плоскостью. Путем замены /ω на s, где s = σ + /ω, рассматриваемые функции можно распространить на всю комплексную плоскость. Чтобы фильтр W(s) был реализуемым, он не должен содержать никаких полюсов в правой половине s-плоскости. Поэтому мы должны приписать к ему сомножитель (/ω+ai). Аналогично, чтобы W'Hs) [или G+(s)] был реализуемым, припишем ему сомножитель (/ω + βχ). Выбор постоянной произволен, так как n(t) n(t) \ W(ju)) W(juj) \z(tK г ψ\ I I Η 'If i„ A "и ι * ~-/ Оптимальная операция над ζ it) а) , W~f(ju>) > H0 U ω) L 1 d(t) 1 Λ J d it) 1—" I 1 J δ) Рис. 6.5. Оптимальный фильтш α—метод Ш 1; б —метод Ш 2. она связана только с регулировкой уровня белого шума. Ради простоты будем полагать, что спектр процесса z(t) имеет единичный уровень, и распределим постоянную величину равномерно. Тогда G+(/a,)=ciSf· (69) Для исследования общего случая рассмотрим диаграмму полюсов и нулей типичного спектра, изображенного на рис. 6.6. Считая данный спектр типичным, приходим к выводу, что процедура носит очевидный характер. Разложим Sr(co) в ряд и припишем все полюсы и нули левой полуплоскости (и половину каждой пары нулей, расположенных на оси) функции G+(/co). Остальные полюсы и нули будут точно соответствовать комплексно-сопряженной величине [G+(/cd)]*. Тот факт, что каждый рациональный спектр может быть разделен таким образом, следует непосредственно из того, что Sr(co) является действительной четной и неотрицательной функцией, обратное преобразование которой есть корреляционная функция. Это и предопределяет различные случаи поведения диаграммы полюсов и нулей, показанных на рис. 6.7, а— 6.7, в. 1. Симметрия относительно оси σ. Иначе Sr(co) не была бы действительной величиной. 2. Симметрия относительно оси /со. В,противном случае Sr(co) не была бы к тому же и четной. 560
Левую полуплоскость ставим в соответствие Развиваем нули на оси JU Правую полуплоскость ставим в соответствие s) X Q - - X e*fs) * G+fe) Χ S = 6+jcJ о J {J -^fcw X G+l·'*) Рис. 6.6. Типичная диаграмма полюсов и нулей. jv ; Симметрия относительна оси 6 *) JOJ в) № А Симметрия относитель но оси J си *) Нули на оси joj парны {полюсов на оси не может быть) Рис. 6.7. Возможные диаграммы полюсов и нулей в я-плоскост* 661
fft) 1 &+(ίω) z(t) H'oti") d(t) 3. Любые нули на оси /ω встречаются только парами. Иначе функция Sr(co) была бы отрицательной при некотором значении ω. 4. На оси /ω полюсов нет. Это соответствует сомножителю 1/ω2, обратное преобразование которого не является корреляционной функцией стационарного процесса. Доказательства этих свойств представляют тривиальные упражнения (см. задачу 6.2.1). Рис. 6.8. Оптимальный фильтр. Мы доказали, что всегда можно отыскать реализуемый обратимый выбеливающий (декоррелирующий) фильтр. Задача обработки сводится теперь к задаче, иллюстрируемой рис. 6.8. Необходимо построить фильтр с такой передаточной функцией #0'(/со), чтобы в результате воздействия на z(f) получалась оценка d(t) по минимуму среднеквадратической ошибки. Очевидно, что й0'(т;) должна удовлетворять (58), если г заменить на г: * Kdz (τ) = J V (ν) Κζ (τ —ν) dvt 0 < τ < < (70) Из требования, чтобы процесс z(t) был белым процессом с единичной спектральной плотностью, следует, что V (*) = ** (Ό. τ>0. (71) Таким образом, если бы мы знали /С<*г(т), то наше решение было'бы закончено. Ввиду того, что z(t) получается из r(t) посредством линейной операции, Καζ{%) отыскивается без особого труда: **(τ)Α£ d(t) § w(v)r(t — x—v)dv = = S w(v)Kdr(T + v)dv= I wi-toKtrtt-ftdfi. — oo —oo Произведя преобразование, получим ^ζ(/ω) = №* (/ω) Sdr (/*>) = Sdr (/ω) [G+ (/ω)]* (72) (73) Мы просто нашли обратное преобразование Sdz(j(u) — функцию Kdq (τ) и оставили часть, соответствующую τ ^ 0. Типичный вид функции Κάζ{τ) показан на рис. 6.9, а. Связанная с /С^(т) величина h0'(x) иллюстрируется рис. 6.9, б. 662
Обозначим преобразование Κάζ(<ή для τ > О через оо оо [Sdz (/ω)]+ Δ $ /<dz (τ) e-/«* άτ = $ й0' (τ) e-/«* dr. ι) ο · ο Аналогично, ο— lSdz(j<*)]-* I Kdz(x)e-i*"dx. — οο Очевидно, Sdz (/ω) = [Sdz (/ω)]+ + [Sdz (/ω)]_, и можно записать Но' (/ω) - [S& (/ω)1+ = [W* (/ω) Sdr (/ω)]+ = Sdr(iu) 1 [G+ </ω)Π+ (74) (75) (76) (77) Тогда весь оптимальный фильтр является просто последовательным соединением выбеливающего фильтра и фильтра с передаточной функцией #ο'(/ω): #0(/ω)4——]\ S*(W 1 (78) Мы видим, что посредством ряда стандартных, простых по своему существу операций можно синтезировать требуемый фильтр. Дадим краткую характеристику всех этапов этой процедуры. л'оМ А Рис. 6.9. Типичные функции: а — типичная ковариационная функция; б—соответствующая ей функция /г0' (τ). 1. Разлагаем входной спектр на две части. Один из сомножителей G+(s) имеет все полюсы и нули в левой части s-плоскости. Другой сомножитель является зеркальным изображением первого относительно оси /ω. 2. Взаимный спектр d(t) и z(f) можно выразить через исходный взаимный спектр, поделенный на [ό+(/ω)1*. Это соответствует некото- г) Вообще говоря, символ [~]+ означает реализуемую часть обратного преобразования выражения, стоящего в квадратных скобках. 563
рой функции, отличной от нуля как для положительного, так и для отрицательного времени. Реализуемая часть этой функции (τ ^ 0) есть Λο'(τ)> а ее преобразование — #0'(/ω). 3. Передаточная функция оптимального фильтра есть просто произведение этих двух передаточных функций. Далее мы увидим, что составная передаточная функция соответствует реализуемой системе. Заметим, что фактически мы построили оптимальный линейный фильтр как единую систему. Разбиение на две части было произведено исключительно из методических соображений. Прежде чем перейти к обсуждению свойств и приложений найденного решения, целесообразно рассмотреть простой пример с тем, чтобы пояснить смысл (78). Пример 3. Допустим, что r(0=V?a(0 + n(0, (79) где a(t) и n(t) — некоррелированные стационарные процессы с нулевыми средними и 2k S«(W)=^TF <80) [мы видим, что a(t) имеет единичную мощность, так что Ρ — передаваемая мощность] , 5η(ω)=γ· (81) Полезный сигнал имеет вид d(t) = a(t + a), (82) где α — постоянная величина. Взяв а > 0, получаем задачу на предсказание; при α = 0 имеем задачу обычной фильтрации, а при α < 0 — задачу фильтрации с задержкой. Решение данной задачи сводится к простому применению процедуры, изложенной в предыдущем параграфе: ' 1 ' ω2 + /ί2 + 2 2 <o* + k* У } Удобно ввести величину АР A-w0- (84) Физический смысл этой величины мы поясним позднее, сейчас же ее можно рассматривать как некий полезный параметр. Прежде всего разложим спектр 5П»)-£* + Г? + Л)-ОЧМ [*<»)]- (85) 2 со2 + /е2 так, что (*)' Теперь Kdr(T:) = E[d(t)r(t-%)] = E{a(t + a)[yPa(t-%)+n(t-%)]} = =ΥΡΕ[α(ί + α)α(ί-τ))=ΥΡΚα(τ + α). (87) 564
Произведя преобразование, получим аь<м-УН. (.)<"-- »%.?" SdzU<*) = Sdr (/ω) 2feVPe+/(oa -/ω + ft [G+ (/ω)]* ω* + ^ уду2 ( _ /ω + k УТ+Л) Для отыскания реализуемой части произведем обратное преобразование: ™-' -iifn^b-t 26νΡβ+'ωοί to + fe)ViV2(-/W + fel/l T+A)J (88) (89) (90) Обратное преобразование может быть весьма просто найдено либо методом вычетов, либо разложением на неприводимые многочлены с применением теоремы сдвига. В результате получим Kdz{%)-- 1 2~\/р VNJ2 1+УТТЛ 21/р 1 k (τ+ α) τ + α > 0, (91) Vn0/2 1+Vl+A 6+ΑνΤ+Λ(τ+α) τ + α<0 Эта функция показана на рис. 6.10. Теперь /ι0'(τ) зависит от величины а. Иначе говоря, величина Kdz (τ) Β облети τ > 0 является функцией а. Рассмотрим три типа операций. Kdz Μ Рис. 6.10. Взаимно ковариационная функция. Случай 1. a = 0. Фильтрация с нулевой задержкой. Полагая в (91) а = 0, имеем V (τ) = 21/> 1 #</ №>) = УлГо/2 1+1/1+Л 1 2J/P β"*ταβ1(τ) 1 Тогда Я0(/ш) = 1+1/1+Л Т/ЛГо/2 /co + fc //о' (/ω) 2УР 1 6+(/ω) (Л^0/2) (l+Vl + Λ) /ш+/еУГ+Л (92) (93) (94) Полученный нами результат интуитивно логичен. Амплитудно-частотная характеристика фильтра показана на рис. 6.11. Фильтр представляет, собой простой фильтр нижних частот, полоса пропускания которого зависит от k и Л. 565
Придадим теперь параметру Л некоторый физический смысл. Ширина спектра процесса сообщен"" прямо пропорциональна /г, как показано на рис. 6.12, а, и равна kin Гц. (на уровне 3 дБ). Другой распространенной мерой ширины полосы служит эффективная полоса, являющаяся шириной полосы прямоугольного спектра с плотностью Sa(0) и с такой же полной мощностью, что и у действительного сообщения, как показано на рис. 6.12, б. Физически Л означает отношение t$OL = ~/ Рис. 6.11. Нормированная частотная характеристика оптимального фильтра. снгнал/шум в эффективной полосе сообщения. Это отношение является наиболее естественной мерой в большей части нашей работы. Связь между Λ и отношением сигнатл/шум в полосе сообщения на уровне 3 дБ зависит от конкретного спектра. Дял данного частного случая Л3дБ = (π/2)Λ. Safol Sra(oj) г/к к/2я co/2n=f -к/Ч к/4 ω/2π^ a) t) ~ Рис. 6.12. Эквивалентный прямоугольный спектр. Для фиксированного k ширина полосы оптимального фильтра возрастает с увеличением Л — отношения сигнал/шум. Таким образом, при Л -> оо амплитуда отклика фильтра стремится к единице на всех частотах, и фильтр пропускает компоненты сообщения без искажений. Поскольку в данном случае шум не существен, это представляется интуитивно логичным. С другой стороны, при Л -^ 0 точка 3 дБ характеристики фильтра стремится к точке k. Коэффициент передачи, однако, стремится к нулю. Как и ранее, это представляется интуитивно логичным: имеется столь много шума, что согласно критерию среднеквадратической ошибки наилучшее значение выходной величины фильтра (среднее значение сообщения) будет равно нулю. 566
Случай 2. α < 0. Фильтрация с задержкой. Здесь /ι0'(τ) имеет импульсный характер, что показано на рис. 6.13. Произведя преобразование, получим #ο'(/ω) = 2kVP м<*> (;(o+fe)(_/(D+ft-|/i + A) _еаб/Г+л H0(j«>) fe(l+Vl+A)(-/w+feVl + A) H0' (/ω) 2feVf (95) G+ (;ω) .α/ω Λ^0/2 [a,2 + fe2(l+A)J eakVl+\{ju)+k) k(l+Vl+A)[<i>* + kHl+A)] Последнее можно переписать в виде #ο(/ω) = 2feVP е0"40 (#0/2)[ω* + ^(Ι+Λ)] 1 (/(u+fe)e«(*/i+A-/o) fe(l+VT+A) Заметим, что выражение вне скобок есть просто Sdr (/ω) Sr(«) .α/ω. (96а) (966) (97) Видно, что когда a — большое отрицательное число, второй член в скобках приближенно равен нулю. Таким образом, #0(/ω) стремится к (97). Это — просто отношение взаимного спектра к полному входному спектру, с задержкой, чтобы сделать фильтр реализуемым. Рис. 6.13. Фильтрация с задержкой. Заметим, что импульсную характеристику рис. 6.13 обычными методами синтеза цепей реализовать затруднительно. Случай 3. a > 0. Фильтрация с предсказанием. Здесь V (τ) = (4Ш=- ..-!·... е~*Т) е~*а- (98> \Т/ЛУ2 i+Vi+л Сравнивая (98) и (92), видим, что оптимальный фильтр для предсказания есть просто оптимальный фильтр для оценивания a(t), умноженный на коэффициент передачи e~kat как показано на рис. 6.14. Это объясняется тем, что a(t) является марковским процессом первого порядка в широком смысле, а шум — белым. Аналогичный результат мы получим в §. 6.3 для процессов более общего вида. 667
Прежде чем подвести итоги нашего обсуждения, рассмотрим подробнее один момент, встретившийся нам в случае 1 приведенного примера. Один из этапов решения заключался в отыскании реализуемой части функции. Часто нет необходимости искать временную функцию, а затем производить повторное преобразование. В частности, если Sdrij®) ecTi> отношение двух полиномов по степеням /ω, то можно записать Sdr (/<*>) IG+ (/ω)]* Ν -F(M+2 i?i i^+Pt Ν ■Σ -/ω-φ-fy (99a) где F(j(u) — некоторый полином. Первая сумма содержит все члены, соответствующие полюсам в левой половине s-плоскости (включая ось -ft) Оптимальный фильтр для сличая нулевой задержки alt) э-Лгос α (ύ+α) Аттенюатор Рис. 6.14. Фильтрация с предсказанием. /со), а вторая сумма содержит все члены, соответствующие полюсам в правой половине s-плоскости. В таком разложенном виде реализуемая часть состоит из~ первых двух членов. Поэтому Sdr (/ω) L [G+ (/ω)Γ N + =f(/<o)+2i /ω+ρ, (996) Использование (996) позволяет сократить необходимые выкладки. В данном параграфе был разработан алгоритм решения уравнения Винера—Хопфа и приведен простой пример, иллюстрирующий применение предлагаемого метода. В следующем параграфе мы исследуем получающуюся при этом среднеквадратическую ошибку. 6.2.2. Ошибки в оптимальных системах Чтобы оценить качество оптимального линейного фильтра, вычислим минимальную среднеквадратическую ошибку. Выражение для среднего квадрата ошибки (24) было приведено при изложении свойства 4. Так как процессы стационарны, а параметры фильтра постоянны во времени, то средний квадрат ошибки не будет зависеть от времени. Поэтому формула (24) упрощается: lp = Kd{b)-\h{x)Kdr{x)d%. (100) 668
Поскольку h0{x) = 0 при τ < 0, то (100) можно записать иначе оо 1р = КА0)— I h0(x)Kdr(x)dx. (101) — оо Теперь оо Но (М = —— [ Kdz (0 erf dt, (102) G+ (/ω) J о где l [G+ (/ω)]* 1 2π J [G+ (/ω)]* ОО Подстановкой обратного преобразования (102) в (101) получаем оо П оо оо ~1 Ъ = КА0)— [ Κ*(τ)(Ιτ\-± f e^rfo-J—- f *Λ(/)eri«dt l (104) — оо I — оо 0 J Изменив порядок интегрирования, будем иметь ОО Г оо оо ~| lP = Kd(0)-<\jKdz(t)dt\ ±- j e-^^-ji— Γ Κ*, (τ) e^dx . (105) о L ,—°° —°° J Часть интеграла внутри квадратных скобок равна Kdz(t). Поскольку Kdz{t)—величина действительная, то оо lp = Kd{0)-\K2dz(t)dt. (106) о Результат (106) является удобным выражением для среднего квадрата ошибки. Заметим, что предварительно необходимо разложить входной спектр и выполнить обратное преобразование. Здесь применимы рассмотренные нами приемы. Формулу (106) можно использовать для иссследования влияния α на средний квадрат ошибки.Обозначим полезный сигнал при α = 0 через d0(t), а полезный сигнал для произвольного α — через da(t) = = d0(t + α). Тогда E[d0(t)z(t-T)]=KdozWW>(T) (107a) и Ε [da(t) ζ(t—τ)] = Ε [d0(t + а)ζ(ί—τ)] =Φ (τ + α). (1076) Теперь можно выразить (106) через Φ (τ). Полагая в (106) *л (0 =*('+«), (Ю8а) 569
имеем ОО 00 & = Kd(0) — Ιφ2(ί + α)άί=Κά(0)—\ф2{и)аи. (1086) О α Отметим, что Φ (и) не зависит от а. Поскольку подынтегральное выражение является положительной величиной, ошибка монотонно возрастает с увеличением а. Ошибка достигает наименьшего значения при α = — оо (бесконечная задержка) и возрастает монотонно до единицы при а-> оо. Этот результат свидетельствует о том, что для любого полезного сигнала минимальная средцеквадратическая ошибка будет убывать, если можно позволить задержку при обработке сигнала. Среднеквадратическая ошибка при бесконечной задержке дает нижнюю границу среднеквадратическной ошибки при любой конечной задержке, и часто называется неустранимой ошибкой. Более интересной величиной в некоторых случаях является нормированная ошибка. Мы определяем нормированную ошибку соотношением ξ£ = Δ _JL_ (109a) 71 - Kd(0) или оо II = 1 — Г Ф2(и)аи. (1096) α Теперь можно применить полученные результаты к предыдущему примеру. Пример 3 (продолжение). Для нашего примера П. 8Р Л^^^^Ч^')' α<°· Ν, (! + ' 1 — 7Г - \ е~ш at, a < 0. 8Р 1_ N0 (1 + УТ+Л)2 (ПО) Вычислив интегралы, получим 1 де+2й/1+Ла 1К = VT+A + (1+уг+л)2УГТл' а<0, (111) 2 $n=Twm (112) 1р = /, ,-,/—- + ,Λ,/π-;τ. «>°· (из) A(l-e~2to) pn (ι+уг+А) Т (1+уг+л)2 ' 570
Двумя предельными случаями для (111) и (113) являются случаи а = — оо и а= оо соответственно: Vl+A* Sp_ — (114) (115) График зависимости ξρβ от (ka) показан на рис. 6.15. Физически величина ka связана с величиной, обратной ширине спектра сообщения. Если ввести величину Те =4·· (П6) К о -2 -/95 -1 -0,5 О 0,5 1 1,5 (кои) Фильтрация Упреждение с задержкой μ ^пи.* Рис. 6.15. Влияние временного сдвига на ошибку фильтрации. то единицами измерения по горизонтальной оси будут а/тс, что соответствует задержке, измеренной на интервалах корреляции. Видно, что ошибка при задержке на одну постоянную времени приближенно равна ошибке при бесконечном времени задержки. Отметим, что ошибка не является симметричной функцией параметра а. Прежде чем подвести итог нашему обсуждению проблемы реализуемых фильтров, рассмотрим родственную проблему нереализуемых фильтров. 6.2.3. Нереализуемые фильтры Вместо требования реализуемости устройства обработки рассмотрим оптимальную нереализуемую систему. Это соответствует случаю Tf >t. Иначе говоря, мы используем вход г(и) в моменты времени позднее, чем t, для определения оценки в момент t. Для случая, когда Tf > /, можно видоизменить (55) так, что получим **(*)= S h0(tit-v)Kr(T-v)dvi ί_Γ/<τ<οο. (117) 571 *7Tf
В данном случае h0(tt t — ν) отлична от нуля при всех v^ t— Tf. Поскольку сюда входят и значения ν < О, фильтр будет нереализуемым. Наибольший интерес представляет случай,, когда Tf — оо. Тогда (117) принимает вид оо Κάτ(τ)= J h0a(v)Kr(x-v)dv, -οο<τ<οο. (118) ОО Мы ввели подстрочный индекс <ш» с тем, чтобы подчеркнуть, что фильтр является нереализуемым. Так как (118) справедливо при любых τ, его можно решить при помощи преобразования Н0а(М = ^^-- (119) Из свойства 4 средний квадрат ошибки равен оо 6e = ^(0)-J Ku(x)KdT{x)dT. (120) —оо Заметим, что \и является средним квадратом ошибки точечной оценки. Согласно теореме Парсеваля 1и = £Г I &«(«>)-Нои (/<■>)S*dr (/ω)] άω. (121) —оо Подстановкой (119) в (121) получим оо fc-i Sd(o>)Sr(<i>)-\Sdr(j<u)\* de> S_r (ω) 2π В частном случае, когда d(t) = a(t), r(t) = a(t) + n(t), а сообщение и помеха некоррелированы, (122) сводится к s" J sa Sn (ω) Sa (ω) dco (co) + Sn(co) 2π (122) (123) (124) В примере, рассмотренном на стр. 564, помеха считалась белым шумом. Следовательно, Sr(co) —оо —оо 572
Вернемся теперь к общему случаю. Нетрудно показать, что выражение (121) равно также оо lu=Kd{0)~ $ Ф»(0Л. (127) —оо Сравнивая (127) и· (107), видим, что эффект использования нереализуемого фильтра равноценен допущению бесконечной задержки полезного сигнала. Этот результат представляется интуитивно логичным. В нереализуемом фильтре мы позволяем себе, разумеется мысленно, использование всего прошлого и будущего входного сигнала и воспроизводим желательный сигнал в настоящий момент времени. Практический путь приблизиться к такому методу обработки — это ждать, пока не поступит как можно большая часть будущего входного сигнала, а требуемый выходной сигнал выдавать в более поздний момент времени. Во многих проблемах связи именно ошибка за счет нереализуемости является фундаментальным ограничением систем. Наиболее существенные моменты, которые необходимо иметь в виду при рассмотрении нереализуемых фильтров, указаны ниже. 1. Средний квадрат ошибки при использовании нереализуемого линейного фильтра (Tf = оо) служит нижней границей среднего квадрата ошибки для любого реализуемого линейного фильтра. Это соответствует неустранимой ошибке (или ошибке при бесконечном времени задержки), с которой мы встречались на стр. 570. Вычисление \и при помощи (124) обычно легче, чем вычисление ξρ при помощи (100) или (106). Поэтому логично производить предварительные вычисления, даже если мы интересуемся только задачей реализуемой фильтрации. 2. Можно построить реализуемый фильтр, ошибка которого приближается к ошибке нереализуемого фильтра, допуская задержку в выходном сигнале. Можно получить средний квадрат ошибки сколь угодно близкий к неустранимой ошибке путем увеличения этой задержки. Практически задержка сигнала во времени, в несколько раз превышающая величину, обратную эффективной ширине спектра [Sa(co) + + 5η(ω)], обычно дает средний квадрат ошибки, близкий к неустранимой ошибке. Вернемся теперь к проблеме реализуемой фильтрации. В §6.2.1 и 6.2.2 был построен алгоритм, который дает конструктивный метод отыскания оптимального реализуемого фильтра и результирующей среднеквадратической ошибки. Другими словами, при наличии необходимой информации всегда можно (по крайней мере в принципе) посредством специальной процедуры получить оптимальный фильтр и результирующую вероятность ошибки. На практике, однако, алгебраическая сложность заставляла большинство инженеров, изучающих оптимальные фильтры, использовать однополосный спектр в качестве канонического спектра сообщения. Отсутствие выражения для среднеквадратической ошибки в замкнутой форме, которое не требовало бы разложения спектра, делало, по существу, невозможным исследование влияния различных спектров сообщений. 573
В следующем параграфе мы обсудим специальный класс задач линейной оценки и выведим выражение в замкнутой форме для минимальной среднеквадратической ошибки. 6.2.4. Выражения для ошибки в замкнутой форме В этом параграфе мы установим ряд полезных результатов в замкнутой форме для частного класса задач оптимальной линейной фильтрации. Представляет интерес случай, когда г(и) = а(и) + п(и), — οο<ιι*ζί. (128) Иначе говоря, принимаемый сигнал состоит из сообщения и аддитивной помехи. -Полезным сигналом d(t) является сообщение a(t). Предполагается, что помеха и сигнал некоррелированы. Спектр сообщения— рациональный с конечной дисперсией. Нашей целью является отыскание выражения для ошибки, которое не требует разложения спектра. Основные результаты этого параграфа были первоначально получены Йовитцем и Джексоном [4]. Удобно рассматривать белую и небелую помехи раздельно. Ошибка в присутствии белого шума. Предположим, что n(t) — белый шум со спектральной плотностью NJ2. Хотя данный результат был впервые получен Йовитцем и Джексоном, гораздо более простые доказательства были даны- Витерби и Каном [5], Снайдером [6] и Хел- стромом [57]. Мы будем пользоваться этими доказательствами комбинированно. Из (128) имеем S,(co) = Sa(co) + -^ (129) 0+(/ω) = [5α(/ω) + -^]+. (130) Из (78) яо(/0) = ! [—^^—\ (ΐ3ΐ)ι> или Н0(М = ! ( SqW + W ML \ . (132) Далее, первый член в" скобках есть просто [Sa(a)) + Ν0/2]+, которая является реализуемой частью. Так как оператор реализуемой части линеен, первый член выходит за скобки без какой-либо модификации. Х) Во избежание двойных подстрочных индексов ъведем обозначение G" (/со) = [G+ (/ω)]*. Напомним, что сопряжение в частотной области соответствует обращению во временной области. Временная функция, соответствующая G+ (/ω), равна нулю при t < 0. Следовательно, временная функция, соответствующая <j~ (/ω), рявна нулю при t > 0. 574
Поэтому #β(/ω) = 1 ! ( ^ ) · (133) Вынесем ι/ N(/2 за фигурные скобки и введем остающийся внутрь оператора [·]-. Операция [·]- является разложением на множители, поэтому NJ2 получим внутри скобок: и'т=х-л^£ш^\тшшщ\- (134) Следующий этап — доказать, что реализуемая часть члена в фигурных скобках равна единице. Доказательство. Пусть Sa(<*>) — рациональный спектр. Тогда S (ω) =—-—L , (135) αΚ ' D(co2) V ; где знаменатель есть многочлен по степеням ω2, порядок которого по крайней мере на единицу выше, чем у многочлена в числителе. Тогда Sa(w)+N0/2 = Λί(ω*) + (Λί0/2)Ρ(ω*) (т) Νο/2 (Ν0/2)ϋ(ω*) ' . Sa (ω) +Ν0/2 ^ Ρ (ω«) + (2/Ν0) Ν (ω«) 13?) Ν0/2 D(co2) Sa((o) + N0/2 Α ω' + αι* (138ч Заметьм, что здесь нет дополнительного множителя, поскольку члены наивысшего порядка в числителе и в знаменателе совпадают. Величины at и βζ· можно всегда выбрать так, чтобы их действительные части были положительными. Если любое из <xf или βζ· — величина комплексная, то сопряженная величина также присутствует. Инвер- сируя обе части (138) и разлагая результат на множители, получим ·$α(ω)+ΑΌ/2-|-1-' _ π (-/ω + β|) ( —/ω + ai) (139) 1[&1?^П",-п['+7^г]· <-> Преобразования всех множителей произведения, за исключением единичного члена, будут равны нулю для положительного времени (их полюсы находятся в правой половине s-плоскости). Перемножение членов соответствует свертке их преобразований. Свертка функций, равных нулю для положительного времени, всегда дает функции, которые 575
равны нулю для положительного времени. Поэтому, когда мы берем реализуемую часть (140), сохраняется только единичный член. Это и есть требуемый результат. Следовательно, Я0(/со)=1- VN0I2 lSa(j<u)+NJ2]+ (HI) Выведем далее выражение для ошибки. Из формул (27) — (28) свойства 4В известно, что ·ξρ=3 HmM*,T) = -?r Пт/г0(б)Д^Ло(0+) τ-* Γ (142) ε->0Τ для случая, инвариантного во времени. Мы также знаем, что ? Н (т) d(u ■= h°(0+) +h°(0r) = h° (0+) J °U ; 2π 2 2 ' —oo так как Α0(τ) — реализуема. Объединяя (142) и (143), получим ξρ=Λ/0 Ι Η0(,ω). — с» Используя (141) в (144), будем иметь Используя комплексно-сопряженную величину (139) в (145), получим (146) 2π ' Sa((u)+N0/2^\+)-i\ άω 2π ' (143) (144) (145) ■-м['-по+£*)' 2π 2π (147) Разлагая произведение, имеем oo ( Г «о Я Я 1Р=лгД ι-h+yii=«i+yy т η /г я +222 /=1 /=1 β=ΐ do) 2π (148) oo /г о« а> Г « Л aj — Pi d(u 0 J ^/ω+α/2π _J ^ ^ (/ω + α£) (/ω + α,·) —oo |_'=1 /—1 rt /г rt +222 ί=1 /=l k=\ (149) 576
Интеграл в первом слагаемом представляет собой просто половину суммы вычетов (в этом легко удостовериться). Покажем теперь, что второе слагаемое равно нулю. Так как подынтегральная функция во втором слагаемом является аналитической в правой части s-шюскости, несобственный интеграл [—оо, оо] равен криволинейному интегралу, взятому по полуокружности бесконечного радиуса. Однако все члены в квадратных скобках при больших |s| имеют порядок не ниже |s|~2. Поэтому интеграл по полуокружности равен нулю. Следовательно, ^ = ^г2(а*Н5г)· (150) Нам остается только найти выражение в замкнутой форме для суммы вычетов. Его нетрудно получить, если заметить, что 1'"(£Ж=«.-е·· <ΐ5ΐ> (Для доказательства этого равенства проинтегрируем левую часть по частям при и = 1η[(ω2 + α£2)/(ω2 + βζ·2)] и dv = άω/2π.) Сравнивая (150), (151) и (138), получаем нужный результат: ^ihnii+M!)^. (152) ОО Используются обе формы записи выражения для ошибки [(150) и (152)]. Первая форма записи часто является наиболее удобной для фактической оценки ошибки. Вторая форма записи полезна тогда, когда необходимо найти Sa(ot)), минимизирующую ξρ, при определенных ограничениях. Следует подчеркнуть важность (152). В классической теории Винера для исследования свойств спектров различных сообщений приходилось фактически производить разложение спектра входного сигнала. Результат (152) позволяет исследовать поведение ошибки непосредственно. В последующих главах мы убедимся в важности этого выражения при решении задачи введения оптимальных предыскажений при угловой модуляции и в других сходных случаях. Попутно отметим, что интеграл в правой части (152) равен удвоенному среднему количеству взаимной информации (по определению Шеннона) между r(t) и a(t). Выражения для ошибки при типичных спектрах сообщений. Рассмотрим два семейства спектров сообщений. Для каждого семейства используем (152) с целью вычисления ошибки при применении оптимального реализуемого фильтра. Для оценки выигрыша, получаемого в результате введения задержки, будем также использовать (124) при вычислении нереализуемой ошибки. 19 Зак, 693 577
Случай 1. Семейство спектров Баттерворта. Процессы сообщений в данном классе имеют спектральные плотности, обратные полиномам Баттерворта порядка 2п. Из (3.98) S (ω:η)= 2пР 3ίη(π/2η) δ ^ k \ + (ωβ)2η ~1 + (ω/&) 42rt ' (153) Числитель (153) есть просто коэффициент усиления, отрегулированный так,- что мощность в спектре сообщения равна Р. Некоторые кривые этого семейства показаны на рис. 6.16. При η = = 1 имеем однополюсный спектр, рассмотренный в §6.2.1. Точка .(&:/?) 0,001 Рис. 6.16. Спектр Баттерворта. изгиба имеет место при ω = k рад/с; огибающая спектра за этой точкой спадает со скоростью 6 дБ/октава. При больших η изгиб остается в той же точке, но огибающая спектра спадает со скоростью 6п дБ/октава. При η = оо мы имеем ограниченный по полосе спектр с прямоугольной огибающей высотой Pnlk и шириной k рад/с. Если использовать kin Гц в качестве удельной ширины (двустороннего) спектра, то отношение сигнал/шум не будет зависеть от η и мы получим полезное соотношение ΛβΔ 2лР k/л N0/2 kN0 Для отыскания ξρ используем (152) 2cn/N0 l+(<o/fe) 1n\ (154) (155) 578
Это выражение можно проинтегрировать (см. задачу 6.2.18) и получить следующее выражение для нормированной ошибки «'.-^(-"ϊ-ΓΚ'+^τ-ϊ)"--1]· <Ι56> Аналогично, для отыскания нереализуемой ошибки используем (124): оо ltt= J ~^l+(«>/k)'» + (2/N0)cn' (157) ОО В результате интегрирования (см. задачу 6.2.19) получим ε Γι . 2п л · я 1<1/2л)-1 /1соч Ιη= Η AjBSin— . (158) Зависимость величины, обратной нормированной ошибке, от Ав представлена на рис. 6.17. Обращает на себя внимание сильная зависимость поведения ошибки от п. Однополюсный спектр—наиболее неблагоприятный спектр при фильтрации. Его асимптотика линейна, тогда как ограниченный по полосе спектр имеет экспоненциальную Рис. 6.17. Величина, обратная среднему квадрату ошибки в случае спектра Баттерворта: а — реализуемого; б — нереализуемого. асимптотику. Нетрудно видеть также, что при η = 3 или 4 помехоустойчивость фильтра достаточно близка к помехоустойчивости в случае ограниченного по полосе спектра (л = оо). Поэтому однополюсный спектр сообщения, используемый обычно в качестве примера, обладает самой низкой помехоустойчивостью. Второй вывод касается различия в выигрыше, получаемом за счет использования нереализуемого фильтра. Для однополюсного спектра 1ип>\Ьп (л=1). (159) 579
Иначе говоря, максимально возможное отношение равно 2 (или 3 дБ). В другом крайнем случае, при η = оо ξρη=^1η(1+ΛΒ), (160) тогда как ^ = -ГП-· (161) 1+Лв Таким образом, отношение ошибок равно (162) ъип А-в Для η = оо можно достичь заметного выигрыша при больших Ав за счет введения задержки. Случай 2. Семейство гауссовых спектров. Второй класс спектров описывается выражением о /т.„ч. 2Ρ/π Γ (η) 1 д dn MRo, kVnrin-—) V+<»2>nk2)n- (1+ω2/^Τ'· ( } Такие спектры можно получить путем пропускания белого шума через /г независимых однополюсных фильтров. В пределе при η ->- оо имеем гауссов спектр lim Sa (ω:η) = -2J^L ре-"2/*2. (164) Семейство гауссовых спектров показано на рис. 6.18. Заметим, что при η = 1 оба случая совпадают. Выражения для обеих ошибок имеют соответственно вид 1р =А Г ^-ΐηΓΐ+ 2<W 1 (165) JOO — ^ . (166) 2π (1 + ω2/^2)Λ+(2/Λ^0)ίίη Чтобы вычислить ξρΛ, перепишем (165) в виде (150). Для рассматриваемого случая вычисления а{ и β/ не вызывают затруднений [53]. Результаты для η = 1, 2, 3 и 5 представлены на рис. 6.19, а. При η = оо наиболее практичный подход заключается в выполнении интегрирования численными методами. Мы вычисляем (166), используя разложение на неприводимые многочлены. Так как о^ и β^ уже найдены, вычисление остатков не встречает затруднений. Результаты для η = 1, 2, 3 и 5 показаны на рис. 6.19, б. Для η = оо результат получен численным 580
интегрированием. Сравнивая рис. 6.17 и 6.19, видим, что гауссов спектр фильтровать труднее, чем спектр, ограниченный по полосе. Заметим, что предельные спектры в обоих классах являются нерациональными (кроме того, они являются неразложимыми). δχ(ω.η) Р/к Рис. 6.18. Семейство гауссовых спектров. Выше мы применили некоторые из результатов, имеющих замкнутую форму, к частному случаю фильтрации в присутствии аддитивного белого шума. Рассмотрим теперь кратко некоторые родственные задачи. 5 10 20 50 Ав а) 5 10 Ζ0 50ЛВ б) Рис. 6.19. Величина, обратная среднему квадрату ошибки в случае класса гауссовых спектров. Коррелированный (небелый) шум и линейные операции. Преимуществом выражения (152) является его простота. При переходе к более сложным спектрам помех выражения для ошибок становятся более громоздкими. Почти во всех случаях эти выражения для ошибок вычислить легче, чем соответствующие выражения, полученные при помощи классического метода Винера. 581
Для наших целей достаточно перечислить ряд случаев, для которых были получены ответы. Выводы для некоторых из результатов содержатся в задачах вне основного текста (см. задачи 6.2.20—6.2.26). 1. Передается сообщение a(t). Аддитивная помеха имеет спектр, содержащий только полюсы. 2. Перед передачей сообщение a(f) пропускается через линейный оператор, передаточная функция которого содержит только нули. Аддитивная помеха является белым шумом. 3. Передается сообщение a(t). Помеха имеет полиномиальный спектр 8η(ω) = Ν0 + Ν2ω^ + Ν,^ + ...+Ν2ηω^. 4. Сообщение a(t) пропускается через линейный оператор, передаточная функция которого содержит только полюсы. Шум является белым. Укажем, что случаи 2 и 4 приводят к таким же выражениям для ошибок, что и случаи 1 и 3 соответственно. Чтобы проиллюстрировать форму ответа, приведем результаты для типичных задач на случаи 1 и 4. Пример (на случай 1). Пусть аддитивная помеха n(t) не коррелирована с сообщением и имеет спектр 2соп2 Тогда ε'"Μ-έί5"(4,+5ίΦ)· ,,68) Этот результат выводится в задаче 6.2.20. Пример (на случай 4). Сообщение a(t) перед передачей интегрируется: t r(t)= j a(u)du + w(t). (169) Тогда где !p=^/i3 + /2, (170) /1= flnfl+^1^ (171) —oo Этот результат выводится в задаче 6.2.25. 582
Следует указать, что форма выражения для ошибки зависит только от формы спектра помехи или от типа линейной операции. Это позволяет нам изменять спектр сообщения и без затруднений исследовать его влияние на вероятность ошибки при фильтрации. В качестве последнего вопроса в нашем обсуждении проблемы винеровской фильтрации рассмотрим оптимальные системы с обратной связью. 6.2.5. Оптимальные системы с обратной связью Одной из форм, в которой оптимальные линейные фильтры встречаются при последующем изложении, — это в качестве элементов систем с обратной связью. Модификация наших результатов, с тем чтобы охватить этот случай, не вызывает затруднений. Пусть остаются в силе все допущения, сделанные в начале § 6.2 (стр. 556—557). Кроме того, потребуем, чтобы линейное устройство обработки имело форму, изображенную на рис. 6.20. Здесь ^(τ) — линейный фильтр, причем gz(<r) выбирается так, чтобы получить наилучшее d(t). Ограничения этого типа естественно возникают при рассмотрении систем управления [9]. В гл. 2 второй части будет показано, как они выступают в роли линеаризованных вариантов демодуляторов. Ясно, что мы хотим, чтобы передаточная функция замкнутой петли обратной связи была равна #0(/ω)· .Обозначим фильтр с обратной связью, осуществляющий эту операцию, через G/0(/co). Теперь nft)\ JT\ »\cfc)\ * ι "■» if\jy—*1 hl '\ \d(t) \ ' Фильтр в целом Рис. 6.20. Система с обратной связью. Н0 (/ω)=. «/. (M l+G/,(*») Решая относительно G/0(/©), получим Gi.(/®) Но (/ω) 1 -Я„ (/ω) (173) (174) Для общего случая определяем #0(/ω), используя (78) и подставляя результат в (174). Для частного случая § 6.2.4 можно написать ответ прямо. Подставив (141) в (174), будем иметь o..</»H(ins««+irr- (175) Отсюда видно, что Gh(j(u) имеет те же полюсы, что и G+(/co), и, следовательно, является устойчивым реализуемым фильтром. Видно также, что полюсы G+(/co) (а следовательно, и фильтра в петле обратной связи) 583
есть просто полюсы спектра оюбцеяия, расположенные в левой половине s-плоскости. Сообщение можно представить себе как выходное напряжение линейного фильтра, когда на вход его подается белый шум. Общий рациональный случай иллюстрируется рис. 6.21, а. Мощность регулируется путем изменения спектральной плотности ιι(ή: E[u(t)u(x)]&q6(t—T). Спектр сообщения записывается в виде Sa(<*)=<l\ frn-l(/CD)*-1+...+fro (/ω)Λ + Ρη-ι(/α>)Λ-1+... + Ρο (176) (177) Степень числителя должна быть по крайней мере на единицу ниже степени знаменателя, чтобы удовлетворялось допущение о конечной мощности, сделанное в § 6.2.4. Из (175) видно, что оптимальный фильтр с обратной связью имеет такие же полюсы, что и фильтр, который может быть использован для создания сообщения. Поэтому фильтр в петле обратной связи имеет форму, показанную на рис. 6.21, б. Нетрудно и®· 0/7-/ 5 + . + Ь0 *П+Р„-1$П~1* + Рп aft) *) ■ft) VTl ιτ/^\Τ/ I ^ь 2 "θ г„_,*"-*+...+г0 •"*Ρη.ι·-'*··'+Ρο -II..II. Ш 41 .1.11 ll-.-ιι..ι.ι I 1 .III > t \ aft) 1 > f s) Рис. 6.21. Фильтры: α—моделирование сообщений; б—каноническая схема фильтра в виде системы с обратной доказать, что степень числителя передаточной функции фильтра в петле обратной связи точно на единицу ниже степени знаменателя (см. задачу 6.2.27). Структура фильтра, изображенная на рис. 6.21, б, называется канонической реализацией оптимального фильтра с обратной связью для рациональных спектров сообщений [21]. В § 6.3 мы убедимся, что общую каноническую реализацию фильтра с обратной связью можно получить для нестационарных процессов и конечных интервалов наблюдения. Заметим, что для отыскания числителя по-прежнему необходимо производить операцию разложения на множители (см. задачу 6.2.27). 534
Можно также показать, что первый коэффициент в числителе равен 2ξ/>/Ν0 (см. задачу 6.2.28). Последний вопрос относительно реализации оптимальных линейных фильтров в виде систем с обратной связью связан с нереализуемыми фильтрами. Так как в § 6.2.2 и 6.2.3 [(1086) и (127)] уже было показано, что использование нереализуемого фильтра (или введение задержки) всегда улучшает помехоустойчивость, то следует учесть это и в схеме с обратной связью. Ранее мы аппроксимировали нереализуемые фильтры путем введения задержки. Из рис. 6.20 видно, что это не применимо в случае gt(%) потому, что выходное напряжение по- даетея на вход в действительном масштабе времени, становясь частью входного напряжения. Ht) \ н® SUM Рис. 6.22. Нереализуемый фильтр, включенный после петли обратной связи. Если допустимо использовать фильтр после схемы с обратной связью, как показано на рис. 6.22, то можно рассматривать и нереализуемые операции. Задержка в фильтре на выходе системы с обратной связью не вызывает каких-либо затруднений, так как его выходное напряжение не используется более ни в какой другой части системы. Выражение для оптимального нереализуемого фильтра Gpuo (/ω) на выходе системы с обратной связью получить нетрудно. Так как последовательное соединение двух систем должно соответствовать #ou(/cd), а система с обратной связью при замкнутой петле — #0(/ω), то , __ Нои (/<*>) врио (Μ Но (/ω) (178) Получающуюся передаточную функцию можно аппроксимировать с какой угодно точностью путем введения задержки. 6.2.6. Примечания В этом параграфе обсудим кратко некоторые интересующие нас аспекты линейной обработки, которые обобщают полученные результаты. Родственные вопросы. Многомерная задача. Хотя векторная задача была сформулирована в § 6.1, мы рассмотрели метод решения только для скалярной задачи. Для случая нереализуемого фильтра переход к векторной задаче тривиален. Для реализуемого случая, когда сообщение или полезный сигнал является вектором, а принимаемое колебание— скаляром, метод решения является очевидной модификацией скалярного метода: Для реализуемого случая, когда принимаемый 585
сигнал является вектором, метод становится довольно сложным. Винер наметил решение этой задачи в [1], которое также довольно громоздко. При другом подходе входную спектральную матрицу разлагают на множители. Соответствующие методы рассмотрены в [10—19]. Нерациональные спектры. Мы ограничились рассмотрением рациональных спектров. Для нерациональных спектров было указано, что можно пользоваться аппроксимацией в виде рациональных спектров. Непосредственное разложение на множители не всегда возможно. Можно показать, что необходимое и достаточное условие для разложимости на множители заключается в том, чтобы сходился несобственный интеграл П logS'(a>) l<fo. J I 1+(ω/2η)« Ι —οο Здесь Sr(co) — спектральная плотность всего принятого колебания. Это условие, называемое критерием Палея—Винера, установлено в [1], где также рассмотрены различные его приложения. Если это условие не удовлетворяется, то r(t) называется детерминированным колебанием. Прилагательное «детерминированный» используется здесь ввиду того, что можно точно предсказать будущее процесса r(i), используя линейную обработку данных только истекшей его части. Простой пример детерминированного сигнала дан в задаче 6.2.39. Оба предельных спектра сообщений в примерах § 6.2.4 были детерминированными. Это означает, что если помеха была бы равна нулю, то можно было бы точно предсказать будущее поведение сообщения. Течение процесса можно легко исследовать, выбирая некоторое произвольное время предсказания (упреждения) α и оцвнивая ошибку предсказания при индексе /ζ-* оо. Для произвольного α среднеквад- ратическую ошибку предсказания можно сделать меньше любого положительного числа, задаваясь достаточно большим η (см. задачу 6.2.41). Почти во всех случаях интересующие нас спектры будут соответствовать недетерминированным случайным колебаниям. В частности, включение в r(t) белого шума гарантирует разложимость спектра. Чувствительность характеристик к малым отклонениям от модели. В области обнаружения и оценки параметров сигналов была рассмотрена важность исследования вопроса о том, в какой мере характеристики оптимальной системы зависят от разного рода отклонений в тонкой структуре от принятой модели. Очевидно, эта «чувствительность» имеет важное значение также и при линейной модуляции. В любом конкретном случае метод исследования чувствительности результатов является прямым. Ряд представляющих интерес случаев рассмотрен в задачах 6.2.31 — 6.2.33. В большинстве скалярных задач результаты не зависят от выполнения в модели тех или иных тонких допущений. В векторном случае необходимо проявлять большую осторожность. Как и ранее, постановка вопроса в общем виде оказывается неконструктивной. Важным моментом, на который вновь следует обра- 586
тить внимание, является то, что всегда необходимо проверять устойчивость результатов к незначительным отклонениям от принятой модели. Окрашенный и белый шум. При попытке оценить сообщение a(t) в присутствии помехи, содержащей как белую, так и «цветную» компоненты, мы встречаемся с интересной интерпретацией оптимального фильтра. Пусть r(t) = a(t) + nc(t) + w(t) (179) и d(t)=a(t). (180) Очевидно, что если бы мы знали nc(t), то оптимальное устройство обработки имело бы структуру, показанную на рис. 6.23, а. Здесь Aq(t) есть оптимальный фильтр для r'(t) = a(t) + w(t), найденный нами ранее. /•/У *ф h0 (τ) nc(t) fit) ±/ΤΝ__ , \(τ) \~ nc(t) h0M aft) 5) Рис. 6.23. Оценка шума. ΓΙ I k I kd (τ) d(t) n(u) Но мы не знаем nc(t)f так как это есть выборочная функция случайного процесса. Представляется логичным оценить nc(t), вычесть оценку из r(t) и пропустить результат через фильтр Α0(τ), как показано на рис. 6.23, б. Можно показать, что оптимальная система осуществляет именно эту процедуру (см. задачу 6.2.34). (Заметим, что α(ή и 7г c(t) являются совместными оценками.) С аналогичным результатом мы встречались в области теории обнаружения. Оптимальное устройство обработки осуществляет как раз то, что делали бы и мы, если бы помехи были известны точно, только оно использует оценки. Линейные операции и фильтры. На рис. 6.1 иллюстрировалась типичная задача оценки. С теми допущениями, которые были введены в настоящем параграфе, она сводится к задаче, показанной на рис. 6.24. Здесь применимы общие результаты (78), (119) и (122). Так как большинство интересующих нас задач соответствует модели, показанной Ф) ! 4- bfk) х(и) -®- "(и) Рис. 6.24. Типичная задача оценки немодул и ров а иного процесса. 587
на рис. 6.24, целесообразно сформулировать наши результаты в такой форме, в которой влияние kd(x) и kf(%) учитывалось бы в явном виде. Требуемые соотношения для некоррелированных сообщений и помех имеют вид [5β(ω)|^(/ω|·+5η(ω)]+ί [Sa (ω) | Kf (/ω) |·+5η (ω)]" J+ V ' В случае реализуемого фильтра необходимо использовать (181) при условии, что d(t) Φ α(ή. Простым контрпримером (задача 6.2.38) можно показать, что линейная фильтрация и оптимальные реализуемые устройства оценки в общем не коммутативны. Иначе говоря, d(t) не обязательно равна оо j k<i{t — τ)α(τ)άτ. —оо Этот вывод противоречит результату, полученному для устройств интервальной оценки по максимуму апостериорной плотности. С другой стороны, из сравнения (119) и (182) следует, что линейная фильтрация и оптимальные нереализуемые устройства оценки (Tf = оо) должны быть коммутативными. Результирующая ошибка в нереализуемом случае при Κά(]'αή = 1 равна оо Sa (ω) Sn (ω) dm ,jg3, Sa(cu)|tf/(/co)|2 + Sn(cu) 2π ' Это выражение является очевидным. Для других /С<*(/со) см. задачу 6.2.35. Некоторые приложения (183) применительно к задаче предварительной фильтрации обсуждаются в задаче 6.2.36. Напомним, что мы исходили из допущения, что kd(%) представляет «разрешенную» в среднеквадратическом смысле операцию. Например, если требуемая операция есть дифференцирование, то мы считали, что a(f) является процессом дифференцируемым в среднеквадратическом (см. задачу 6.2.37 как пример возможных затруднений, когда это допущение не справедливо). Краткие выводы §6.2. Достаточно подробно была рассмотрена задача линейной обработки стационарных процессов, когда для обработки доступно все бесконечное прошлое процесса. Основные результаты сводятся к следующему. 1. Конструктивное решение данной задачи имеет вид (78): я0(/(о)=—L_[^l(M_1 . 588
2. Влияние задержки или предсказания на результирующую ошибку оптимальной линейной системы обработки описывается (1086). Во всех случаях при увеличении задержки наблюдается монотонное улучшение помехоустойчивости. Во многих случаях этот выигрыш оправдывает соответствующее усложнение системы. 3. К помехоустойчивости нереализуемого фильтра можно подойти сколь угодно близко, вводя задержку при обработке. Достоинство концепции нереализуемого фильтра заключается в том, что ответ почти всегда может быть легко получен и он представляет собой нижнюю границу оценки по минимуму среднеквадратической ошибки в любой системе. 4. Выражение для ошибки в замкнутой форме при наличии белого шума имеет вид [см. (152)]: 2 J L Л'о/2 J 2π ΟΟ 5. Каноническая структура фильтра для белого шума, изображенная на рис. 6.21, позволяет просто сопоставить сложность оптимального фильтра со сложностью спектров сообщений. Рассмотрим теперь другой подход к задаче точечной оценки. 6.3. Фильтры Кальмана — Бьюси Основная задача и на этот раз заключается в обработке принимаемого колебания r(u)t Τ ι ^ и^. t> с целью получить точечную оценку некоторого полезного сигнала d(t) по минимуму среднеквадратической ошибки. В скалярном случае принимаемое колебание можно записать в ви- где г(и)=с(и)а{и) + п(и), Tt^u^t, (184) где a(t) и n(t) — случайные процессы с нулевыми средними значениями и ковариационными функциями Ka{U и) и (N0/2)8(t — и) соответственно, a d(t) = a(t). Задача является гораздо более общей, чем данный пример, но для обоснования нашей заинтересованности в исследовании этой проблемы приведенного примера вполне достаточно. Оптимальное устройство обработки содержит линейный фильтр, который удовлетворяет уравнению t Kar(t>°)= $ К{1,х)КЛ%ио)ах, Tt<o<t. (185) В § 6.2. был рассмотрен частный случай, когда Tt = — оо и процессы стационарны. На одном из этапов процедуры решения была найдена функция G+(/co). Мы отметили, что если пропустить белый шум через линейную систему с передаточной функцией G+(/co), то выходной процесс будет иметь спектр 5г(со). Было также установлено, что в слу- 589
чае белого шума фильтр может быть реализован в виде так называемого канонического фильтра с обратной связью. Оптимальный фильтр в петле обратной связи имеет такие же полюсы, что и линейная система, выходной спектр которой должен быть равным Sa(co), если на ее вход подать белый шум. Единственная трудность заключается в отыскании нулей оптимального фильтра в петле обратной связи. Для конечного интервала наблюдения необходимо решать (185). В гл. 4 мы имели дело со сходными уравнениями и отметили, что преобразование интегрального уравнения в дифференциальное уравнение с системой граничных условий является целесообразной процедурой. В ряде примеров было также отмечено, что когда сообщение является скалярным марковским процессом [напомним, что для стационарного нормального процесса это означает, что ковариационная функция имеет вид А ехр (—В\ t— и\) ], результаты оказываются значительно проще. Отмеченные особенности плюс значительная доля интуиции позволяют нам высказать следующие соображения о другом подходе к решению задачи, который может оказаться плодотворным. 1. Вместо описания интересующих нас процессов при помощи их ковариационных функций, следует характеризовать их при помощи линейных, возможно с изменяющимися во времени параметрами, систем, которые генерировали бы их при подаче на входы систем белого шума1*. 2. Вместо описания линейной системы, генерирующей сообщение, посредством изменяющейся во времени импульсной характеристики следует описывать ее при помощи дифференциального уравнения, решением которого и является искомое сообщение.· Наиболее удобным описанием оказывается векторное дифференциальное уравнение первого порядка. 3. Вместо определения оптимальной оценки как выходной величины линейной системы, определяемой интегральным уравнением, следует задавать оптимальную оценку как решение дифференциального уравнения, коэффициенты которого определяются статистикой процессов. Очевидным преимуществом этого метода задания является то, что если даже мы не можем решить дифференциальное уравнение аналитически, то всегда можно легко его решить при помощи аналоговой или цифровой вычислительной машины. В этом параграфе мы сделаем указанные выводы более корректно и исследуем получаемые результаты. Прежде всего обсудим кратко представление линейных систем с изменяющимися во времени параметрами при помощи переменных состояния, а также вопросы генерации случайных процессов. Далее выведем дифференциальное уравнение, которому удовлетворяет оптимальная оценка. И, наконец, рассмотрим некоторые приложения развитого здесь метода. Оригинальная работа в этой области принадлежит Кальману и Бьюси [23]. Х) Преимущества такого способа задания впервые были установлены и объяснены Дольфом и Вудбери в 1949 г. [22]. 590
6.3.1. Представление линейных систем посредством дифференциальных уравнений и генерация случайных процессов1* Ранее мы характеризовали линейные системы при помощи импульсной характеристики h(t, и) [или просто Η(τ) в случае систем с постоянными во времени параметрами]. Отличительной особенностью такого описания является то, что входной сигнал считается известным на интервале — оо <ί<οο. Часто этот метод описания оказывается наиболее удобным. Многие системы могут быть представлены и другим методом — посредством дифференциального уравнения, связывающего входной сигнал с выходным. Именно этим методом обычно пользуются при изложении вводных глав теории линейных систем. Импульсная характеристика h(t, и) есть просто решение дифференциального уравнения , когда входным сигналом служит импульсв момент времени и. Рассмотрим на простом примере три основные идеи, существенные с точки зрения описания систем посредством дифференциальных уравнений. Первая идея связана с начальными условиями и переменными состояния при рассмотрении динамических систем. Если требуется найти выходной сигнал на некотором интервале t0 ^ t < tlf то необходимо знать не только входной сигнал на этом интервале, но также и определенное число начальных условий, которых должно быть достаточно для характеристики того, как именно любой из цредшествую- •щих входных сигналов (t < t0) влияет на выходной сигнал системы на интервале ί > t0. Мы определяем состояние системы как минимальное количество информации относительно воздействий предыдущих сигналов на входе системы, необходимое для полного описания выходного сигнала при t~> t0. Переменные величины, которые содержат эту информацию, есть переменные состояния [24]. Должно быть достаточное число состояний, которым можно поставить в соответствие каждую пару (вход— выход) сигналов. При строгой математической формулировке из этих допущений следует, что если заданы состояние системы в момент времени t0 и входной сигнал на интервале от t0 до tl9 то можно найти как выходной сигналу так и состояние системы в момент времени 7Х. Заметим, что данное определение исходит из того, что интересующие нас динамические системы являются детерминированными и реализуемыми (входные сигналы, относящиеся к будущему времени, не могут оказывать влияние на выходной сигнал). Если состояние системы можно описать конечномерным вектором, то такая система называется конечномерной динамической системой. В этом параграфе мы ограничимся рассмотрением конечномерных систем. Проиллюстрируем это положение простым примером. х> В этом параграфе излагаются основные исходные сведения, необходимые для решения задач, представляющих непосредственный интерес. Этот предмет подробно освещен в ряде книг (например, [24—28]). Наше изложение является исчерпывающим, однако ряд результатов сформулирован без доказательства. 591
Пример 1. Рассмотрим цепочку RC, изображенную на рис. 6.25. Выходное напряжение y(t) связано с входным напряжением u(t) дифференциальным уравнением (RC)y(t)+y(t) = u(t). (186) R и λ />ч \ Источник и (τ) \^\н&пряжения 5ъ| Чтобы найти выходное напряжение y(t) на интервале t ^ t0, необходимо знать u(t), t > t0, а также напряжение на конденсаторе в момент времени t0. Таким образом, подходящей переменной состояния является y(t). Вторая идея сводится к реализации (или моделированию) дифференциального уравнения при помощи аналогового вычислителя. Для наших целей его можно представить себе как систему, состоящую из интеграторов, цепей с переменными во времени коэффициентами, передачи, сумматоров и нелинейных безынерционных устройств, объединенных таким образом, чтобы воспроизвести требуемое соотношение между входным и выходным сигналами. Для примера простой цепи RC реализация при помощи аналогового вычислителя показана на рис. 6.26. Начальное условие y(t0) выступает здесь в качестве смещения на выходе интегратора. Смещенное выходное напряжение интегратора является переменной состояния системы. Третья идея относится к вопросу генерации случайного процесса. Если u(f) есть случайный процесс или y(t0) есть случайная величина (или они оба являются случайными), то y(t) есть также случайный про- Рис. 6.25. #С-цепь. u(t) -φ RCy(t) Μ) y(t) У салитесь Интегратор Рис. 6.26. Реализация фильтра в виде аналогового вычислителя. цесс. Используя систему, описываемую (186), можно генерировать как нестационарные, так и стационарные случайные процессы. Приведем пример нестационарного процесса. Пусть y(t0) есть нормальная случайная величина N(0, σ0), u(t) = 0, k = l/RC. Тогда y(t) есть нормальный случайный процесс с нулевым средним и ковариационной функцией \ e-k (t+u—2t0) K9(t,u)=o0* tyU^t0. (187) В качестве примера стационарного процесса рассмотрим случай, когда u(i) является выборочной функцией процесса типа белого шума со 592
спектральной плотностью q. Если процесс на входе начинается при t0 = — оо и y(t0) = 0, то на выходе имеем стационарный процесс со спектром *ίω)=-^1, (188) q = 2ollk .(189) Изучим теперь эти идеи в более общем контексте. Рассмотрим систему, описываемую дифференциальным уравнением вида уМ(0 + /?„-ι (%(я-|}(0 +... +РоУ(*) = b0 и (t), (190) где y{n)(f) — п~я производная от y(t). Напомним, что для определения решения уравнения п~го порядка необходимо знать значения y(f), ..., ..., y{n~l)(t) в момент времени t0. Это замечание будет ключом к отысканию представления посредством переменных состояния для данной системы. Первым шагом при отыскании реализации в форме аналогового вычислителя является моделирование членов левой части этого уравнения. Это иллюстрируется рис. 6.27, а. Следующий шаг заключается в таком взаимном соединении этих различных величин, чтобы указанное уравнение удовлетворялось. Дифференциальное уравнение определяет входное напряжение на сумматоре и приводит к блок-схеме, изображенной на рис. 6.27, б. Наконец, вводим начальные условия, задавая определенные смещения на выходах интегратора, и получаем схему, показанную на рис. 6.27, в. Переменные состояния есть смещенные напряжения на выходе интегратора. Часто бывает проще работать с векторным дифференциальным уравнением первого порядка, чем со скалярным дифференциальным уравнением л-го порядка. Для (190) преобразование не вызывает затруднений. Пусть x1(t) = y(t), *At) = y{t)=x1{t)i xn(t) = y<n-14t)=xn-l(t), К (t) = ίΚ»> (ί) = -Σ Pk-ι у«-х > (/)+К и (t) = £= 1 = - Σ Pk-ι xk(t) + b0u(t). (1916) Обозначив систему xt(t) через матрицу-столбец, замечаем, что скалярному уравнению п~го порядка эквивалентно следующее η -мерное векторное уравнение первого порядка: -^Ai(/) = Fx(0 + Ga(/), (192) (191а) 593
где F = О О О А> 1 О 1 О —Pi—Рг—Ра·- ~Рп-\ (193) G = ΓΟΟ О (194) Jn), y'm(t) —* 4 > У m-z)(t} ■* ib-*■ y(t) Z"-2/ Pn.}y(n-rl(t) \рп.2у!"-2Ш \p0y(tr a) aft) ЕЛУк-1}Ш -ib ytt) β-«->·"* y(t) ^. ъ*± p0y(t) в) Рис. 6.27. Различные варианты реализации фильтра в виде аналогового вычислителя. 594
Вектор x(f) называется вектором состояния для данной линейной системы, а (192)—уравнением состояния системы. Заметим, что выбранный нами вектор состояния не является единственно возможным. Любое несингулярное линейное преобразование вектора x(t) дает другой вектор состояния. Выходное напряжение y(t) связано с вектором состояния уравнением y(t) = Cx(t)9 (195) где С есть матрица (1 χ η) C = [lj0j0j0!...0]. (196) Уравнение (195) называется выходным уравнением системы. Два уравнения — (192) и (195) — полностью определяют систему. Точно так же, как и в первом примере, можно моделировать нестационарные и стационарные случайные процессы, используя систему, описываемую уравнениями (192) и (195). Для стационарных процессов, как следует из (190), мы можем моделировать любой процесс с рациональным спектром вида S„(<o)= - , (197) считая u(t) процессом типа белого шума и t0 = — оо. В этом случае вектор состояния x(t) есть выборочная функция векторного случайного процесса, a y(t) — одна из компонент этого процесса. Следующим более общим дифференциальным уравнением является y^{t)+pn-xy^-" (/) + ... +РоУ(0 = = bn-lu("-D(t) + ...+bQu(t). (198) Прежде всего найдем реализацию в виде аналогового вычислителя, которая соответствует данному дифференциальному уравнению. Проиллюстрируем возможный метод такой реализации путем рассмотрения простого примера. Пример 2А. Рассмотрим случай, когда η = 2 при нулевых начальных условиях. Тогда (198) примет вид y(t) + Piy(t)+p0y(t) = b1ii(t) + b0u{t). (199) Первое замечение, которое можно сделать, заключается в том, что мы хотим избежать фактического дифференцирования u(t), так как во многих представляющих интерес случаях u(t) является процессом типа белого шума. Сравнивая порядок высших производных в обеих частях (199), видим, что избежать дифференцирования можно, если предположить, что u(t) существует в виде составной части входного напряжения первого интегратора (рис. 6.28) и исследовать результаты подобного допущения. Для этого перегруппируем члены следующим образом: Ιί(0-*ι«(θ1 + Ριί?(0 + Ρβ^(0 = *ο«(0. (200) 595
Результат показан на рис. 6.28. Определяя переменные состояния как выходные напряжения интеграторов, получим *ι(Ο=*0)-»ι«(Ο· Используя (200) и (201), будем иметь xi(t) = x2(t) + b1u(t), *2 (0 = — Ро *ι (0 - Pi (*2 (0 + *ι и (О) + 60 « (0 = = —Ρο*ι(0—Ρι*2(0 + (*ο—*ιΡι)«(0· —p7 (201a) (2016) (202a) (2026) Рис. 6.28. Реализация фильтра (п = 2) в виде аналогового вычислителя. Мы можем записать (202) как векторное уравнение состояния, введя F=l „ η I (203a) L —Po —PiJ ' G = [ * 1. L^o — Pibi\ Тогда x(t) = Fx(t) + Gu(t). Выходное уравнение будет иметь вид y(t) = [H0]x(t)±Cx(t). (2036) (204а) (2046) Уравнения (204а) и (2046) в сочетании с начальным условием х(*0) = 0 характеризуют систему полностью. Несложно распространить этот частный метод на случай уравнения П'ТО порядка (см. задачу 6.3.1). Назовем это канонической реализацией № 1. Наш выбор переменных состояния был несколько произвольным. Чтобы продемонстрировать это, рассмотрим пример 2А повторно и разовьем другое представление состояния системы. 596
Пример 2Б. И на этот раз У (O + Pi У (t) + p0y(t) =Ьг'и (t) + b0u(t). (205) Прежде всего вычертим два интегратора и две ветви, обусловленные величинами Ьг и Ь0. Данная частичная система изображена на рис. 6.29, а. Теперь необходимо ввести обратную связь и задать переменные состояния таким образом, чтобы элементы матриц F и G были равны одному из коэффициентов исходного дифференциального уравнения: единице или нулю. Из рис. 6.29, а видно, что это alt) uft) а) x2(t) φ- *,(*)=№ 6) Рис. 6.29. Аналоговая реализация уравнения (205). легко сделать, если по ветви обратной связи подать взвешенное значение хМ) (= yif)) в каждую точку суммирования, как показано на рис. 6.29, б. Уравнения для переменных состояния имеют вид *ι (0=0(0, *ι (0 = *2 (0 -Pi У (0 + Ьг и (0, *2 (0=-Ро y(t) + b0u (t). Матрицы F и G равны соответственно ρ=Γ-ρι +4. L-Po 0j" °-га· Отсюда видно, что система обладает требуемым свойством. 597 (206) (207) (208) (209) (210)
Распространение на случай исходного дифференциального уравнения η-го порядка не вызывает осложнений. Результирующая реализация показана на рис. 6.30. Уравнения для переменных состояния имеют вид Xi(t) = y{t), ΧΛί)=Χχ{ί)+Ρη~\ y(t) — ba-l U (t), (211) u(t) xn(t)=xn-i(t) + p1y(i)-b1u(t), xn(t) = -p0y(t) + b0u(t). -*b xndl Xn-rft) xztt) —*—-il— xtM yd). Рис. 6.30. Каноническая реализация № 2: переменные состояния. Матрица векторного дифференциального уравнения равна F = —Ρη-ι Ι 1 —Pn-i | 0 -Рх |0 -Ро ! 0 0 1 1 ... 0 1 0 (212) G = Ьп-1 Ьп-2 (213) V. К J Будем называть эту реализацию канонической реализацией №2. 598
Остаетсй еще рассмотреть третыо полезную реализацию. Передаточная функция, соответствующая (198), равна У (в) 'п— 1 s"-' + ... + &0 Х(8) «" + ?„_! «Я-Ч·..+Рв- Atf(s). (214) a(t) *г>-1 У*) . - "ft) lit) > */ ~Ί 5-Λ/ J*l_ I • *» I 5-Л/, | Рис. 6.31. Каноническая реализация № 3: α— передаточная функция; б—реализация в виде аналогового вычислителя. Это выражение можно разложить на неприводимые многочлены η α. (215) где λ* — корни знаменателя, которые считаются некратными, г at — соответствующие остатки. Система показана в форме преобразования на рис. 6.31, а. Очевидно, можно идентифицировать выходное напряжение каждой из субсистем как переменную состояния и реализовать
всю систему, как показано на рис. 6.31, б. Матрица F—диагональная. Ь = К о о . (216) а элементы матрицы G суть остатки разложения G = «ι α2 (217) Теперь выходное напряжение y{t) является суммой переменных состояния где i= l FA[ljl ... 1]. (218а) (2186) Будем называть эту реализацию канонической реализацией № 3. (Реализация для случая кратных корней выводится в задаче 6.3.2.) Каноническая реализация № 3 требует разложения на неприводимые многочлены для отыскания матриц F и G. Заметим, что уравнение состояния включает η независимых скалярных уравнений первого порядка χ. = χ. χ. (t) + аг и (t)t ί=1, 2, ..., η. (219) Решение этой системы гораздо проще, чем решение векторного уравнения. С другой стороны, отыскание разложения на неприводимые многочлены может потребовать некоторых выкладок, тогда как канонические реализации № 1 и 2 можно получить путем простого анализа формы записи. Мы рассмотрели три различных метода реализации системы, описываемой дифференциальным уравнением л-го порядка с постоянными коэффициентами. В каждом случае вектор состояния был другой. Матрицы F также были различны, но нетрудно доказать, что они имеют одинаковые собственные значения. Следует подчеркнуть, что несмотря на то, что мы именуем эти реализации каноническими, некоторые другие реализации при решении конкретных задач могут оказаться более желательными. Любое несингулярное линейное преобразование вектора состояния ведет к новому представлению состояния. Теперь мы располагаем возможностью моделирования любого стационарного случайного процесса с рациональным спектром и конечной дисперсией путем подачи на вход любой из рассмотренных схем- 600
ных реализаций белого шума. Кроме того, можно моделировать широкий класс нестационарных процессов. До сих пор нами рассматривались вопросы представления линейных систем с постоянными во времени параметрами посредством переменных состояния и соответствующего векторного дифференциального уравнения. Было показано, что это может соответствовать физической реализации в виде аналогового вычислителя, позволяющего моделировать широкий класс случайных процессов. Далее нам следует рассмотреть системы с изменяющимися во времени параметрами и многоканальные системы со многими входами и выходами. Для систем с изменяющимися во времени параметрами рассмотрим векторные уравнения **<Q- = F(t)x(t)+G(t)u(t), (220а) dt y(t)=C(t)x(t) (2206) в качестве основного представления1*. Матрицы F(t) и G(t) могут быть функциями времени. Используя в качестве входного воздействия белый шум E[u(t)u(x)]=qb(t—T)9 (221) можно моделировать некоторые нестационарные случайные процессы. Следует заметить, что нестационарный процесс может появиться даже тогда, когда матрицы F и G постоянны, а х(^0) — детерминированная величина. Хорошим примером может служить винеровский процесс, определенный на ст. р. 231 гл. 3. Пример 3. Здесь F(t) = 0, G(t) = σ, C(Q = 1 и (220) обращается в dx(t) -^- = а«(0· (222) Полагая, что #(0) = 0, получаем винеровский процесс. Другие конкретные примеры систем с изменяющимися во времени параметрами рассматриваются в последующих параграфах и в задачах. Целесообразность изучения многоканальных систем вытекает непосредственно из наших рассуждений в гл. 3, 4 и 5. Рассмотрим простую систему рис. 6.32, генерирующую два выходных напряжения УгЬ) и У*{0· Предполагается, что состояние системы 1 описывается уравнениями x1(t)=F1(t)x1(t)+G1(t)u1(t), (223) y1(t) = C1(t)x1(t), (224) 1} Канонические реализации рис. 6.28 и 6.30 все еще можно использовать. Важно заметить, что они не соответствуют такому же дифференциальному уравнению я-го порядка, как в случае системы с постоянными параметрами (см. задачу 6.3.14). 601
Ufft) Генератор »\ сигналоо одной, формы yf (t) u2 (t) Генератор Г1-*' ——Ч сигналов одной формы УМ u(t) Генератор векторных сигналов хг(*) X(t) 9ft) Рис. 6.32. Генерация двух сообщений. где xt(f) — n-мерный вектор состояния. Аналогично, представление состояния системы 2 имеет вид x2(t) =F2(t)x2(t) +G2(t) u2(t), (225) (226) где x%(t) — /п-мерный вектор состояния. Более удобным способом описания этих двух систем является единая векторная система уравнений с (я + т)-мерным вектором состояния (рис. 6.32, б): Г χι (О LX2 X(t) F(0 0(f) α(ί) = c(o = ,(0 J L ° i" -[■ о f7(o Gi_(0!_°__' о |o,(o_ Uljt) L«2(i)J ■CxWjO 0 ί C2 (*) ] y(0-[^-l. U(oJ (227) (228) (229) (230). (231) (232) Результирующие дифференциальные уравнения имеют вид x(t) = ?(t)x(t) + G(t)u(t), (233) y(f)=C(i)x(f). (234) Возбуждающая функция является векторной. Для задачи моделирования сообщения будем предполагать, что возбуждающая функция — белый процесс с матричной ковариационной функцией E[u(t)uT(x)]bQb(t-x), (235) где Q — неотрицательно определенная матрица. Блок-схема процесса моделирования показана на рис. 6.33. 602
Заметим, что в общем случае начальные условия могут быть случайными величинами. Тогда для определения характеристик вторых моментов нам необходимо знать ковариационную функцию в начальный момент времени Кж(<0. 'о)^£[х('о)х7('о)] (236) и среднее значение E[x(t0)]. Можно также моделировать связанные процессы путем замещения нуль-матриц в (228), (229) или (231) на ненулевые матрицы. u(t) Матричный усилитель с изменяющимся во времени . усилением x(t) Интегратор Fit) /7Х/7 x(t) ом тхп 4(t) Матричный усилитель с изменяющимся во времени усилением Матричный усилитель с изменяющимся во времени усилением Рис. 6.33. Процесс генерации сообщения. Следующий этап в нашем обсуждении — рассмотреть решение (233). Начнем со случая однородного уравнения с постоянными во времени коэффициентами. Тогда (233) сводится к x(f)=Fx(f) (237) с начальным условием х(/0). Если х(^) и F — скаляры, то решение имеет вид x(t)=ent-t*)x(t0). (238) Для векторного случая можно показать (см., например, [27—30]), что x(i)=eF«-O)x(i0), где eF' определяется бесконечным рядом eF'M+R- 21 (239) (240) Функцию eF^"'·) обозначим через Φ(ί—/0) Δ^Φ(τ). Функция Φ(ί — — t0) называется переходной матрицей состояния системы. Для случая системы с постоянными во времени параметрами можно легко доказать следующие два свойства. 603
Свойство ll1^. Переходная матрица состояния удовлетворяет уравнению d<t>(t-t0) =Έφ{ί_ίο) (241) at или **il> = F<D(T). (242) άτ [Использовать равенство (240) и его производные в обеих частях (239).] Свойство 12. Начальное условие Φ(ί0-ί0) = Φ(0) = Ι (243) вытекает непосредственно из (239). Однородное решение можно выразить через Φ(ί — t0): x(t)=O>(t-t0)x(t0). (244) Решение (242) легко получить, использовав метод обычного преобразования Лапласа. Преобразовав (242), имеем s<J>(s) — I = F<B(s), (245) где единичная матрица появляется из начального условия (243). Перегруппировав члены, получим [si — F]<B(s) = I (246) или <B(s) = (sI — F)-i. (247) Переходная матрица состояния имеет вид Φ(τ)=^-1[Φ(5)]=^-1[(5ΐ — F)-1]. (248) Проиллюстрируем этот метод простым примером. Пример 4. Рассмотрим систему, описываемую уравнениями (206)—(210). Преобразования переходной матрицы имеют вид •«-Hi Я-К: Г· 4>(s)=— ! Г S ' 1. (251) s2+PiS + p0 L—Po s + pj Для отыскания Φ(τ) произведем обратное преобразование. Ради простоты положим рх = 3 и р0 = 2. Тогда Φ(τ) = 2е~2х-е-х ί е-х-е-2т IJe-K- e-η 2^-х"е-2т. (252) Х) Так как мы вьшуждены обращаться к свойствам, изложенным в начале главы, во избежание путаницы будем придерживаться последовательной системы нумерации. 604
Важно отметить, что комплексные собственные частоты, входящие в это решение, определяются знаменателем <D(s), который является просто определителем матрицы si — F. Следовательно, эти частоты являются корнями уравнения det[sl— F]=0. (253) Для случая системы с изменяющимися во времени параметрами основная концепция матрицы переходного состояния сохраняется в силе, однако некоторые из приведенных выше свойств более не соблюдаются. Из скалярного случая нам известно, что Φ(ί, t0) будет функцией двух переменных вместо функции всего лишь разности между t и t0. Определение. Переходная матрица состояния определяется как функция двух переменных Φ(ί, t0), которая удовлетворяет дифференциальному уравнению Φ(ί, ίο)=Ρ0Φ(ί, t0) (254а) с начальным условием Ф(/0, t0) = I. Решение в любой момент времени имеет вид x(t) = <S>(t, t0)x(t0). (2546) Аналитическое решение, как правило, трудно получить. Однако в большинстве случаев, когда мы пользуемся переходной матрицей, в аналитическом решении нет необходимости. Обычно нужно только знать, что оно существует и что оно обладает определенными свойствами. В тех случаях, когда требуется фактически найти решение, мы будем пользоваться численными методами. Два свойства можно вывести без затруднений: Φ (U, ί0)=-Φ(ί2, *Ί)Φ(*Ί> to)* ПРИ всех to* *i> t2 (255a) и Φ-4Ί. ^о)-Ф(^ *ι)· (2556) Для неоднородного случая уравнение имеет вид χ (0 = F (0 χ (t) + О (t) u (t). (256) Общее решение содержит однородное и частное решения t χ(ί)=Φ(ί, t0)x(to) + \®(t, T)G(T)u(x)dT (257) to (подставляем (257) в (256) для проверки того, что оно является решением). Выходное напряжение у(^) равно y(t) = C(t)x(t). (258) При изложении материала гл. 4 и 5, а также § 6.1 настоящей главы мы характеризовали линейные системы с изменяющимися во времени параметрами при помощи их импульсной характеристики h(i, τ). 605
Такое задание исходит из того, Что входная величина известна на интервале от — оо до L Таким образом, t y(t)= ξ h(f, τ)ιι(τ)Λ. (259) — оо В большинстве представляющих интерес случаев влияние начального условия х(— оо) в (257) не проявляется. Следовательно, мы можем положить его равным нулю и получить t у (ί) = С (0 $ Φ (t, τ) G (τ) и (τ) άτ. (260) — оо · Сравнивая (259) и (260), имеем ; jC(f)<D(*. τ)Ο(τ), t^x, h(t, τ)= Λ . (261) 4 ' (0 при других t. v Укажем, что три матрицы, входящие в правые части (259) — (261), будут зависеть от представления состояния, которое мы выбираем для системы, но матричная импульсная характеристика является единственной. Как указывалось ранее, данная система является реализуемой. Это обстоятельство отражается наличием 0 в (261). Для систем с постоянными параметрами Y(s) = H(s)U(s) (262) и H(s) = C<B(s)G. (263) В уравнении (262) предполагается, что входная величина имеет преобразование Лапласа. Для стационарного случайного процесса необходимо пользоваться интегральным преобразованием (§ 3.6). Большая часть наших рассуждений до сих пор была справедливой для произвольной возбуждающей функции u(t). Теперь установим некоторые статистические свойства векторных процессов x(t) и γ(ή для частного случая, когда u(t) является выборочной функцией векторного случайного процесса типа белого шума Ε [и (0 ит (τ)] = Q6 (t—τ). (264) Свойство 13. Взаимная корреляция между вектором состояния x(t) системы, возбуждаемой белым шумом u(t) с нулевым средним, и входной величиной ιι(τ) равна Ksn(f, τ)±Ε[χ(ί)η*(%)]. (265) Это разрывная функция, которая равна 0, τ>/, Кх„(*, T)=|-i-G(f)Q, τ = ί, (266) Φ(ί, t)G(t)Q, tQ<x<t. 606
ит ιτ) . (267) Доказательство. Подстановкой (257) в определение (265) получим {Г / Ί Ф(/, t0)x(t0) + lo(t,a)G(a)u{a)da\ L t0 Внеся математическое ожидание под знак интеграла и полагая, что начальное состояние х(/0) не зависит от и(т) при τ > t0, будем иметь t Кхи(Л τ) = $Φ(ί, a)G(a)E[u(a)ur(x)]da = to t = \ Φ (ί, a) G (a) Q6 (α—τ) da. (268) ίο При τ > t это выражение равно нулю. Если τ = ί, а дельта-функция симметрична, так как она является пределом ковариационной функции, то мы берем только половину площади у правой граничной точки интервала. Таким образом, Κχβ(/, t) = ±-0(t, t)G(t)Q. (269) Используя результат, следующий из (254а), получим выражение, расположенное во второй строке (266). Если τ < t, то будем иметь Κχ„(ί, τ)=Φ(ί, t)G (t)Q, τ<ί, (270а) что соответствует третьей строке (266). Частный случай (270а), которым мы воспользуемся позднее, получается, если положить τ ->■ t снизу lim Кх«(/, T)=G(f)Q. (2706) Отсюда легко получим выражени для взаимно корреляционной функции выходного вектора y(i) и и(т): /Су« (Л т)=С f)Kxa(f, τ). (271 Свойство 14. Дисперсионная матрица вектора состояния х(0 системы x(t)^F(t)x(t)+G(t)u(0 (272) удовлетворяет дифференциальному уравнению Лх (/) = F (t) Лх (t) + Лх (ί) F (/) + G (/) QG7 (/) (273) с начальным условием Ax(t0)=E[x(t0)xT(t0)]. (274) Заметим, что Αχ(ί) = Κχ(ί, 0-1 Доказательство. Ax(t)bE[x(t)xT(t)]. (275) 607
Продифференцировав, получим ^-=Ε[ψ жЧ0] + *[х(/) *^]. (276) Второй член есть просто результат перестановки первого. Заметим, что χ(ή недифференцируема в среднеквадратическом: поэтому нам необходимо быть внимательными при использовании (276). Подставляя (272) в первый член (276), получим E[^r*T(t)]=E{[f(t)x(t)+G(t)u(tj\xT(t)\. (277) Используя свойство 13 применительно ко второму члену (277), будем иметь Ε [^ψ- хт (θ] = F (О ЛХ (t) + -i- G (t) QG' (t). (278) Использование (278) и его перестановки в (276) дает Лх (t) = F (t) Ax (t) + Лх (t) F^ (t) + G (t) (КГ (f), (279) что и требовалось доказать. Мы рассмотрели следующие идеи: 1. Переменные состояния линейной динамической системы. 2. Реализации в форме аналогового вычислителя. 3. Векторные дифференциальные уравнения первого порядка и переходные матрицы состояния. 4. Моделирование случайных процессов. Дальнейшим нашим шагом будет приложение этих идей к задаче линейной оценки. Модель наблюдения. Повторно рассмотрим задачу линейной модуляции, описанную в начале главы, в терминах переменных состояния. Основная задача линейной модуляции была проиллюстрирована на рис. 6.1. Ее формулировка через переменные состояния для более простого частного случая дана на рис. 6.34. Сообщение a(t) создается путем пропускания u(f) через линейную систему, как было показано выше. Таким образом, χ (0 = F (0 χ (t) + G (t) и (t) (280) и *(t)*xi(t). (281) Ради простоты предполагается, что интересующее нас сообщение является первым компонентом вектора состояния. Затем сообщение умножается на несущее колебание c(t). В системе ДБП—AM колебание c(t) является синусоидальным. Мы включаем несущее колебание в линейную систему, вводя величину C(f) = [c(f):0j0...0]. (282) 608
Тогда y(t) = C(t)x(t). (283) €(ή часто именуется как модуляционная матрица. (В литературе по автоматическому управлению она называется матрицей наблюдений.) Генерация сообщения Рис. 6.34. Простой случай линейной модуляции при задании системы посред· ством переменных состояния. Колебание y(f) передается по каналу с аддитивным белым шумом. Таким образом, r(t)=y(t) + w(t), Γί</<Γ/> r(t) = C(t)x(t)+w(t)9 Tt<Ct<Tf, где (284) E[w(t)w(x)]=^b(t—τ)0 (285) Данная модель является чрезмерно ограниченной. Поэтому обобщим ее несколькими различными способами. Две модификации этой модели имеют фундаментальный характер и мы рассмотрим их прежде всего. Другие модификации отложим до § 6.3.4. Модификация № 1. Коррелированный (небелый) шум. В этом случае помимо белого шума имеется компонента цветного или небелого (коррелированного) шума nc(t). Предполагается, что коррелированный шум может генерироваться путем возбуждения конечномерной динамической системы белым шумом. г (0 = См (0 ΧΛί (t) +ne(t) + w (tj. (286) Подстрочный индекс М означает сообщение. Уравнение (286) можно записать в виде r(t) = C(t)x(t) + w(t), (287) если преобразовать вектор состояния сообщения таким образом, чтобы он включал в себя и процесс коррелированного шума. Новый век- 609
торный процесс х(/) состоит из двух частей. Одна из них — векторный процесс Хм(0> соответствующий переменным состояния системы, используемым для моделирования модулирующего процесса. Другая — векторный процесс х^(0> соответствующий переменным состояния системы, моделирующим коррелированный шум. Таким образом, Гхл.е>1 жм»[-;-й-]. <288) Если ΧΛί(0 есть ^-мерный, а х^(^) — я2-мерный вектор, то х(/) — — (ηλ + м2)-меРный вектор. Модуляционная матрица имеет вид . . C(t)=[CM(t)\CN(t)]; (289) Cj[i(t) определяется (286), a CN(t) выбирают так, чтобы ne(t)=CN(t)xN(t). (290) С использованием этих определений мы получаем (287). Здесь уместно привести один простой пример. Пример. Пусть /-(*) = V"2Pa(t)sin(uct + nc(t) + w(t), — эо < t, (291) где 2knPn ω2+ fe„2 4<ω)=^±Γ7- <293> nc(t), a(t) и w(t) — некоррелированные величины. Для получения представления в виде переменных состояния положим t0 = — ос и допустим, что а(— сю) == = пс(— сю) = 0. Определим вектор состояния x(t) как *«-[мо1· ,294) Тогда F(,)-["»° -l\ t2K) 0(0= Π, Jl. (29S) -Г.'· Л] И C(0 = [K2Psina)c/ : I]. (298) Видно, что матрицы F, G и Q являются диагональными ввиду независимости сообщения и коррелированного шума, а также того факта, что каждый из них имеет лишь один плюс. В общем случае независимых сообщения и шума можно разложить матрицы F, G и Q и их недиагональные миноры будут равны нулю. 610
Модификация №2. Векторные каналы. Следующий случай, который необходимо учесть, чтобы получить общую модель, — это случай, когда имеется несколько принятых колебаний. Как и следует ожидать, это обобщение не встречает трудностей. Исходя из т каналов, имеем векторное уравнение наблюдения r(f) = C(f)x(0 + w(f), (299) где вектор г(0 является m-мерным. Проиллюстрируем эту модель примером. a(t) cf(i) wf(t) C2 d) Zd2t &—<&- »,(# *,<*) Cm it) tfmCt) Рис. 6.35. Простая разнесенная система. Пример. Простая система с разнесением изображена на рис. 6.35. Предположим, что a(t) является одномерным процессом. Тогда x(t) = a(t)). Модуляционная матрица имеет размерность т X 1: C(i) = [ ci(t) ст (t) (300) Шумы каналов являются белыми нормальными процессами с нулевыми средними, но могут быть коррелированными друг с другом. Эта корреляция может изменяться во времени. Результирующая ковариационная матрица имеет вид Ε [w (0 wT (и)] Δ R (0 δ (t — u), (301) где R(f) — положительно определенная матрица. В общем случае x(t) является я-мерным вектором, а канал — т-мер- ным, так что модуляционная матрица имеет размерность (т χ η). Мы предполагаем, что канальный шум \ν(ή и белый процесс u(i), который генерирует сообщение, не коррелированы. При учете этих двух модификаций наша модель будет достаточно общей и включать большинство интересующих нас случаев. Далее нам необходимо вывести дифференциальное уравнение для оптимальной оценки. Но прежде чем приступить к этой процедуре, дадим сводку основных положений. 20* 611
Краткая характеристика модели Считается, что все процессы генерируются (моделируются) путем пропускания белого шума через линейную систему с изменяющимися во времени параметрами. Эти процессы описываются векторным дифференциальным уравнением ^=F(f)x(0 + G(flu(f), (302) где Ε [и (t) ит (τ)] = Q6 (t — τ), (303) a x(t) задается как детерминированный вектор или как случайный вектор с известной статистикой вторых моментов. Решение (302) можно записать в виде переходной матрицы t χ (0 = Φ (f, t0) х {ίο) +1Φ (Λ τ) G (τ) u (τ) άτ. (304) ίο Выходной процесс y(t) получается в результате линейного преобразования вектора состояния. Он наблюдается после искажений, вносимых аддитивным белым шумом. Принимаемый сигнал r(t) описывается соотношением r(f) = C(f)x(Q+w(f)._ (305) Шум измерения является белым и описывается ковариационной матрицей E[v/(t)v/T(u)]=R(t)6(t —τ). (306) До сих пор мы обсуждали только свойства вторых моментов случайных процессов, моделируемых путем возбуждения линейных динамических систем посредством белого шума. Очевидно, что если и(/) и w(t) являются совместно нормальными векторными процессами и x(t0) — статистически независимый нормальный случайный вектор, то допущение о гауссовости, сделанное на стр. 546, будет соблюдаться. (Независимость x(t0) есть лишь вопрос удобства; она необязательна.) Покажем далее, как можно модифицировать полученные ранее результаты по оптимальной линейной фильтрации с тем, чтобы воспользоваться преимуществом данного метода представления. 6.3.2. Вывод уравнений оценки Получим дифференциальное уравнение, решение которого является оценкой сообщения (или сообщений) по минимуму среднеквадрати- ческой ошибки. Напомним, что оценка вектора х(/) по минимуму среднего квадрата ошибки есть вектор x(t)> компоненты xt(t) которого выбираются так, что среднеквадратическая ошибка при оценивании каждой 612
компоненты является минимальной. Иначе говоря, минимизируются величины E[(Xi(t) —Xt(f))2]> ί = 1, 2 /г. Отсюда следует, что сумма средних квадратов ошибок E{[xT(t) —xT(t)][x(t) — χ(ή]} также минимизируется. Этот вывод не сложен, но несколько утомителен. Он состоит из четырех частей. 1. Исходя из векторного уравнения Винера — Хопфа (свойство ЗА—V) для реализуемой процедуры оценки, выводим дифференциальное уравнение относительно переменной U в котором τ играет роль параметра. Этому уравнению, а именно (317), должна удовлетворять характеристика h0(i, τ) оптимального фильтра. 2. Так как оптимальная оценка х(/) получается путем пропускания принятого сигнала через оптимальный фильтр, (317) приводит к дифференциальному уравнению (320), которому должна удовлетворять оптимальная оценка. Все коэффициенты этого уравнения, за исключением h0(i, t), .оказываются известными. 3. Далее необходимо найти выражение для h0(t, t). Свойство 4B-V выражает h0(/, f) через матрицу 1Ρ(ί) ошибок. Поэтому столь же успешно можно найти выражение для ξρ (t). Для этого сначала необходимо найти дифференциальное уравнение для ошибки χε(ί) [см. (325)]. 4. Наконец, ввиду того, что lp(t)*E[xB(t)xl(t)\, (307) можно использовать (326) для отыскания матричного дифференциального уравнения, которому должна удовлетворять ξρ(ί) [см. (330)]. Выполним теперь все эти пункты более подробно. Этап 1. Начнем с интегрального уравнения, полученного для оптимального устройства точечной оценки, осуществляемой за конечное время [свойство 3A-V, (52)]. Мы оцениваем весь вектор x(t): t Кх (t, a) CT (σ) = I h0 (/, τ) Кг (τ, σ) άτ9 Τί<σ<ίί (308) Ti где ΚΓ (τ, o)=G(t)Kx(t, g)Ct(g)+R(t)8(t—σ). (309) Продифференцировав обе части по t, будем иметь аК,^,<У)С^(а)=Ь0(О)Кг(^ σ) + dt t +1^1^ Кг (τ, a)dx, Tt<a<t. (310) Ti Рассмотрим сначала первый член в правой части (310). При σ <; t из (309) следует, что Кг(*. a)=C(/)[K,(i, о)СЦа)], a<t. (311) 613
Выражение в квадратных скобках есть просто левая часть (308). Следовательно, М*. 0 Кг (/, σ)=]Ίι0(ί, t)C(t)h0(t, τ)ΚΓ(τ, σ)Λ, σ</. (312) Теперь рассмотрим первый член в левой части (310) р^*г(*)]· (313) aKx(i' ϋ)=.Ε\ dt Используя (302), имеем 3Κχ(ί, σ) dt = F(/)Kx(i, σ)+ϋ(/)Κ«χ(ί, σ), (314) но второй член при σ <ct равен нулю [см. (266)]. На основании (308) видно, что F(i)Kx(f,o)(7(o) = f F(i)h0(i,T)Kr(x,a)dT. (315) Подстановкой (315) и (312) в (310) получим 0 = .f f-F(Oh0(i,T)-fh0(i,OC(Oh0(i,T) + + ^-^]Kr(va)rfT, Τι<σ«. ' (316) Очевидно, если выражение в квадратных скобках будет равно нулю при всех τ, Tt ^ τ ^ /, то (316) будет удовлетворяться. Так как R(f) положительно определена, это условие является также и необходимым (см. задачу 6.3.19). Таким образом, дифференциальное уравнение, которому удовлетворяет оптимальная импульсная характеристика, имеет вид dh0(t τ) =¥{t)ho{tiT)_ho{tit)C{i)ho{tiTy (317) at Этап 2. Оптимальную оценку получаем пропусканием входного сигнала через оптимальный фильтр. Следовательно, x(i) = f Η0(/,τ)Γ(τ)έίτ. (318) Ti В (318) предполагается, что реализуемая оценка х(7\) по минимуму среднеквадратической ошибки равна нулю (x(Tf) = 0). Поскольку принятой информации не имеется, наша оценка в момент времени Т% основывается на априорных сведениях. Если x(Tt) есть случайная величина с вектором средних значений E[x(Ti)] и ковариационной мат- 614
рицей Кх(Гг, Ti), то оценка по минимуму среднеквадратической ошибки равна x(Ti) = E[x(Ti)]. Если x(Ti) — величина детерминированная, скажем хя(Гг), то можно рассматривать ее как случайную величину, средние значения которой равны Xd(0> т. е. £[x(7\)]AXD(i), а ковариационная матрица Kx(Tit Tt) тождественно равна нулю, т. е. Κχ(7\.,Γ;)Δ0. rttJ-j^-Jpt) Процесс генерации сообщения С ft) Рис. 6.36. Структура устройства оценки с обратной связью. т Kit) В обоих случаях в (318) предполагается, что E[x(Tt)] = 0. Не представляет труда получить модификации для других начальных условий (см. задачу 6.3.20). Дифференцируя (318), имеем Ti (319) Подставляя (317) в правую часть (319) и используя (318), получим ?ψ- = F (Ζ) χ (0 + h0(/, t) [г (О-С (t) χ (/)]. (320) Удобно ввести новое обозначение для h0(t, t), показывающее, что она является функцией только одной переменной z(t)±b0(t,t). (321) Операции в (322) могут быть представлены матричной блок-схемой рис. 6.36. Мы видим, что все коэффициенты, за исключением ζ(ή, известны, но (53) позволяет выразить h0(t> t) через матрицу ошибок z(t) = h0(tJ)=--lP(t)CT(t)R-4t). 615 (322)
Поэтому (320) будет полностью определено, если мы сможем найти выражение для %p(t) — ковариационной матрицы ошибок для оптимального реализуемого устройства точечной оценки. Этап 3. Сначала находим дифференциальное уравнение для ошибки 8(0, где χβ(ί)Δχ(0—х(0· (З23)ч Продифференцировав, получим dxB(t)_dx(t) dx(t) /q9.v at ~ at dt ' (ozq) Подставляя (302) вместо первого, а (320) — вместо второго слагаемого в правой части (324) и используя (305), получим требуемое уравнение а-ЦР~= [F(t)-z(t)C(t)]xe(t)-z(t)w(t)+G(t)u(t). (325) Последний этап — вывести дифференциальное уравнение для Этап 4. Продифференцировав lP(t)bE[xe(t)xJ(t)l (326) будем иметь dlP (0 м =4^*Н+4-<0^]· (327) Подстановкой (325) в первое слагаемое (327) получим е[^Р-х/(/)] = £ {[F(/)-z(f)C(0] χε(/)χ/(t)- -^z{t)w(t)xeT(t)+G(t)u(t)xeT(t)}. "(328) Из (325) нетрудно усмотреть, что χε(ί) есть вектор состояния для системы, возбуждаемой взвешенной суммой двух независимых белых шумов w(i) и u(t). Поэтому математические ожидания во втором и третьем слагаемых являются точно такими же, как и найденные в свойстве 13 [вторая строка (266)]: E[d^xeT(t)] = F(t)lP(t)-z(t)C(t)lp(t) + + i2(0 R(/) z^o+l о (0Qor(0. (329) Прибавляя результат перестановки и заменяя z(t) правой частью (322), получим дисперсионное уравнение ^ = F(01p(0 + 6p(0F(0-Sp(0C40R-1(<)C(0Sp(0 + + G(t)QGT(t). (330) Это уравнение и начальное условие lP(Ti) = E[xs(Ti)x/(Ti)] (331) 616
однозначно определяют |р(/). Используя (322), получим ζ(ή — коэффициент передачи оптимального фильтра. Заметим, что дисперсионное уравнение не содержит принятого сигнала. Поэтому его можно решать до приема какой-либо информации и использовать для определения коэффициентов передачи в оптимальном фильтре. Дисперсионное уравнение является матричным уравнением, эквивалентным п2 скалярным дифференциальным уравнениям. Однако ввиду того, что матрица |ρ(ί) симметрична, необходимо решать -ψη(η + 1) скалярных нелинейных дифференциальных уравнений. В общем - случае невозможно получить в явном виде точное аналитическое решение, но это не имеет значения, так как уравнение получается в форме, удобной для интегрирования на аналоговой или цифровой вычислительной машине. Дисперсионное уравнение является матричным уравнением Рикка- ти, свойства которого всесторонне исследованы в других контекстах (см., например, [31—35]). Приведем лишь два свойства. Первое связано со случаем стационарного процесса с бесконечной памятью (задача Винера), а второе — с аналитическими решениями. Свойство 15. Предположим, что Тг—фиксировано, а матрицы F, G, С, R и Q — постоянны. При определенных условиях с возраста нием ί будет наблюдаться начальный переходный период, после которого коэффициенты передачи фильтра будут приближаться к постоянным значениям. Из (322) и (330) видно, что при |р(/) ->■ 0 ковариационная матрица ошибок и матрица коэффициентов передачи стремятся к постоянным значениям. Если справедливо условие \ρ{ί) = 0, то данная задача носит название задачи оценки при установившемся (стационарном) состоянии. Левая часть (330) в этом случае равна нулю и дисперсионное уравнение превращается в систему -γ η(η + 1) квадратных алгебраических уравнений. Неотрицательно определенное решение системы есть 1р. По поводу этого утверждения необходимо сделать ряд замечаний. 1. Как формулировать условия, чтобы задача оценки при установившемся состоянии системы имела смысл? Чтобы дать на этот вопрос наилучший ответ в общем виде, необходимо знать некоторые положения, которые не излагались [23J. Достаточное условие заключается в том, чтобы сообщение соответствовало стационарному случайному процессу. 2. Для малых η можно вычислить различные решения и выбрать из них правильное. Даже при умеренных η (например, η = 2) практически более целесообразно решать (330) численным интегрированием. Мы можем начать с некоторой произвольной неотрицательно определенной \p{t) и положить, что решение сходится к стационарному результату (точную формулировку см. в [23], теорема 4). 3. Напомним, что %p(f) можно генерировать до приема информации в действительном масштабе времени. В качестве простого примера 617
моделирования дисперсии при помощи аналогового вычислителя рассмотрим уравнение dip (0 о -2klp(t)- ±lP*{t) + 2kP. dt (332) (Оно появится в примере 1.) Простой аналоговый метод моделирования показан на рис. 6.37. Начальным условием является 1р(Т^ = Ρ (см. обсуждение в следующем параграфе). 2кР ~"Ф Ш--р щ > Устройство 8оз8еде - ния в квадрат Рис. 6.37. Аналоговое решение дисперсионного уравнения. 4. Для решения (или алгоритмизации решения) дисперсионного уравнения необходимо задать %Ρ(Τι). Здесь имеется несколько возможностей: а) Процесс может начаться в момент времени Tt с известного значения (например, с нулевой дисперсии) или со случайной величины, имеющей известную дисперсию. б) Процесс может начаться в некоторый момент времени t0 гораздо раньше Tt и достигнуть статистически установившегося состояния. В свойстве 14 на стр. 607 было выведено дифференциальное уравнение, которому удовлетворяло Ах (/). Если достигается статистически уста: новившееся состояние, то Ах (ή = 0 и (273) сводится к 0 = FAx+AxF^ + GQG^. - (333а) Это — алгебраическое уравнение, решением которого является Лх. Тогда |р(Г,) = Ах, (3336) если процесс достиг установившегося состояния до момента времени 7У Для того чтобы ненаблюдаемый процесс достигал статически установившегося состояния (Ах (f) = 0), необходимо и достаточно, чтобы собственные значения F имели неотрицательные действительные части. Это условие гарантирует, что решение уравнений (333) будет неотрицательно определенным. Во многих случаях ненаблюдаемый стационарный процесс задается в основном посредством его спектра Sy((u). Элементы матрицы Лх 618
легко получить из Sy(a>). В качестве примера рассмотрим вектор состояния в (191): χ, = dtv-» Если y(t) есть стационарный процесс, то 1,2,... , л. (334а) ? da; Лж.п = J 5,(ω)— (3346) или в более общем виде , dw ^ ι ел f Αχ./*= ί (/ω)^(ω)^ ί = 1,2,... ,/ζ, Λ--=1,2,...,/г. (334в) Заметим, что для данного вектора состояния ΛΧι/Λ = 0 при (i+fe) нечетном (З34г) ввиду того, что Sy(a>) является четной функцией. Второе свойство дисперсионного уравнения в ряде случаев позволяет получить аналитические решения (главным образом в задачах, характеризуемых постоянной матрицей и конечным временем). В основном тексте мы не останавливаемся на деталях, однако в некоторых задачах они используются. Свойство 16. Дисперсионное уравнение можно свести к системе двух линейных уравнений: ^г1 = F W v* W + G W QQT W v* O» ^ii) = c^0R-IWC(0v](O-Fr(Ov2(O, (335) или, что эквивалентно, Α [Σιβ) 1 = Γ ψ J Gi(l*pl 1 Γνχ (01 (336) dt[vt(t)l lCT(t)R-l(t)C(t) ! -Fr(0 JLv.(i)J Представим переходную матрицу (336) в виде т ('' г) ~ [т^Г^ГтТ^Гг·)J · (337) Тогда можно показать [32], что Ър (0 = [Τιι (Λ Tt) Ь (Tt) + Т12 (t, 7\·)] χ Χ [Τη (ί, Γ,) ξρ ί 7\) + Τ22 (ί, Γ,)]"1. (338) Если интересующие нас матрицы постоянны, то всегда можно найти переходную матрицу Τ в качестве матрицы коэффициентов (336). (См., например, задачу 6.3.21, где матрица Τ получена при помощи метода преобразования Лапласа. Как показано в этой задаче, чтобы охватить все собственные значения, нам необходимо взять контур справа от всех полюсов.) 619
В этом параграфе задачу оптимальной линейной фильтрации мы сформулировали в терминах переменных состояния. Все представляющие интерес величины выражаются в виде выходных величин динамических систем. Три уравнения, описывающие эти динамические системы, выражают наши главные результаты. Уравнение оценки U^==¥(t)i(t) + z(t)[v(t)-C(t)x(t)]. (339) at Уравнение коэффициента передачи z(t)=lp(t)CT(t)R-i(t). (340) Дисперсионное уравнение ^=Р(О5р(0 + 6р(Орт(О-6р(ОСг(0К-ЧОС(О6р(О + + G(t)QOT(t). (341) Для иллюстрации их применения рассмотрим ряд простых примеров, выбранных ради одной из трех целей: 1. Показать иной подход к задаче, которая может быть решена при помощи классической теории Винера. 2. Проиллюстрировать задачу, которую нельзя решить при помощи теории Винера. 3. Получить конкретный результат, который будет полезным при последующем изложении. 6.3.3. Приложение В этом параграфе мы рассмотрим несколько примеров, иллюстрирующих применения результатов, полученных в § 6.3.2. Пример 1. Рассмотрим спектр сообщения первого порядка 2kP В этом случае x(t) является скалярной величиной, x(t) = a(t). Если предположить, что сообщение не модулировано, а шум измерения белый, то r(t) = x(t) + w(t). (343) В данном случае легко находим нужные величины: F (*)=-*, G(0=1, С (0=1. (344) Q = 2kP, 620
Подставив эти величины'в (339), получим дифференциальное уравнение для оптимальной оценки dxjt) at -**(0+*(0И0-*(01· (345) Соответствующий фильтр изображен на рис. 6.38. Значение коэффициента передачи z(t) определяется в результате решения дисперсионного уравнения. Ht)\ Ряс. 6.38. Оптимальный фильтр: пример 1. Во-первых, предположим, что устройство оценки достигло установившегося состояния. Тогда стационарное решение дисперсионного уравнения можно получить без особого труда. Положив левую часть (341) равной нулю, будем иметь 0=-2fe|pco-^oo — +2kP, (346) где через %Роо обозначена дисперсия в установившемся состоянии: ζΡοο Δ 1 im ξρ (t)t t -> oo Существуют два решения уравнения (346): одно отрицательное и одно положительное. Так как ζΡοο — средний квадрат ошибки, он должен быть положительным, поэтому lpoo = k^(-\ + VT+A) (347) (напомним, что A = 4P/kN0). Из (340) получим г(оо)Аг00=|Рв0Л-1 =*(-1 + у7+А). (348) Ясно, что данный фильтр должен быть эквивалентен фильтру, полученному в примере § 6.2. Передаточная функция при замкнутой петле обратной связи равна Н0 (/со) Подстановкой (348) в (349) получим /со + /е + г0 Н0(М- fe(Vl+A —1) (349) (350) что совпадает с (94). Задачу для переходного процесса можно решить аналитическим или численным методом. Подробное рассмотрение аналитического решения произведено в 621
задаче 6.3.21 на основе свойства 16, стр. 619. Переходная матрица имеет вид Τ(7Ί + τ,7Ί) = cosh (γτ) sinh(YT) ] 2kP N0y sinh (γτ) sinh (γτ) cosh (γτ) + — sinh (γτ) (351) где γΔ/ί/1 + Λ. (352) Если предположить, что ненаблюдаемое сообщение находится в статистически установившемся состоянии, то~х(Т{) = 0 и 1Р(ТЬ) = Ρ [В (342) предполагается, что a(t) имеет нулевое среднее]. Используя эти допущения и подставив (351) в (358), получим (y + k)2 e+yt — (y—k)2 e~yt I lP(t + Ti) = 2kP 2kP y + k 1 + \y±k) -2yt i-i ,-2y/ При t-> oo имеем tf-*-00 2kP N0/ (353) (354) что согласуется с (347). На рис. 6.39 показано поведение нормированной ошибки как функции времени для различных значений Λ. Числа, поставленные у правых концов кривых, соответствуют разности ξρ(1, 2) — ξΡοο, являющейся мерой того насколько близко ошибка приближается к своему значению при установившемся состоянии системы. 0,8 0,6 о,* 0,2 I - I / ^—. 3 1 10 (p(O)'f ι ι ι ι ι ι 0,007 | 0,003 , 0,001 I I 1 1 1 Рис. 6.39. Средний квадрат ошибки для случая однополюсного спектра. 0,2 0,4 0,6 0,8 1,0 Пример 2. Логичным обобщением однополюсного случая является класс фильтров Баттерворта, определяемый (153): 2пР sin(ji/2Az) лГ1.ч 5α(ω:Αζ) = 1 · * (355) ау } к 1 + (со//г)2л Для формулировки этого соотношения в терминах переменных состояния нам необходимо иметь дифференциальное уравнение процесса генерирования сообщения: а(л)(0 + Рл.1а<я-1)(0+...+рва(0 = и(0- (356) 62 2
Фигурирующие здесь коэффициенты табулированы для различных η в учебниках по теории цепей (например, [37, 38]). Значения для к — 1 показаны на рис 6.40а. Место положения полюсов для различных η показаны на рис 6.406. Если интере- η 2 3 4 5 6 7 Рп 1 1.414 2.000 2.613 3,236 3.864 4.494 Рп 2 1.000 2.000 3.414 5.236 7.464 10.103 Рп — 3 1.000 2.613 5.236 9.141 14.606 Рп—4 1.000 3,236 | 7,464 14,606 Рп — 5 1 1.000 ! 3.864 10.103 Рп— 6 1.000 4,494 Рп-7 1,000 а(я)(0 + Ря-1а(я-1>(0+...+.Рва(0=и(0· дифференциального ус ры Баттерворта [38] Рис. 6.40а. Коэффициенты дифференциального уравнения, описывающего спект- -31 п=1 а Круг j ω i единичного *^>j)a0ut/ca , \ 6 / / / \ 4, -4-£- > n=2 3ω. 1 \ 4._ 1 \6 / / /7=3 t' 4. \ V ь / /7=4* Полюса при s = exp(jjt(2m+n-l)}:m-f,2,...,2/7 Рис. 6.406. Диаграммы полюсов спектров Баттерворта. соваться только процессом сообщения, то можно выбрать любое удобное представление состояния. Один из примеров определяется уравнением (191): xi(t) = a(t), jc2(i) = i(0=ii(0. x3(t) = a(t)=x\(t), η in(0=- Σ Ρ*_ι*Λ(0+«(0. ft—1 (357) 623
Результирующая матрица F для любого η получается, если использовать (356) и (193). Прочие необходимые величины равны "О 1 О(0 = О 1 С(0 = [1!0|...|0]. π *2^" Q = 2nPk2n~l sin ί-^г ), Wo Из (340) видно, что z(t) есть матрица размерностью (η Χ Г): Sii (О" Z(0=T0 Sl2 (О Sin (О (358) (359) (360) (361) (362) к (0 = ^ (0 + -у In (0 [г (0 - *ι (01. *2 (0 = *3 (0+ -JT &12 (0 l· (0 4*1 (Ob ίη (0= —p0ii (0 -Pi *2 (О — · · · ~Р„- ι *nr(0+-JjT &* W [r W _il Wl· (363) Соответствующая блок-схема показана на рис. 6.41. Для отыскания значений ln(t),..., lln(t) необходимо решить дисперсионное уравнение. Это можно сделать аналитически, использовав свойство 16, стр. 619, η ft) Рис. 6.41. Оптимальный фильтр: сообщение Баттерворта η-го порядка. 624
однако численный метод решения гораздо практичнее. Предположим, что Ti = 0 и что неохватываемый нашим наблюдением процесс находится в статистически установившемся состоянии. Чтобы найти ξρ(0), используем (334). Заметим, что переменные состояния выбираются так, чтобы удовлетворялось (334 г). Это обстоятельство отражается наличием нулей в |р(0), как показано на рисунках. На рис. 6.42, а показана зависимость ошибки от времени для случая двух полюсов. И на этот раз числа, поставленные у правых концов кривых, яв- **<*> Рис. 6.42. Фильтр Баттерворта второго порядка: а —средний квадрат ошибки; б—коэффициенты передачи. ляются разностью 1р (1,2) — ξΡοο. Видно, что при t = I ошибка практически достигает своего установившегося значения. На рис. 6.42, б показано поведение члена ξι2(0· Аналогичные результаты иллюстрируются для случая трех и четырех полюсов на рис. 6.43 и 6.44 соответственно1 > Во всех случаях установившееся значение достигается практически при t = I. (Заметим, что к = I, так что временной масштаб является нормированным.) Это означает, что после t = I параметры фильтров, по существу, независимы от времени. (Однако это вовсе не означает, что все члены %P(t) достигают установившегося значения.) Близкий вопрос, который мы оставляем для самостоятельного упражнения, заключается в следующем. Пусть фильтр с постоянными параметрами рассчитан на устаног вившееся состояние. Какими будут его характеристики для переходного режима по сравнению с оптимальным фильтром, параметры которого изменяются во времени (см. задачи 6.3.23л 6.3.26). J> Численные результаты, представленные на рис. 6.39 и 6.41—6.44, заимствованы из [36]. 625
0,2 Ο,β 0,6 Ο,β 1,0 1,2 t a) 0,2 0 -0,2 0 1/10 0,2 Qtt fe? 1 1 1 0,6 0,8 --*——_ """a—. -,,№ί1] R=1 ι 1 ' J 1,0 1,2 t R*1 j w f/fO j 1 1 1 l | 1 1 1 l I . ι i 092 0,4 0,6 0,8 δ) 1,0 1,21 Рис. 6.43. Фильтр Баттерворта третьего порядка: α—средний квадрат ошибки; б—коэффициенты передачи. Пример 3. В двух предыдущих примерах рассматривались стационарные процессы. Простым нестационарным процессом является винеровский процесс. Его можно представить в виде дифференциального уравнения *(0) = 0. (364) Заметим, что несмотря на то, что коэффициенты дифференциального уравнения постоянны, данный процесс является нестационарным. Если принять, что то получить оценку не представляет труда х (t) = z(t)[r(t)-x(t)]> 626 (365) (366)
0,8 0,S 0,2 г\ \ г \ >* J 1_ .1. 1 F= 0 1 0 0 0 / 0 0 0 -1 -2,61 -J,*/ - V С ^^^L· ; ο -ο&4 ο 0 Ο,Μϊ 0 -0,№ о ~o.m ο ι I » I I I - 1J10 0 ' 0 1 ?f6/ G-- o\ Q=3,06 \ .'J 1 = [ισσο] -^, 0,020 -l ■ 0,016 0,017 I I I I I I l 0,2 0,4- 0,6 0,6 1,0 1,2 t a) 0,2 0,4 0,6 0,8 f90 1,2 t 0,2 0^ 0,6 0,8 КО 1,2 t Рис. 6.44. Фильтр Баттерворта четвертого порядка: а—средний квадрат ошибки; б, в, г—коэффициенты передачи. 627
где m=Tbw (367) tp(t)= --jflp W + G2Q. (368) Задачу переходного процесса легко решить, используя свойство 16, стр. 619 •(см. задачу 6.3.25). Результат имеет вид NoG*QY'2l 1-е-2*' Г **о Л \ 1/2 / е*-е-*\ / N0G*Q\1'2/ 1+е — 2γ/ (369) где γ = [2<j2(?/W0]1/2. (Заметим, что (369) не является предельным случаем (353), так как начальное условие здесь другое.) При t -* оо ошибка стремится к своему установившемуся значению: fr.-ffe-Q) 1/2 (370) jформулу (370) можно получить непосредственно из (368), положив \p(t) = 0.J Для установившегося состояния фильтр изображен на рис. 6.45. Интересно отметить, что эта задача не учитывается моделью фильтра Винера — Хопфа § 6.2. Эвристически этот случай можно Htlr Л. ^ > χ Μ V2GZQ/N0 \ X ft) f охватить, записав 5*(ω) = G2Q ω2 + ε2 ' (371) Рис. 6.45. Фильтр в установившемся состоянии (к примеру 3). решив задачу методом спектрального разложения и затем положив ε -»- 0. Нетрудно показать, что такой подход приводит к системе, представленной на рис. 6.45. Пример 4. В этом примере мы построим каноническую модель приемника для следующей задачи: 1. Сообщение имеет рациональный спектр, у которого порядок (степень) числителя как функции ω2 по крайней мере на единицу ниже, чем степень знаменателя. Мы используем модель переменных состояния, описанную на рис. 6.30. Матрицы F и взадаются выражениями (212) и (213) соответственно (каноническая реализация № 2). 2. Принимаемый сигнал является скалярной функцией. 3. Модуляционная матрица имеет единицу в первом столбце и нули на всех •остальных местах. Иначе говоря, в отсутствие измерительного шума будет наблюдаться только немодулированное сообщение С(0 = [1|0...0]. •Уравнение, описывающее оценку, получается из (339): х= Fx(0 + z(0[r(0-*i(0] z(t)=—lP(t)CT(t). "о (372) (373) (374) Как и в примере 2, коэффициенты передачи равны просто первой строке матрицы ошибок, умноженной на 2/N0. Результирующая структура фильтра показана на рис. 6.46. При t -> оо усиление становится постоянной величиной. 628
Для .случая постоянного коэффициента передачи путем сравнения части системы, обведенной штриховой линией, с двумя блок-схемами рис. 6.30 и 6.31, а получаем структуру фильтра, изображенную на рис. 6.47. "02+ Фильтр с обратной связью Рис. 6.46. Каноническая схема устройства оценки для стационарных сообщений в статистически установившемся состоянии. Задав фильтр в петле обратной связи посредством его передаточной функции, получим ел—1 G'o(s) = — I. 11' ... +i т No s" + P„_1s"-1+ ..·+ Ро (375) Таким образом, коэффициенты числителя передаточной функции фильтра в петле обратной связи соответствуют первому столбцу матрицы ошибок.^Полюсы (какмы убедились ранее) совпадают с полюсами спектра сообщения. Mt) Τ" Νη ϊ„* π-1, ■··*$ 1TJ +Pn-1S π-1. h Ρ a(t) ait) Рис. 6.47. Каноническая схема устройства оценки для стационарных сообщений в статистически установившемся состоянии. Заметим, что для определения коэффициентов числителя необходимо решить дисперсионное уравнение. Пример 5А [23]. В качестве простого примера только что рассмотренного общего случая возьмем процесс сообщения, показанный на рис. 6.48,а. Если мы хотим использовать каноническую структуру приемника, которая только что была синтезирована, то необходимо изменить модель генерации сообщения, как показано на рис. 6.48, б. 629
Нетрудно заметить, что Pi = K po = 0, &i = 0, b0=l. Далее, используя (212) и (213), получим -г::} «-[?]·«-«* (376) (377) Q = qt R=N0/2. Результирующая структура фильтра, являющаяся просто частным .случаем рис. 6.47, изображена на рис. 6.48. w(t) 1 Ati sb+k) | δ) -ft) ^φ ш ait) £,tt) = &(t) в) ■ Рис. 6,48. К примеру 5А: а —генератор сообщения, б —аналоговое представление; в—оптимальное устройство оценки. Дисперсионное уравнение системы в установившемся состоянии имеет вид _2_ Л/о (378) 'v0 2 2(-*ξιι + |ι.)—тгБ?1 = 0, -*£ΐ2 + ξ22— "ТГ 111 ξΐ2 = 0, 'V0 W, Ιί2=ί· 630
Таким образом, ошибки системы в установившемся состоянии равны ь.4{-»+['+«(^)"Т"}· Мы взяли положительно определенное решение. Передаточная функция фильтра в петле с обратной связи в установившемся состоянии имеет вид Gio (s) s(s + k) 1/2 (380) Пример 5Б. Интересный пример, близкий к предыдущему, показан на рис. 6.49. Добавим подстрочные индексы А и В для обозначения величин в примерах 5А и 5Б соответственно. Видно, что, за исключением некоторых постоянных, выходной процесс совпадает с про- uft) S+U х2вМ S XfR ft) Рис. 6.49. К примеру 5Б, генерация сообщения. цессом, рассмотренным в примере 5А. Промежуточная переменная x2B(t) в этой реализации, однако, не появляется. Мы исходим из того, что интересующее нас сообщение есть x2B(t). В гл. 2 второго тома мы встретимся с моделью рис. 6.49, а результирующая структура системы оценки играет важную роль в задаче частотной модуляции. Это всего лишь конкретный пример общей задачи, когда сообщение подвергается линейной операции перед передачей. Существует два простых способа решения данной задачи. Один из них заключается в использовании результата примера 5А. Для этого необходимо представить x2B(t) в виде линейной комбинации x1A(t) и x2A(t) — переменных состояния в примере 5А: Р*2В (0?=*1В(0 (381) при условии Замечая, что получим *iB(0 = *u(0, *2AV)= kxlA(t)+XlA(t)9 К (0=*i (t) = -kxx (t)+x2 (t). ΒΛ A A i3J2» (383) (384) (385) Здесь минимизация среднеквадратической ошибки фильтрации коммутативна с линейными преобразованиями. [Доказательство тождественно доказательству (2.237).] Следовательно, — 1 *2B(t)=-r[UlA(t)+X2A(t)]. (386) 631
Укажем, что это не эквивалентно тому, чтобы положить β*2Β(<) равным производной от XiA(t). Таким образом, 1*в (t)=h β (0· (387) На основании этих заключений можно построить блок-схему оптимального фильтра путем модификации рис. 6.48. Результат показан на рис. 6.50. Отсюда легко получить выражение для дисперсии ошибки β2Ι22β (0 = кЧ11А (t)-2k%l2A (0+|22л (О· Рис. 6.50. К примеру 5Б, устройство оценки. (388) В противном случае, если бы мы не решили пример 5А, то подошли бы к решению задачи прямым способом. Принимаем сообщение за одну из переменных состояния. Соответствующие матрицы имеют вид '-С-Я· «-[?]· «-" 0] (389> Q=<te. (?90) Структура системы оценки показана на рис. 6.51. Дисперсионное: уравнение имеет вид 2 -.2 Su(0 = 2Ki.(0--^r6n(9. iii (0 = β|22 (0 -*|,» (0 —\г In (0 in (0. |22(0= - Щп(0—-^"6i2 (0 + ?*. (391 > 632
Даже для установившегося состояния решить эти уравнения аналитически затруднительно. В данном частном случае нам помог только что решенный пример 5А. Вполне очевидно, что ξη(ί) в обоих случаях должна быть одной и той же, если положить дА = β2<7β Из (379) находим £ll. оо~ kN0 2 kN0K ί Г, 2 /2?Ββ»\ι/ηΐ/2| (392) по определению Другой коэффициент передачи |12t ^ теперь получить не представляет труда: 512, со- 4β · (««) Так как предполагалось, что интересующим нас сообщением является x2(t) можно также легко вычислить дисперсию ошибки t Li &*N9\ ξ22,οο~ 2k [Ι Β 8β2 ]· (394) Нетрудно показать, что (388) и (394) дают одинаковые результаты и что блок- схемы рис. 6.50 и 6.51 обладают одинаковыми зависимостями между r(t) и x2(t). Внутренние различия между двумя указанными системами проистекают из различия выбранных нами представлений состояний систем. 1*V ^, Ζ yh_ Ν L / s+k ^. Ц L &гвЮ β s 2ft 1 Рис. 6.51. К примеру 5Б, оптимальное устройство оценки. Пример 6. Рассмотрим теперь тот же процесс сообщения, что и в примере!, но будем считать, что помеха является суммой белого шума и некоррелированного с ним цветного шума: n(t) = nc(t) + w(t) (395) и 2/ес Ре Sc(w)=^tfr· (396) Как уже было показано, мы просто включаем nc(t) как компоненту в вектор состояния. Таким образом, (397) (398) 633
G(0=[J j]. (399) C(0 = [I 1], (400) Q(0 2 Матрица коэффициентов передачи обращается в 2 R(0=-??. (402> А ^' = л/ *РУ1>^ 'vo ИЛИ ζ (0 = — fP (0 С (t) (403) ^0 'ii(t) = -%rlln(t) + lit(t)], (404) ги(0 = ^-[1и(0 + Еи(0Ь (405) Уравнение, определяющее оценку, имеет вид dx (t) dt или, если выразить через компоненты, dxt (О dt dx2 (t) dt = F (0 χ (0 + z (0 [r (O-C (0 x (Ob (406) шпоненты, bxi (t) + zu (t) [r (t) -Xl (t)-x2(t)l (407) = - kc x2 (t) + z21 (t) [r (t) -*! (0 -x2 (t)l (408) Блок-схема системы показана на рис. 6.52, α. Эта форма структуры свидетельствует о симметрии процесса оценивания. Заметим, что оценки связаны посредством ветви обратной связи. Эквивалентная асимметричная структура, показывающая влияние цветного шума на сообщение, представлена на рис. 6 52, б Для отыскания коэффициентов передачи необходимо решить дисперсионное уравнение. Подстановкой в (341) найдем Ιιι (0 = -Щи (0 - ητ (ξιι (0 +ξΐ2 (0)2 + 2kP, (409) ii2 (o = ~(k+kc) g12 (о - 4- teli (ο+1» (o) tei2 (o+S22 (0). (*ιο> ξ22 (0= - 2kc ξ22 (t)—^r (|12 (0 + ξ22 (Ο)2 +2kc Ρe. (411) Следует сделать' два замечания. 1. Система, изображенная на рис 6.52, а, показывает все существенные особенности канонической структуры, необходимой для оценивания системы независимых случайных процессов, сумма которых наблюдается в присутствии белого шума (по вопросу синтеза общей канонической структуры см. задачу 6.3.31). В общем случае связь проявляется точно таким же образом. 2 Мы пытались подойти к случаю, когда белый шум отсутствует (N0 ~ 0)„ используя предельный переход. Трудность заключается в том, что в этом случае дисперсионное уравнение вырождается. Синтез структуры приемника для случая чистого цветного шума обсуждается в § 6. 3 4. 634
Пример 7 Наиболее распространенным примером случая многократного наблюдения применительно к связи служит система разнесенного приема. Упрощенная теория такой системы дана ниже. Допустим, что сообщение передается по т каналам с известными коэффициентами передачи, как показано на рис. 6.53. ^ГТ\ 1 ρ ( — ζ\ *b\ Jt ~t 1+ Γ*1?// ?1Z f*^ j - "^U-1 s Π* -e^fcU— I ^ Ll· +t L+. - ~yi1 *ΊΖ [^ / - ~n * 5 * gg xfft/=aW f x2(t)-nc(t) j я; "^rt "ν j ■^ ^ Л рг ^L7TT \Zf(t) 2 £^+!22 Afc S +#c «c 2. $ft+tfz M0 s + k Xf(t) 6) Рис. 6.52. Оптимальное устройство оценки для случаев небелого и белого шума (статистически установившееся состояние). В каждом канале действует помеха типа белого шума. Модуляционная матрица имеет размерность m X п, однако только первый ее столбец отличен от нуля: С(0 = С2| Мс.'О]. (412) Ради простоты будем полагать, что помехи в каналах некоррелированы. Поэтому матрица R(t) будет диагональной: Л 2 2 R(0 = О Nrn' 2 (413) 635
Матрица коэффициентов передачи z(t) имеет размерность η Χ m, ее ij-\\ элемент равен 2cj zij(t)^—lii{t). (414) Общая структура приемника представлена на рис. 6.54, а. Обозначим напряжение на входе внутренней петли через v(f), WfM с2 w2(t) г,Ю "гШ v(t)=z(t)[r(t)-C(t)i(t)]. (415а) Используя (412)—(414), получим Ощ Wm(t/ 1-<&-&-^ [т 2с, Ί Ν, ] (4156) Нетрудно заметить, что первый Рис. 6.53. Система разнесенного член в квадратных скобках представ- приема. ляет безынерционное устройство сложения принимаемых сигналов. Обозначим выходное напряжение этого устройства через rc(t): т 2с, / = 1 NS (416) Видно, что оно является точно таким же устройством сложения по максимуму отношения сигнал/шум, с которым мы встречались в гл. 4. Схема оптимального фильтра может быть перечерчена так, как показано на рис. 6.54, б. г (ί) x;ft) Рис. 6.54. Система разнесенного приема. 636
При этом приходим к одноканальной задаче, в которой принимаемое колебание имеет вид rc w = ( 212-й)а w + 2 ■? ^(/)· <417а> Модуляционная матрица является в этом случае скалярной величиной 2М а помеху можно записать в виде т 2с МО* У. —-n}{t). (417b) / = ι WJ Если сообщение а(2) имеет единичную дисперсию, то эффективная мощность равна /' т 2 Υ Pet = (.2 ν'J · <4Ι8) а эффективный уровень шума 2 / = 1 Следовательно, все результаты, полученные для одноканального случая, можна использовать и в данном случае, произведя простое изменение масштаба. Например, для однополюсного спектра сообщения, рассмотренного в примере \у получим Net lPoo = k — (_1+|/1+ Aef), (420) где Aef=— r_L = — У ί . (421> k ft, "J k ft Nj Аналогичные результаты справедливы, когда матрица R(t) не является диагональной и когда сообщение является нестационарным процессом. Рассмотренные примеры иллюстрируют задачи, наиболее часто встречающиеся в области связи. Другие примеры вынесены за пределы основного текста. 6.3.4. Обобщения Чтобы охватить другие интересные задачи, необходимо сделать ряд обобщений. Рассмотрим их кратко в данном параграфе. Предсказание. В этом случае d(t) = x(t + α), где α — положительно. Можно легко показать, что d (0 - Φ (t + α, t) x (t)l a > 0, (422) 637
где Ф(/, τ) — переходная матрица системы, χ (ί) = F (t) x(t) + G (t) u (t) (423) (см. задачу 6.3.37). Если мы имеем дело с системой, параметры которой постоянны, то Φ(ί + α, t)=e™ (424) и (422) обращается в i(f)=e*«x(f). (425) Фильтрация с задержкой. В этом случае d(t) = x(t + α), но a отрицательно. Из предыдущих рассуждений известно, что в этом случае возможен значительный выигрыш, в связи с чем целесообразно его охватить в нашем обобщении. Однако здесь модификация полученного результата не столь проста, как в предыдущем случае предсказания. Оказывается, что канонический приемник сначала находит реализуемую оценку, а затем использует ее для получения требуемой оценки. Задачи этого типа основательно рассмотрены в [40]. Задача оценивания х(^), где tx — точка внутри фиксированного интервала наблюдения, также рассмотрена в [40]. Указанные задачи аналогичны задачам на нереализуемые фильтры, рассмотренным в §6.2.3 (см. задачу 6.6.4). Линейные преобразования вектора состояния. Если d(t) есть линейное преобразование переменных состояния χ(ή, т. е. d(t)=kd(t)x(t), (426) то d(t)=kd(t)i(t). (427) Заметим, что kd(t) не является линейным фильтром, а есть линейное преобразование переменных состояния. Этим самым просто утверждается то, что оценивание по минимуму среднеквадратической ошибки и линейное преобразование коммутативны. Матрицу ошибок получаем без особого труда: ld (t) Δ Ε [(d (t) - d (0) (<F (t) - dT (t))] = kd (t) lp (t) k/ (t). (428) Именно этот метод был нами использован в примере 5Б. Некоторые линейные операции. Во многих случаях полезный сигнал получают путем пропускания x(t) или γ(ή через линейный фильтр, как показано на рис. 6.55. Представляют интерес линейные операции трех типов: 1. Операции типа дифференцирования, например d(t) = ±Xl(t). (429) Данное выражение имеет смысл только тогда, когда χλ(ί) есть выборочная функция дифференцируемого в среднеквадратическом про- 638
цесса1). Если это условие соблюдается, то всегда можно выбрать d(t) как одну из компонент вектора состояния сообщения и тогда будут непосредственно применимы результаты § 6.3.2. Заметим, что at (430) Иначе говоря, линейная фильтрация и реализуемое оценивание не коммутативны. Результат (430) станет очевидным, если мы рассмотрим структуру системы оценки, представленную на рис. 6.51. u(cj Генерация^ {сообщений. XftJ требуемая линейная операция dftj H(t) Рис. 6.55. Требуемые линейные операции. 2. Несобственные операции. Например, предположим, что y(f) скалярная функция и где d(t)=~-§ kd(%)y{t — T)dx, XdW ' /ω + β Ύ /ω + β (431a) (4316) В этом случае полезный сигнал является суммой двух слагаемых. Первое слагаемое есть y(f). Второе слагаемое является результатом операции свертки по истекшей части у (ή. Вообще несобственная операция состоит из взвешенной суммы y(f) с его производными плюс некоторая операция при наличии памяти. Чтобы получить представление посредством переменных состояния, необходимо несколько модифицировать наши результаты. Обозначим вектор состояния динамической системы, импульсная характеристика которой есть kd(x), через xd(0· (Здесь она является скаляром.) Тогда Xd(t)=-$*d(t)+y(t) (432) d(t) = (a-£)xd(t) + y(t). (433) Х) Отметим, что мы имели дело с вектором χ (t), когда одна из компонент была недифференцируемой. Однако выходная величина системы всегда существовала в среднеквадратическом смысле 639
χ Таким образом, выходное уравнение содержит дополнительное слагаемое. В общем виде xd( t) = Ε, (t) xd(t) + Gd(t)x (0, (434) d(t)=Cd(t)xd(t) + *d(t)x(t). (435) Из (435) видно, что если преобразовать вектор состояния так, чтобы он содержал как xd(t), так и x(t), то будет справедливо (427). Введем преобразованный вектор состояния Уравнение для модифицированного процесса имеет вид Уравнение наблюдения остается без изменения r(t)=C(t)x(t)+w(t). (438) Однако нам необходимо переписать его в терминах модифицированного вектора состояния r(t)=Ca(t)xa(t) + w(t), (439) где С«(*)МС(0;0]. (440) Теперь d(t) получается в результате линейного преобразования модифицированного вектора состояния. Итак, d(t) = Cd(t)id(t) + Bd(t)x(t) = [Bd(t)\Cd(t)] [ία(t)]. (441) (В качестве простого примера см. задачу 6.3.41.) 3. Собственная операция. В этом случае импульсная реакция kd(x) не содержит никаких импульсов или их производных. Здесь прямо применимы все замечания для случая несобственных операций, если положить bd(f) = 0. W(t) X(t) ^ , « *>\ Линейный фильтр •ла\«*) Рис. 6.56. Линейная фильтрация перед передачей. Линейная фильтрация перед передачей. В этом случае сообщение перед передачей пропускают через линейный фильтр, как показано на рис. 6.56. Все замечания, относящиеся к предыдущему случаю, можно применять и здесь, если сделать очевидную модификацию^ На- 640
пример, если линейная фильтрация является несобственной операцией, то можно записать xf(t) = Ff(t)xf(t)+Gf(t)x(t), (442) yf(t)=Cf(t)xf(t) + Bf(t)x(t). (443) Тогда модифицированный вектор состояния будет иметь вид χα (0 =[--£:!· (444) LM0J Уравнение модифицированного процесса записывается в виде Гр(0| О Ι ГО (01 *w=[^W)\^{t)+l-T-\u{t)· (445) При этом уравнение наблюдения переходит в следующее: r(0=y,(0+w(0 = [B,(0|c,(tfl ri^J+w(i). (446) Для двух последних случаев модифицированный вектор состояния является ключом к решению задачи. Корреляция между#(*)и w(t). На практике встречаются случаи, когда векторный процесс белого шума u(t), генерирующий сообщение, коррелирован с векторным шумом измерения w(t). Модификация вывода оптимального алгоритма в этом случае не вызывает затруднений1 \ Рассматривая исходный вывод, видим, что результаты для первых двух этапов остаются неизменными. Поэтому i(t) = F(t)i(t)+h0(t,t)[r(t)-C(t)i(t)]. (447) В случае коррелированных u(t) и \ν(ή выражение для z(t)&h0(t,t)&limh0(t,u) (448) необходимо модифицировать. На основании свойства 3A-V и определения %p(t) имеем lP(t)= lim \Kx(t,u)- ίΜ/,τ)ΚΓχ(τ,«)Λτ . (449) «-г L Ti J Умножением на CT(t) получим lp(t)Cr(t)= Hm Kx(/,w)C^(0-Jh0(/,T)Krx(T,a)C^OrftU = lim Kn(t,u)— K»w ('.")— J h0(t,x)Krx(r,u)CT(u)dx . (450) 1} Этот частный случай впервые был рассмотрен в [41]. В нашем выводе мы следуем Коллинзу [42]. 21 Зак. 693 641
Теперь из векторного уравнения Винера—Хопфа следует, что lim Kxr(^w) = lim If h0(t, τ)ΚΓ(τ, ύ)άτ = = lim f b0(t9T)[Krx^9u)CT(u) + R(T)b(T—u) + C(T)Kxw(x9u)]dx (45 Используя (451) в (450), получим %ρ(ί)σ (i) = lim h0 (Λ u)R(u)+] h0(f, t)C(t)KXw(t, и)ах—КМ*#) I (452) Первое слагаемое (452) непрерывно, а второе в пределе равно нулю, поскольку равно нулю Kxw(t, и) во всех точках, кроме и = t. Ввиду непрерывности h0(t, τ) интеграл равен нулю. Третье слагаемое учитывает влияние корреляции. Таким образом, lP(t)C(t)=h0(t,t)R(t)-Um Kxw(f.M). (453) Используя свойство 13 (стр. 606), получим UmKx*(t,u) = G(t)P(t)t (454) где Elu(t)wT(x)]b6(t—x)P(t). (455) Тогда ζ(t)Δh0 (t9 t)=Hp(t)V(t) + G(t)P(t)] R-1 (t). (456) Последнее, что нам остается, — это модифицировать дисперсионное уравнение. Из (328) видно, что нам необходимо вычислить математическое ожидание E[[-z(t)w(t)+G(t)u(t)]xJ(t)}. (457) Для этого введем новую возбуждающую функцию, воспроизводящую белый шум, v(t)b—z(t)w(t)+G(t)u(t). (458) Тогда E[v(t)vT(x)] = [z(t)R(t)z^(t) + G(tyQGT(t)]8(t—T) — - [ζ (t) E [w (t) xf (t)] G^(t)+G(t)E[u (t) wT (t)] z? (t)] (459) или E[v(t)vT(x)]r[z(t)R(t)zT(t)—z(t)PT(t)GT(t) — —G(t)P(t)zT(t) + G(t)QGT(t)]8(t — x)bM(t)8(t — T). (460) 642
Используя свойство 13 (стр. 606), будем иметь E[(-z(t)w(t) + Q(t)u(t))xJ(t)]=±tA(t). (461) Подстановкой в дисперсионное уравнение (327) получим iP(t) = {F№p(t)-z(t)C№P(t)}+{~V + z(t)H(t)zT(t)- —ζ (О Рг (0 Gr (t) — G (t) Ρ (0 ζΓ (0 + GT (t) QGr (f). (462) Если для ζ (0 использовать выражение (456), то (462) обращается в lP(t) = [F (0-G (0 Ρ (/) R-i (ί) С (f)] gp(0 + Sp (0 [F"(0- -C40R-40PrWG(0]-6p(OCr(OR-1(OC(06p(0 + + G (0 [Q- P (t) R-1 (ί) Ρ^ (01G^ (0, (463) что и является требуемым результатом. Сравнивая (463) с обычным дисперсионным уравнением (341), нетрудно заметить, что полученная структура является точно такой же. Коррелированный шум оказывает такое же влияние, как изменение F(t) и Q в (330). Если ввести F*t(t)±1?(t) — G(t)P(t)R-l(t)C(t) (464) и Q*t(t)±Q-P(t)R-l(t)PT(t)9 (465) то (341) можно использовать непосредственно. Заметим, что структура данного фильтра совпадает со структурой фильтра в случае отсутствия корреляции; меняется только зависимость от времени коэффициента передачи ζ(ί). Здесь мы впервые встречаемся с изменяющейся во времени Q(f). Результаты (339) — (341) оказываются справедливыми и для данного случая. Ряд интересных случаев, когда имеет место корреляция, вынесен в задачи. Случай одного цветного шума. В рассуждениях мы исходили из того, что присутствует ненулевая компонента белого шума. В задаче обнаружения мы встречались со случаями, когда снятие этого допущения приводило к вырожденным испытаниям. Поэтому несмотря на то, что это допущение оправдывается физическими соображениями, целесообразно исследовать случай, когда компонента белого шума отсутствует. Начнем с простого примера. Пример. Процесс генерации сообщения описывается дифференциальным уравнением М0=М0М0 + М0М0· (466) Генерация цветного шума описывается дифференциальным уравнением x2(t) = F2 (t) x2(t) + G2 (0 u2 (*)'. (467) Процесс наблюдения является суммой этих двух процессов y{t) = x1(t)+x2(t). (468) 643
Здесь отсутствует белый шум. Все наши предыдущие рассуждения в связи с «выбеливающими» (декоррелирующими) фильтрами исходили из того, что посредством некоторой процедуры можно пропустить y(t) через фильтр, рассчитанный так, что выход, обусловленный x2{t), будет белым шумом. Обратим внимание, что мы отбеливали только цветной шум, а не всю входную смесь. Из (468) нетрудно усмотреть, что полезным выходным сигналом является y(t) — F2(t) y(t). Обозначив новую выходную величину через г'(£), имеем г' (О Δ у (О -F2 (t) у (t) = х\ (t) -F2 (t) xx (0 +G2 (t) u2(t), (469) r' (t) = lF1(t)-F2(t)]x1(t)+wf (t), (470) где W (t) ΔΟχ (Ο αχ {t)+Q% (t) u2 (t). (471) Теперь мы получили нашу задачу в знакомой форме записи г' (t)=£{f)x{t)+w'(t): (472) где C(t) = [F1(t)-F2(t)\0]. (473) Уравнение состояния имеет вид Γ*ι(0ΐ рч(0 о "I Г*(о1 Кмо οΙΓμοΊ (474) Uwl L о .MoJUwJ L о OtiOJ U.WJ Видно, что измерительный шум w'(t) коррелирован с u(t): Ε [и (t)w' (τ)] = β (/—τ) Ρ (ί), (475) так что '«-ет· Структуру оптимального фильтра нетрудно получить, если использовать уравнение передачи (456) и дисперсионное уравнение (463), выведенные в последнем параграфе. Общий случай1) является несколько более сложным, но основная идея остается той же (см., например, [43], [41] или задачу 6.3.45). «Чувствительность». Во всех наших рассуждениях мы исходили из того, что матрицы Έ(ή, G(t), €(ή, Q и R(/) известны точно. На практике матрицы могут фактически отличаться от предполагаемых. Проблема чувствительности сводится к отысканию увеличения ошибки, когда реальные матрицы не соответствуют модели. Примем следующую модель: Хто (0 = Fmo (t) Хшо (0 + Gmo (t) umo (0, (477) rmo (t) = Cmo (t) xrao (t) + wrao (t). (478) X) Мы опустили два важных момента ввиду того, что задача, связанная с наличием одного только цветного шума, встречается не очень часто. Первым вопросом является минимальная размерность рассматриваемой задачи. В данном примере соответствующим выбором переменных состояния можно прийти к скалярному дисперсионному уравнению вместо матричной записи размерностью (2 X 2). Затем можно найти χ (t) посредством линейного преобразования долученной оценки переменной состояния для системы минимальной размерности и принимаемого сигнала. Второй вопрос касается начальных условий для дисперсионного уравнения. ξρ (0~) может не быть равной ξρ (0+). Читателя, интересующегося более детальным изложением, отсылаем к двум упомянутым источникам. 644
Корреляционными матрицами являются Qmo и Rmo(0· Обозначим матрицу ошибок при допущении данной модели через |Шо(0· (Подстрочным индексом «то» заменяется слово «модель».) Теперь допустим, что реальная ситуация описывается уравнениями iac (t) = Fac (t) xac (t) + Gac (0 uac (0, (479) rao(0=Cae(f)xae(0 + wM(O (480) с корреляционными матрицами Qac и Rac(0· Нам необходимо найти фактическую ковариационную матрицу ошибок 1ас(0 системы, являющейся оптимальной при данной модели, когда на входе действует гас(0- (Подстрочный индекс «ас» заменяет слово «actual».) Подробный вывод сделан в [44]. Основные результаты приведены в виде соотношений (484) — (487). Введем величины: lau(t)bE[*eac(t)xlJt)]f (481) lae(t)bE[xao(t)xlJt)], ^482) F8(^Fac(0-Fmo(0. (483a) Ce(0*Cac(0-Cmo(0· (4836) Действительная ковариационная матрица ошибок определяется тремя матричными уравнениями tac (О = {[Fmo (0-Imo (0 С (0 Rmo (t) Cmo (t)] %ас (t) - -ire(t)-lmo(t)CTmo (0RmO(0Ce(0];iae(0} + + {~}r + Gac (t) Qac Oldt) + tmo (t) CL (0 R~i (t) Rao (0 X XRmO(0Cmo(/)|mo(0. (484) te (0 = Fao (/) la8 (t) +%ae (t) Fmo (0-lae (0 CL (0 RmO (0 X X Cmo (t) tmo (t)- Aac (t) ¥τε (0 + Лас(0 Cl (0 R-J (0 X X Cmo (0 Imo (0+ Gao (t) Qac GL (0, (485) где Лас(0Д£[хао(0хГс(0] (486) удовлетворяет знакомому нам линейному уравнению Лас (0 = Fac (t) Лас (t) + Лас (t) Fie (t) + Gac (0 Qac Garc (t). (487) Видно, что можно сначала решить (487), а затем (485) и (484). Другими словами, эти уравнения связаны только в одном направлении. Решая таким образом и считая, что дисперсионное уравнение для 1то(0 уже решено, мы убедимся, что эти уравнения являются линейными и изменяющимися во времени. Некоторые типичные примеры рассмотрены в [44], а также в задачах. 645
Краткие итоги § 6.3 С учетом указанных обобщений формулировка модели в виде фильтра с обратной связью пригодна для решения всех задач, которые только можно решить на основе классической винеровской теории. (Возможным исключением является случай стационарного процесса с нерациональным спектром. Теоретически метод спектрального представления пригоден для нерациональных спектров, если, они удовлетворяют критерию Палея — Винера, но фактическое решение в большинстве интересующих случаев практически выполнять нецелесообразно). Перечислим кратко некоторые преимущества формулировки задачи при помощи переменных состояния. 1. Так как это представление во временной области, то его легко распространить на нестационарные процессы и конечные интервалы времени. 2. Форма решения такова, что его можно реализовать на ЭВМ. Это преимущество не следует недооценивать. Часто, когда поставленная задача достаточно проста и ее можно решить аналитически, наша интуиция оказывается достаточно хорошей, так что оптимальное устройство обработки оказывается лишь немного лучше, чем логически правильно спроектированное, но специализированное устройство обработки. Однако по мере возрастания сложности.модели наша интуиция становится все менее надежным путеводителем, и оптимальная схема зачастую играет роль руководства по проектированию устройства обработки. Если мы не в состоянии простым-способом получить количественные ответы для оптимального устройства обработки, то это преимущество утрачивается. 3. Третье достоинство не является очевидным из нашего рассмотрения. В оригинальной работе [23] признается и широко используется дуальность задач оценки и автоматического управления. Это позволяет строго доказать многие из полезных результатов методами, заимствованными из области автоматического управления. 4. Другое преимущество метода переменных состояния, которым мы не будем пользоваться в полной мере, заключается в его применимости к задачам, связанным с нелинейными системами. В гл. 2 второго тома мы докажем некоторые результаты, которые могут быть получены этим методом. Разумеется, у этого метода имеются и свои недостатки. К числу наиболее существенных недостатков относятся следующие: 1. Представляется затруднительным получить выражения для ошибки в замкнутой форме, аналогичные (152). 2. В нескольких случаях, как например, в случае нереализуемых фильтров, задачи этим методом решать значительно труднее. Материал данного параграфа служит в качестве введения в вопросы применения метода переменных состояния. Со времени появления оригинальной работы Кальмана и Бьюси в этой области выполнено большое число исследований. Различные аспекты данной задачи и родственные вопросы рассмотрены во многих статьях и книгах. В гл. 2—4 646
второго тома мы еще раз встретимся с задачами, при решении которых используется метод переменных состояния. Обратимся теперь к задаче амплитудной модуляции и посмотрим, как можно здесь применить результаты §6.1—6.3. 6.4. Линейная модуляция в системах связи Общие положения §6.1 применимы к произвольным задачам линейной модуляции. В § 6.2 был рассмотрен метод решения, который применим к немодулированным сообщениям. В § 6.3 общие результаты относились к случаю линейной модуляции, однако в примерах были рассмотрены главным образом смодулированные сигналы. Рассмотрим теперь частный случай линейной модуляции, часто встречающийся в задачах из области связи. Эти задачи характеризуются тем, что в качестве несущей (переносчика) используется колебание, частота которого много больше ширины спектра сообщения. Распространенными примерами являются обычная AM с несущей - s(t,a(t)) = Y2P[l+ma(t)]cos<uet (488) и двухполосная AM с подавленной несущей s(t9a(t)) = Y2Pa(t)cos<ue(t)9 (489) s(t,a(t))--=YF>[a(t)cos(uct — Z(t)sm(uct}, (490) где a(t) связано с сообщением a(t) заданным линейным преобразованием (мы рассмотрим этот вопрос более подробно на стр. 652). Путем выбора соответствующего преобразования можно получить однополосный сигнал. Все упомянутые системы характеризуются тем, что c(t) по частоте существенно отличается от процесса сообщения. Как будет показано позднее, это ведет к упрощению структуры устройства оценки (или демодулятора). Рассмотрим несколько интересных случаев и обсудим как реализуемые, так и нереализуемые задачи. Обратимся сначала к реализуемой задаче точечной оценки. 6.4.1. ДБП—Aft*. Реализуемая демодуляция В качестЕе перЕого примера рассмотрим систему двухполосной амплитудной модуляции с подавленной несущей s(t,a(t))=[Y2Pcos<uet]a(t)=y(t). (491) Напишем это уравнение в общей форме линейной модуляции, положив c(0^2Pcos<dc/. (492) fi47
Прежде всего рассмотрим задачу реализуемой демодуляции при нал ичии белого шума. Обозначим вектор состояния сообщения через х(/) и предположим, что сообщение a(t) является его первой компонентой. Оптимальная оценка определяется уравнениями где l*iQ- = F(/)i(i)+z(/)[r(0-C(Oi(0]. C(/) = [c(/)iO|0...0] z(t) = lP(t)V(t) No (493) (494) (495) Блок-схема приемника показана на рис. 6.57. Чтобы упростить эту структуру, нам необходимо исследовать характер фильтра в петле обратной связи и c(t). Прежде всего предположим, что фильтр в петле обратной связи является фильтром нижних eft) пм-ал?. 1—<хь V-^ / v^— 2 \*0 1 —^ Фильтр x,it) = г, ft) - aft) eft) Рис. 6.57. Приемник ДБП — AM, форма № 1. частот по отношению к сос — частоте несущего колебания. Такое допущение логично, так как в системе амплитудной модуляции спектр сообщения лежит в области нижних частот относительно ω с. Теперь посмотрим, что произойдет с a(t) в ветви обратной связи после двукратного умножения на c(t). Результат умножения можно записать в виде c2{t)'a{t) = P{\+cos2^ct)a{t). (496) Согласно нашему исходному допущению a(f) не содержит частотных компонент вблизи 2сос. Поэтому, если фильтр в петле обратной связи является фильтром нижних частот, то компонента с частотой, близкой к 2ωс через него не пройдет, и, не изменяя выходной величины, блок-схему можно перечертить так, как показано на рис. 6.58. Теперь петля работает на нижних частотах. Остается показать, что получающийся при этом фильтр является просто обычным оптимальным фильтром нижних частот. Это нетрудно уяснить, если проследить, каким образом c(f) входит в дисперсионное уравнение (см. задачу 6.4.1). 648
Мы видим, что результирующий фильтр нижних частот тождествен фильтру, получающемуся в случае отсутствия модуляции. Так как модулятор просто переносит сообщение на более высокую частоту, можно полагать, что дисперсия ошибки будет такой же. Получить выражение для ошибки не представляет труда. ^ьоьысг 05й у-щ I Dv-~ \ - ΖΡ No » ^ Фи льтр \ xf(tj*a(t) 1 Рис. 6.58. Приемник ДБП — AM, окончательная форма. Рассматривая выражение для входной величины системы и вспоминая, что r(t)=[Y2Pcos(uct] a(t) + n(t), (497) мы видим, что на входе петли действует сигнал ri (0 = [ Yp a(t) + n8 (t)] + слагаемые удвоенной частоты, (498) где ns(t)—исходный шум n(t), умноженный на "J/2/P coscoc/,. Sns((u)=No/2P. (499) Таким образом, выражение для входной величины системы совпадает с тем, которое было получено в § 6.2. Следовательно, выражение 1 — Ъп(ш) No 2 \ Nn ι г -ωс <-ojc ω Рис. 6.59. Ограниченный по полосе шум с равномерным спектром. для ошибки (152) непосредственно применимо для случая амплитудной модуляции с двумя боковыми полосами и подавленной несущей: ъРп1 Μ lnfl+ад d(u 2π (500) Кривые рис. 6.17 и 6.19 для спектров Баттерворта и Гаусса в данном случае находят прямое применение. Следует заметить, что шум фактически имеет спектр, показанный на рис. 6.59, так как имеются элементы, работающие в полосе частот, 649
через которую проходит сигнал, прежде чем поступить на обработку. Ввиду того, что фильтр рис. 6.58 является фильтром нижних частот, аппроксимация в виде белого шума будет справедливой при условии, что спектр будет равномерным во всей эффективной полосе пропускания фильтра. 6.4.2. ДБП—AM. Демодуляция с задержкой Рассмотрим теперь ту же задачу в случае, когда допустима нереализуемая фильтрация (или фильтрация с задержкой). Ради дальнейшего упрощения будем полагать, что процесс сообщения является стационарным. Таким образом, Т1 = оо и Ka(U и) = Ka{t — и). В этом nft) *ф eft) No Sa (ω) J-COS^* X eft) ^- ft) ■a) a a(t) ^ ^4x)—-I Ю SaM Safohjfc a a ft) в) Рис. 6.60. Демодуляция с задержкой. случае наиболее просто принять гауссову модель и использовать процедуру оценки по максимуму апостериорной плотности, разработанную в гл. 5. Уравнение оценки по максимуму апостериорной плотности вероятности получается из (6.3) и (6.4): оо a„tf)= \ —Ka(t — u)c(u)[r{u) — c(u)a(u)]duf — оо</«х>. (501) -оо ^0 Подстрочный индекс «ш> указывает здесь на то, что устройство оценки является нереализуемым («unrealizable»). Нетрудно заметить, что операция под интегралом есть свертка, что предполагает наличие блок- 650
схемы, изображенной на рис. 6.60, а. Используя те же рассуждения что и в §6.4.1, получим блок-схему рис. 6.60, б и окончательно — рис. 6.60, в. Оптимальный демодулятор является просто комбинацией перемножителя с оптимальным нереализуемым фильтром1 \ Выражение для ошибки имеет вид t = Г Sg (ω) (Νρ/2Ρ) άω (5Q2) U _i Sa(a>) + N0/2P 2π ' Этот результат, разумеется, тождествен результату, полученному в случае немодулированного процесса. Как уже указывалось, это объясняется тем, что линейная модуляция есть просто операция транспонирования спектра по оси частот. 6.4.3. Амплитудная модуляция. Обобщенное понятие несущей В большинстве обычных систем связи несущим колебанием является синусоидальное колебание. Однако во многих случаях желательно использовать в качестве несущей колебание более общего вида. Приведем несколько простых примеров. 1. Как мы увидим, в зависимости рт спектра помехи при различных несущих получаются различные ошибки демодуляции. Поэтому во многих случаях синусоидальное колебание в качестве несущего является неэффективным. Частным случаем является случай преднамеренной аддитивной помехи. 2. В сетях связи с большим числом неактивных абонентов может возникать потребность совместной работы многих систем в общем диапазоне частот. Примером может служить спутниковая система связи с произвольным доступом. Путем использования различных широкополосных ортогональных несущих подобный режим работы может быть обеспечен. 3. Во втором томе будет показано, что использование широкополосной несущей позволяет успешно работать в каналах связи со случайно изменяющимися во времени параметрами. Имеется много других ситуаций, когда целесообразно отказаться от использования синусоидальных несущих. Модификация результатов § 6.4.1 является очевидной. Пусть s(t,a(t)) = c(t)a(t). (503) Из рис. 6.60 нетрудно видеть, что если c\t)a(i) = k[a(t) + высокочастотное слагаемое], (504) то последующие операции будут идентичными. Если это несправедливо, то задачу необходимо исследовать повторно. В качестве второго примера линейной модуляции рассмотрим однополосную амплитудную модуляцию. Х) Данный результат был впервые получен в [46] (см. также [45]). 651
6.4.4. Однополосная амплитудная модуляция с подавленной несущей1* В случае однополосной системы связи сообщением a(f) модулируется несущее колебание cos ω J. Кроме этого, временной функцией α(ή, линейно связанной с a(t)y модуляции подвергается несущее колебание sin (oct Таким образом, передаваемый сигнал имеет вид s(t9a(t)) = YPla(t)cQs<uJ— a(f)sin<ocf]. (505) Здесь коэффициент j/2 исключен с тем, чтобы мощность передачи была такой же, как в случае двухполосной амплитудной модуляции. Несущее колебание в этом случае также подавляется. S$4 Рис. 6.61. Спектр передачи ОБП. ω Функция a(t) есть преобразование Гильберта от функции a(t). Она соответствует выходу линейного фильтра А(т), у которого входом служит функция a(t). Передаточная функция фильтра равна Я (/ω): (—/. о, 1+/. ω>0, ω = 0, ω<0. (506) Можно показать (см. задачу 6.4.2.), что результирующий сигнал имеет спектр, полностью лежащий выше несущей на оси частот (рис. 6.61). Чтобы найти структуру оптимального демодулятора и его помехоустойчивость, рассмотрим случай Tf = оо как наиболее простой. Из (505) видно, что случай ОБП соответствует комбинации слагаемых с памятью и без памяти. Существует несколько путей для вывода уравнения оценки. Можно вернуться к выводу (5.25), сделанному в гл. 5, модифицировать это выражение для ds(t, a(t))/dAr и далее продолжить с этого момента (см. задачу 6.4.3). Идя другим путем, можно рассмотреть векторную задачу и произвести совместную оценку a(f) и a(t) (см. задачу 6.4.4). Подобная эквивалентность имеет здесь место ввиду трго, что a(f) и a(f) входят в передаваемый сигнал линейным образом. Заметим, что метод переменных состояния оказывается нецелесообразным, поскольку фильтр, осуществляющий преобразование Гильберта (506), не является динамической системой с конечным числом степеней свободы. г) Мы полагаем, что читатель знаком с ОБП. Соответствующими руководствами могут служить [47—49]. 652
Предлагаем читателю в качестве упражнения сделать соответствующий вывод, здесь же приведем только окончательные результаты. Полагая, что шум является белым и имеет спектральную плотность W0/2, и используя (5.160), получим уравнение оценки X (507) ^)=^-§ VpUos<dczRa(t,z)—sin(ocz x $ h(z-y)Ra(t,y)dy \\[r(z)-YP[a(z)cos(*cz- — α (ζ) sin (дс z]\ dz и *(') = ^ S УЯ cosocz $ h{t-y)Ra{y>z)dy - 4 — sin (oc г Ra (t, y)\ { г (г) — У? [α (a:) cos (oc z—Ъ (г) sin (oc 2]} dz. (508) Эти уравнения выглядят довольно сложными. Однако, перечертив блок-схему и использовав определение #(/ω) (506), мы придем к простому приемнику рис. 6.62 (более подробное изложение можно найти в задаче 6.4.5). f(t) Фильтр ОБП с единичным коэффициентом передачи a(t)+ns(t) 5 α (ω) с / ) Ν° Sa(oJ)+jp aft) Рис. 6.62. Приемник ОБП. Нетрудно показать, что ns(t) имеет спектральную плотность NJ2. Сравнение рис. 6.60 и 6.62 делает очевидным, что по помехоустойчивости однополосная модуляция с подавленной несущей и двухполосная модуляция с подавленной несущей по среднему квадрату ошибки равноценны. Поэтому при выборе системы для конкретного применения мы должны руководствоваться другими соображениями, например эффективностью использования спектра (занимаемой полосой частот). Приведенные два примера иллюстрируют основную идею решения задачи оценки сообщения при линейных методах модуляции, используемых в обычных системах связи. Представляют также интерес еще два вида модуляции: двухполосная и однополосная амплитудная модуляция, в которых несущая не подавляется. Передаваемый сигнал в первом случае записывается в виде (488). Синтез приемников осуществляется аналогичным образом. 653
С точки зрения точности оценки можно ожидать, что поскольку часть располагаемой мощности расходуется на передачу остаточной несущей, ошибка оценки должна увеличиться. Качественно это легко показать (см. задачи 6.4.6 и 6.4.7). Мы вправе спросить, зачем вообще сохранять остаточную несущую. Ответ, разумеется, надо искать в нашей модели линии связи. Мы предполагали, что модулируемая функция (или несущая) c(t) точно известна на приеме. Иначе говоря, мы исходили из того, что приемник синхронизирован по фазе с генератором передатчика. По этой причине оптимальные приемники рис. 6.58 и 6.60 часто называют синхронными демодуляторами. Для применения такого демодулятора на практике приемник необходимо обеспечить точно такой же несущей. В простейшем случае с этой целью передается тональный пилот-сигнал, однозначно связанный с несущей. В приемнике пилот-сигнал используется для формирования копии колебания c(t). При рассмотрении системы, в которой несущая, восстанавливается из сигнала, посылаемого передатчиком, мы сталкиваемся с проблемой неточности получаемой копии c(t). Указанная неточность объясняется наличием помех в канале, по которому передается пилот-сигнал. Хотя вопросы восстановления несущей из принимаемого сигнала будут изложены более систематически в гл. 2 второго тома, мы можем проиллюстрировать влияние фазовой ошибки в системе AM при помощи простого примера. Пример. Пусть г (t) = V2Pa(t) cos (uct + n(t). (509) Допустим, что используется детектор рис. 6.58 или 6.60. Однако вместо умножения точно нас(^) мы умножаем на ~[/2Р cos ((uct + Φ), где Φ — фазовый угол, являющийся случайной величиной с распределением рф (Ф). Будем считать, что Φ от n(t) не зависит. Легко показать, что при заданном значении Φ эффект неточного знания опорной фазы эквивалентен уменьшению мощности сигнала Pef=Pcos^. (510) Мы можем далее найти выражение для среднего квадрата ошибки (реализуемой или нереализуемой) для сигнала уменьшенной мощности и усреднить результат по распределению рф(Ф). По своей идее выкладки не вызывают затруднений, однако довольно утомительны (см. задачи 6.4.8 и 6.4.9). Интуитивно представляется, что если угол Φ почти всегда мал (скажем, |Ф < 15°), то влияние неточности будет незначительным. В этом случае наша модель, в которой c(t) предполагается известной точно, является хорошим приближением к действительной физической ситуации, а результаты, получаемые при помощи этой код ел и, будут точно предсказывать помехоустойчивость реальной системы. Возникает ряд близких вопросов. 1. Можно ли восстановить несущую, совсем не затрачивая мощности на передачу пилот-сигнала? Этот вопрос обсуждался Костасом [50]. Мы рассмотрим его в разделе задач к гл. 2 второго тома. 2. Если в оценке c(t) имеется случайная ошибка, то является ли оптимальной структура приемника, изображенная на рис. 6.58 или 6.60? В общей постановке вопроса ответ будет отрицательным. Однако в большинстве практических случаев эта структура незначительно отличается от оптимальной. 654
3. Мож но ли построить теорию оптимальных оценок, которая имела бы практическое значение для общего случая случайной модуляционной матрицы, т. е. г(*)=С(0х(0 + п(0, (511) где C(t) — случайная величина? Мы убедимся впоследствии, что конструктивность такой теории зависит от статистики C(t). (Оказывается, что наиболее просто можно ответить на этот вопрос лишь в разделе задач к гл. 3 второго тома.) 4. Если синхронное детектирование является оптимальным, то почему оно не используется более часто? Это объясняется сравнительной сложностью реализации синхронного детектирования. В задаче 6.4.10 вычислена помехоустойчивость системы ДБП — AM с остаточной несущей при использовании простого детектора. При большом отношении сигнал/шум она лишь незначительно уступает помехоустойчивости синхронного детектирования. Поэтому в тех случаях, когда мы имеем один передатчик и много приемников (например, при коммерческом радиовещании), гораздо проще увеличить мощность передатчика, чем усложнять схему приемника. Однако в военной и космической связи чаще бывает легче усложнить приемник, чем увеличить мощность передатчика. На этом мы заканчиваем рассмотрение линейных методов модуляции. Обсудим теперь кратко некоторые результаты, полученные в данной главе. 6.5. Фундаментальная роль оптимального линейного фильтра Поскольку были подробно подведены итоги по различным параграфам, то нет необходимости повторять их в общих итогах главы. Вместо этого обсудим кратко три области, где методы, развитые в шестой главе, имеют большое значение. Линейные системы. Мы подошли к данному вопросу, показав, что для линейных методов модуляции интервальная оценка сообщения по максимуму апостериорной плотности вероятности находится путем обработки r(t) посредством линейной системы. Для рассмотрения точечных оценок мы прибегли к методу, которым ранее не пользовались, а именно: потребовали, чтобы устройство обработки было линейной системой, и отыскивали наилучшую из возможных систем в этом классе. Мы убедились, что если наложить на структуру подобное ограничение, то имеют значение только вторые моменты процессов. Это как .раз пример того типа, который упоминался в гл. 1, когда бывает достаточно частичного задания ввиду того, что используется структурный подход. Мы тогда завершили изложение, показав, что линейная система является наилучшим возможным устройством обработки во всех случаях, когда справедливо допущение о гауссовости процессов. Поэтому все результаты, полученные в шестой главе, играют двоякую роль. Они соответствуют оптимальным устройствам обработки для рассмотренных критериев при соблюдении условия гауссовости процессов и вместе с тем они соответствуют наилучшим линейным алгоритмам обработки для любых случайных процессов. Методы этой главы играют фундаментальную роль и в двух других областях. Нелинейные системы. В гл. 2 второго тома будут изложены вопросы синтеза оптимальных приемников для нелинейных систем модуля- 655
ции. Как можно полагать, сами эти приемники являются нелинейными системами. Будет показано, что оптимальные линейные фильтры, синтезированные в данной главе, можно рассматривать как компоненты общей нелинейной системы. Мы убедимся также, что модель системы с точки зрения ее влияния на сообщение во многих случаях можно считать линейной. В этих случаях результаты шестой главы оказываются непосредственно применимыми. Наконец, как показано в гл. 5, ошибка демодуляции в нелинейной системе может ограничиваться ошибкой, достижимой в некоторой родственной линейной системе. Обнаружение случайных процессов. В гл. 3 второго тома мы вновь обратимся к задаче обнаружения и оценки, однако на основе более общей модели. Будет показано, что рассмотренные нами линейные фильтры являются компонентами оптимального обнаружителя (или устройства оценки). Мы покажем, почему в этих двух областях следует ожидать наличия оптимального линейного фильтра. После завершения нашего изложения фундаментальное значение оптимальных линейных фильтров в различных и далеко отстоящих друг от друга областях станет очевидным. 6.6. Некоторые замечания Следует сделать замечания по некоторым примыкающим вопросам. 1. В §6.2.4 было показано, что для стационарных процессов на фоне белого шума реализуемая среднеквадратическая ошибка связана с шенноновской взаимной информацией. Для нестационарных процессов на конечном интервале можно вывести аналогичное соотношение. 1р=2"± а/(Г:М0,а(0) t (512) 2. При рассмотрении фильтров методом переменных состояния мы ограничились случаем непрерывных во времени процессов. Можно легко модифицировать этот метод, распространив его на системы с дискретными во времени сигналами. (Результаты для дискретной системы были получены при решении задачи 2.6.15 методом последовательной оценки.) 3. Иногда встречаются задачи, когда входной процесс содержит устанавливающуюся детерминированную компоненту и нужно минимизировать среднеквадратическую ошибку, обусловленную случайным входным процессом, ограничив одновременно среднеквадратическую ошибку, вызванную переходным процессом. Этот метод является простой модификацией рассмотренных методов (см., например, [51]). 4. В гл. 3 были рассмотрены собственные функции и собственные значения интегрального уравнения λΦ(ί)= J Ky(t,u)0(u)du, T^t^Tj. (513) 656
Для рациональных спектров были получены решения путем отыскания соответствующего дифференциального уравнения, его решения и использования указанного интегрального уравнения для оценки граничных условий. Из наших рассуждений в § 6.3 явствует, что можно найти более эффективный с точки зрения вычислений метод, если использовать методы переменных состояния. Эти методы развиты в [52] и [54] (см. также задачи 6.6.1 —6.6.4).'Конкретно результаты сводятся к следующему. а) Решение однородных уравнений Фредгольма на основе метода переменных состояния. Этот метод позволяет эффективно находить собственные значения и собственные функции скалярных и векторных случайных процессов. б) Решение неоднородных уравнений Фредгольма на основе метода* переменных состояния. Этот метод позволяет отыскивать функцию g(f), появляющуюся в оптимальном обнаружителе при наличии цветного шума. Он является также ключом к решению задачи синтеза оптимальных сигналов. в) Решение задачи оптимального нереализуемого фильтра на основе метода переменных состояния. Это позволяет достигать наилучшей помехоустойчивости при использовании заданного количества входных данных. Значение указанных результатов не следует недооценивать, так как они приводят к решениям, которые можно просто оценивать численными методами. Мы разовьем эти методы более подробно во втором томе и используем их для решения различных задач. 5. В гл. 4 были рассмотрены выбеливающие фильтры для задачи обнаружения сигналов на фоне цветного шума. При первоначальном обсуждении мы не требовали реализуемости. После исследования случая стационарного процесса на бесконечном интервале (стр. 354) мы установили, что может быть найден реализуемый фильтр и что одну компоненту можно интерпретировать как оптимальную реализуемую оценку цветного шума. Аналогичный результат может быть получен для случая нестационарного процесса на конечном интервале (см. задачу 6.6.5). Это позволяет использовать методы переменных состояния в целях отыскания выбеливающего фильтра. Этот результат будет также весьма ценным в главе третьей второго тома. 6.7. Задачи Задачи к § 6.1. Свойства линейных устройств обработки Задача 6.1.1. Пусть г(*)=а(0+я(0, Tt<t<Tf, где a(t) и n(t) — некоррелированные нормальные процессы с нулевыми средними значениями и ковариационными функциями Ka(t> и) и Kn(tt и) соответственно. Найти Ра (у | г (О; Т. < t < Tf (Л \г (Οί Τ χ < t < Tf). 657
Задача 6.1.2. Рассмотрим модель, представленную на рис. 6.3. 1. Вывести свойство 3V (51). 2. Конкретизировать (51) на случай, когда a(t) = х(/). Задача 6.1.3. Рассмотрим векторную модель, изображенную на рис. 6,3. Доказать, что М*. 0R(*) = 5p(*)Cr(f). Примечание. Задачи 6.1.4—6.1.9 иллюстрируют случаи, когда результаты наблюдения представляют собой конечное множество случайных величин. Кроме этого, шум измерения равен нулю. Эти задачи свидетельствуют о той простоте, с которой выражение (29) приводит к задачам линейной оценки. Задача 6.1.4. Рассмотрим простую задачу предсказания. Мы наблюдаем a(t) в один момент времени. Полезный сигнал имеет вид d(t)=a(t+a), где а — положительная постоянная. Допустим, что E[a(t)) = 0, Ε [a (t) а (и)] = Ка (t-u) ^Ka (τ). 1. Найти наилучшую линейную оценку d(t) по минимуму среднеквадратической ошибки. 2. Какова среднеквадратическая ошибка? 3. Конкретизировать выражение для случая, когда /Са(т) = е—Λ,τ|· 4. Показать, что для корреляционной функции п. 3 оценка по минимуму среднеквадратической ошибки не изменится, если было бы доступно все прошлое процесса. 5. Справедливо ли это для любой другой корреляционной функции? Обосновать ответ. Задача 6.1.5. Рассмотрим следующую интерполяционную задачу. Даны значения а(0) и а(Т): E[a(t)] = 0, — со < t < оо, E[a(t) a(u)] = Ka(t — u), — оо < г, и < со. 1. Найти оценку a(t) по минимуму среднеквадратической ошибки. 2 Какова получающаяся при этом среднеквадратическая ошибка. 3. Вычислить ее для t = Т/2. 4. Рассмотреть частный случай Κα(τ) = е~к^ τ ' и найти постоянные устройства обработки. Задача 6.1.6. [55]. Мы наблюдаем a(t) и a(t). Пусть d(t) = a(t + α), где α — положительная постоянная. 1. Найти линейную оценку d(t) по минимуму среднеквадратической ошибки. 2. Сформулировать условия, налагаемые на Κα(τ)> чтобы ответ на вопрос п. 1 имел смысл. 3.'Проверить результат для малых а. Задача 6.1.7. [55]. Мы наблюдаем а(0) и a(t). Пусть d (t)~\ а (и) du. о 1. Найти линейную оценку d(t) по минимуму среднеквадратической ошибки. 2. Проверить результат для t < 1. Задача 6.1.8. Обобщить предыдущую модель на (п + 1) наблюдений: я(0), а(0, a(2t) ... a(nt). nt d (0=f a (u) du- о 658
1. Найти уравнения,^определяющие оптимальное линейное устройство об· работки. 2. Найти точное решение для nt < 1. Задача 6.1.9. [55]. Необходимо восстановить сообщение a(t) no бесконечному числу отсчетов (выборок) а(пТ)у η = ... — 1, 0, +1, ..., используя линейную оценку по минимуму среднеквадратической ошибки оо я(0= 2 cn(t)a(nT). 1. Найти выражение, которому должны удовлетворять коэффициенты сп (О- 2. Рассмотреть частный случай, когда Sa(co) = 0, М>у- · Вычислить коэффициенты. 3. Доказать, что получающаяся при этом среднеквадратическая ошибка, равна нулю. (Заметим, что это доказывает теорему отсчетов для случайных процессов.) Задача 6.1.10. Из (29) явствует, что E[e0(t)r(u)]=-0, Tt<u<Tf. 1. При выводе (29) мы предполагали, что h0(t, и) является непрерывной^ и определяли h0(t, T{) vih0(t, Tf), исходя из требования непрерывности. Допустим, что г(и) содержит компоненту белого шума. Доказать, что Е1ео(1)г(Тг)]ф0, E[e0(t)r(Tf)]=hO. 2. Теперь снимем условие непрерывности h0(t, и) и допустим, что г(и) содержит компоненту белого шума. Найти уравнение, определяющее h0(t, и), чтобы Ε [е0 (t) г (и)] = 0, Ti< u<Tf. Одинаковы ли среднеквадратические ошибки для фильтров пп. 1 и 2? Объяснить почему. 3. Обсудить последствия исключения из г(и) компоненты белого шума. Будет ли h0(t, и) непрерывной? Используем ли мы строгое или нестрогое неравенство в интегральном уравнении? Задачи к § 6.2. Стационарные процессы с бесконечным прошлым (Винеровские фильтры) Реализуемые и нереализуемые фильтры Задача 6.2.1. Мы ограничили наше внимание рациональными спектрами. Запишем спектр в виде (ω-η1)(ω-»2)...(ω-η^) or (CD) = С " ? ^z=F"j» где N и Μ — четные числа. Предполагается, что 5г(со) — интегрируема на действительной оси. Доказать следующие утверждения. 1. Sr(cu) = Sr*(co). 2. с является действительной величиной. 3. Все rti и di с ненулевыми мнимыми частями входят в виде сопряженных пар. 4. Sr(co)>0. 659
5. Любой действительный корень числителя имеет четную кратность 6. Ни один корень знаменателя не может быть действительным. 7/ N <М. Убедиться, что эти результаты включают в себя все свойства, указанные «а рис. 6.7. Задача 6.2.2. Пусть г (и) = а (и) + η (и), — сю < и < t. Колебания а(и) и п(и) — выборочные функции некоррелированных процессов, имеющих нулевые средние значения и спектры вида 2ko 2 Sa (ω) = ° и Sn(<o) = tf2a>3 СО^ + АГ •соответственно. 1. Полезным является сигнал a(t). Найти реализуемый линейный фильтр, который минимизирует среднеквадратическую ошибку. 2. Какова получающаяся среднеквадратическая ошибка? 3. Повторить пп. I и 2 для случая, когда фильтр может быть нереализуемым, и сравнить получающиеся среднеквадратические ошибки. Задача 6.2.3. Рассмотрим модель, указанную в задаче 6.2.2. Допустим, что Sn((u) = N0 + N2(u*. 1. Повторить задачу 6. 2. 2. 2. Убедиться, что полученные ответы сводятся к ответам в задаче 6.2.2, когда N0 = 0, и к ответам, указанным в тексте, когда N2 = 0. Задача 6.2.4. Пусть г (и) = а (и)-\-η (и)у —оо < и < t. -Функции а(и) и п(и) — выборочные функции независимых нормальных случайных процессов с нулевыми средними значениями и 2/ζσα2 2сап2 Необходимо найти точечную оценку a(t) по минимуму среднеквадратической ошибки. 1. Установить выражение для оптимального устройства обработки. 2. Найти точное выражение для частного случая, когда . σπ2 = σα2, c = 2k. 3. Проанализировать ответ к п. 2 с целью проверки его интуитивной правильности. Задача 6.2.5. Рассмотрим модель, указанную в задаче 6.2.4. Пусть теперь Sn(«) = — + ~ц^. 1. Найти оптимальный реализуемый линейный фильтр (критерий — мини- <мум среднеквадратической ошибки). 2. Найти выражение для ξρΛ. 3. Убедиться, что результат п. I сводится к результату задачи 6.2.4, когда No — 0, и к результату, рассмотренному в основном тексте, когда ση2 = 0. Задача 6.2.6. Пусть г (u) — a(u)-\-w(u)t —эо < и < t. 660
Сигнал и помеха кекоррелированы; их спектры соответственно равны 2V2P/k N0 5α(ω) = г л ' л и Sw((*) = —L· αν ' 1+(ω2/£2)2 2 Полезный сигнал есть a(t). Найти оптимальный реализуемый линейный фильтр, обеспечивающий минимальную среднеквадратическую ошибку. Задача 6.2.7. Сообщение a(t) перед передачей пропускается через линейную цепь, как показано на рис. 6.1*. Выход y(t) искажается некоррелированным белым шумом, имеющим спектральную плотность N0/2. Спектр сообщения имеет вид 26σα2 1. Требуется найти'реализуемую оценку a(t) по минимуму среднеквадрати- ческой ошибки. Найти оптимальный линейный фильтр. 2. Найти 1Рп как функцию а и ΛΔ_4σ 2/kNQ. 3. Найти значение α, минимизирующее ξρβ. 4. Как изменятся результаты, если нуль в предварительном фильтре находится в точке + k, а не в — k. в ft j yd) »«>№ nft) HoUoj) a(t) Предварительная фильтрация Рис. 6.1* Идеальное предсказание. Следующие четыре задачи связаны с чистым предсказанием. Модель данной задачи: г(и) = а(и), -эо < и < t d(t) = a(t + a), где α > 0. Мы видим, что в принятом колебании шум отсутствует. Цель состоит в предсказании a(t). Задача 6.2.8. Пусть Sa (ω) = 2k ω2 + / 1. Найти оптимальный (по критерию минимума среднеквадратической ошибки) реализуемый фильтр. 2. Найти нормированную ошибку предсказания ξρΛ, Задача 6.2.9. Пусть Sa(co) = 1 (1+CD2)2 Повторить задачу 6.2 8. 661
Задача 6.2.10. Пусть 5α(ω) = 1+ω2 1+ω4 - Повторить задачу 6.2.8. Задача 6.2.11. 1. Принятый сигнал есть а(ц)у — сю < и < t. Полезный сигнал есть d(t) = = a(t + α), α > 0. Найти #0(/ω), при которой среднеквадратическая ошибка где E[[d(t)-d(t)]2}, d(t)=\ h0(t—u)a(u)du будет минимальной. Спектр сообщения a(t) имеет вид η 5Λ(ω)= ["J Л2 ί = ι (ω2 + kt*) где ki4=kj\ ίφ] при i=l, ..., я, /=1, ..., п. 2. Теперь предположим, что принятый сигнал есть а(и), Τι < и < t, где Τι — конечное число. Найти h0(t, τ), при которой среднеквадратическая ошибка минимальна: d(t)= \ h0 (t, и) a (u)du. 3. Позволяют ли ответы по пп. 1 и 2 сделать какие-либо общие утверждения относительно задач на идеальное предсказание, когда спектр сообщения не имеет нулей? Задача 6.2.12. Сообщение создается так, как показано на рис. 6.2*, где u(t) — процесс типа белого шума с единичной спектральной плотностью, а Mth S + Xf s + x2 \_X/ ft) Рис. 6.2*. \Zv(t) h^L Σ/ аг·, i — 1, 2 и λί, i = 1,2 — известные положительные постоянные. Аддитивный белый шум w(f), имеющий спектральную плотность N0/2, некоррелирован с u(t). 1. Найти выражение для линейных фильтров, выходы которых являются реализуемыми оценками xi(f), i = 1,2, по минимуму среднеквадратической ошибки. 2. Доказать, что 2 ί=1 662
3. Полагая доказать, что 2 ί=1 2 ί(ο= Σ*Λ('>· Задача 6.2.13. Пусть г («) = α (м) + м (w), — эс < « < t, где α(«) и я(а) — некоррелированные случайные процессы со спектрами ω2 1 5β(ω)= , 5η(ω)= - 0 ν ' ω4 + 1 ηκ ' ω2 + ε2 соответственно. Полезный сигнал есть a(t). Найти оптимальный по минимуму среднеквадратической ошибки линейный фильтр и получающуюся ошибку для предельного случая, когда ε -> 0. Изобразить графически модуль и фазу #0(/ω). Задача 6.2.14. Принимаемое колебание равно г (и) = а (u)-\-w (и), —оо < и < tt где а(и) и w(u) — некоррелированные случайные процессы со спектрами соответственно. Пусть t + a d(t)* J a(u)du, a > 0. 1. Найти оптимальный (по минимуму среднеквадратической ошибки) лилейный фильтр для оценки d(t). 2. Найти 1% Задача 6.2.15 (продолжение). Рассмотрим такую же модель, что и в задаче 6 2 14. Повторить указанную задачу для следующих полезных сигналов: ι I. d(t) =— I a(u)du, α > 0. 2. £*(*) = —*— ί 3(«)ίί«, α > 0, β>0, β>α Ρ—α J Что произойдет при (β—α) ^ 0? + 1 3. d(/)= 2 ^fl(^-»a), α > 0. /г= —1 663
Задача 6.2.16. Рассмотрим модель, представленную на рис. 6.3*. Функция u(t) — выборочная функция белого процесса, имеющего единичную спектральную плотность. Η айти реализуемые линейные оценки (по минимуму среднеквад- ратической ошибки) x^t) и x2(t). Вычислить среднеквадратические ошибки и взаимную корреляцию между этими ошибками (Гг· = — сю). u(t) S+k г fCt) $+к Ж x2(i)\lSy(t) w шт@) "ΤΗ) Рис. 6.3*. Задача 6.2.17. Рассмотрим задачу из теории связи, иллюстрируемую на рис. 6.4*. Сообщение a(t) — выборочная функция стационарного нормального процесса, имеющего нулевое среднее значение и единичную дисперсию. &Дт) канала—линейная не обязательно реализуемая система с постоянными во времени параметрами. Аддитивный шум n(t) — выборочная функция белого гауссова процесса, имеющего нулевое среднее значение и спектральную плотность N0/2. /Fate) kf(z) -θ n(t) n(t) Рис. 6.4*. 1. Для отыскания a(t) колебание r(t) обрабатывается посредством оптималь- оо ного нереализуемого линейного фильтра. Полагая f Ι#/(/ω)|2(Λ»/2π) == 1, —σο , найти &/(τ), которая минимизирует минимальную среднеквадратическую ошибку. 2. Представить Ау(т) графически для аК ' со2 + /е2 Выражения для ошибки в замкнутой форме Задача 6.2.18. Требуется проинтегрировать 2cn/N0 No С άω Г 2cn/N0 ] 1. Сделать это, положив у = 2cn/N0. Продифференцировать по у, а зателз проинтегрировать по ω. Проинтегрировать результат от 0 до у. 2. Обсудить условия, при которых этот метод справедлив. Задача 6.2.19. Вычислить «■-if l + (<o/fe)*« + (2/W0)c„ 664
Примечание. В следующих семи задачах выведены выражения для ошибок в замкнутой форме для некоторых интересных случаев. Решения большинства из этих задач являются весьма трудными. Во всех-задачах г (и) = а (и) + п (и), —оо < и < t, где а(и) и п(и) — некоррелированы. Полезный сигнал есть a(t). Используется оптимальный (по минимуму среднеквадратической ошибки) линейный фильтр. Оптимальный реализуемый линейный фильтр соответствует H0(j(x>), a 5П = Я0(/о>)=1—* Μ/ω) Μ-//„ (/ω). ЫХ В 2 Большая часть результатов, приведенных в задачах, была получена в [4]. Задача 6.2.20. Пусть ω2 + α2 Показать, что lSn (ω)]+ [Sa(a))+Sn(<»)l+ где [2 f"„ , Sn (ω) dco Ί "^jSn(£u)InS0(co)+Sn(o» ^[ Задача 6.2.21. Показать, что если lim Sn (ω) ->-0, то ω->οο оо С άω lp = 2) {5η(ω)-|00(/ω)|Μ5α(ω)+5η(ω)]} — · о Использовать этот результат совместно с результатом предыдущей задачи для того, чтобы показать, что для однополюсного шума Задача 6.2.22. Рассмотрим случай, когда Показать, что «->η (ω) + 5α(ω) где К определяется соотношением fin Г 8η{ω) + Κ 1*0 = 0. J ί5η(ω)+5α(ω)] о Задача 6.2.23. Показать, что, когда Sn(co) является многочленом, оо Ь = - -^ j d«> {Sn (ω)-IG0 (/ω) |2 [Sa (ω) +Sn (ω)] + Sn (ω) In | G0 (/ω) | 2}. о 665
Задача 6.2.24. Как было указано в основном тексте, можно удвоить объем класса задач, к которым эти результаты применимы путем простого рассуждения. На рис. 6.5, а* представлена типичная система, в которой сообщение перед передачей фильтруется. Очевидно, среднеквадратическая ошибка в этой системе не отличается от ошибки в системе, изображенной на рис 6.5, б*. Используя данные задачи 6.2.23, убедиться, что aft)- s No ω2 / Sn(<o)-{K \ 2β2 nUa(<») + Sn(«>) ) =Л[«-—" 2β2 Sn (ωΗ К 1п|Ов(/<о)|*}Ао = d<o. nft) & J3 ^ \Ъп(ш)-¥-у\ φ 2β< fift) *) δ) Рис.6.5*. Задача 6.2.25 (продолжение) [39]. Используя модель задачи 6.2.24, показать, что 1р=-Т-[/(0)13+/г(0), где /(0) 2β2 Sa (ω) ] ίίω = Η'+-^] 2η F(0): 2 Ν0 , 2β2 1 + 2β2 S„ (ω) ] ίίω ω2 ^ (ω) Ί #ο J 2π когда Задача 6.2.26. [20]. Распространить результаты задачи 6.2.20 на случай. Sn(co) = ^ Ν! а* ω2 + α2 и найти | GQ (/ω) |2 и ξρ . Реализации в виде схем с обратной связью Задача 6.2.27. Убедиться, что оптимальный фильтр с обратной связью имеет вид, показанный на рис. 6.21, б. Обозначим числитель через F(s). I. Показать, что F(s) B{s)B(-s) + P(s)P{ -of- P(s), где B(s) и P(s) определены на рис. 6.21, а. 2. Показать, что степень полинома F(s) точно на единицу ниже степени полинома P(s). 666
Задача 6.2.28. Доказать, что δ/> = ~ lim sGio(s) = -lTfn-\> ^ S-> oo Ζ где Gjo(s) — оптимальный фильтр в петле, a /я_| определена на рис. 6.21, б. Задача 6.2.29. В этой задаче мы построим реализуемый выбеливающий фильтр. В гл. 4 было показано, что нереализуемый выбеливающий фильтр можно легко получить при помощи разложения Карунена—Лоэва. Пусть г (и) — пс (и)-\- w (и), — ъ < и < t, где пс(и) имеет рациональный спектр, aw(u)—некоррелированный процесс типа белого шума. Обозначим оптимальный по минимуму среднеквадратической ошибки реализуемый линейный фильтр для оценки nc(t) через H0(j(u). 1. Доказать, что 1 — #0(/ω) является реализуемым выбеливающим фильтром. Начертить схему выбеливающего фильтра в виде схемы с обратной связью. Указание. Обратиться к структуре фильтра с обратной связью, соответствующей (173). 2. Найти обратный фильтр для I — H0(j(u). Начертить схему реализации обратного фильтра в виде схемы с обратной связью. Задача 6.2.30 (продолжение). Каковы необходимое и достаточное условия того, чтобы найденный в задаче 6.2.29 фильтр", обратный выбеливающему, был устойчивым? Обобщения Задача 6.2.31. Рассмотрим простую задачу на нереализуемый фильтр, в которой г (и) —а (и)-\-п (и), —оо < и < оо d(t) = a(f). Допустим, что мы проектируем оптимальный нереализуемый фильтр Hou(j(u), используя спектры 5α(ω) и Sn(co). На практике спектр помехи SnP (ω) = Snd (ω) + Sne (ω). 1. Показать, что среднеквадратическая ошибка при использовании НоиЦы) равна оо Ъир = 1ио+ J \Hou(i<*)\2Sne(<»)— > 2π — оо где подстрочный индекс «up» означает нереализуемую среднеквадратическую ошибку на практике, а индекс то» — нереализуемую среднеквадратическую ошибку оптимального фильтра, когда расчетные допущения выполняются точно. 2. Показать, что изменение в ошибке равно 41 ■= ί lXi^tml·"^ — оо 3. Рассмотрим случай Snd (ω) = -γ , Sne (ω) = ε -γ 667 άω 2π
Спектр сообщения равномерен и ограничен по полосе. Показать, что еЛ Δξ* = (1 + Л)« где Л — отношение сигнал/шум в полосе сообщения. Задача 6.2.32. Вывести выражение для изменения в среднеквадратической ошибке оптимального нереализуемого фильтра, когда действительный спектр сообщения отличается от расчетного спектра сообщения. Задача 6.2.33. Повторить задачу 6.2.32 для оптимального реализуемого фильтра и белого шума. Задача 6.2.34. Доказать, что система, изображенная на рис. 6.23, б, есть оптимальный реализуемый фильтр для оценки a(t). Задача 6.2.35. Вывести (181) и (183) для произвольного /С<*(/со). Задача 6.2.36. Среднеквадратйческая ошибка при использовании отптималь- ного нереализуемого фильтра определяется выражением (183): = С Sa (ω) Sn (ω) άω ~ J Sa(cu)S/((u)-bSn(cu) 2π где S/((o)A|^(/(o)|«, 1. Рассмотрим следующую задачу. Ограничим мощность передачи оо Р= J 5α(ω) Sf (ω) — Найти выражение для S/(co), минимизирующее среднеквадратическую ошибку. 2. Вычислить получающуюся среднеквадратическую ошибку. Задача 6.2.37. Пусть г (и) = а (и)-\-η (и), —оо < и < t, где а(и) и п(и) — некоррелированы. Пусть 5α(ω) = -γτ^-, Sn(cu) = 8*. Полезный сигнал есть d(t) = (d/dt)a(t). 1. Найти Я0(/ш). 2. Обсудить поведение H0(j(u) и ξρ при ε -> 0. Почему ответ вводит в заблуждение? Задача 6.2.38. Повторить задачу 6.2.37 для случая В чем существенное различие между случайными процессами сообщений в этих двух задачах? Убедиться, что дифференцирование и оптимальная реализуемая фильтрация не коммутативны. Задача 6.2.39. Пусть a(u) = cos(2nfu + Q>), —сю < и < t, где Фи/ — независимые случайные величины: РФ(Ф)=—, 0<Φ<2π; pf(X) = 0, Х<0. 668
1. Описать получающийся ансамбль. 2. Доказать, что Sa(f) = р/(|/|)/4. 3. Выбрать р/(Х) так, чтобы a(t) было детерминированным процессом (см. стр. 586). Указать линейное устройство предсказания, среднеквадратиче- ская ошибка которого равна нулю. 4. Выбрать р/(Х) так, чтобы a(f) не было детерминированным процессом. Показать, что можно предсказать a{t) с нулевой среднеквадратической ошибкой, если использовать нелинейное устройство предсказания. Задача 6.2.40. Пусть gr+ (τ) = jr-ι [G+ (/ω)]. Доказать, что минимальная среднеквадратическая ошибка для идеального предсказания равна α о Задача 6.2.41 [1]. Рассмотрим спектр сообщения 02 ναζ-,-Ι s«(°»=[(i+t)7 1. Показать, что «Г1-(τ) , τη *ехр(— %Уп) •Т (<г\ = „-"/2(/г_1)| 2. Показать, что при больших η «И±Ч-'('-тт)> о 3. Использовать п. 2 для того, чтобы показать, что для любых ε2 и α можно сделать ξρ < ε2 путем увеличения п. Объяснить, почему этот результат справедлив. Задача 6.2.42. Сообщение a(t) является процессом с нулевым средним, наблюдаемым в отсутствии шума. Полезным сигналом является d(t) = = a(t + α), α > 0. Ι. Допустим, что Найти d(t), используя a(t) и его производные. Какова среднеквадратическая ошибка при α < k? 2. Допустим, что Показать, что и среднеквадратическая ошибка равна нулю для всех а. Задача 6.2.43. Рассмотрим простую разнесенную систему r1(t) = a(t)-\-n1(t), 669
где a(t)y n^t) и n2(t) — независимые стационарные нормальные процессы с нулевыми средними значениями и конечными дисперсиями. Мы желаем обрабатывать ri[t) и г2(0 так» как показано на рис. 6.6*. Спектры Snl(co) и 5η2(ω) известны, спектр 5α(ω),— неизвестен. Требуется, чтобы сообщение a(t) не искажалось. Другими словами, если n^t) и n2(t) равны нулю, то выходной сигнал должен быть точно равен a(t). 1. Какое условие это наклагает на #ι(/ω) и #2(/ω)? 2. Нужно выбрать #χ(/ω) так, чтобы E[n02(t)] было минимальным при условии, что сообщение a(t) должно воспроизводиться точно в отсутствие помех ",(t)^ φ ι Hf(jco) Ηζ(ΐω) __. ι I Tk a(t)+ric{t) J Рис.6.6*. на входе. Фильтры должны быть реализуемыми и могут выполнять операции над процессами с ^бесконечным прошлым. Найти выражение для #ю(/а>) и #2ο(/ω) через заданные величины. 3. Доказать, что a(t), полученная по п. 2, является' несмещенной эффективной оценкой выборочной функции a(t). [Следовательно» a {t) = ami (t)\. Задача 6.2.44. Обобщить результат задачи 6.2.43 на случай η входов. Доказать, что любая л-мерная задача неискаженной фильтрации может быть сформулирована как задача с (л — 1)-мерным винеровским фильтром. Задачи к § 6.3. Нестационарные процессы на конечном интервале времени (фильтры Кальмана — Бьюси) Π редставления процессов посредством переменных состояния Задача 6.3.1. Рассмотрим дифференциальное уравнение y{n4t)+Pn-ly{n-lHt) + .-.+P0y(t) = bn_]u(n-l>(t) + ...+b0u(t). Распространить каноническую реализацию 1 (стр. 596) на данный случай. Желаемая функция F равна F = О О 1 о -Pi о ι ~Рп Начертить реализацию в виде аналогового вычислителя и найти матрицу G. Задача 6.3.2. Рассмотрим дифференциальное уравнение, приведенное в задаче 6.3.1. Вывести каноническую реализацию 3 (см. стр. 600) для случая кратных корней. h fl^fi Задача 6.3.3 [27]. Рассмотрим дифференциальное уравнение y{nHt) + Pn^y{n^l)(t) + ^^+P0y{t)==bn__xu^-^{t)+...+b0u{t). 670
1. Показать, что система, изображенная на рис. 6.7*, является корректной реализацией в виде аналогового вычислителя. 2. Написать векторное дифференциальное уравнение, которое описывает данную систему. Ϊλ \ Γ7Ί s —4ν X/) 1-1 1 S ~~Ч 1 ——** — Хр- / r-2 г it)] Рис. 6.7*. Задача 6.3.4. Начертить реализацию в виде аналогового вычислителя для следующих систем: 1. y(t) + 3y(t)-\-4y(t) = u(t) + u(t), 2. "yi (0 + 3^ (О + 2</2 (0 = «ι (0 + 2 н2 (0 + 2и2 (0, У г (0 + 4ух (t)+3y2 (0 = 3ы2 (0 + % (<)· Написать соответствующие векторные дифференциальные уравнения. Задача 6.3.5 [27]. Найти матрицу передаточной функции и начертить график передаточной функции для описанных ниже систем. Дать пояснения по поводу количества необходимых интеграторов. 1 · У1 (0 + 3 </! (О + 2(/х (0 = «! (О + 2«! (О + и2 (0 + ы2 (О, Уг (0 + 2(/2 (0= -«Ι (0-2"i (0+ "2 (О· 2. yi(t) + yi(t) = u1(t) + 2u2(t), У г (0+ 3{/2 (0 + 2i/2 (/) = «, (0+ "2 (0-«i (О· 3. </, (0 + 2^2 (0 + Ух (0 = «! (О + "ι (0 + "г (0. y'l (0+г/Ί (0+ί/2 (0 = «г (О + «ι (0 · 4- j/i (/) + 3 у г (<)+2»i (О = 3«! (О + 4«2 (0 +8и, (ί), № (0 + 3t/2 (0-4(/ι (Ο-ί/Ί (0 = «ι (0 + 2ы2 (<) + 2и2 (0. Задача 6.3.6 [27]. Найти векторные дифференциальные уравнения для следующих систем, используя метод разложения на неприводимые тиногочлены; 1. y(t) + 3y(t) + 2y(t) = u(t), 2. "y\t)+4 у (t)+5y {t) + 2y (t) = u(t), 3. y\t) + 4y'(t) + 6y~(t)+4y(t) = u(t), 4. 'ί/ι(0-10(/2(0+ί/ι(0 = "ι(0. </2(0 + 6(/2(0="2(0· 671
Задача 6.3.7. Вычислить е 1. 2. Ft для следующих матриц: ч: я· Задача 6.3.8. 1. Вычислить eF* для следующих матриц: г,: :ι [_о о oj F = г° .0 Lo 0 0 —6 ι o-i 0 1. о -J 1 0 0 1 -11 —6 F = Задача 6.3.9. Дана система со следующим представлением состояния: x(0 = Fx(0 + Gm(0. y(t) = Cx(t)t х(0) = 0. Пусть U(s) и Y(s) означают преобразования Лапласа функций u(t) и y(t) соответственно. Мы нашли, что передаточная функция равна H(s) = У (8) U (8) = C0(s)G = C(sI—|Н" G. Показать, что полюсы H(s) являются собственными значениями матрицы F. Задача 6.3.10. Рассмотрим схему, показанную на рис. 6.8*. Источник включается в момент времени t = 0. Ток i(0~) и напряжение на конденсаторе зс(0~) равны нулю. Измеряемый величиной является напряжение на сопротивлении R. С If J. Ш) Рис. L , ^^^"v-ч, \ R 6.8*. 672 Η
1. Написать векторные дифференциальные уравнения, описывающие данную систему, а-также уравнение, которое описывает процесс измерения. 2. Начертить реализацию схемы в виде аналогового вычислителя. Задача 6.3.11. Рассмотрим систему автоматического управления, изображенную на рис. 6.9*. Выходной величиной системы является a(t). Две входные n(t) *щ- s+a КФЧ-ь aft) Рис. 6.9*. величины b(t) и n(t) являются выборочными функциями некоррелированных стационарных случайных процессов с нулевыми средними. Их спектры равны Написать векторное дифференциальное уравнение, описывающее математически эквивалентную систему, входом которой является вектор белого шума u(t)t a выходом — a(t). Задача 6.3.12. Рассмотрим дискретную многолучевую модель, показанную на рис. 6.10*. Временные задержки считаются известными Коэффициенты передачи каналов являются независимыми процессами с нулевыми средними и спектрами вида 2k j Oj- 5^(ω)= ω2 + ^.2 , /=1, 2 = 1, 2, 3. Аддитивный белый шум является некоррелированным и имеет спектральную плот* ность N<J2. Входной сигнал s(t) — детерминированный (известен). b,(t) ^Задержка:^ W[ ft) > Ι » Ъадержка: zz —*О0 ^νίνΗΠν"""^ Задержка :т5\ Рис. 6.10*. 1. Написать уравнения состояния и наблюдения для данного процесса. 2. Указать, как они изменились бы, если коэффициенты передачи каналов были бы коррелированы. Задача 6.3.13. В основном тексте были подробно рассмотрены представления состояния для систем с постоянными во времени параметрами. Рассмотрим систему с изменяющимися во времени параметрами У (t) + Pi (t) у it) + Ро it) у it) =*bt(t)u (t) + b0 (t) и (0. 22 Зак. 693 673
Показать, что эта система имеет представление состояния такой же формы, что и в примере 2: * y(t)=[\ 0] χ (0=Μ0, где hx(f) и /ι2(0 — функции, которые необходимо найти. Задача 6.3.14 [27]. Дана система, определяемая дифференциальным уравнением с изменяющимися во времени коэффициентами: fe=0 4=0 Показать, что эта система имеет уравнения состояния xx(t) Hit) .*n(0J + 0 о -Ρ η •Ρη-ι • φ · 0 ο ί —Ρι МО xt(t) ,*η'(0_ 'ftW ft» (9 »(0» y(t)=Xi(t)+go(t)u(t), где £o(0 = MO> / —ι /—r лю-мо- 2 2 (и+пт7')рг_г-т(')4т)(0. г=0я=0 ч " * / Задача 6.3.15. Показать, что Лх (0 = Φ (t, t0)\ Лх (ί„) + J Φ (ί0, τ) G (τ) Q (τ) 0Γ (τ) ΦΤ (/„, τ) άχ 1 χ ΧΦτ(ί, /») является решением уравнения (273). Здесь Ф(/, to) — основная переходная матрица, т. е. -|-Ф(<, <о) = Р(0Ф«, ί0), Ф(<о, <о) = 1. Показать, что это решение является единственным. Задача 6.3.16. Выразить Ky(i, τ) через Κχ(ί, 0 и *('> τ). гДв " i(t) = F(t)x(t) + G(t)u(t), ■ y(t)=C(t)x(t), E[u{t)uT(x)] = €ib(t=,T). 674
Задача 6.3.17. Рассмотрим систему первого порядка, определяемую уравнениями -*^=-*<0*(0+*(0«<0, at 9(t)=x(t) . Определить общее выражение для переходной матрицы данной системы. Что представляет h(t, τ) для данной системы? ι. Найти h(ty τ) для k(t) = k(l+msin((u0t))9 g(t) = l. %4. Обобщается ли этот метод на векторные уравнения? Задача 6.3.18. Показать, что для систем с постоянными параметрами дисперсия в стационарном состоянии ненаблюдаемого процесса определяется соотношением оо lim Kx (t, t)= f e+FxGQGre/r τ άτ, где x(0 = Fx(0+Gu(0, E[u(0ur(T)] = Q6(^-T), или, что эквивалентно, /оо — /оо /оо HmKx(/> t)=-^ Г [sI-Fl-^GQGn-sl-F7']- /->оо 2π/ J Задача 6.3.19. Доказать, что условие (317) является необходимым, когда R(Q положительно определена. Задача 6.3.20. В этой задаче в нашей процедуре оценки мы учтем влияние ненулевых средних. Описывающими модель уравнениями являются уравнения (302)—(306). 1. Допустим, что х(Т{) — гауссов случайный вектор E[x(Ti)]* т(Тг)фО в Ε {[χ (Г0~т (Ti)) lxT (Тг)-тт (Гг)]} = Кх (Ти Т{). Он статически независим от u(t) и w(f). Найти векторные дифференциальные уравнения, определяющие оценку (по минимуму среднеквадратической ошибки) x(f), t>Ti 2. Допустим, что m(Ti) = 0. Снимем допущение о том, что u(t) имеет нулевое среднее. £[u(0] = mu(0 и Ε {[u (0-mu (0] К (τ)-ηί (τ)]} = Q (t) δ(*-τ). Найти векторные дифференциальные уравнения, определяющие χ (t). Задача 6.3.21. Рассмотрим пример 1 (см. стр. 620). Использовать свойство 16 для вывода (351). Следует помнить, что при использовании метода преобразования Лапласа контур необходимо брать правее всех полюсов. 675
Задача 6.3.22. Рассмотрим систему второго порядка, иллюстрируемую рис. 6.11*, где Ε [и (t) и (т)] = 2РаЬ (α + b) δ (*—τ), E[w(t)w(x)] = -^d(t~T). a, b — возможно комплексно-сопряженные величины). Переменные состояния есть *ι(Ο=0(Ο, *ι(*) = ί(0· 1. Написать уравнение состояния и выходное уравнение для данной си- w(t) aft) (s+a) fs+Ь) 9(t) φ n(t) Рис.6.11*. 2. Для этого .представления состояния определить дисперсионную матрицу Лх в стационарном состоянии ненаблюдаемого процесса, иначе говоря, найти Λχ = UmE[x(t)xT(t)], где x(Q — вектор состояния данной системы. 3. Найти переходную матрицу T(t, Tt) для уравнения at Г F GQG71 = Ur-!C _Έτ\Ί^Ύ^ [см. (336)], используя метод преобразования Лапласа. (В зависимости от значений a, b, q и Ν0ί2 — соответствующие экспоненциальные функции будут действительными, комплексными или теми и другими одновременно.) 4. Найти lp(f) при начальном условии Примечание. Хотя мы располагаем аналитическим аппаратом для определения ξρ(ή системы любого порядка, эта задача показывает, что численные методы являются более удобными. Задача 6.3.23. Поскольку параметры оптимального линейного фильтра не зависят от времени, то, как явствует из спектрального разложения методом Винера, получаемая с помощью этого фильтра на конечном интервале времени на· блюдения оценка будет неоптимальной Цель данной задачи — определить, насколько ухудшается оценка при использовании винеровского фильтра на конечном интервале наблюдения. Рассмотрим систему первого порядка в которой x(t)=—kx(t) + u(t), r(t) = x(t) + w(t), E[u(t)u(x)] = 2kP6(t—x), £[*(0)] = 0, E[x*(0)) = P0t 676 Ti = 0.
i. Какова дисперсия ошибки, получаемой при использовании фильтра Кальмана — Бьюси? 2. Показать, что фильтр с постоянными параметрами (т. е. фильтр Винера) определяется соотношением 4kP/N0 где у = k(\ + AP/kNo)1/2. Обозначим выходную величину винеровского фильтра через xWo(t). 3. Показать, что представление состояния для винеровского фильтра имеет вид *«.(') = -?*«.(*)- 4Pk N*(k + y) г it). где *Шо(0) = 0. 4. Показать, что ошибка для данной системы равна 4Pk ew.W=-Ve- (*)_и(0 + ш0 ' ii»(k+y) »(*), •e.(Q)--*(0). 5. Введем Показать, что и убедиться, что ι», (о=^[4.(0]. 6».<0=-2гё..(0 + ш0 ' 6·. №>=*·. 4fePy γ+ί: ' U.(0 = W(l-e-2Y0 + P0e-2^. 6. Построить график зависимости отношения среднеквадратической ошибки» получаемой при использовании фильтра Кальмана — Бьюси, к среднеквадратической ошибке, получаемой при использовании фильтра Винера, от времени, т. е 1р(0 β(0 = S..W для γ=1,5 k, 2k и Ък и Р0 = 0, 0,5 Ρ и Р. Заметим, что выражение (353) для \p{t) справедливо только при Р0 = Р. Является ли полученный результат интуитивно правильным? Задача^6.3.24. Рассмотрим следующую систему: i(t) = Fx(t) + Gu(t), \y(t) = Cx(t), где F = 0 0 о L—Po —Pi —Р2 —Рз J G = С = [1000], 22В зак. 693 E[u(t)u(T)] = Q6(t — τ). 677
Найти ковариационную матрицу стационарного состояния, т. е. limKx(f, t) t-+oo для процесса Баттерворта четвертого порядка, используя приведенное выше представление. 5β(ω) = 8 sin (π/16) 1+ω8 Указание. Использовать результаты на стр. 619. Задача 6.3.25. Рассмотрим пример 3 на стр. 626. Использовать свойство 16 для решения (368). Задача 6.3.26 (продолжение). Допустим, что используется фильтр для стационарного состояния, показанный на рис. 6.45. Вычислить дисперсию ошибки для неустановившегося состояния. Сравнить ее с дисперсией оптимальной ошибки, определяемой формулой (369). Задача 6.3.27. Рассмотрим систему, изображенную на рис. 6.12, а*, где £[u(t)u(r)] = G*b(t-x); No E[w(t)w(%)]= ■δ(*-τ); a(Ti) = a(Ti) = 0. 1. Найти оптимальный линейный фильтр. 2. Решить дисперсионное уравнение в стационарном состоянии. 3. Убедиться, что метод «расщепления полюсов» классической теории Винера дает правильный ответ. wft) uft) S2 aft) Θ- "ft) *) Uft) .wft) aft) /4\ Mt) -φ δ) Рис.6.12*. Задача 6.3.28 (продолжение). Обобщение задачи 6.3.27 показано на рис. 6.12, б*. Повторить задачу 6.3.27. Указание. Использовать табличные характеристики многочленов Баттерворта, приведенные на рис. 6.40. Задача 6.3.29. Рассмотрим модель в задаче 6.3.27. Введем вектор состояния »-К№]· ·<"- 1. Определить Кх (f, u) = E[x (t) xT(и)]. 2. Определить оптимальный реализуемый фильтр для оценки x(t) (вычислить коэффициенты передачи аналитически). 3. Убедиться, что полученный ответ сводится к ответу в задаче 6.3.27 при t -> оо. Задача 6.3.30. Рассмотрим пример 5А на стр. 629. Написать дисперсионное уравнение для произвольного момента времени (t > 0) и решить его. 678
Задача 6.3.31. Пусть η r(t)= ^ktat(t) + w(t)9 ί = 1 где cti(t) — статистически независимые сообщения с представлениями состояния ii(0 = Ft(0xi.(0 + Gi(0ei(0. αϊ (0 = С, (0 χι (О, а ад(£) — белый шум со спектральной плотностью NJ2. Обобщить оптимальный-, фильтр рис. 6.52, а на данный случай. Задача 6.3.32. Допустим, что частица выходит из начала координат в момент времени t = 0 и блуждает с постоянной, но неизвестной скоростью. Измерения искажаются аддитивным белым гауссовым шумом со спектральной плотностью NJ2. Таким образом, r(t) = ut + w(t), t >0. Предположим, что Ε(ί/) = 0, £(ϋ2) = σ2 и что υ — гауссова случайная величина. 1. Найти уравнение, определяющее оценку vt по максимуму апостериорной плотности. 2. Найти уравнение, определяющее оценку vt по минимуму среднеквадра- тической ошибки. Использовать метод, изложенный в гл. 4, для решения данной задачи. Задача 6.3.33. Рассмотрим модель в задаче 6.3.32. Используем метод § 6.3 для решения данной задачи. 1. Найти линейную оценку по минимуму среднеквадратической ошибки для сообщения a (t) Δ_ vt. 2. Найти получающуюся среднеквадратическую ошибку. 3. Показать, что при больших t \p(t)~ Задача 6.3.34 (продолжение). 1. Убедиться, что ответы к задачам 6.3.32 и 6.3.33 совпадают. 2. Модифицировать процедуру оценки в задаче 6.3.32 для получения оценки по максимуму правдоподобия (полагая, что ν — неизвестная детерминированная величина). 3. Высказать качественные соображения об условиях полезности априорных знаний. Задача 6.3.35 (продолжение). 1. Обобщить модель задачи 6.3.32 на случай произвольного полиномиального сообщения К когда E(t>f) = 0; £(»ι^) = σ|«βι,. 2. Получить решение для к = 0, 1,2. 22В* 679 37У0 У/2 а )
Задача 6.3.36. Рассмотрим систему второго порядка, изображенную на рис. 6.13*: E[u(t)u(%)) = Qd(t-T), £[ш(0И*)] = -у-в(*-т), xi(t) = y(t), x%(t) = y(t). 1. Написать уравнение состояния и определить стационарное решение ковариационного уравнения, положив ξρ(ί) = 0. 2. Влияют ли значения величин а, Ь, (?, Л/0 на корни, выбираемые нами для того, чтобы ковариационная матрица была положительно определенной. aft) 1 fc+a) (s + Ь) у It) J wit) "\ n(t) <чУ Рис.6,13*. .3. В общем случае имеется восемь возможных корней. Определить на плоскости а, Ь какой корень выбирается для каждой заданной точки при фиксированных Q и No- Задача 6.3.37. Рассмотрим задачу на предсказание, обсужденную на стр. 637. 1. Вывести результат, сформулированный посредством уравнения (422). Напомним, что d(t) = x(t + α), α > 0. 2. Определить ковариационную матрицу предсказания как ξ«Δ_£ {[d(0- d(t)][dT (t)-dT (*)]}. Найти выражение для |р. Убедиться, что полученный ответ ведет себя правильно при а -> оо. Задача 6.3.38 (продолжение). Применить результат по п. 2 к модели сообщения и шума, рассмотренной в примере 3 на стр. 570. Убедиться, что этот результат совпадает со (113). Задача 6.3.39 (продолжение). Пусть г (и) = а (и) -f w («), — оо < и < t d(t) = a(t + a). Процессы а(и) и w(u) некоррелированы и имеют спектры 21/2 Ρ/k 0 N0 5«(ω) = - 1 + (cd2//j2)2 5η(ω) = Использовать результат задачи 6.3.37 для отыскания E[(d(t) — d(t))2] как функции параметра а. Сравнить полученный результат с результатом задачи 6.3.38. Считаете ли вы, что ошибка предсказания является монотонной функцией л—порядка спектра Баттерворта? 680
Задача 6.3.40. Рассмотрим следующую задачу оптимальной реализуемой фильтрации: r(u) = a(u)-\-w(u)t 0<u<ty Sw(cu) = A-, 5β»(ω) = 0. Полезный сигнал имеет вид da(i) d(t)=- dt Требуется отыскать оптимальный линейный фильтр, используя метод переменных состояния. 1. Сформулировать задачу. Определить в явной форме переменные состояния, которые используются в данной задаче, а также все матрицы. 2. Начертить развернутую блок-схему оптимального приемника, не прибегая здесь к матричной форме записи. 3. Написать дисперсионное уравнение в виде системы скалярных уравнений. Высказать соображения по ее решению. 4. Найти стационарное решение, положив ip(t) = 0. Задача 6.3.41. Пусть г (и) = а (и)-\-η (и), 0 < и < tt где а(и) и п(и) — некоррелированные процессы со спектрами Полезный сигнал получается путем пропускания a(t) через линейную систему, передаточная функция которой равна — j(u + k 1. Найти оптимальный линейный фильтр для оценки d(t) и написать соответствующее дисперсионное уравнение. 2. Решить это дисперсионное уравнение для стационарного состояния. Задача 6.3.42. Рассмотрим модель в задаче 6.3.41. Пусть Kd (/ω) V /ω+β ) Повторить задачу 6.3.41. Задача 6.3.43. Рассмотрим модель к задаче 6.3.41. Пусть d(t)- I a(u)dut α > 0, β > 0, β > α. β 1. Подходит ли данная задача к какому-либо из случаев, рассмотренных в § 6.3.4 основного текста? 2. Показать, что эту задачу можно решить, используя метод переменных состояния. 3. В чем состоит основное условие того, что решение по п. 2. возможно? 681
Задача 6.3.44. Рассмотрим следующую задачу введения предыскажений, иллюстрируемую на рис. 6.14*. Здесь d(0=a(0, и процессы некоррелированы. 1. Найти оптимальный реализуемый линейный фильтр, используя метод переменных состояния. 2. Решить дисперсионное уравнение для t -> оо. (Можно считать, что статистически установившееся состояние существует.) Заметим, что интересующим нас сообщением является а(и), а не yf(t). а(и) % Ь+Ро I WfU) ^п(а),0^а^ t Рис.6.14*. Задача 6.3.45. Оценивание при наличии коррелированного шума. В этой задаче мы рассмотрим простой пример оценивания методом переменных состояния в коррелированном шуме. Применяемый здесь метод проще того, что изложен в основном тексте, так как требуется оценить только одну переменную состояния. Рассмотрим следующую систему: *1 (0 = —Ml (О + U1 (О» *2 (0 = —^2 *2 (0 +«2 (0. £[Μ0Μτ)]=2/!ιΡιδ(*-τ), Ε [и2 it) и2 (τ)] = 2*! Р2 δ (/—τ), £[*ι2(0)] = Ρι, £[*22(0)] = Ρ2, £[*ι(0)*2(0)] = 0. Заметим, что г (f)=*i(0+*·('). т. е. в результатах измерения белый шум отсутствует. Мы хотим применить метод «выбеливания» для того, чтобы оценить xx(t) и x2(t). Прежде всего необходимо генерировать сигнал r'(t), который содержит компоненту белого шума. 1. Определим линейное преобразование переменных состояния в виде Γ*ι(0Ί JJ1 -Π f*i(01 J_r*i(0 -*>(0] Ui(0J 2 L 1 lJ U(0J 2 L r(t) У Заметим, что одна из новых переменных состояния — y2(t) равна 1/2г(0 и, следовательно, она известна на приемной форме. Найти уравнения состояния для y(t). 2. Показать, что новые уравнения состояния можно записать в виде уг (*)=-*' У! (0 + 1"' (t) + mr (*)], г' (0=ί/2 (*) + *' у2 (*) = С У1 (t)+wf (t), 682
kt + k2 _ —(ki—k2) , 2 2 »' (0=^-[«ι(0 + «ι (01; тг(0=С^,(0. Заметим, что mr(f)—известная на приемной функция. Поэтому ее влияние на yx{t) также известно. Отметим, также, что новый наблюдаемый сигнал r'(t) состоит из суммы линейно модулированной компоненты yx(t) и компоненты белого шума. 3. Применить результаты по оцениванию в присутствии коррелированной помехи для вывода уравнений реализуемого фильтра Кальмана — Бьюси. 4. Найти уравнения, которые связывают дисперсию ошибки χλ(ί) с E[(yi(t)-yi(t))2]^Py(t). 5. Конкретизировать полученные результаты применительно к случаю, когда kx = k2. Каким становится дисперсионное уравнение в пределе при t -> -> оо? Является ли такой*переход интуитивно понятным? 6. Высказать соображения по поводу того, как этот метод обобщается применительно к системам более высоких порядков, когда в результатах измерения отсутствует компонента белого шума. В случае многократного измерения может ли когда-либо возникнуть сингулярная задача, т. е. задача идеального оценивания? Примечание. Решение задачи нереализуемой фильтрации было получено несколько другим путем в [56]. Задача 6.3.46. Пусть ά (τ) = — km0 α (τ) +и (τ), 0 < τ < ty г (τ) —α (τ) + w (τ), 0 < τ < t. Здесь: Ε [α (0)] = 0, Ε [α* (0)] = a*/2kmC; Ktt(t, τ) = ο*δ(ί —τ); Допустим, то мы обрабатываем г(т) при помощи реализуемого фильтра, оптимального для указанной выше модели сообщения. Фактический же процесс сообщения имеет вид α (τ) = — feac α (τ) + « (τ), 0 < τ < t. Найти^уравнения, определяющие £ас(0—действительную дисперсию ошибки. Задачи к § 6.4. Линейная модуляция в системах связи Задача 6.4.1. Написать дисперсионное уравнение для примера ДБП — AM, рассмотренного на стр. 647. Начертить блок-схему системы для моделирования сигнала и убедиться в том, что высокочастотными членами можно пренебречь. Задача 6.4.2. Пусть s(ti a(t))= VT[a(t)cos((uct + Q) — a(t) sin (cdc *+θ)]; здесь Л(/со) = Я(/со)Л(/со), 683
#(/ω) определяется (506), а угол θ не зависит от a(t) и равномерно распределен на интервале (0,2π). Выразить энергетический спектр s(t, a(t)) через 5α(ω). Задача 6.4.3. В этой задаче нужно получить интегральное уравнение, определяющее оптимальную оценку однополосного сигнала [см. (505), (506)]. Начать вывод с (5.25) и получить (507). Задача 6.4.4. Рассмотрим модель к задаче 6.4.3. Введем а(0 Г * (01 {a(t)\· Использовать результаты оценки векторного процесса, полученные в § 5.4, для вывода (507). Задача 6.4.5. 1. Начертить блок-схему, соответствующую выражению (508). 2. Использовать модификацию блок-схемы и свойства Η (/ω), определяемые (506), для получения рис. 6.62. Задача 6.4.6. Пусть Ρ \ 1/2 s{t, a(t))= I - где s (t, a(t)) = ί t *m> ) ' [1 + ma (t)] cos <>>ct, 2k Принимаемое колебание имеет вид r(t) =s(t, a(t)) + w(t), — oo < t < oo, где w(t) — белый шум со спектральной плотностью N0/2. Найти оптимальный нереализуемый демодулятор и построить график зависимости среднеквадрати- ческой ошибки от т. Задача 6.4.7. (продолжение). Рассмотрим модель в задаче 6.4.6. Пусть [ 0 для других ω. Найти оптимальный нереализуемый демодулятор и построть график зависимости среднеквадратической ошибки от т. Задача 6.4.8. Рассмотрим пример, приведенный на стр. 654. Допустим, что /m cos θ Ρφ(θ)=- :—» —π < θ < π 2π/0 (Лт) и 2k S„ (ω) = 1. Найти выражение для среднеквадратической ошибки при использовании нереализуемого демодулятора, теоретически оптимального для случая известной фазы. 2. Аппроксимировать интеграл п. 1 для случая, когда Ат > 1. Задача 6.4.9. (продолжение). Рассмотрим модель задачи 6.4.8. Пусть Se(e>)= 1Ш'11 [ 0 при других ω. Повторить задачу 6.4.8. 684
Задача 6.4.10. Рассмотрим модель задачи 6.4.7. Демодулятор показан на рис. 6.15*. Допустим, что /п« 1 и i+W, где 2π(^! + 1Τ)«ω0. при других ω, »(t) Полосовой фильтр \cuct ZJtW Квадратичное устройство Фильтр нижних частот Sit) Рис. 6.15*. Выбрать hjjf) так, чтобы минимизировать среднеквадратическую ошибку. Вычислить получающуюся ошибку Ъ>р. Задачи к § 6.6. Родственные вопросы В задачах 6.6.1—6.6.4 мы покажем, как развитый нами метод переменных состояния можно использовать в ряде важных приложений. В первой задаче получается необходимый предварительный результат. Во второй и третьей задачах развит метод решения однородных и неоднородных уравнений Фред- гольма как векторных, так и скалярных. Четвертая задача посвящена оптимальному нереализуемому фильтру. Полное изложение вопросов синтеза оптимального нереализуемого фильтра можно найти в [54]. Модель для указанных четырех задач имеет вид x(0 = F (Ox (0 + G(0 "(О, у(0 = С(0х(0, ^Iu(0u7(t)] = Q6(^-t). Мы используем функцию ξ(0 с тем, чтобы не расходиться с формой записи, принятой в [54]. Она не связана с дисперсионной матрицей %p(t). Задача 6.6.1. Введем линейный функционал If 5(0=5 Кх С τ>8 (*)<**. где s(t) — ограниченная векторная функция. Требуется показать, что если Кх(£, τ) является ковариационной матрицей выраженного посредством переменных состояния случайного процесса х(0, то этот функционал можно представить как решение дифференциальных уравнений dl{t) at = F(06(0 + G(OQGT(04(*) ^--Ρ'(0,(0-.<0. 685
с граничными условиями 4(7» = 0, 6(Т,) = РоЧ(^|), где Ро=Кх(7-|, 7Ί). 1. Показать, что указанный выше интеграл можно записать в виде ξ (0=j Φ(ί, τ)Κχ(τ,τ)8(τ)ίίτ+ξ Kx(t, ήΦτ(τ, t)s(x) di. Ti * Указание. См. задачу 6.3.16. 2. Пользуясь правилом Лейбница, показать, что Tf ■^ψ- = F (0 δ (0 + G (0 QGr (0 ξ Φ7 (τ, 0 s (τ) Λ. Указание. Обратить внимание на то, что Kx(t, t) удовлетворяет дифференциальному уравнению dkx(t,t) т т dt = F (О К (*, 0+ Кх (t, t) F' (t) + G (0 QG' (0 (см. (273) в основном тексте), при этом Кх (Гг-,7,г) = Р0, а ФТ (τ, t) удовлетворяет сопряженному дифференциальному уравнению dt при Φ (Τи Т{) = \. 3. Введем второй функционал .= _ρΓ(0Φ7(τ,0 Ь 4(0= J Φ7(τ, Os(T)dt. Показать, что он удовлетворяет дифференциальному уравнению dt = _F'(04(0-»W· 4. Показать, что дифференциальные уравнения должны удовлетворять двум независимым граничным условиям Ч(7/) = 0, 6(Г,)=РоЧ(7',). 5. Комбинированием ответов по пп. 2, 3 и 4 получить требуемый результат. Задача 6.6.2. Однородное уравнение Фредгольма. В этой задаче мы выведем систему дифференциальных уравнений для определения собственных функций однородного уравнения Фредгольма. Указанное уравнение имеет вид ;> ^ Ку (*, τ) Φ (τ) άτ= λΦ (t), Tt < t < Tj Ti 686
или Φ (t) = -γ С (>) § К (*, τ) Ст (τ) Φ (τ) άτ при λ > 0. Введем так, что 5 0= $ Κ^,τ^^ΦίτΜτ ф(о:=-^с(о?(о. 1. Показать, что ξ (0 удовлетворяет дифференциальному уравнению j_ г? (οι = Г £ If) ', о WQ^_rjo itt L4 (ОJ Ι — Ст'" r.tt\ I ι С (0 с(0 I -F'(Q ГКО] Li (оJ при граничных условиях 1(7,г) = РоЧ(7,г), ч(Г/) =0. (Использовать результаты задачи 6.6.1.) 2. Показать, что для существования нетривиального решения, удовлетворяющего заданным граничным условиям, необходимо, чтобы det [Ψη| (Г/, Tt: λ) Ρ0 + Ψηη (Г,, Гг: λ)] = 0, где Ψ (t, Τι: λ) определяется посредством J_ at [ Ψη|(ί,7νλ)|ψηη(ί, Γ,: λ). F (0 J G (ί) QGr (0 1 Г»Ч"П(<.Г,:Х) Ι Φηξ«, Ti-.λ) , Ψ|η «. Γ| ·· λ) j *„„<<. Γ,: λ) ] и Ψ(Γ^, 7^: λ) = Ι. Значения λ, удовлетворяющие этому уравнению, равны собственным значениям. 3. Показать, что собственные функции определяются соотношением Φ (t, Tt: λ)= 1£@- [Ψκ (t, Γ,: λ) Ρ„ + Ψη| (*, Tt : λ) ]4 (Τι), где ΐ)(Τί) удовлетворяет условию ортогональности: [Ψη| (7>, Τ г: λ) Ρ0+Ψηη (Г/, Tt: λ)]4(Γ,) = 0. Задача 6.6.3. Неоднородное уравнение Фредгольма. В этой задаче мы выведем систему дифференциальных уравнений для определения решения неоднородного уравнения Фредгольма. Это уравнение имеет вид } Ky(t, T)g(t)<iT+og(0 = s(0, Tt<t<Tt, ο >0. 687
1. Введя ξ (9 = J Kx (ί, τ) Cr (τ) g (τ) άτ. Τι показать, что неоднородное уравнение можно записать в виде б(о:=4-ио-с(око]· 2. Используя задачу 6.6.1, показать, что ξ(ί) удовлетворяет дифференциальным уравнениям —Ρ(01 =r__lL(i)__> ® w?£^_w ~| ίξ (<) 1 *U(0J r;mf.m! _ IU <0j С (ft С (ί) ι T Cr(Qs(Q при граничных условиях ξ(7,0 = Ρο4(7,ι·)> Ч(Г/) = 0. Примечание. В общем случае можно заменить σ произвольной положительно определенной изменяющейся во времени матрицей R(£) и весь вывод остается справедливым при очевидных модификациях. Задача 6.6.4. Нереализуемые фильтры. В этой задаче мы покажем, как неоднородное уравнение Фредгольма можно использовать для определения структуры оптимального нереализуемого фильтра. Ради простоты алгебраических выкладок будем полагать r(t) скалярной величиной. 1. Показать, что интегральное уравнение, определяющее оптимальный нереализуемый фильтр для оценки х(*) в любой точке t на интервале [Ти Tf), имеет вид I* К, (*, τ) Сг (τ) = $ Ь0 (t, σ) Кг (σ, τ) do, Tt<t<Tt, Tt<x<Tf. (1*) 2. Используя ядро, обратное Kr(t, τ) [см. (4.161)], показать, что Ti /Tf \ * W = jj Κχ ('· τ> °Τ <τ> § & <τ- σ)' (<0 <*σ , Ti < t < Tf. (2*) 3. Как и в гл. 5, обозначим член, стоящий в скобках, через rg(x). Заметим, что rg (τ) дает решение неоднородного уравнения Фредгольма, когда входной величиной является r(t). Используя задачу 6.6.3, показать, что rg(t) определяется уравнением где dl{t) dt r«(0=^('W-C(fti(ft), :F(ft?(ft + G(ftQGr(ft4l(ft, *Ш = 2 cr (0 c (() ξ (0_pr (0 4i (0 _JL cr (n r (i)( <« JV« M, (3*) (4a*) (46*) 688
δ (Γι) = ΚΧ (Γ,, Γ,) 4ι (Γι), (5а*) 4ι (Γ/) = 0. (56*) 4. Используя результаты задачи 6.6.1, показать, что χ (t) удовлетворяет дифференциальному уравненению. dx(t) ~ τ —7i- = F (t) χ (0 + 0 (0 QOT (0 42 (0. (6a*) at ^^=_cr(0re(0-Fr(0 42(0. (бб*) где ϊ(Γι)=Κχ(Γ|>Γ|)42(Γί·)> (7а*) 4·(Γ/) = 0. (76*) 5. Подставить (3*) в (66*). Показать, что 4ι(0 = 4·(« (8а*) и χ(0 = ξ(0· (86*) 6. Показать, что структура дифференциального уравнения для оптимальной нереализуемой оценки χ (t) есть dx (ί) dt -=F(0x(0 + G(0QGr(04(0. (9a*) где ■^r-=cr(i)4-cWi(0-Fr«)4(0-cr(0-|-rW· <96*> at sN0 N0 ί(7Ί)=Κχ(Γ,, Г,)ч(Г,), (Юа*) Ч(Г/) = 0. (Юб) 1. Необходимо решить два л-мерные линейные векторные дифференциальные уравнения. 2. Ошибка, определяемая ковариационной матрицей нереализуемой ошибки, не учитывается структурой фильтра. 3. Полагая Tf переменной величиной, можно определить структуру дифференциального уравнения для х(Г/) в виде функции от Tf. Получаемые уравнения являются просто уравнениями Кальмана — Бьюси для оптимального реализуемого фильтра Задача 6.6.5. В задачах 6.2 29 и 6 2 30 был рассмотрен реализуемый выбеливающий фильтр для бесконечных интервалов и стационарных процессов. В настоящей задаче мы убедимся в том, что эти результаты обобщаются на случай конечных интервалов и нестационарных процессов. Пусть г (τ) = пс (τ) + w (τ) Tt < τ < t, где яс(т) можно моделировать в виде выхода некоторой динамической системы х" (0 = F (0 χ (0 + G (0 и (0, пс (0 = С (0 х(0, возбуждаемой белым шумом u(t). Показать, что процесс r'(t) = r(t)-iic(t)=:r(t)-C(t)£(t) является белым. 689
Задача 6.6.6. Последовательное оценивание. Рассмотрим устройство, осуществляющее кодирование сверточным кодом (рис. 6.16*). 1. В каком состоянии находится данная система? 2. Показать, что соответствующая система уравнений состояния имеет вид п+1 Уп4-1 ~~ *ι,„+ιΊ ρ ι οι г *2.я+1 = ° 0 И ■ .*s.n+J L° 0 Oj I. ι ο οΊΡ"·, + Ί 11 lJ wn+l :2,n (Все операции сложения производятся по модулю 2.) Последовательность двоичных цифр \ х3 х? ~/ 7)V *к±г~^ Рис. 6. 16*. Jr Регистр сдвига »"ЗВ» // *2 Допустим, что процесс и соответствует последовательности независимых двоичных случайных величин с Е(ип = 0)=Ри, Е(ип=1) = 1-Ря. Кроме того, пусть компоненты у передаются по двум независимым идентичным двоичным симметричным каналам, так что 1*71 = У Θ W, где £(«Vi = °)=^, E{wnA = \)=\-Pw. Наконец, обозначим последовательность результатов измерений |*ъ г2, ..., гп через гп. 3. Показать, что апостериорная плотность вероятности рх _f-1 | ζ/ι+ ι χ (Χη+ι Ι ΖΉ-0 УД°влетв°Ряет следующему рекуррентному соотношению: Ρ*η+ι\*η+ΑΧη+ι\Ζη+ι)- 4+1 I *n+l (R»+l I Xn+l) Σ 4+1 I xn (Χη+3 Ι *») 4 Ι ζ, (Χ, Ι Ζη) χη+1 χη гле Σ ~ означает суммирование по всем возможным состояниям. 690
4. Как бы Вы построили приемник для оценки хЛ_^_ χ по максимуму апостериорной плотности? Что необходимо вычислять для каждой такой оценки? 5. Дать сравнительную оценку этой процедуры оценки с дискретным фильтром Кальмана. 6. Как возрастает сложность этой процедуры при увеличении длины цепного кода? Решение некоторых задач Решение задачи 6.1.1 Мы видим, что α(ίχ) при r(t), заданном на интервале Tt < t < Tf, является нормальной случайной величиной. Следовательно, чтобы определить ее плотность вероятности, необходимо только найти среднее и дисперсию. Мы знаем, что оценка по максимуму апостериорной вероятности и оценка по минимуму среднекваратической ошибки равны условному среднему. Из (6.6) и (6.10) It a (h) = Ε [a (h) I г (*)] - \ h0 (tl9 и) г (и) du, где h0 (ti, и) определяется уравнением J' Ka(h, ")=\ ΜΊ> τ)[Κα(τ, u) + Kn(t, u)]dxy Tt<u<.Tf. 'Ti Согласно свойствам 4 и 10 Tt ο* [β (Ok (t)] = Ka(h, <!)-§ Λ,(ίι, н)Кв «i,«)<t« Α ξ (ίχ). Поэтому ,α, /.чч 1 Γ (Α— a(Wl Решение задачи 6.1.4 1. Требуемый сигнал равен d(t) = α(£ + α), а оценка его обозначается через d(t), где di(t) = ca(t). (6.1*) Средний квадрат ошибки равен lp=E[{Z(t)-a(t + a))2] = c*Ka(0)-2cKa(a)+Ka(0). (6.2*) Дифференцируя по с, получим -^1Р = 2сКа(0)-2Ка(а). Приравнивая к нулю и решая относительно с, получим - Ка (а) 691
2. Чтобы найти средний квадрат ошибки, подставим (6.3*) в (6.2*): 1р'= ( /Co(0)J ^(0)-2 ΚΑΟ) *«(α> + *"(0> = /сй(0) · (6·4 > 3. Подставляя это выражение в (6.1*) и (6.3*), имеем d0(t) = e-kaa(t). Наименьший средний квадрат ошибки равен |р = 1—ехр(—2/га). 4. Этот результат очевиден, если признается тот факт, что если Ка (τ) — «= ехр(—k |τ I), то a(t) есть марковский в широком смысле процесс. С другой стороны, его можно доказать и непосредственно. Пусть a(h)> h < t, будет вторым наблюдением и при этом используется оценка d(t) = c1a(t1)+ca(t). Можно выбрать?! и с, чтобы минимизировать наименьший средний квадрат ошибки. Если сх = О для всех tt < /, то желаемый результат достигнут (это одновременно необходимое и достаточное условие): dip dcj = 2[cx7(a(0) + cKe(f1-Q-Ke(<1-<-a)] =0 £·, = ?, <% dc = 2[с1/Гв(/1- 0 + c^a(0) - Ka(«)] = 0. C|=C| Решая относительно Ci, получим - - *a («) *а (*) + /Со (0) Kg (τ + a) Cl= К* №>-*»« ' (6·5) где x=t—t1 > 0. Подставляя /CaW = exp( — k\x\) (6.6*) в (6.5*), получим Ci = 0 при всех ti < tt a > 0. Этим и завершается доказательство. 5. Чтобы сг = 0у потребуем: Κα(α)Κα(τ) = Κα(0)Κα(τ + α), а > 0, τ > 0. Можно положить /Са(0) = 1, поскольку речь идет просто об усилении. Беря логарифм от обеих частей, получим ln/Ca(a) + lni<'a(T) = ln/Ca(T + a), a>0, τ > 0. (6.7*) 692
Чтобы (6.7*) соблюдалось, необходимо и достаточно, чтобы 1п/Са(#) был линейной функцией для всех χ > 0: \пКа (х) = $х, х>0 или #а(*) = ехрф;с), χ > 0. Поскольку Ка(х) является ковариационной функцией, β < 0 и Ка (—х) = = Ка(х)- Это завершает доказательство. Решение задачи 6.2.1 1. По определению оо Sr(co) = f /?r(T)e-^dT = — οσ оо = \ #r (τ) [cos ωτ — /sinorr] άτ. (6.1*) — οο Поскольку #Γ(τ) является корреляционной функцией действительного процесса, она является действительной четной функцией τ. Поэтому член sin ωτ в (6.1*) при интегрировании дает нуль: Sr (ω) = I Rr (τ) cos ωτ dx. Видим, что Sr((u) есть действительная четная функция ω. 2. При больших ω Sr(co) ->mN-M. Так как Sr((u) действительна для всех ω, с должно быть действительной величиной. 3. Рассмотрим произведение (ω —Λι) (ω—л2) = со2—(пг + п2) (u + nt щ. (6.2*) Чтобы оно было действительным, потребуем, чтобы Im [п2] = — Im [%] (второй член), Фп =—Фп (третий член). Из этого вытекает, что Re[n2] = Re[«i]· Это и требовалось доказать. Заметим, что для того чтобы (6.1*) было действительным, Яе[п2] = — Яе[п1]. Поэтому Re[n1] = Re[n2] = 0. При двух корнях нули должны располагаться так, как показано ниже kjw 693
При четырех корнях имеем (ω—пг) (ω—η2) (ω—η3) (ω—η4). Аналогичные рассуждения показывают, что диаграмма нулей должна быть симметричной относительно обеих осей. 4. Рассмотрим прохождение r(t) через идеальный полосовой фильтр "О) -(ω+άω) (ω+άω) ω Среднеквадратическое значение выхода равно Sr(co) do, которое должно быть положительным. 5. Любой действительный корень числителя должен появляться с четной кратностью, в противном случае при прохождении через корень числитель должен был бы менять знак, что противоречит (4). 6. Если знаменатель <Sr(co) имеет действительный корень, то когда мы интегрируем по нему, интеграл становится сингулярным. Однако мы предположили, что Sr (ω) является интегрируемым по действительной оси. оо 7. Допустим, чтоГ Sr (ω) άω существует, из чего следует, что lima)Sr((D)=0. -оо ω-00 При больших ω 5г(ш)^с/0М-^. Следовательно, М— W>0, M>N. Поскольку Μ и N четны, Μ>Ν + 2. Решение задачи 6.2.2 1. Спектр принимаемого колебания равен где Тогда Sr(co) = 2κσ2 -#2ω2 = tf2 ω4+#2κ2ω2 + 2*(?2 = N* ω2+κ2 ' *"" o2+/e2 (/ω+Ci) (ft»+g2) (—j(Q + Ci) (—/о>+с2) (/co+/e)(—/co+/e) Чт-т(-^ГГ· j(u + K SdrU®) = ί 2/ca2 K2 + CD2 694
Согласно (6.73) drK] } [G+(/co)]* (_/ω+^)(-/ω + Γ2) \ίΝ2 (/ω + κ) (-/*>+*) 2κσ2 1 Κ^2 (-/со+СхН — /со+с2)(/со + /с) 2κσ2 1 *л(т)=7^7^Й^Т^е*τ>°· 2κσ2 1 Яо/(М) = [5,/г(/ш]+ = -7= j/W2 (k + Cj) (к + с2) (/со+к) Из (6.77) Из (6.78) ___!__ /ω + κ 2κσ2 1 #ο(/ω) = G+(/co) о (/ω)- (/ω + έ?ι)(/ω + έ?ι) #2 (K + Cl)(K + c2)(i(o+K) = 2κσ2 1 ~ Ν2 (к+сг) (к + с2) (ja + cj) (/co + c2) 2. Чтобы вычислить ξρ, используем (6.106): lP = Kd(0)-]l<dz(t) dt = Ka (0)-J[V (t)]*dt = о о / 2κσ2 \2 I = σ2 — (-7= —. (6.1*) 3. Когда Η (/ω) является нереализуемой, используем (6.119). я ,/ач $<*г (/<*>)_ 2κσ^ omU ' Sr(o) Λ^2ω4+^2Λ:2ω2+2σα2Λ: ' Чтобы вычислить ξΜ, используем (6.124): __ Г 26σα2Λί2ω2 dco 1и~~ J N2<*\ + N2k4 оо 8CD2-f-2a2fc 2π Ж^ (/ω + ^)(/ω+ί:2)( —/ω+CxK —/ω+ί2) 2π * —οο Последнее выражение сводится к 6.—*5г". (6-2*) ct + c2 Отношение \и к ξρ можно получить из (6.1*) и (6.2*). Можно также построить график, аналогичный рис. 6.15. Решение задачи 6.2.3 1. Из (6.78): Ηθ°ω)= α+(/ω) L 0-(/ω) Ι 695
Входной спектр имеет вид Sr((D) = So((0) + Sn(a))= i -f- . Разлагая на множители, имеем /CD + fc где Г - 2N2 2 —8N2koa2 (6.1*) / ,it,+^_]/(,,6,-^y Г 2W2 -8#2£σα2 V2=|/ ί Г ч — ; (6.2*) S^/ω) 2*σ„* ι <j-(/cd) VN2 (/ω + £)(/ω—νι)(/ω—γ,) азование, взяв ча> Γ^Γ(/ω)1 __2feoV ίθ-(/ω) J+ VN2 Произведя преобразование, взяв часть для t > О и преобразовав повторно, получим 1 h (*+vi)(H-yi)(M-A») ' #ο(/ω) = #2 (/ω + γι) (/ω + γ2) (* + V2) (&+Τι) Среднеквадратическая ошибка равна =°4'-^ о 1 1 (fc + Yi)2(fc + Y2)2 2. Задаваясь iV0 = 0 и сравнивая полученные результаты с результатами, выведенными в задаче 6.2.2, убеждаемся, что они тождественны. Для N2 = О необходимо найти предел при N2 -> 0: y^N-U^+f+{^ = ^2[1+Л], где Аналогично, Ho{l<u)-N™o\N2yi* (* + γ2)(/ω + γ2) )~Λ^0(1+(1+Λ)^2) ja>+kVT+K' 696
что совпадает с выражением, приведенным в основном тексте (заметим, что N0 в условиях задачи соответствует N„/2 в основном тексте). Когда N2 -*· О, [2feo*]* 1 1 ш _ 2с* *р N0 kHl+VT+A)2 2k N0k(l+VT+A)*- _ t Γ Λσ* Ι 3. Для нереализуемых фильтров Sa (ω) 2ko2 Нои (/ω) = ■ Sr (ω) Ν2 ω4 + (W0 + N2 k2) ω2 + (#<> k2 + 2σ2 k) При Ν2->0 I 2feo2 4. = ? £η(ω)£α(ω) άω _ 7 Ν0+Ν%ω* J S„ (ω) + Sa (ω) 2π J tf2 ω4 + (# о + Ν2 k2) ω2 + (Ν0 k2 + 2σ2 k) —οο —οο ^ω_27 (*+ΐ/Ί^)(-*»+ΐ/|τ) *._ 2π ° ) (/ω + γι)(/ω + γ2)(_ /ω + γ^ί — /ω + γ2) 2π =2to, —α* +—"ι L У 2γ1(γ1 + Υ2)(γ2—γι) 2γ2(γχ + γ2) (Υι—V2) ) Ti+Y«W« Yi-Ya V Υ2 ?χ ) + Υ!-γ2 (Ъ Ъ)) Υΐ+Υ2\#2 VlY2 / Когда Nz -> О, Решение задачи 6.2.7 1. Принимаемый спектр имеет вид W0 ω2 + γ2 Sr(Cu) = -r ; (6.1*) rv ' 2 ω2 + α2 ν ' где Взаимно корреляционная функция равна Kdr(T) = E{a(t) r (t—T)] = E [a (t) J hpf (u) a (t—x—u) du = —oo oo = J hpf(u)Ka(?+u)du. —oo 697
В области преобразования Г ~ / «ν* ι и \ ои* 2 *) Это выражение можно также получить путем подстановки в (6.181). Из (6.1*) Sdr (/ω) = Я£, (/ω) Ss (ω)= l/fL ( =l!»±L) J^L·. (6.2* dr pr s V k\ — /ω + α 7 co2 + fc2 <же получить путем подстановки в (6.181). Из (6.1* G+(/to) = l/^>i^+X. (6.3*) |/ 2 /ω + α Используя (6.2*) и (6.3*), имеем Sdr (/ω) τ /~2а_пи_ t 1_ Тогда О-(/ω) |/ We"" α (/ω + *)(-/ω+γ) (6.4*) Г Sgr (/ω) 1 _ι /"2« L G" (/ω) J+ |/ WV0 2kaa* l & + V /ω + k и V/ α 46σα2 , — · —(/ω + α) - 0+ (/ω) L σ- (/ω) J+ (/ω + *) (/ω + γ) Это выражение можно переписать в виде аЛ \ HJfl (/ω) Н0 (/ω) = _ " у , (6.5*) где а гА — и Л = - £ fcW0 Заметим, что при Л -> оо Я0 (/ω) -> Я"^1 (/ω). 2. Среднеквадратическая ошибка равна |p=Krf<o)-J*iJe<9<«; (6.Ю6) о S /;ьч_ frfr'W Г 2*σ"2 Ι,/""" — /со-f-^ 1 Г1 У 2~ -/ω + я] =2fe02l/JE ί a V ^,*(/ω + *)(-/ω+γ) ' •=2^/l Итак, W) = 2*a0>J/ ^xj^e-*, />0; Ιρ=·-,θ4ασ2 ^ #,(* + ?>·
Это выражение можно переписать в виде 1р„=1- Лг (.+y1+f)' (6.6*) 31). Чтобы минимизировать %Рп, минимизируем величину, обратную второму члену, mm г ('-1/^Г Лг ί=τ{ΐ{"Γ + 21/ 1 + 7+г+л]}· (6·7*> Обозначим значение величины г в точке минимума через г0. Продифференцировав, найдем, что г0 должно удовлетворять уравнению 1=- 1 + V (6.8*) 1+- го Эквивалентно: 0 = [г(г2 —1) —Л][(г2 —1) + Лг]. Можно показать, что минимум имеет место в точке, соответствующей единственному положительному корню первого множителя. Этот корень равен Го=[т+1/^"^] +Lt-'|/i!"^J · (6.9*) Используя (6.8*) в (6.6*) и упрощая, получим ьрп, opt 1 + 3/У (1+г0Т При больших Л ^~Л>/3и!;р„)0р1~ЗЛ-2/3. Для сравнения этого результата с результатом, полученным без введения предыскажений, можно использовать \Рп~ 2Л~~^2 для больших Л. Итак, отношение ошибок становится сколь угодно большим по мере увеличения Л. В гл. 2 второго тома будут приведены примеры использования результата этого типа. 4. Это отразится на 5^Γ(/ω), который будет равен #о (/*>) = фильтра им , /~~2сГ co2 + fc2 Передаточная функция оптимального фильтра имеет вид (6.10*) 2 /ω + α (—/ω + V) No /ω + Υ L ( — /ω + α)2( — /ω + fc) J + (6.11*) X) Это решение предложено Крузе (Т. J. Cruise). 699
Заметим, что второй член равен нулю при τ > 0. Следовательно, Я0(/ш) = 0. Для объяснения этого результата исследуем взаимную корреляцию между входом a(t) и выходом y(t) оптимального фильтра. Из (6.10*) Кау (τ) = 0 при τ>0. Следовательно, прошлые и настоящие значения y(t) не содержат информации о настоящем значении a(t). В этом случае наилучшей оценкой является среднее значение a(t), которое равно нулю. Решение задачи 6.2.8 1. Спектр равен Sr(cu) = ——— и Из (6.88) Из (6.73) Тогда /ω + fc Kdr (t) = V2k п_г (t + a) e-*«+a>. 1 [S^(/co)]+=^2fce- ol *—ka. /ω + fc Используя (6.78), получим Я0(/ш) = е-К Заметим, что этот результат можно также получить путем предельного перехода в случае 3 на стр. 567 при N0-+0. 2. Из (6.106) ξρ = Κά (0)_j4j2(T) dT = Ka(0)-j2ke-2k«+V dT = l-e-2*a. о о Как и следовало ожидать, limgp=0 и lim|p=l. α-»0 α->οο Решение задачи 6.2.43 1. Из условия отсутствия искажений вытекает требование, что Я1(/ш) + Я2(/ш) = 1. 2. Интересующая нас величина равна ОО 00 Ε \пс% (01 = J S„, (ω) Ι 1 -Η, (/ω) |» — + J S„s (ω) | Ht (/ω) |» —. (6.1*) ■~-οο —οο 700
Это выражение тождественно выражению оо оо °l= JSa(α>) 11 —Я0 (/ω) Ι2 "^ + ]4(ω) | Η0 (/ω) |2 -^-. (6.2*) —οο —οο (Скалярная задача винеровской теории фильтрации в § 6.2.1.) Следовательно, решение уравнения (6.1*) можно записать без каких-либо выкладок путем элементарного исследования. Из (6.78): Яо(/ш)= ! Г ^И 1 . (6.з*) °W ' [Sa (ω)+Sn ((о)]+ L[Sa(<o)+Sn(<o)]- J+ V ' Поэтому в (6.1*) 1 Г Sni (со) 1 Η2ο{ΐω)- [5ηι(ω) + 5η2(ω)]+ [ [Sni (со) + 5П2(ш)]- J+ (6'4*} //ι0(/ω)=1-//2()(/ω). (6.5*) 3. Чтобы показать, что a(t) является несмещенной, необходимо только, чтобы E[nc{t)] —- 0. Структура системы имеет вид »t(t)- n2(t)· \U") -%(J") *»c(t) поскольку Е[пг{1)] = Ε[η2(ή] = О, E[nc(f)] = 0. Итак, в данной задаче показано, что оценивание a(t) при условии, сформулированном в п. 1, равносильно оцениванию n2(t) на фоне аддитивного шума Λι(0· Но пг(1) и n2(t) являются гауссовыми, поэтому эта оценка является эффективной. Следовательно, ввиду эквивалентности задач, оценка a(t) дожна быть эффективной. Решение задачи 6.3.1 Дифференциальное уравнение имеет вид y(n4t)+pn-iy{n~l)(t)+--- + P0y(.t)=bn_lu<n-^ Нам необходима реализация вида x{f)=Fx(t) + Gu(f), (t)+...±bQu(t). (6.1*) (6.2*) где F = Г ° 0 L—Ро 1 1 0 -Pi 701 о η 1 —Ρπ-iJ
Записав (6.2*) в виде системы скалярных уравнений, получим: x1(t)=x2(t) + g1u(t)i x2(t) = x3(t) + g2u(t), \«) = -Ροχι V)-Pix2 W-· · · -Рд-i*»Ю+*пи (О· Блок-схема системы, соответствующей этой системе уравнений, имеет вид u(t) Ί~ Л ь -*-1 | 9п | \9n-i\ I & 1 *i(*)-y(t) -? ь (6.4*) Если задаться Xi(t)= y(t)t то *(*)=* (0. х2 (0=хх (0 — ^ «(0 = у (о — ^ и (0, *8 (0 = *2 (0—^2 И (0 = У (0 — £l И (0 — #2 И (0 > *η(0=^η-1>(0-Λ«(^2^-Λ«(η"3)(0-···-ίη-ΐΜ(0. in(0=y(">(0-ft«(,,"1>(0-ft«(,l"2)W---.-firii-i«(0. Чтобы найти gi, сначала используем последние уравнения (6.3*) и (6.4*), а затем остальные уравнения (6.4*): = —poXi (t)—p1x2(t)— .. . — рп^хп (t)—gnu (t) = --Роу(0-Р1(у(1)(0-йи(0)-рв(у(2)(0-йи(1)(0-ли(0)- Это выражение можно переписать в виде Ло+Рп-^-'ЧО + .-.+РоИО^ ... +(£n + Pi gi + p2 g*+ . · · + Pn-i £n-i+gn) и (О- (6.6*) Сравнивая (6.6*) с (6.1*), получим требуемый результат: gi = bn-i> g2 = bn-2—pn-igi = bn-2—pn-l δη-ϊ» gn = b0—Pl gl—p2g2- ... —gn. (6.7*) 702
Решение задачи 6.3.4 1. Используем каноническую реализацию № 2 (стр. 598). Из (6.211): *ι(Ο = 0(Ο. *2(0 = *ι (0+Зу(*)-и(*). Дифференцируя, имеем «1(0=*, (0 -3M0 + u(t), *2 w=i; (^+3ir (о-и (o=ir' "(0+Зу (0-и (0 или *,(0=-4*ι(0+«(0· Реализация в форме аналогового вычислителя приведена на рис. 6.30. Уравнение состояния имеет вид «.отJ L-4 «J U»J L+u 2. Нам необходимы четыре переменные состояния. Подходящим выбором является: *1<9 = л(0. *ι(0=*ι(0 + 3»ι(<)-2«ι(0. *з(0=Ы0. *«(')=*8(*)+4»ΐ(9· Дифференцируя, имеем *ι (0 =*2 (0—3*1 (0 + 2"2 (О'. *ι(0 = «ι(0+3«ι(0-2«Ί(0 или х2 (0= -2ж,(0 + 2и, (0+«ι (0. *s(0 = *4(0— 4·«ι (О· *4 (0 =* у, (0 +4(/ι (0 = 3«2 (0 + И1 (0-4й (0-3(/2 (0 +4у, (0 или х4 (<) = _ 3*з (0 + Зи2 (0 + «χ (0. Реализация в форме аналогового вычислителя показана на рисунке. h<*)-4 ° ° у®· Матрица коэффициентов передачи 703
pi (0 Η (t) χ* it) [_** (Oj 1 p! if) χ* it) xz it) J 1L** (OJ + Γθ 2~j 1 2 0 0 ι 3J Г MO1 L«i(0j Уравнение состояния имеет вид *—3 1 0 0" 0 0—20 —4 0 0 1 0 0—30 Решение задачи 6.3.7 1. Поскольку F—постоянная, можно использовать (6.247) и (6.248) для отыскания Φ (t): ΓΙ Π rs — 1 — Π-i 1 [s — \ 1 1 s — \ 1ί8~ιλ 1 Ls(s— 2) 1 s(s—2) s —1 s(s — 2) J rj(e2i + D ( j(e2i-0' I -(e«-l) ! -(e2<+0 2 12 »-i(<). Г 3 2] р-1_р—3 —2 l"1 1 p—6 2 ] F~[_l 6J: [s,-F]"-[ ! S_6J _ (s-4)(s-5) L-l s-3j' Γ s—6 φ(<) = ^-ι _(s-4) (s-5) — 1 L (s-4) (s-5) "[ -(e«Ie«)! 2е5'-е4Г (s-4)Js-5) s-3 (s-4) (s-5) "-i(0 3. '-K J]· J L 4 s + 3j s2 + 5s + 26|_-4 !s + 2_T [si re"Vj-3) cl Φ(0 = sin bt + eai cos&* — — ea' sin&* -ea' sinW 0 eQ*(a + 2) . e, sin bt-\-e cos 0? и-i (0. где 5 1 .— a=— и 6=— 1^79. 2 2 Решение задачи 6.3.9 Передаточная функция имеет вид H(s) = C[\s—F]-1G, [Is— F]-i = , I is —F| 704
где через А обозначена матрица, сопряженная [Is—F]. Поэтому полюсы функции Η (s) являются нулями функции [Is — F]. Последние суть просто собственные значения F. Решение задачи 6.3.12 1. Спектр процесса в j-м канале перемножителя имеет вид Этот процесс можно генерировать путем пропускания белого шума через простой фильтр. чю _!2£ bAt) Входной процесс имеет спектральную плотность σ7·2. Дифференциальное уравнение имеет вид bj(t) = -kjbj(t) + V2kjuj(t). Вектор состояния для всего канала равен Г*1<')1 *t(0 · L ^з со J где Входной вектор равен χ(ί) = Г"1 <<)"] и(0= «iW . L"3 (о J Уравнение состояния имеет вид x(0 = Fx(0 + Gu(0, ■Г - ° 1· 1 где Принятый сигнал равен где F = | -к. VVzkl _ о G = f2ki £[u(f)uT(T)] = Q6(<-t), ίσι2 0 1 r(t) = C(t)x(t) + w(t), С (0 Δ [s (<_τι) :s (<_τ2) ;s (/_τ3)]. 705
5. Если коэффициенты передачи каналов коррелйрованы, то Q будет име^ь недиагональные элементы. Решение задачи 6.3.16 Из (6.257): t х (0 = Ф (*, τ) χ (τ)+ J* Φ (t, v)G (о) u (υ) dv> t>x. (6.1*) τ Ковариационная функция имеет вид Ку(^т) = £[у(^у7'(т)]==С(0Кх(^т)С7,(т), (6.2*) где Κχ(^τ)=£[χ(0χ7(τ)]. (6.3*) Используя (6.1*) в (6.3*), получим / Кх (t, τ) = Φ (t, .τ) Ε [χ (τ) χ7 (τ)] + J" Φ (*, t>) G (t>) £ [u (») *7 (τ)] άν. (6.4*) τ Теперь £[u(t>)x7(T)J — 0, ί/>τ, так как u (v) является белым шумом. Следовательно, интеграл в (6.4*) равен нулю. Поэтому Κχ(*,τ) = Φ(*,τ)Κχ(τ,τ) и Ку (*, τ) = С (О Φ (*, τ) К* (τ, τ) С7 (τ), *>τ, что и является требуемым результатом. Значение для £<τ вытекает из симметрии матрицы ковариационных функций Ky(f, т) = С(9Кж(*. *)ФГ(*. ОС7 (τ), ί<τ. Решение задачи 6.3.23 1. Дисперсионное уравнение имеет вид | (0 = -Щ (t) + 2kP—£-V (0. I (0) = Яо· "О Из примера 1 (§ 6.3.3, стр. 620): I (t)-2kP (V+*)e* + (V-fe)e-* SW-2W». (Y+fe)2ev<_(Y_fe)2e-vi · (6·! } где лр γΔ^Ι+Λ)1'2 иЛ=——. — Nok 2. В стационарном состоянии 1(0=0; ^=*7[-i + /i+Al=Y(Y-*); (6.2*) j(0=-hi (t) + -?- ξ» (»■ (θ - * w)· (6·3*) 706
Поскольку рассматривается стационарный режим, фильтр Кальмана—Быоси является винеровским фильтром 2 4kP #о У—k No /ω+ — %„ + k 3. Выход винеровского фильтра равен xw0(t). Из (6.4*): 4kP two (t) = -γί*β V)+No{k + y)r (0> ^о (0)=ο. (6.5*) 4. Ошибка равна «%о (0 = *wo (*) —*(0» Дифференцируя, имеем ew0(0 = *we(Os= —*(0· Используя (6.3*) и (6.5*), получим <h*o (0 = ~Y^o (0 + Т77ГТГ, ' W + Ь* (')-* (0 = W0(* + Y) 4&Ρ = - ν (em (0+* (0)+** ®+ΊΓΠΓΓ\ τ W -" (*>= "<>(« +Υ) = - Υε,,ο (0 + (k-y) χ (0 + (γ-*) (χ (t)+w (0)-и (/). 4fcP *νο (0 = - Υ%·ο (0 + ю (0-и (0, (6.6*) Поэтому с начальным условием 8W0 (0) = хш (0)—χ (0) = — χ (0). 5. Среднеквадратическая ошибка равна W>=£[4o(')]; ξ„,ο(0 = 2£[έ,ί,ο(0ε„,ο(0]; Используя свойство 13, выражение (6.266), имеем Elx(t)u(t)]=±G(t)Q=kP, E[xm(t)u(t)]=0, Ε [и (0 zw0 (01 = - kP, Е[И0е„(0]=Я[,(0^о(01 = ]^Т7)^=—· Следовательно, 8k Ρ kP i.o(0 = -2YU(0 + ]^T7),—-2.P ИЛИ |»β(0=-2γξ«β(0 + ——. (6.7*) Y + fc 707
с начальным условием Решение (6.7*) имеет вид где Таким образом, lwo(0) = E[e2wQ(0)]=P0. lwo(t) = Ae-W 2kP y + k ' A = Po- 2kP y + k 2kP (ΐ_β-2ν0 + Λ>β-2γ*. У + k Используя (6.2*) в (6.8*), получим 1^(0 = 1» C-e-2v') + Poe-2^ 6. Переписав (6.1*) в более удобной форме и использовав (6.9*), имеем а—1\2 (6.8*) (6.9*) β (9= 1р(0 1 + ί—У \a+l) b — 2akt \a+l) — lakl где мы положили y = ak и Р0 = ЬР. Этот результат можно представить графически для а = \, 5, 2, 3 и &== = 0,0,5,1- Решение задачи 6.3.27 1. Состояние представлено в виде: u(t) x,(t) = a(t) w(t) r(t) Уравнение состояния имеет вид ГО Π Г01 х(Но ojxW+LiJ"(/)· Из рис. 6.46 оптимальный фильтр в статистически стационарном состоянии имеет структуру: г \ 1 hi \ 1 $я ' чТкЫ" ^(t)-a(t) 708
2. Дисперсионное уравнение стационарного состояния имеет вид δϋΐι- LO 0 Γΐΐη О Г N0 Lbttblba lis -м: а· (6.1*) Переписав (6.1*) в виде системы скалярных уравнений, получим I* 2 би'-О. ΙΐΐΙΐ2=0, Решения, требуемые для данного фильтра, имеют форму Оптимальный фильтр сводится к следующей структуре: Г(У ХС "^ „ 1"~ ^t I 1 ■ , a(tL 3. Чтобы синтезировать винеровский фильтр, положим σ2 $β(ω)= —. ω4 Из (6.175) оптимальный фильтр при реализации по схеме с обратной связью имеет вид в,.<м-(^)"'[(,.и+^)]*-. 0,.(ί.,.[^±^]*-.. Для разложения на множители разобьем полюсы на оси /ω ω4 = Ππι[(/ω + ε)2(—/ω + ε)2]. ε-*0 или Разлагая на множители, получим 6ζο(/ω) = (/ω)2 + V2 (2σ*/Ν0) ^4 (/ω) + (2σ2/#0)* '2 (/ω)2 U . ... ^ /2(2σ2/Λί0)1 *4 (/ω) + (2σ2/Λί0)'/2 Этот результат соответствует фильтру, изображенному на рисунке п. 2. 709
Решение задачи 6.3.32 1. Принимаемое колебание равно Г (f) = ut+W (ί), 0<t<T. Для оценки по наибольшей апостериорной вероятности можно использовать выражение (4.103): τ <>map= -j£ J V (i) -*<*. ν)] -^ dt 0 где s(/,o) = ttf. Это выражение сводится к τ 2σ2 °шар; 2σ2 Γ ο Проинтегрировав и перегруппировав члены, имеем τ §r(t)tdt о Oman— шар- r§ „ 3 ' 2σ2 2.. Поскольку модуляция линейная и параметр имеет нормальное распределение, оценка по наименьшему среднему квадрату ошибки и оценка по наибольшей апостериорной вероятности совпадают. Заметим, что эта оценка является эффективной, поэтому наименьший средний квадрат ошибки легко получается из граничного выражения Крамера — Рао. Используя (4.110), получим '«·--»-[£+#*· Решение задачи 6.3.37 1. Уравнение состояния имеет вид i(t) = F(t)x(t) + G(t)a(t). (6.1*) Полезный сигнал равен t+a d(t) = x(t+a)=<P(t+a9t)x(t) + j Φ(*+α,τ)(?(τ)ιι(τ)έΙτ. (6.2*) Нам известно, что оценка по минимуму среднеквадратической ошибки равна условному среднему сигнала d(f) при условии, что результат наблюдения г(т) определен на интервале t0 < τ < t Таким образом, 3 (t)=E [х (t+a) | г (τ); ί0<τ<ί] = Φ (t + a, t) Ε [χ (t) | r (τ); *ο<τ<*]+ J Φ(*+α,τ)0(τ)£[ιι(τ)|Γ(θ); t0<Q<t]dTf (6.3*) где использовано (6.2*). Последний член равен нулю, так как области t < τ < < t+a и t0 < θ < t являются непересекающимися, а и(т)—белый шум. В одной точке τ = θ = t математическое ожидание имеет конечное значение, но интеграл равен нулю. Следовательно, а (*) = Ф(* + а, *)£(*), (6.4*) что и требовалось получить. 710
2. Ковариационная матрица ошибок имеет вид 6? (о=я {tf (t) - d до] ia (о- d (oir>. (6.5*) Используя (6.2*) и (6.4*), имеем ί(0-d (0 = Ф(*+α, *)[£(')-х U)l- j Ф(^ + сс, τ)χ xG(T)u(T)dx. (6.6*) Использовав (6.6*) в (6.5*) и вспомнив, что ошибка при использовании оптимального устройства обработки некоррелирована со входом, имеем Н-α 'Н-а 5?(0 = Φ(* + α19ξ/>(0Φ7,('+α,Γ+ Г Г Φ (* + <*, τ) G (τ) QG7, (ϋ)χ t i χΦτ(t + a, ό) δ (τ— ν)άτάν. Это выражение сводится к t+a ξ%ν)=Φ(ί + αλ()ξΡ(ί)ΦΤ (t + att)+ Γ Φ(*+α,τ)0(τ)αθΓ(τ)ΦΓ(*+α,τ)<*τ. 1 (6.7*) Для системы с постоянными во времени параметрами (6.7*) сводится к g« (0=еРл Up(t) + fe-*xGQGT е~*ТЧт\е*Т«. При а -> оо последнее выражение стремится к Кх(£, £). Этот результат ожидался интуитивно. Решение задачи 6.3.43 1. Эта задача выходит за рамки классификации, рассмотренной на стр. 638—641, так как требуемую линейную операцию нельзя представить посредством переменных состояния. 2. Требуемая операция записывается в виде 1 β 1 β d(0 = —ja(a)da=-^jC(«)x(«)<i«, где х(и) — вектор состояния, упомянутый в задаче 6.3.41. Используя (6.257), получим d(t) = JZ^]C{u) Ιφ№·0χ(0 + |φ(«.τ)Ο(τ)α(τ)ιίτ1έΙΐί. Оценка по наименьшему среднему квадрату ошибки равна условному среднему сигнала d(t) при условии, что результат наблюдения г(г) определен на интервале О < г < t Таким образом, 1 β ί ί (t) = — j С (а) Ф (и, t) Ε [χ (t) I r (ζ); 0<ζ<*] + a I + f Φ («, τ) G (τ) Ε [u (τ) [ r (z)\ 0<z<t] dx\ du. Математическое ожидание во втором члене равно нулю, так как указанные интервалы являются непересекающимися, а ιι(τ) — белый шум. Математическое 711
ожидание в первой члене есть просто реализуемая оценка в концевой точке интервала наблюдения, которую обозначим через x(f). Следовательно, 1 β α 3. Решение по п. 2 является простым, так как область требуемой линейной операции не пересекается с интервалом наблюдения. Решение задачи 6.3.44 1. Заметим, что мы должны иметь как а(и)> так и yf(u) в качестве компонентов вектора состояния. Одной из реализаций является следующая структура: Ф) | s*Pz 1 g*Pi -^yfW —+a(t) Вектор состояния имеет вид X Уравнение состояния имеет вид ид где Ε [и (t) и (τ)] = 2σα2 δ (t —τ) Δ Q6 (t—τ). Матрица наблюдений равна Ctf) = [lO]. Уравнение оценки записывается в виде (6 Л*) (6.2*) Η? Λ,Ρ^τβ™--™ ««■> a(t)=x2(t) = [0 l]x(0. , (6.4*) 2. Дисперсионное уравнение стационарного состояния можно записать в виде трех скалярных алгебраических уравнений: 2 г (Pi+Рг) 1и +ТГ bl ξϊ2—2σα2 Vр± ρ2=0ί "о 2Ρίξ22+ —ξ?2-2σ2ρ1 = 0/ (6.5*) 712
Как и следовало ожидать, первое уравнение можно решить независимо. (Это всего лишь пример 1 на стр. 621.) Решая второе уравнение, получим [-i + 1/l4 4σα2 />2#0 (6.6·) fc tog*VPiP% ^а%УРгР% 2 / 4σ 2 Эти два члена определяют оптимальный фильтр. Наименьший средний квадрат ошибки при оценивании сообщения равен !«-*»■—-7Г*12· (6·8*) Используя (6.7*), (6.8*) можно записать в виде ξ22 = σ„4ΐ-- А" ч J, (6.9*) !ί«~ ~ где Л = /•Δ 4σα2 Ρι^ο Мы можем минимизировать ξ22 путем выбора г с целью максимизации второго члена. Это простой пример задачи на расчет оптимальных предыскажений. 'Заметим, что ξ22/σα есть просто нормированная среднеквадратическая ошибка, которая была получена в п. 2 задачи 6.2.7 при использовании методов винеровской теории фильтрации [см. (6.6*).]. Следовательно, выполненная в п. 3 оптимизация справедлива и здесь. N Литература 1. Wiener N. The Extrapolation, Interpolation, and Smoothing of Stationary Time Series. Wiley, New York, 1949. 2. Колмогорова. Η. Интерполирование и экстраполирование стационарных случайных последовательностей. «Известия АН СССР», серия математическая, 1941, т. 5, N 1. 3. Б о д е Г. В., Шеннон К. Е. Упрощенное изложение линейной минимально-квадратичной теории сглаживания и предсказания. В сб. переводов «Теория информации и ее приложения», под ред. А. А. Харкевича. Физмат- гиз, 1959. 4. Υ о ν i t s Μ. С, J а с k s о η J. L. Linear Filter Optimization with Game Theory Considerations. IRE National Convention Record, pt. 4, 1955, p. 193— 199. 5. V i t e r b i A. J., С a h η С. R. Optimum Coherent Phase and Frequency Demodulation of a Class of Modulating Spectra. Trans. IEEE, 1964, v. SET 10, № 3 (September), p. 95—102. 6. S η у d e r D. L. Some Useful Expressions for Optimum Linear Filtering in White Noise. Proc. IEEE, 1965, v. 53, № 6, p. 629—630. 23 Зак. 693 713
7. Хелстром К· Статистическая теория обнаружения сигналов. Пер с англ., под ред. Ю. Б. Кобзарева. Изд-во иностранной литературы, 1963 8. L i π d s а у W. С. Optimum Coherent Amplitude Demodulation. Proc. NEC, 1964, v. 20, p. 497—503. 9. Newton G. C, Gould L. Α., Kaiser J. F. Analytical Design of Linear Feedback Controls. Wiley, New York, 1957. 10. Wong E., Thomas J. B. On the Multidimensional Filtering and Prediction Problem and the Factorization of Spectral Matrices. J. Franklin Inst., 1961, v. 8, ρ 87—99. 11. Υ ο u 1 a D. С On the Factorization of Rational Matrices. Trans. IRE, 1961. v. IT-7, July, p. 172—189. 12. A m a r a R. C. The Linear Least Squares Synthesis of Continuous and Sampled Data Multivariable Systems. Report № 40, Stanford Research Laboratories, 1958. 13. В г о с k e t t R. Spectral Factorization of Rational Matrices. Trans. IEEE, v. IT (to be published). 14. Davis M. С On Factoring the Spectral Matrix. Joint Automatic Control Conference, Preprints, p. 549—566, June 1963; also, Trans. IEEE, 1963, v. AC- 8, October, p. 296—305. 15. KavanaughR. J. A Note on Optimum Linear Multivariable Filters, Proc. IEE, v. 108, pt. C, p. 412—417, Paper № 493M, 1961. 16. Wiener N.,Massani P. The Prediction Theory of Multivariable Stochastic Processes. Acta Math., 1958, v. 98, June. 17. Hsieh H. C, Leondes С. Т. On the Optimum Synthesis of Multipo- le Control Systems in the Wiener Sense. Trans. IRE, 1959, v. AC-4, p. 16—29. 18. Μ с С г а с k e n L. G. An Extension of Wiener Theory of Multi-Variable Controls. IRE International Convention Record, pt. 4, 1961, p. 56. 19. Lee H. С Canonical Factorization of Nonnegative Hermetian Matrices. J. London Math Soc, 1948, v. 23, p. 100—110. 20. Μ ο h a j e r i Μ Closed-form Error Expressions. M. Sc. Thesis. Dept. of Electrical Engineering, MIT, 1968. 21. Snyder D. L. The State-Variable Approach to Continuous Estimation. MIT, Sc. D. Thesis, February, 1966. 22. D о 1 ρ h C. L., Woodbury M. A. On the Relation Between Green's Functions and Covariances of Certain Stochastic Processes and its Application to Unbiased Linear Prediction. Trans. Am. Math. Soc, 1948. 23. К a 1 m a n R. Ε., Β u с у R. S. New Results in Linear Filtering and Prediction Theory. ASME J. Basic Engr., 1961, March. 24. Ζ a d e h L. Α., DeSoer С A Linear System Theory. McGraw-Hill, New York, 1963. 25. Gupta S. С Transform and State Variable Methods in Linear Systems. Wiley, New York, 1966. 26. A t h a n s M., F a 1 b P. L. Optimal Control. McGraw-Hill, New York, 1966. ч 27. D e R u s s о P. Μ , R о у R J., С 1 о s e С. М. State Variables for Engineers. Wiley, New York, 1965. 28. S с h w a r t ζ R. J., F r i e d 1 a n d B. Linear Systems. McGraw-Hill, New York, 1965. 29. С о d d i η g t ο η Ε. Α., L e ν i η s ο η N. Theory of Ordinary Differential Equations. McGraw-Hill, New York, 1955. 30. В e 1 1 m a n R. E. Stability Theory of Differential Equations. McGraw- Hill, New York, 1953. 31. McLachlan N. W. Ordinary Non-Linear Differential Equations in Engineering and Physical Sciences. Clarendon Press, Oxford, 1950. 32. L e ν i η J. J. On the Matrix Riccati Equation. Proc. Am. Math. Soc, 1959. v. 10, p. 519—524. 33 R e i d W. T. Solutions of a Riccati Matrix Differential Equation as Functions of Initial Values. J. Math. Mech., 1959, v. 8, № 2. 34 Reid W Τ A Matrix Differential Equation of Riccati Type Am. J. Math., 1946. ν 68, p. 237—246; Addendum, ibid , 1948, v. 70, p. 460. 7И
35. С о 1 e s W. J. MatrixR iccati Differential Equations. J. Soc. Indust Appl. Math. 1965, v. 13, № 3 (September). 36. В a g g e г о e r A. B. Solution to the Riccati Equation for Butterworth Processes. Internal Memo., Detection and Estimation Theory Group, MIT, 1966. 37. G u i 1 1 e m i η Ε. A. Synthesis of Passive Networks. Wiley, New York, 1957. 38. Weinberg L. Network Analysis and Synthesis. McGraw-Hill, New York. 39. S η у d e r D. L. Optimum Linear Filtering of an Integrated Signal in White Noise. Trans. IEEE, 1966, v. AES-2, №2, (March), p. 231—232. 40. Baggeroer A. B. Maximum A Posteriori Interval Estimation. WESCON, Paper № 7/3, August 23—26, 1966. 41. Br ys on A. E., J oh a ns en D. E. Linear Filtering for Time-Varying Systems Using Measurements Containing Colored Noise. Trans. IEEE, 1965, v. AC-10, № 1. 42. С о 1 1 i η s L. D. Optimum Linear Filters for Correlated Messages and Noises. Internal Memo. 17, Detection and Estimation Theory Group, MIT, October 28, 1966. 43. В a g g e г о е г А. В., Collins L. D. Maximum A Posteriori Estimation in Correlated Noise. Internal Memo., Detection and Estimation Theory Group, MIT, October 25, 1966. 44. V a η Τ r e e s Η. L. Sensitivity Equations for Optimum Linear Filters. Internal Memo., Detection and Estimation Theory Group, MIT, February 1966. 45. Τ h о m a s J. B. On the Statistical Design of Demodulation Systems for Signals in Additive Noise. TR-88, Stanford University, August 1955. 46. В о о t ο η R. C, Goldstein Μ Η., The Design and Optimization of Synchronous Demodulators. IRE Wescon Convention Record, Pt. 2, 1957, p. 154—170. 47. «Single Sideband Issue», Proc. IRE, 1956, v. 44, № 12. 48. В о 3 e η κ ρ a φ τ Д ж. М. В сб. «Лекции по теории систем связи», под ред. Багдади Е. Дж. Гл. 8. Пер. с англ., под ред. Б. Р. Левина. Изд-во «Мир», 1964. 49. Schwartz M. Information Transmission, Modulation, and Noise McGraw- Hill, New York, 1959. 50. С о s t a s J. P. Synchronous Communication Proc. IRE, 1956, v. 44, December, p. 1713—1718. 51. JaffeR., RechtinE. Design and Performance of Phase-Lock Circuits Capable of Near-optimum Performance over a Wide Range of Input Signal and Noise Levels. Trans. IRE, 1955, v. IT-I, March, p. 66—76. 52. Baggeroer A. B. A State Variable Technique for the Solution of Fred- holm Integral Equations. Proc. 1967 Intl. Conf. Communications, Minneapolis, Minn., June 12—14, 1967. 53. В a g g e г о е г А. В., Collins L. D. Evaluation of Minimum Mean Square Error for Estimating Messages Whose Spectra Belong to the Gaussian Family. Internal Memo., Detection and Estimation Theory Group, MIT, RLE, July 12, 1967. 54. В a g g e г о e r A. B. A State-Variable Approach to the Solution of Fred- holm Integral Equations. MIT, RLE Technical Report 459, July 15, 1967. 55. Ρ a p о u 1 i s A. Probability, Random Variables, and Stochastic Processes. McGraw-Hill, New York, 1965. 56. В г у s ο η A. E., F r a z i e r M. Smoothing for Linear and Nonlinear Dynamic Systems. USAFTech. Rpt. ASD-TRD-63-119 (February 1963). 57. Η e 1 s t г о m С W. Topics in the Transmission of Continuous Information. Westinghouse Res. Labs., Rept. 64-8C3-522-RI, August 27, 1964.
Условные обозначения, сокращения, символы Условные обозначения В книге использованы следующие условные обозначения: 1. Буквенные обозначения, набранные прямым жирным шрифтом, означают векторы или матрицы. 2. Символ | | означает абсолютное значение векторной (модуль вектора) или скалярной величины, заключенной внутри черточек. 3. Детерминант (определитель) квадратной матрицы А обозначается как |А| или det А. 4. Буквами рукописного шрифта f(-) и %(-) обозначены соответственно преобразования Фурье и Лапласа. 5. Кратные интегралы часто записываются в виде J dxf (τ) J dig (t, τ) Δ J/ (τ) { j* dig (t9 τ)} άτ. 6. E[-] означает математическое ожидание величины, стоящей в квадратных скобках. Черта над символом также иногда используется для обозначения математического ожидания. 7. Символом ® обозначена операция свертки оо x(t)®y(t)b i x(t—τ) у (τ) dr. —оо 8. Случайные величины обозначаются строчными буквами (на- . пример, χ и х), значения случайных величин и неслучайных параметров — прописными (например, X и X). В некоторых задачах теории оценок большая часть рассуждений справедлива как для случайных, так и для неслучайных параметров. В этих случаях мы отступаем от указанных выше обозначений во избежание повторного изложения каждого вопроса. 9. Плотность вероятности величины χ обозначается - через рх(·), а распределение вероятности — Рх(·)· Вероятность события А обозначается как Ρ ΙΑ]. Плотность вероятности величины χ при условии, что случайная величина а имеет значение Л, обозначена через P*|a(X| А). Если плотность вероятности зависит от неслучайного параметра Л, то также используется обозначение рх\а(Х\ А). 10. Вертикальная черта в каком-либо выражении означает «при условии, что», например, Р[А\ χ ^ X] — вероятность того, что происходит событие А при условии, что случайная величина χ не превышает значения X. 716
11. Преобразования Фурье обозначаются как F(jco) и F(co). Последнее используется, когда преобразование являете я действительной функцией ω. 12. Некоторые общеупотребительные математические символы перечислены ниже: оо—пропорционально t-*~T~—t стремится к Τ снизу Α+ΒΔΑ{]Β—А или β или Л и β вместе l.i.m. — предел в среднеквадратическом смысле оо J dR—интеграл, взятый по той же области, что и ука- ~°° занный вектор А7—траспонированная матрица А А-1 — матрица, обратная А О—матрица, все элементы которой равны нулю -биномиальный коэффициент Δ —определяется как k) k\{N—k)\ Δ . JdR—интеграл по множеству Ω Сокращения Ниже перечислены некоторые сокращения, используемые в книге. АИМ — амплитудно-импульсная модуляция ЧМ — частотная модуляция ДБП—AM — двухполосная амплитудная модуляция ДБП—AM—ПН — двухполосная амплитудная модуляция с подавлением несущей ФМ — фазовая модуляция ЧМ—ЧМ — двухступенчатая частотная модуляция ЧИМ—частотно-импульсная модуляция КОП—критерий отношения правдоподобия РНМК—равномерно наиболее мощный критерий РХП—рабочая характеристика приемника Символы Основные используемые обозначения определены ниже. Во многих случаях обозначения вектора являются очевидной модификацией обозначения скалярной величины. Аа — действительное (фактическое) значение параметра ^Аг — значение выборки (отсчета) в момент времени tt a(t) — преобразование Гильберта функции a(f) aabs — минимальная абсолютная ошибка оценки величины а Ятар — оценка величины а по максимуму апостериорной плотности (вероятности) 717
cimi — оценка величины А по максимуму правдоподобия ami{t)— оценка величины a(t) по максимуму правдоподобия cims— оценка величины а по минимуму среднеквадрати- ческой ошибки α — весовой коэффициент амплитуды регулярной составляющей коэффициента передачи райсовского канала α — ограничение, налагаемое на Рр (критерий Неймана—Пирсона). а — время запаздывания или упреждения (в контексте оценок непрерывных сигналов) В — постоянное смещение В(А) — смещение, являющееся функцией параметра А Bd (t) — матрица в уравнении состояния для полезного сигнала β — параметр (индекс, коэффициент модуляции) при частотно-импульсной и угловой модуляции С — пропускная способность канала С(ае) — стоимость ошибки оценки аг С(ау а) — стоимость оценивания величины а, когда а — фактическое значение параметра C(ds(t)) — функция стоимости (потерь) при точечной оценке Ср — стоимость ложной тревоги (т. е. утверждения Н19 когда истинна Я0) Си — стоимость утверждения, что справедлива Нь когда на самом деле истинна Я/ См — стоимость пропуска (т. е. утверждения Я0, когда на самом деле истинна Ях) Соо — пропускная способность канала при бесконечно большой полосе пропускания С(^) — матрица модуляции (или наблюдения, измерения) Cd(t) — матрица наблюдения полезного сигнала См (t) — матрица модуляции сообщением СлКО — матрица модуляции помехами χ — пространство параметров χα — пространство параметров для а Χθ — пространство параметров для θ χ2 — хи-квадрат (закон распределения вероятностей) D(co2) — полином в знаменателе представления спектра d — требуемая функция параметра d — показатель достоверности (качества) — параметр на рабочих характеристиках приемника в случае гауссовой задачи d — оценка требуемой функции d(t) — полезный сигнал d(t) — оценка полезного сигнала da — фактический показатель достоверности (качества) 718
d-в (t) — байесовская точечная оценка df — параметр системы ЧМ (девиация частоты) do(t) — оптимальная среднеквадратическая оценка (оптимальная оценка по минимуму среднего квадрата ошибки) ds(t> a(t)) — производная сигнала s(t, a(f)) по сообщению a(t) de(t) — ошибка точечной оценки d*(t) — выход произвольной нелинейной операции δ — фаза регулярной составляющей райсовского канала Δ — интервал при детектировании ЧИМ Ad — изменение показателя достоверности Δάχ — требуемое изменение величины d AN — изменение уровня белого шума Δ« — ограничение, налагаемое на отклонение ковариационной функции Am — среднеразностный вектор (т. е. вектор, означающий разность между двумя вектор-средними) AQ — матрица, обозначающая разность между двумя обращенными ковариационными матрицами Ε — энергия (подстрочный индекс не употребляется, если в рассматриваемой задаче имеется только одна энергия) Еа — математическое ожидание, взятое только по случайной величине а Ee(N)—энергия сигнала ошибки (как функция числа членов аппроксимирующего ряда) Е\— энергия мешающего сигнала Ει— энергия по ι-й гипотезе Ε г — математическое ожидание энергии принимаемого сигнала Et — энергия передаваемого сигнала Еу — энергия колебания у (t) Еъ Е0 — энергия сигналов по гипотезам Нх и Н0 соответственно Ее — энергия сигнала ошибки (в контексте «чувствительности») елКО — сигнал ошибки ε/ — интервальная ошибка ет — полная ошибка erf (·) — функция ошибки (в общепринятом смысле) erf*(·) — функция ошибки (по определению в тексте) erfc(-)— дополнительная функция ошибки (в общепринятом смысле) erf с* (·)—дополнительная функция ошибки (по определению в тексте) η — порог при испытании по критерию отношения правдоподобия £(.) — операция вычисления математического ожидания [иногда обозначается также через (7)] 719
F — функция, подлежащая минимизации или максимизации, которая содержит множитель Лагранжа f(t) — огибающая передаваемого сигнала /(/) — функция, используемая в различных контекстах fit : г(и), Τι ^ и ^ Tf) — нелинейная операция над колебанием г(и) (включает линейную операцию как частный случай) /с — частота генератора (сос = 2я/с) /δ(0 — нормированный разностный сигнал F — матрица дифференциального уравнения F(/) — изменяющаяся во времени матрица дифференциального уравнения Fd(t) — матрица дифференциального уравнения, описывающего полезный сигнал G+(/cd) — множитель спектра Sr(co), имеющий все полюсы и нули в левой полуплоскости (и половину нулей на оси /ω). Его преобразование для отрицательного времени равно нулю g(t) — функция, используемая при анализе коррелятора в случае небелой помехи g(t, A) g(t, A) — функция, используемая в задаче оценивания величины А или А на фоне небелой помехи g(Xi) — функция собственного значения gh(t) — однородное решение gt(i) — импульсная переходная функция фильтра в петле обратной связи Slot1)* Gioti®) — импульсная переходная функция и передаточная функция оптимального фильтра в петле ёри (τ) — импульсная переходная функция нереализуемого фильтра, включенного после петли gpuo(v), GpuoQ®) — импульсная переходная функция и передаточная функция оптимального нереализуемого фильтра, включенного после петли gb(t) — импульсное решение gA(t) — разностная функция при анализе коррелятора для случая небелой помехи gk — взвешенная сумма g(Xi) gco(t), Goo(/cd) — решение для бесконечного интервала G — матрица дифференциального уравнения G(/) — изменяющаяся во времени матрица дифференциального уравнения - Gd — линейное преобразование, описывающее полезный вектор d Gd(t) — матрица дифференциального уравнения для полезного сигнала 6(0 — функция, используемая при анализе векторного коррелятора 720
gd(A) — нелинейное преобразование, описывающее полезный вектор d Г(л:) — гамма-функция γ = k\/ 1 + Л — параметр у — порог испытания по произвольному критерию (часто в величину γ включают различные постоянные) уа — множитель в задаче нелинейной модуляции, которым определяется дисперсия ошибки Н0, #!,..., Нг — гипотезы в задаче на принятие решения h(t, и) — импульсная переходная функция фильтра с изменяющимися во времени параметрами (выход в момент времени ί, обусловленный импульсом на входе в момент времени и) Лс1ь (t, и) — импульсная переходная функция канала hiJJ) — функция нижних частот (огибающая отклика полосового фильтра) h0(t, и) — импульсная переходная функция оптимального линейного фильтра ^ό(τ)> ^ό(/ω) — импульсная переходная функция и передаточная функция оптимального устройства обработки выбеленного сигнала h0u(t), Houti®) — импульсная переходная функция и передаточная функция оптимального нереализуемого фильтра hw(t, и) — импульсная переходная функция выбеливающего фильтра he (ί, и) — импульсная переходная функция произвольного линейного фильтра h*(t, и) — импульсная переходная функция линейного фильтра при рассмотрении условия единственности Η — линейное матричное преобразование h0 (t, и) — импульсная переходная функция оптимального линейного матричного фильтра /0(·) — модифицированная функция Бесселя первого рода нулевого порядка hy h — интегралы /г — неполная гамма-функция I — единичная матрица J (ί, и) — информационное ядро J** — элементы матрицы «М y-J(i, и) — обращенное информационное ядро Ju — элементы информационной матрицы Jk(U и) — /С-й член аппроксимации информационного ядра J — информационная матрица Фишера Jd — компонента информационной матрицы, соответствующая результатам наблюдения Зр — априорная компонента информационной матрицы 721
Зт — полная информационная Матрица ^(со) — преобразование / (τ) ^_1(ω)— преобразование / _1 (τ) Kna(t, и) — фактическая ковариационная функция шума (при рассмотрении проблемы чувствительности) Kne(ttu) — эффективная ковариационная функция шума (при рассмотрении проблемы чувствительности) Κηε (ί, и) — отклонение ковариационной функции шума (при рассмотрении проблемы чувствительности) Кх (t, и) — ковариационная функция величины χ (t) k — постоянная Больцмана k(t, r (и)) — операция, используемая при доказательстве обратимости К — ковариационная матрица ка (t) — линейное преобразование величины χ (t) Kd (t, v) — матричный фильтр с ρ входами и q выходами, связывающий a (v) и d (t) Kf (иу υ) — матричный фильтр с ρ входами и η выходами, связывающий а {υ) и χ (μ) I (R), / — достаточная статистика / (А) — функция правдоподобия la — фактическая величина достаточной статистики (при рассмотрении проблемы чувствительности) Ic, Is — достаточные статистики, соответствующие косинусной и синусной компонентам / — множество (система) достаточных статистик Λ — параметр, который часто соответствует отношению сигнал/шум в эффективной полосе сообщения A(R), Λ (гк(0) — отношение правдоподобия Λ (Γχ (/), А) — функция правдоподобия Λβ — отношение сигнал/шум в опорной полосе частот для спектров Баттерворта Aef — эффективное отношение сигнал/шум Ag — обобщенное отношение правдоподобия Ат — параметр распределения вероятности фазы Лздб — отношение сигнал/шум в полосе, отсчитываемой по ослаблению 3 дБ Лх — ковариационная матрица вектора χ Αχ (t) — ковариационная матрица вектора состояния (=КХ (/, 0) λ — множитель Лагранжа λ/ — собственные значения матрицы интегрального уравнения λ£Η — собственные значения канальной квадратичной "^ формы λ[ — полное собственное значение In — натуральный логарифм loga — логарифм по основанию а 722
Mx(jv)9Mx(jv) — характеристическая функция случайной величины χ (или х) т*(0 — функция — среднее значение процесса Μ — матрица, используемая при рассмотрении случая небелой помехи m — вектор-среднее μ (s) — показатель производящей функции моментов N — размерность пространства наблюдений N — число коэффициентов разложения в ряд N(m, a) — гауссово (нормальное) распределение вероятности (плотность вероятности) со средним значением т и стандартным отклонением а Ν (ω2) — полином в числителе при представлении спектра Nef — эффективный уровень шума N0 — спектральная плотность n(t) — шумовой случайный процесс nc(t) — небелый (цветной, коррелированный) шум (помеха) (не содержит белого шума) tiEi (t) — внешний шум (помеха) щ — /-я компонента шума (помехи) ню (t) — шум приемника njf) — компонента шума (помехи) на выходе выбеливающего фильтра ncr (t) — реализуемая оценка небелой компоненты шума по минимуму среднего квадрата ошибки n>cu(t) — нереализуемая оценка небелой компоненты шума по минимуму среднего квадрата ошибки N — числа корреляционной матрицы шума η, η — случайная величина шума (или векторная величина) ξαε — коэффициент взаимной корреляции между ошибочным и фактическим векторами состояний ξ/ — математическое ожидание ошибки оценивания на интервале (интервальной оценки) %u(t) — элементы ковариационной матрицы ошибок im/ — дисперсия интервальной оценки по максимуму правдоподобия %p{t) — математическое ожидание ошибки реализуемой точечной оценки ξρ;(/) — дисперсия ошибки точечной оценки /-го сигнала \pn{t) — нормированная ошибка реализуемой точечной оценки ξ£ — нормированная ошибка как функция времени уп- реждения (запаздывания) ξροο — математическое ожидание ошибки точечной оценки (статистически стационарное состояние) \и — оптимальная нереализуемая ошибка 723
£un — нормированная оптимальная нереализуемая ошибка ξ*(0 — среднеквадратическая ошибка при использовании нелинейной операции lac — фактическая ковариационная матрица %d(t) — ковариационная матрица при оценивании d (t) Ipoo — стационарная (для статистически установившегося состояния) ковариационная матрица ошибок (ос — несущая частота u>d — допплеровский сдвиг частоты Ρ — мощность Р(г) — вероятность ошибки PD — вероятность обнаружения (условная вероятность) Pef — эффективная мощность Pf — вероятность ложной тревоги (условная вероятность) Pi — априорная^вероятность ί-й гипотезы Рм — вероятность пропуска (условная вероятность) Pd(Q) — вероятность обнаружения для заданного значения θ ρ — оператор дифференцирования (=d/dt) р0 — фиксированная вероятность интервальной ошибки в задачах, связанных с ЧИМ Λ·/#. (R|#i) — плотность вероятности величины г при условии, что правильна гипотеза Hi Рх (Xt) или рх (X : ή — плотность вероятности случайного процесса в момент времена t Ρ(ί) — взаимно корреляционная матрица между входом источника сообщений и аддитивным шумом в канале Ρ{·\> Р(') — вероятность события, указанного в квадратных или круглых скобках Φ(ί) — собственная функция Ф$(0 — *-я координатная функция, /-я собственная функция Φ*(δ) — производящая функция моментов случайной величины χ Φ(ί) — фаза сигнала \j)L(i) — фазовая функция нижних частот φ(ί, τ) — переходная матрица состояний для системы с изменяющимися во времени параметрами φ(ί — ί0)ΔΦ(τ) — переходная матрица состояний для системы с постоянными во времени параметрами Q(a, β) — Q - функция Маркума Qn(t> и) — обратное ядро q — величина спектральной плотности возбуждающего скалярного белого шума Q — ковариационная матрица возбуждающего векторного белого шума (§ 6.3) Q — обратная ковариационяая матрица К 724
Qi> Qo — обратная ковариационная матрица Κι, Κ0 Qn(w> z) — ЯДР° обращенной матрицы R — производительность источника (скорость передачи, символы/с.) Rx (t, и) — корреляционная функция Μ — риск Л(а (t)tt) — риск при точечной оценке риск при использовании абсолютной функции стоимости Л в — байесов риск Лр — риск при использовании фиксированного критерия *#ms — риск при использовании среднеквадратической функции стоимости *#unf — риск при использовании равномерной функции стоимости r(t) — принимаемое колебание (обозначает как случайный процесс, так и его выборочную функцию) rc(t) — комбинированный принимаемый сигнал rg(t) — процесс на выходе фильтра, соответствующего обращенному ядру, когда на входе его действует процесс г (t) гк (0 — /С-членная аппроксимация г* С) — выход выбеливающего фильтра r*a(t) — фактический выход выбеливающего фильтра (в контексте чувствительности) г**(0 — выход фильтра Sq (со), эквивалентного последовательному включению двух выбеливающих фильтров ρη — коэффициент корреляции нормированных сигналов st (t) и Sj (t) ρ12 — коэффициент ковариации двух случайных величин R(£) — ковариационная матрица векторного белого шума R — корреляционная матрица ошибок Re7 — корреляционная матрица ошибок при интервальной оценке г, R — вектор наблюдения RL [ ·, ·] — радиальная сферическая функция S(j(o) — преобразование Фурье сигнала s (t) Sc (ω) — спектр небелого шума (помехи) Son [ · у' 1 — круговая сферическая функция Sq((*>) — преобразование Фурье Q(x) Sr((u) — спектр плотности мощности (энергетический спектр) / принимаемого сигнала Sx(a>) — спектр плотности мощности (энергетический спектр) 5ε0(/ω) — преобразование оптимального сигнала ошибки s(t) — сигнальная компонента r(t) (при рассмотрении только одного сигнала — без подстрочного индекса) 725
s (/, A) — сигнал, зависящий от А s(t, a(t)) — модулированный сигнал sa(0 — фактический сигнал s(t) (в контексте чувствительности) si(t) — мешающий сигнал Sia(t) — фактический мешающий сигнал (в контексте чувст^ вительности) st — коэффициент разложения сигнала s(t) st — t-я компонента сигнала sr(tt θ) — компонента принимаемого сигнала st(t) — передаваемый сигнал so(t) — сигнал по гипотезе Н0 si(0 — сигнал по гипотезе Нг Si(i, θ), s0(tyb) — сигнал с нежелательными параметрами se (t) —: сигнал ошибки (в контексте чувствительности) $δ(0 — разностный сигнал (ΫΕ^ (t) — YE$q (t)) sq(0 — случайный сигнал sg!f: (t) — выбеленный разностный сигнал s* (t) — сигнальная компонента на выходе выбеливающего фильтра s*r (t) — выход выбеливающего фильтра, обусловленный сигналом ошибки σ2 — дисперсия σΐ, org — дисперсия по гипотезам Нъ Н0 аъ\ — дисперсия ошибки s(t) — векторный сигнал Те — эффективная температура шума θ, θ — нежелательный параметр θ — оценка фазы θα — фактическое значение фазы в бинарной системе Och(i) — фаза коэффициента передачи (переходной функции) канала θα — оценка θχ T(t, τ) — переходная матрица [ ]т — транспонированная матрица M-i(f) — единичная ступенчатая функция (единичный скачок) «(/), и(/) — сигнал на входе системы V — переменная при кусочной аппроксимации VCh (О VCh(t) — огибающая коэффициента передачи (переходной функции) канала ν(ί) — комбинированный возбуждающий шум для случая коррелированной помехи νι(0> уг(0 — векторные функции (свойство 16, гл. 6) W — ширина полосы (Гц) W(j(u) — передаточная функция выбеливающего фильтра W^ch — односторонняя ширина полосы канала (Гц) Ц^-^/со) — обращенная передаточная функция выбеливающего фильтра 726
W(i) — процесс типа белого шума w(t) — импульсная переходная функция выбеливающего фильтра W — матричная операция, выходной вектор которой имеет диагональную ковариационную матрицу W — ковариационная матрица x(t) — вход модулятора x(t) — случайный процесс x(t) — оценка случайного процесса χ — случайный вектор χ(ί) — вектор состояния xa(t) — модифицированный вектор состояния Хас — фактический вектор состояния х<*(0 — вектор состояния для желательной операции Xf(t) — предварительно отфильтрованный вектор состояния хм(0 — вектор состояния для случая сообщения хто — вектор состояния (в модели) . *N(t) — вектор состояния для случая помехи y(t) — решение дифференциального уравнения y(t) — часть колебания г (/) , несущественная для принятия решения y(t) — передаваемый сигнал у — векторная компонента наблюдения, несущественная для принятия решения y=s(A) — нелинейная функция параметра А Ζ — пространство наблюдений Ζ€(ώ) — интегрально-косинусное преобразование Zs(cu) — интегрально-синусное преобразование Zlf Z2 — подпространства пространства наблюдений ζ(ί) — выход выбеливающего фильтра z(t) — матрица коэффициента передачи фильтра, переходная функция которого есть h0(i, t), в терминах переменных состояния.
ПРИЛОЖЕНИЕ Некоторые нерассмотренные вопросы0 Несколько раз по ходу изложения мы встречались с интересными вопросами, исчерпывающее рассмотрение которых увело бы нас слишком далеко в сторону от главной темы. В данном кратком обзоре указывается соответствующая литература для дальнейшего изучения. Кодирование в цифровых системах связи. Наиболее важный из числа нерассмотренных вопросов — это использование методов коди- . рования с целью уменьшения количества ошибок в системах передачи последовательностей цифр. Результаты классической теории информации, полученные Шенноном, определяют, насколько хорошо можно осуществить эту процедуру. Большое число исследований было посвящено отысканию путей приближения к указанным классической теорией пределам. Изложение этих вопросов можно найти в [1—6]. Библиография текущих журнальных публикаций регулярно появляется в серии «Успехи теории информации» [7, 8]. Методы последовательного обнаружения и оценки. На протяжении всей книги мы имели дело в основном с фиксированным интервалом наблюдения. Однако достоверность (качество) обнаружения часто можно повысить, если существует возможность производить испытания на интервале переменной длины. Фундаментальная работа в этой области принадлежит Вальду [10]. К задаче обнаружения и оценки сигналов результаты Вальда были применены Петерсоном, Бирдзоллом и Фоксом [11], а также Бузгангом и Миддлтоном [12]. Впоследствии во многих работах были рассмотрены различные аспекты данной задачи (например [13—22]). Не параметрические методы. При рассмотрении вопросов обнаружения и оценки мы всегда предполагали, что случайные величины и процессы имеют известные распределения вероятностей. Непараметрический статистический подход сводится к разработке критериев, не зависящих от распределения. Как и следует ожидать, проблема оказывается более трудной, и даже в классическом случае существует ряд нерешенных задач. К классической области относятся книги Фрейзера [23] и Кендалла [24]. Другие источники перечислены в [25] и [26]. Результаты, полученные для случая непрерывных сигналов, являются менее удовлетворительными. Ряд моделей исходит из диск- х) В Приложении излагается содержание § 7.3, опущенной при переводе седьмой главы, где выделены вопросы, которые, несмотря на значительный объем монографии, лишь кратко упомянуты в первом томе и не получают дальнейшего освещения во втором томе, подготавливаемом к изданию в русском переводе. 728
ретизации входной величины и последующего использования известного классического результата. К числу последних интересных работ в этой области принадлежат [27—32]. Адаптивные и обучающиеся системы. Определения «адаптивные» и «обучающиеся» приобрели сейчас популярность. При соответствующем определении понятия адаптивности многие известные системы можно интерпретировать как адаптивные или обучающиеся. Основной подход здесь довольно прост и прямо ведет к цели: нам необходимо построить систему, которая эффективно работала бы в неизвестных или изменяющихся условиях; дав возможность системе изменять свои параметры или структуру в зависимости от поведения входной величины, можно улучшить ее характеристики по сравнению с фиксированной системой. Сложность системы зависит от принятой модели, учитывающей внешние условия, и от числа степеней свободы, допускаемых в системе. Этой общей области посвящено много работ (например [33—50] и [9]). Распознавание образов. Интересующая нас задача в этой области заключается в распознавании (или классификации) образов, основывающемся на некотором неидеальном наблюдении. К числу представляющих интерес направлений в этой области относятся распознавание печатных знаков, классификация целей в гидроакустических системах, распознавание речи и различные области медицины, например, кардиология. Данную задачу можно сформулировать как в статистической, так и в нестатистической трактовке. Для наших целей более подходит статистическая постановка задачи. При статистическом подходе к постановке задачи результаты наблюдения обычно сводятся к N-мерному вектору. Если имеется Μ возможных образов, то задача сводится к конечномерной многоальтернативной задаче на испытание Μ гипотез, изложенной в гл. 2. Если далее предположить, что результаты измерений подчиняются нормальному закону распределения, то будет непосредственно применима общая гауссова задача, рассмотренная в § 2.6. Некоторые типичные приложения теории распознавания образов были проиллюстрированы в задачах к гл. 2. Более актуальная и вместе с тем более трудная задача возникает тогда, когда предположение о нормальности распределения оказывается несправедливым. Некоторые полученные для этого случая результаты обсуждаются в [8]; там же приведена библиография дополнительной литературы по этому вопросу. Дискретно-временные процессы. При изложении материала книги мы в основном имели дело с результатами наблюдений, которые являются выборочными функциями непрерывных во времени процессов. Многие из полученных результатов можно сформулировать заново при помощи процессов, дискретных во времени. Некоторые подобные преобразования были развиты в задачах вне основного текста книги. Негауссов шум. Начиная с гл. 4, рассмотрение было ограничено- гауссовыми (нормальными) случайными процессами. Как указывалось в конце гл. 4, при помехах другого вида могут получаться иные результаты. Некоторые типичные результаты рассмотрены в [51—57]. 729
Системы передачи информации с обратной связью. Во многих физических ситуациях целесообразно иметь линию обратной связи между передатчиком и приемником. Введение такой линии открывает новые возможности при проектировании системы связи и часто позволяет достигать достаточных эффективности и помехоустойчивости системы при гораздо меньшей степени ее сложности, чем это было бы возможно при отсутствии обратной связи. В [58] Грин описал состояние работ в этой области вплоть до 1961 года. К числу последних работ относятся [59—631 и [761. Физические реализации. Конечным результатом .большей части наших построений являлась структурная схема оптимального приемника. Практические реализации этих схем рассмотрены в различных работах. Наиболее характерные системы, в которых нашли применение методы современной теории связи, описаны в [64—681. Использование марковских процессов. За исключением § 6.3, наш подход к решению задачи обнаружения и оценки сигнала можно охарактеризовать как метод «ковариационной функции — импульсной реакции», успешное применение которого основывается на том факте, что рассматриваемые процессы являются гауссовыми. Другой подход к решению этой задачи может основываться на марковском характере изучаемых процессов. Этот метод можно назвать методом «дифференциального уравнения в переменных состояния». Он имеет ряд преимуществ при решении многих задач. В [69—75] этот метод рассмотрен применительно к некоторым конкретным задачам. Несомненно, существуют и другие родственные вопросы, которые в этом кратком обзоре не нашли отражения, однако те, что перечислены выше, на наш взгляд, являются основными. Литература 1. В aggeroer А. В. Some Applications of State Variable Techniques in Communications Theory. Sc. D. Thesis, Dept. of Electrical Engineering, MIT, February 1968. 2. Возенкрафт Дж , Джекобе И. Теоретические основы техники связи. Пер. с англ. .под ред. Р. Л. Добрушина. Изд-во «Мир», 1969. 3. Φ а н о Р. М. Передача информации. Статистическая теория связи. Пер. с англ. под ред. Р. Л. Добрушина. Изд-во «Мир», 1965. 4. G а 1 1 a g e r R. G. Notes on Information Theory, Course 6.574, MIT. 5. Питерсон У. Коды, исправляющие ошибки. Пер. с англ. под ред. Р. Л. Добрушина. Изд-во «Мир», 1964. 6. Голомб С., Цифровые методы в космической связи. Пер. с англ. под ред. В. И. Шляпоберского. Изд-во «Связь», 1969. 7. Elias P., Gill Α., Price R., Swerling P., Zadeh L., Abramson N. Progress in Information Theory in the U. S. Α., 1957—Ι960. Trans. IRE, I960, v. IT-7, July, № 3, p. 128—143. 8. Zadeh L.A., A bramson NM В al akrishnan A. V., Braver- man D., Eden M., Feigenbaum Ε. Α., Kail at h Т., Lerner R. M., MasseyJ., Mueller G. E., Peterson W. W., Price R., Sebestyen G., Slepian D., Thorn a* 730
s i a n A. J., Turin G. L. Report on Progress in Information Theory in the U. S. A. 1960—1963. Trans. IEEE, 1963, v. IT-9, October, ρ 221—264. 9. AusiinM. E. Decision-Feedback Equalization for Digital Communication Over Dispersive Channels. MIT, Sc. D. Thesis, May 1967 10. Вальд А. Последовательный анализ. Пер. с англ., под ред Севастьянова Б. Α.- Физматгиз, I960. 11. Петерсон У., Бирдзолл Т., Фокс У. Теория обнаружения сигналов. В сб. переводов «Теория информации и ее приложение» под ред. А. А. Харкевича. Физматгиз, 1959. Также в сб. переводов «Прием импульсных сигналов в присутствии шумов» под ред. А. Е. Башарииова и М. С. Александрова. Госэнергоиздат, I960. 12. Б у з г а н г Дж , Миддлтон Д. Оптимальное последовательное обнаружение сигналов в шуме. В сб. переводов «Прием сигналов при наличии шума» под ред. Л. С. Гуткина. Изд-во иностранной литературы, I960. 13. БласбальгГ Связь теории последовательного обнаружения с теорией информации и применение ее к обнаружению сигналов в шуме посредством биномиальных испытаний В сб. переводов «Прием сигналов при наличии шума» под ред. Л. С. Гуткина. Изд-во иностранной литературы, I960; Последовательное обнаружение в гауссовом шуме радиосигналов синусоидальной формы с произвольным коэффициентом заполнения. Пер. с англ. «Вопросы радиолокационной техники». 1958, № 4, стр. 17—31. В 1 a s b а 1 g H. Theory of Sequential Filtering and Its Application to the Detection and Classification. Doctoral dissertation, Johns Hopkins University, 1955. 14. Marcus M. В., S w e r 1 i η g P. Sequential Detection in Radar with Multiple Resolution Elements Trans. IRE, 1962, v. IT-8, April, p. 237—245. 15. Τ u r i η G. L Signal Design for Sequential Detection Systems with Feedback. Trans. IEEE, 1965, ν IT-11, July, p. 401—408; Comparison of Sequential and Nonsequential Detection Systems with Uncertainty Feedback. Trans. IEEE, 1966, v. IT-12, January, ρ 5—8 16. V i t e r b i A. J. The Effect of Sequential Decision Feedback on Communication over the Gaussian Channel Information and Control, 1965, v. 8, February, p. 80—92. 17. G a g 1 i a r d i R. M., R с с d I S On the Sequential Detection of Emerging Targets. Trans. IEEE, 1965, ν IT-11, April, p. 260—262. 18. Η e 1 s t г о m C. W. A Range Sampled Sequential Detection System. Trans. IRE, 1962, v. IT-8, January, p. 43—47. 19. К e η d a 1 1 W., R e e d I. S. A Sequential Test for Radar Detection of Multiple Targets. Trans. IRE, 1963, v. IT-9, January, p. 51. ЧЮ. Marcus M. В., Bussgang J. Truncated Sequential Hypothesis Te- sis The RAND Corp , RM-4268-ARPA, Santa Monica, California, November, 1964. 21. R e e d I. S , S с 1 i η Ι Λ Sequential Test for the Presence of a Signal in One of k Possible Positions Trans. IRE, 1963, ν IT-9, October, p. 286. 22. S e 1 i η I The Sequential Estimation and Detection of Signals in Normal Noise, I. Information and Control, 1964, v. 7, December, p. 512—534; II, Information and Control, 1965, ν 8, January, p. I—35. 23. F r a s e r D. A. S Nonparametric Methods in Statistics, Wiley, New York, 1957. 24. К e η d a 1 1 M. G. Rank Correlation Methods, 2nd ed., Griffin, London, 1955. 25. L e h m a η π Ε. L Testing Statistical Hypotheses, Wiley, New York, 1959. 26. S a v a g e I. R Bibliography of nonparametric statistics and related topics. J. American Statistical Association, 1953, v. 48, p. 844—906. 27. К a n e f s k у М. On sign tests and adaptive techniques for nonparametric detection. Ph. D. dissertation, Princeton University, Princeton, New Jersey, 1964. 28. W о 1 f f S S , Τ h о m a s J. В., Williams T. The Probability Coincidence Correlator: a Nonparametric Detection Device. Trans. IRE, 1962, v. IT-8, January, p. 1—19 29. Ε k r e H. Polarity Coincidence Correlation Detection of a Weak Noise Source. Trans. IEEE, 1963, v. IT-9, January, p. 18—23. 731
30. К a n e f s к у М. Detection of Weak Signals with Polarity Coincidence Arrays. Trans. IEEE, 1966, v. IT-12, April. 31. D al у R. F. Nonparametric Detection Based on Rank Statistics. Trans. IEEE, 1966, v. IT-12, April. 32. Μ i 1 1 a r d J. В., К u r ζ L. Nonparametric Signal Detection — An Application of the Kolmogorov—Smirnov, Cramer-Von Mises Tests. Trans. IEEE, 1966, v. IT-12, April. 33. Weaver С S. Adaptive Communication Filtering. Trans. IEEE, 1962, v. IT-8, September, p. 169—178. 34. В r e i ρ ο h 1 Α. Μ., Κ ο s с h m a η η Α. Η. Α Communication System with Adaptive Decoding. Third Symposium on Discrete Adaptive Processes, 1964 National Electronics Conference, Chicago, October 19—21, p. 72—85. 35. L a w t ο η J. G. Investigations of Adaptive Detection Techniques. Cornell Aeronautical Laboratory Report, № RM-1744-S-2, Buffalo, New York, November, 1964. 36. Lucky R. W. Techniques for Adaptive Equalization of Digital Communi" cation System. Bell Syst. Tech. J., 1966, February, p. 255—286. 37. Μ a g i 1 1 D. T. Optimal Adaptive Estimation of Sampled Stochastic Processes. Stanford Electronics Laboratories, TR № 6302-2, Stanford University, California, December, 1963. 38. S t e i g 1 i t ζ K., Thomas J. B. A Class of Adaptive Matched Digital Filters. Third Simposium on Discrete Adaptive Processes, 1964 National Electronics Conference Chicago, Illinois, October, 1964, p. 102—115. 39. Grog ins к у Η. L., Wilson L. R., Mid diet on D. Adaptive Detection of Statistical Signals in Noise. Trans. IEEE, 1966, v. IT-12, July. 40. Η Or Y. C, Lee R. С Identification of Linear Dynamic Systems. Third Symposium on Discrete Adaptive Processes, 1964 National Electronics Conference, Chicago, Illinois, October, 1964, p. 86—101. 41. Ν ο 1 t e L. W. An Adaptive Realization of the Optimum Receiver for a Sporadic-Recurrent Waveform in Noise. First IEEE Annual Communication Convention, Boulder, Colorado, June, 1965, p. 593—598. 42. Esposito R., Middleton D., Mullen J. A. Advantages of Amplitude and Phase Adaptivity in the Detection of Signals Subject to Slow Rayleigh Fading. Trans. IEEE, 1965, v. IT-llyOctober, p. 473—482. 43. Η a n с о с к J. С, W i n t z P. A. An Adaptive Receiver Approach to the Time Synchronization Problem. Trans. IEEE, 1965. v. COM-13, March, p. 90— 96. 44. D i Τ о г о M. J. A New Method of High—Speed Adaptive Serial Communi· cation Through Any Time-Variable and Dispersive Transmission Medium. First IEEE Annual Communication Convention, Boulder, Colorado, June, 1965, p. 763—767. 45. D a v i s s ο η L. D. A Theory of Adaptive Filtering. Trans. IEEE, 1966, v. IT-12, April, p. 97—102. 46. S с u d d e r H. J. Probability of Error of Some Adaptive Pattern-Recognition Machines. Trans. IEEE, 1965, v. IT-U, July, ρ 363—371. 47. J а к о w i t ζ С. V.; S h u e у R. L., White G. M. Adaptive Waveform Recognition. TR60-RL-2353E, General Electric Research Laboratory, Schenectady, New York, September, 1960. 48. Glaser Ε. Μ. Signal Detection by Adaptive Filters. Trans. IRE, 1961, v. IT-7, April, № 2, 'p. 87—98. 49. В о у d D. Several Adaptive Detection Systems. M. Sc. Thesis, Department of Electrical Engineering, MIT, July, 1965. 50. S с u d d e r H. J. Adaptive Communication Receivers. Trans. IEEE, 1965, v. IT-11, N 2, April, p. 167—174. 51. A 1 g a z i V. R., L e r η e r R. M. Optimum Binary Detection in Non- Gaussian Noise. Trans. IEEE, 1966, v. IT-12, April. 52. R e i f f e η В., Sherman Η. An Optimum Demodulator for Poisson Processes; Photon Source Detectors. Proc. IEEE, 1963, v. 51, October, p. 1316— 1320. 732
53. К и г ζ L. A Method of Digital Signalling in the Presence of Additive Gaussian and Impulsive Noise. 1962 IRE International Convention Record, Pt. 4, p. 161—173. 54. Лекции по теории систем связи. Пер. с англ., под ред. Б. Р. Левина. Изд-во «Мир», 1964. Гл. 7. 55. Μ i d d 1 e t ο η D. Acoustic Signal Detection by Simple Correlator in the Presence of Non-Gaussian Noise. J. Acoust. Soc. Am., 1962, v. 34, October, p. 1598—1609. 56. F e 1 d m a n J. R., F a r а о η e J. N. An analysis of frequency shift keying systems. Proc. National Electronics Conference, 1961, v. 17, p. 530—542. 57. A b e η d K. Noncoherent optical communication. Philco Scientific Lab., Blue Bell, Pa., Philco Rept. 312 (February 1963). 58. Лекции по теории систем связи. Пер. с англ. под ред. Б. Р. Левина. Изд-во «Мир», 1964, Гл. 11. 59. О m u r a J. К. Signal Optimization for Channels with Feedback. Stanford Electronics Laboratories, Stanford University, California, Technical Report №7001-1, August, 1966. 60. S с h a 1 k w i j k J. P. Μ., Κ a i 1 a t h T. A Coding Scheme for Additive Noise Channels with Feedback — Part I: No Bandwidth Constraint. Trans. IEEE, 1966, v. IT-12, Aprrl. 61. S с h a 1 k w i j k J. P. M. Coding for a Class of Unknown Channels. Trans. IEEE, 1966, v. IT-12, April. 62. Η ο r s t e i η Μ. Sequential Transmission using Noiseless Feedback. Trans. IEEE, 1963, v. IT-9, №3 (July), p. 136—142. 63. С r u i s e T. J. Communication using Feedback. Sc. D. Thesis, Dept. of Electrical Engr., MIT, 1968. 64. Τ u r i η G. L. Signal Design for Sequential Detection Systems with Feedback. Trans. IEEE, 1965, v. IT-11, July, p. 401—408. 65. В e 1 e η s k i J. D. The application of correlation techniques to meteor burst communications. Presented at the 1962 WESCON Convention, Paper № 14.4. 66. L e r η e r R. M. A Matshed Filter Communication System for Complicated Doppler Shifted Signals. Trans. IRE, I960, v. IT-6, June, p. 373—385. 67. Berg R. S., etal. The DICON System. MIT Lincoln Laboratory, Lexington, Massachusetts, Tech. Report №251, October 31, 1961. 68. К r a k a u e г С S. Serial-Parallel Converter System «SEPATH». Presented at the 1961 IRE WESCON Convention, Paper № 36/2. 69. Van Trees H. L. Detection and Continuous Estimation: The Fundamental Role of the Optimum Realizable Linear Filter. 1966 WESCON Convention, Paper № 7/1, August 23—26, 1966. 70. S η у d e r D. L. A Theory of Continuous Nonlinear Recursive-Filtering with Application of Optimum Analog Demodulation. 1966 WESCON Convention, Paper № 7/2, August 23—26, 1966. 71. Baggeroer A. B. Maximum A Posteriori Interval Estimation. 1966 WESCON Convention, Paper № 7/3, August 23—26, 1966. 72. О m u r a J. K. Signal Optimization for Additive Noise Channels with Feedback. 1966 WESCON Convention, Paper № 7/4, August 23—26, 1966. 73. S с h w e ρ ρ e F. С A Modern Systems Approach to Signal Design. 1966 WESCON Convention, Paper № 7/5, August 23—26, 1966. 74. A t h a n s M., S с h w e ρ ρ e F. С On Optimal Waveform Design Via Control Theoretic Concepts I: Formulations. MIT Lincoln Laboratory, Lexington, Massachusetts (submitted to Information and Control); On Optimal waveform Design Via Control Theoretic Concepts II: The On-Off Principle. MIT Lincoln Laboratory, Lexington, Massachusetts, JA-2789, July 5, 1966. 75. Schweppe F. C, Gray D. Radar Signal Design Subject to Simultaneous Peak and Average Power Constraints, Trans. IEEE, 1966, v. IT-12, № 1, p. 12—36. 76. Cruise T. J. Achievement of Rate-Distortion Bound Over Additive White Noise Channel Utilizing a Noiseless Feedback Channel. Proc. IEEE, 1967, v. 55, № 4 (April). 733
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсолютная ошибка 64 Адаптивные и обучающиеся системы 727 Аддитивный нормальный (гауссов) шум 293, 297, 417, 428 АИМ (дискретная AM или AT) 290 Амплитуда случайная 393, 442 АМ-ЧМ 521 Ансамбль выборочных функций 210 Асимптотика некогерентных многопозиционных систем 441 Асимптотически гауссова оценка 82 Асимптотически эффективная оценка 320 Асимптотические свойства оценок 81 — — собственных функций и собственных значений 242 Байесовские испытания 36, 145 — оценки, задачи 147 — — случайных параметров 63 — — точечные 552 Байесов риск 37 Баранкина граница 82, 153, 328 Баттачария граница 82, 154, 327, 426 Баттерворта спектры 228, 578, 622— 626 Белый шум 233 Бесселевы функции первого рода модифицированные 383, 384 Бинарная система связи, частично когерентный канал 389 Бинарное AT 418 — обнаружение простое 293 — ФТ 418 — ЧТ 418 Бинарные испытания гипотез 35, 139 — неортогональные сигналы, канал со случайной фазой, вероятность ошибки 440 — ортогональные сигналы, квадратичный приемник, релеевский канал 444 — —, N релеевских каналов 456 Биномиальное распределение 151 Биортогональные сигналы 424 Больцмана постоянная 287 Броуновское движение 231 Вектор гауссов 105 — смещения 83 — состояния 595 — средних значений (вектор-среднее) 108, 109, 115 Векторное интегральное преобразование 261 — ортогональное разложение 258, 259 — представление сигналов 209 — уравнение Винера — Хопфа 557 Векторные каналы 611 — дифференциальные уравнения 593 — случайные процессы 257, 275 — собственные функции 258 Вероятность ложной тревоги 43 , границы 129 — — —, приближенные выражения 131 — обнаружения 43 — ошибки, бинарные неортогональные сигналы, случайная фаза 440 — —, границы 129 — —, приближенные выражения 131 — —, определение 51 — —, ортогональные сигналы, равномерно распределенная фаза 438 — — по элементам 424 — — наименьшая, критерий 51 — пропуска 43 — —, границы 129 — —, приближенные выражения 132 Вычеты 600 Гауссова величина, характеристическая функц 105 — —, определение 105 — общая задача, классическая 104 — обнаружения, задачи 161 линейной оценки, задачи 164 Гауссов (нормальный) процесс 219 — —, белый шум 233 , задачи 266 — —, представление методом дискретизации (выборок) 269 — —, множество нормальных про- —цессов 222 — —, определение 219 — —, свойства 219 — —, факторизация(разложение на множители) высших моментов 266 Генерация (моделирование) коэффициентов 207 — случайных процессов 592 Гильберта преобразование 652 Гипотезы, испытания, многоальтернативная задача 57, 303 — —, общая бинарная задача 299 — — простые бинарные 35, 139 — сложные (составные) 96, 151 — фиктивные 61 Глобальная оптимальность 423 Грама—Шмидта процедура 217, 304, 420: Граница Баранкина 82, 153, 328 —Баттачарии 82, 154, 327, 426 — вероятности ложной тревоги 129 734
ошибки 129 — — пропуска 129 —, граничная матрица 411 — , граничный эллипс 93 — дополнительной функции ошибки 52, 143 — качества критерия 124, 169 — — идеального наблюдателя (идеального измерения) 99 — Крамера — Рао 76, 82, 90, 95, 318, 319 — нижняя матрицы ошибок, оценка векторного сигнала 527 — — оценки по минимуму средне- квадратической ошибки, случайный параметр 83 — — среднеквадратической ошибки оценивания сигнала 510 — ошибки, оптимальное разнесение, релеевский канал 456 — — оценивания нескольких неслучайных величин 90 — — — — случайных параметров 95 — Чернова 128 ДБП — AM 495 ДБП—AM—ПН—495 Демодуляция ДБП—ΛΜ реализуемая 647 — с задержкой 650 Детерминированная функция, ортогональное представление 206 Динамическая система, переменные состояния линейной динамической системы 591, 608 Дискретный временной процесс 727 — фильтр Кальмана 168 — — линейный оптимальный 164 Дифференциальное уравнение первого порядка векторное 593 в переменных состояния, марковские процессы 728 — —, представление (описание) линейных систем 591 — — с изменяющимися во времени коэффициентами 601, 605, 574 Дифференцирование квадратичной формы 156 Дополнительная функция ошибки 50 Допплеровский сдвиг частоты 20 Достаточная статистика 41 в гауссовой задаче 108, 109, 113 — —, геометрическая интерпретация 48 , косинусная составляющая 382 , определение 48 — — оценки 69 — —, синусная составляющая 382 Единственность оптимальных линейных фильтров 551 Задание (представление) случайного процесса во временной области 203 — — — вторыми моментами 211, 263 — в частотной области 204 — обычное 210 — полное 211 — — — частичное 211 Задержка (запаздывание), влияние на ошибку 569 —, демодуляция сигналов ДБП— AM с задержкой 650 —, линия задержки с отводами 168 —, фильтрация с задержкой (метод переменных состояния) 638 —, чувствительность к задержке 434 Замирания релеевские 394 Замкнутая форма выражений для ошибок, белый шум 574—581 , задачи 664 — — — — — , линейные операции 581 — — — — —, небелый шум 581 Измерения идеальные, вероятность ошибки в релеевском канале 399 — —, граница качества критерия 99 — параметров канала 393 Импульсная переходная матрица 606 Интегральные преобразования Фурье 252, 263, 274 — уравнения Фредгольма 359 , задачи 271, 430 — — однородные 216, 223 — — —, свойства 217 — —, решение 359 — — с разделимыми ядрами 360 — — с рациональными ядрами 359 Интервальная оценка 502 Интерференция (помеха) межсимвольная 168 — негауссова 416 — от других (мешающих) целей 368 Информация взаимная 656 — по Фишеру 90 Информационная матрица 95, 510, 527 — — результатов наблюдений 95 Информационное ядро 513, 517, 527 Испытания (критерии) байесовские 36, 145 — бесконечно чувствительные (неустойчивые) 376 — бинарные 36, 139 — гипотез 36, 139 — максимальной апостериорной вероятности 60 — минимаксные 45 — многоальтерпативные 57, 145 — Неймана — Пирсона 46 — неустойчивые (бесконечно чувствительные) 376 735
Испытания обобщенного отношения правдоподобия 102, 404 — отношения правдоподобия 39 — равномерно наиболее мощные (РНМ) 100, 404 Кальмана — Бьюси фильтры 583 Канал AT с аддитивным шумом 418 — —, N яекогерентных (с неизвестной фазой) каналов 452 , N релеевских каналов 455 — — частично (неполностью) когерентный (неполностью известная фаза) 438 —, пропускная способность 310 Каналы векторные (параллельные или разнесенные) 611 —, измерение параметров 393, 398 —, измерительные приемники 446 — когерентные, Μ ортогональных сигналов, частично'когерентные 418 — —, N частично когерентных каналов 454 — линейные с известными параметрами 376 — разнесенные (параллельные или векторные) 404, 449, 611 — райсовские 401—403, 444, 454 457 — релеевский 393—400, 455, 456 — —, вероятность ошибки при идеальном измерении 400 — — при ортогональных сигналах 399 , Μ ортогональных сигналов 442 , N каналов AT 455 .— —, N каналов с бинарными ортогональными сигналами 456 , определение 394 , РХП 398 — со случайной фазой 438, 452 —, ядра канальные 378 Карунена — Лоэва разложение 218 Качества границы и приближения 124 Квадратичная форма 156, 437 Кинеплекс 447 Классическая теория оптимального разнесения 119 оценок 62 параметров 62 Ковариационная функция 212 Ковариационно-стационарный процесс 213 Кодирование в цифровых системах связи 726 — конволюционным (цепным) кодом (сверточное) 690 Коммутативность эффективности 94 — интервальной оценки по максимуму апостериорной вероятности и линейной фильтрации 509 — оценки по минимуму среднеквад- ратической ошибки 86 Комплексные огибающие 440 Концентрации эллипсы 89, 92 — эллипсоиды 89 Координатной системы преобразование ПО Коррелированные нормальные„случайные величины, квадратичная форма 437 — сигналы, Μ одинаково коррелированных сигналов 311 Коррелятор 335, 397 Корреляционная матрица ошибок 95 — операция 208 Корреляционно-стационарный процесс 213 Корреляционный приемник 295 — — с квадратичным детектором 396 Коэффициент корреляции 209 Крамера — Рао неравенство (граница) — см. Граница Крамера — Рао и Неравенство Крамера — Рао Критерий Байеса 36, 57 — максимального ·> отношения сигнал/шум 25 — Неймана—Пирсона 36, 46 — Пей л и — Винера 586 — решения 36 Круговые сферические фунции 229 Лагранжа множители 46 Линейная модуляция 499, 542 — — в системах связи 647, 683 Линейные динамические системы 591 — каналы 434 — операции над случайными процессами 212 — оценки 351, 542 — фильтры до передачи 640 оптимальные 235, 563, 620 — — с изменяющимися во времени параметрами 235 Линия задержки с отводами 168 Ложная тревога 44 Максимальная апостериорная вероятность, вычислитель 60 —, интервальная оценка сигналов 502 — — —, критерий 60 , уравнение оценки для непрерывных сообщений 503 — — оценка 67, 73 Максимальное отношение сигнал/шум критерий 25 —, система сложения (комбинирования) 408, 636 — правдоподобие, оценка 75 Максимизация отношения сигнал/ шум 25, 263 736.
Марковский процесс 211 , метод дифференциального уравнения в переменных состояния 728 , плотность вероятности 266 Map кума Q-функции 388 Матрица граничная 411, 527 — импульсная переходная 606 — информационная 510, 527 — ковариационная 106 — —, задача с одинаковыми ковариационными матрицами 107 — ошибок, оценка векторного сигнала 527 — , обратное ядро 407, 449 — переходного состояния 604, 605 Матрица, собственные векторы 112 —, собственные значения 112 — частных производных 156 Матричное уравнение Риккати 617 Межсимвольная интерференция 168 Мерсера теорема 217 Меры ошибки 87 Метод выбеливания 332 — дискретизации (выборок), непрерывные нормальные процессы 269 — дифференциального уравнения в переменных состояния, марковские процессы 728 — неструктурный 24 — переменных состояния, вывод уравнений оценки 612 — структурный 24 Механизм вероятностного перехода 33 Минимакс, критерий 45 — рабочая точка 56 Минимальное расстояние, приемник по минимальному расстоянию 302 Многоальтернативная задача классическая 57 общая гауссова 161 Многомерные сигналы, оценка 519, 536 Многоуровневые системы модуляции 520 Модель наблюдения 608 — обнаружения сигнала 286 Модифицированные распределения (плотности) 127 — векторы состояния 640 — собственные функции 217 — функции Бесселя первого рода 383 Модуляция амплитудная двухполосная (ДБП-АМ) 22, 496, 647, 650 однополосная (ОБП—AM) 652 — амплитудно-импульсная (АИМ или AT) 18 —, индекс модуляции 519 — линейная 542, 647, 683 —, многоуровневые системы моду·' ляции 520 — нелинейная 499 — частотная 496 — частотно-импульсная (ЧИМ или ЧТ) 19 — фазовая 496 Моменты нормального процесса 266 —, метод выборочных моментов 158 —, производящая функция моментов 125 Негауссова помеха (шум) 416, 728 Нежелательные параметры 378, 435 Некогерентный прием AT 440 — —, асимптотика многопозиционных систем 441 — — — по iV каналам 452 — — — с ортогональными сигналами 454 Нелинейная модуляция 499 — оценка на фоне небелого гауссова шума 352 — —, общая гауссова классическая задача 164 — — на фоне белого гауссова шума 317 — система 655 Непрерывные нормальные процессы, метод дискретизации 269 — сигналы, оценки 23, 495, 533 — сообщения, уравнения оценок по максимуму апостериорной вероятности 503 Неприводимые многочлены (простые или элементарные дроби) 568, 599 Неравенство Буняковского—Шварца 77 — Крамера — Рао 76, 318 (см. также Граница Крамера—Рао) Нерациональные спектры 586 Нереализуемые фильтры 571 Несингулярное линейное преобразование, вектор состояния 600 Неслучайные величины, граница ошибок оценивания 90 — параметры, неравенство Крамера— Рао 76 — —, оценка 151 — сигналы, оценка 529,. 539, 670 Несмещенные оценки 74 Нестационарные процессы 231, 601 Неструктурный метод (подход) 24, 27 Неустойчивые критерии 376 Неустранимые ошибки 570 Обнаружение, вероятность обнаружения 43 — в присутствии мешающей цели 369
— в разнесенных (параллельных) каналах 36 —, иерархия (классификация) задач 18 —, качество обнаружения 49, 296 —, классическая задача 32 —, многоальтернативная задача 303 . —, модели обнаружения сигналов 286 —, общая бинарная задача 299 — простое бинарное 293 — в небелом шуме 329 — случайных процессов 656 Обобщенное отношение правдоподобия, критерий 102, 404 Обратимость 331, 428 Обратная связь, системы с обратной связью, задачи 666 — — — оптимальные 583 — — — —, реализации фильтра 584 Обучающиеся системы 168 Огибающая комплексная 440 Ограничение по порогу 325 — по ширине полосы 325 Ортогональные представления 206 — сигналы, канал с известными параметрами 306 — — N некогерентных каналов 454 — — N релеевских каналов 457 — — один из Μ сигналов 444 — — одиночный некогерентный канал 438, 441 — рейсовский канал 401 — 403, 444 — — — релеевский канал 398— 400, 442 Ортогональный полный ряд 207 Ортонормальные функции 206 Оценки (оценивание), 62, 147 — амплитуды, канал со случайной фазой 441 — асимптотически эффективные 320 — байесовские 62, 147 — времени прихода сигнала 320 — линейные 274, 351, 542 — методом переменных состояний 589 — многомерных сигналов 519 — нелинейные 164, 317, 352 — нескольких параметров 85, 156 — несмещенные 74 — по максимуму апостериорной вероятности 73, 498 — — параметра 75 — — сигнала интервальные 502 — — — точечные 545 — по максимуму правдоподобия 75 параметра 75 сигнала 529, 539 — по наименьшему среднему квадрату ошибки 510 — последовательное 150, 165, 689 — при наличии небелого шума 350, 527, 633, 643 — смещенные 152 — состоятельные 82 — частоты в канале со случайной фазой 441 — эффективные 76, 78 Ошибка абсолютная (модуль) 64 —, вероятность 49, 303, 438, 440 —, выражения в замкнутой форме, белый шум 574, 580 , задачи 664 — —, линейные операции 581 — —, небелый шум 580 — , границы среднеквадрэтической ошибки, несколько неслучайных параметров 90 , несколько случайных параметров 94 — —, неслучайный параметр 76 — —, случайный параметр 83 , оптимальное разнесение, релеевский канал 455 — интервальной оценки 510 —, корреляционная матрица 94 —, критерий минимальной вероятности 43 —, матрица, нижняя граница 527 —, мера 87 — среднеквадратическая, влияние задержки 569 — — нереализуемая 571 — — неустранимая 569 — —, представление 206 — —, приближенные выражения 206 — —, спектры -Баттерворта 578 , спектры Гаусса 580 —, функция ошибок, границы 52 — — дополнительная 49 Парсеваля теорема 207 Периодические процессы 246, 273 Плотность вероятности (распределение) априорная сопряженная 148 — — воспроизводящая 148 Коши 152 — — модифицированная 127 Раиса 454 Релея 393 — — совместная нормальных процессов 222 марковских процессов 266 -г- — —огибающей и фазы райсовс- кого канала 454 — — χ-квадрат 118 Полный ортонормальный ряд 207 Полное задание процесса 210, 211 Полюсы, метод расщепления полюсов 628, 678 738
Порог испытаний 39 —, ограничение по порогу 325 Последовательная оценка 150, 165, 689 Правдоподобие, отношение правдоподобия, 39 обобщенный критерий 102, 104 обычный 39 —, оценка по максимальному правдоподобию 75, 529, 539 —, уравнение правдоподобия 75 —, функция правдоподобия 75 Предел в среднеквадратическом 215 Предположение о гауссовости (нормальности) 546 Представление векторное 209 — методом дискретизации 269 дифференциального уравнения 590, 728 — на бесконечном интервале времени 249 — ортогональным рядом 206 —, ошибки представления 207 — полосового процесса 265 Приемник для измерения параметров канала 393 — известных сигналов на фоне белого шума в виде согласованного фильтра 296 — корреляционный 295, 302 — на фоне небелого шума 335 — по минимальному расстоянию 302 по наибольшему сигналу 303 — минимальной вероятности ошибки ' 43 — , рабочие характеристики (РХП) 49 — сигналов со случайными параметрами на фоне шума в виде сочетания устройства оценки и коррелятора 397 коррелятора и квадратора 396 фильтра и квадратора 396 — субоптимальный 419 Пропуск цели, вероятность 44 Производная сигнала по сообщению 499 Пропускная способность канала 310 Пространство выборок 210 — наблюдений 33 — параметров 63 — решений 296 Пространственно-временные системы обработки сигналов (решетки) 522 Пуассона распределение 42, 53 Пуассоновский случайный процесс 142 Рабочая точка минимаксная 56 — характеристика приемника (РХП) 49 Равномерная функция стоимости 64 Равномерно наиболее мощный критерий (РНМК) 100, 104, Радиальные сферические функции 229 Размерность пространства решений 47 — системы сигналов 420 Разнесение, общая гауссова задача 119 — оптимальное 455, 456, 457 — по поляризации 522 — пространственное 522 — райсовских каналов 457 — релеевских каналов 455 —, системы разнесения 636 — частотное 522 Рандомизация правила решения 54к 142 Распознавание образов 727 Распределение биномиальное 51 — гауссово (нормальное) 89 — Коши 152 — модифицированное 127 — Раиса 454 — Релея 393 — совместное 222 — κ-квадрат 118 Расстояние Баттачария 134 — между вектор-средними 108 Рациональные спектры 224, 560 — ядра 359 Риккати уравнение 617 Риск байесов 36 Сигналы биортогональные 424 — известные 16, 20, 22, 293 — многопозиционные 303, 420 — многомерные 520 — непрерывные 23, 495 — неслучайные 529, 539 — одинаково коррелированные 311 — оптимальные 345, 435, — ортогональные 304—311, 398— 400,401—403, 438, 441, 444,454, 455, 456 — симплексные 311, 420, 423 — случайные 17 — со случайными параметрами 378, 435 Синтез оптимального сигнала 345 — — линейного фильтра 235, 546 — приемника методом выбеливания 332 — — — достаточных статистик 342 Карунена — Лоэва 340 Сингулярность 346, 431 Системы связи аналоговые 22, 495 цифровые 15, 168, 286 739
Сложные (составные) гипотезы 96 , задачи 158 — сигналы 378 Случайная модуляционная матрица 655 Смещение, вектор смещения 87 — известное 74 — неизвестное 74 Собственные векторы матрицы 152 — значения 216 — — максимальные 245 — —, свойство монотонности 241 — функции 216 — — векторные, скалярные собственные значения 258 — — модифицированные 217 — —"скалярные с матричными собственными значениями 260 — — и собственные значения, асимптотические свойства 242 — — , решение для оптимального линейного фильтра в терминах собственных функций и собственных значений 240, 241 — — , свойства 241 Согласованный фильтр 263, 296, 386 Сопряженные априорные плотности 148 Состоятельные оценки 82 Спектры Баттерворта 228 — нерациональные 586 — рациональные 224, 560 — с ограниченной полосой 228 Стоимости (потерь) функция 36 — — в виде абсолютного значения (модуля) ошибки 64 квадрата ошибки 64 — — неубывающая 71 равномерная (простая) 64 — — симметричная и выпуклая 70, 150, 551 строго выпуклая 553 Сходимость в среднеквадратическом 215 — равномерная 217 Точечная оценка 545 — —, ошибка при точечной оценке 236 Угловая модуляция с предыскажениями 486 Условное среднее 66 Факторизация (разложение на множители) моментов высших порядков 266 Фиктивная гипотеза 61 Фильтр винеровский 556, 659 — в петле обратной связи оптимальный 583 — выбеливающий 332 — —, обратимость 331 реализуемый 558, 657, 689 — Кальмана—Бьюси 589, 670 — матричный 555 — неискажающий 533, 670 — после петли обрратной связи 585 —, приемник в виде сочетания фильтра с детектором огибающей 386 с квадратором 395 — с изменяющимися во времени параметрами 235 — согласованный 263, 296 — трансверсальный 168 Фредгольма уравнения векторные 258, 407 — второго рода 359, 364 — однородные 223 — первого рода 359, 360 — с разделяющимися ядрами 360, 367 — с рациональными ядрами 359, 360, 364 Характеристическая функция нормального процесса 222 гауссова вектора 105 Цель мешающая 368 — нефлуктуирующая 453 — флуктуирующая 455 Цифровые системы связи 15, 168, 286, 726 Частичное задание процесса 211 Частотная модуляция (ЧМ) 496 — область, задание в частотной области 204 Чернова граница 128 ЧИМ (дискретная ЧМ или ЧТ) 19 Чувствительность (устойчивость) 311, 370—376, 431, 586, 644 Шум белый 233 — небелый (коррелированный, цветной, окрашенный) 332, 336, 340, 342, 344, 346, 350, 428, 430, 527, 585, 633, 643, 682 Энергетический спектр 214 Эффективные оценки 76, 318, 511 Эллипс граничный 92 — концентрации 90, 92 Ядра информационные 513, 517, 527 — интегральных уравнений 216 — канала 378 — обратные 337, 407, 449 — разделимые 360 — рациональные 359 740
ИМЕННОЙ УКАЗАТЕЛЬ1 Абенд (Abend К·) [7—57], 727 Абрамовиц (Abramovitz M.) [2—3], 49, 118 Абрамсон (Abramson N.) [7—7], 726; [7—8], 726, 727 Акима (Akima H.) [4—88], 322 Альгази (Algazi V. R.) [4—67],'417; [7—51], 727 Амара (Amara R. C.) [6—12], 586. Артуре (Arthurs E.) [4—72], 423, 425, 440, 448 Баггерер (Baggeroer А. В.). [3—32], 228; [3—33], 228; [6—36), 625; [6—40], 638; [6—43], 644; [6—52], 657; [6—53], 580; [6—54], 657; [7—71], 728. Багдади (Baghdady Ε. J.). [4—17], 293 Байес (Bayes Τ.) [ΓΙ—1], 10 Балакришнан (Balakrishnan A. V.). [4—70], 423; [7—8], 726, 727 Балсер (Balser M.) [4—51], 393 Баранкин (Barankin E. W.) [2—15], 82, 153 Бартлетт (Bartlett M. S.) [3—28], 255 Баруча-Рид (Bharucha-Reid А. Т.) [2—2], 42 Баттачария (Bhattacharyya A.) [2— 13], 82; [2—29], 134 Баумерт (Baumert L. D.) [4—19], 293, 309 Беллман (Bellman R. E.) [2—16], 92, 93, 112; [6—30], 603 Беннетт (Bennett W. R.) [4—92], 435 Берг (Berg R. S.) [7—67], 728 Берлекемп (Berlekamp E. R.) [2—25], 124, 129 Биленски (Belenski J. D.) [7—65], 728. Бирдзол (Birdsall T. G.) [4—9], 293; [7—11], 726. Бласбелг (Blasbelg H.) [7—13], 726 Боде (Bode H. W. ) [6—3], 557 Бойд (Boyd D.) [7—49], 727 Большев Л. Η. (Bolshev L. Ν.) [2— -41*], 118 Браверман (Braverman D.) [7—8], 726, 727 Брайсон (Bryson A. E. ) [6—41], 641, 644; [6—56], 683 Брейпол (Breipohl A. M.) [7—34], 727 Бреннан (Brennan D. G.) [4—58], 401; [4—65], 408 Брокетт (Broekett R.) [6—13], 586 Буллингтон (Bullington K·) 4—52, 393 Бусганг (Bussgang J. J.) 4—82, 448; 7—12, 726; 7—20, 726 Бутон (Booton R. C.) 6—46, 651 Бьюси (Bucy R. S.) 6—23, 590, 617, 629, 646 Бэттин (Battin R. H.) [3—11], 224; [4—54], 360 •Вайнштейн Л. A. (Wainstein^L. Α.) [4—15], 293, 322, 403 Вальд (Wald A.) [7—10], 726 Ван-дер-Варден (Van der-Varden B.I.) [2—40*], 41 Ванд дер Зил (Vander Ziel A.) [3—8], 222 Ван-Метер (Van Meter) [4—10], 293 Ван Трис (Van Trees H. L.) [2—14], 82; [4—24], 327; [5—4],,505; [5—7], 510; [5—11], 527; [6—44], 645; [7—69], 728 Вейнберг (Weinberg L.) [6—38], 623 Вильяме (Williams '£.) [7—28], 726 Вильсон (Wilson L. R.) [7—39), 727 Винер (Wiener N.) [II—7], 10; [6—1J, 557, 586, 669; 6—16, 586 Винц (Wintz P. A.) [7—43], 727 Витерби (Viterbi- A. J.) [2—36], 70, 71; [4—19], 293, 309; [4—44], 382, 390, 391, 392, 439, 440; [4—69], 422, 441; [6—5], 574, [7—16], 726 Возенкрафт (Wozencraft J. M.) [4—18], 293, 322, 416, 420, 438, 444, 446; [6—48], 652; [7—2], 726 Вольф (Wolf J. K.) [4—63), 363, 405; [5—10], 523 Вольф (Wolff S. S.) [7—28]," 726 Вонг (Wong E.) [4—64], 405; [5—9], 523; [6—10], 586 Вудбери (Woodbury M. A.) [6—22], 590 Вудворд (Woodward P. M.) [4—7], 293; [4—8], 293, 322 Вэллей (Valley G. E.) [4—1], 287 *) В квадратных скобках указаны глава (или «Предисловие к английскому изданию»' — П) и порядковый номер источника; гл. 7 соответствует «Приложению Ь перевода. 741
Галлагер (Gallager R. G.) [2—25], 124, 129; [2—26], 124; [7—4], 726 Галтиери (Galtieri С. А.) [4—43], 344 Гарлиарди (Garliardi R.-M.) [7—17], 726 Гаусс (Gauss К. F.) [Π—3], 10 Гиллемин (Guillemin Ε. Α.) [6—37], 623 Гилл (Gill A.) [7—7], 726 Гильберт (Hilbert D.) [3—3], 216; [4—33], 358, 359 Гильдебранд (Hildebrand F. B.) [2—18], 92, 93, 112; [3—31], 236 Глейзер (Glaser Ε. Μ.) [7—48], 727 Гнеденко Б. В. (Gnedenko В. V.) [з 27] 255 Гоблик (Goblick Т. J.) [2—35], 138 Голомб (Golomb S. W.) [4—19], 293, 309; [7—6], 726 Гольдштейн (Goldstein Μ. Η.) [6—46], 651 Гоулд (Gould L. Α.) [6—9], 583 Грей (Gray D.) [7—75], 728 Гренандер (Grenander U.) [4—5], 293; [4—30], 340, 342 Грин (Green P. E.) [7—58], 728 Гринвуд (Greenwood J. A.) [2—4], 49 Грогински (Groginsky H. L.) [7—39], 727 Гулта (Gupta S. C.) [6—25], 591 Давенпорт (Davenport W. B.) [II—8], 11; [2—1], 42, 88; [3—1], 212, 214, 215, 216, 224, 264; [4—2], 287, 394, 431 Дарлингтон (Darlington S.) [3—12], 224; [4—62], 360; [4—87), 322 Дейвис (Davies I. L.) [4—7], 293 Дейвиссон (Davisson L. D.) [7—45], 727 Дейли (Daly R. F.) [7—31], 726 Де Руссо (DeRusso P. M.) [6—27], 591, 603, 670, 671, 674 Де Cop (DeSoer C. A.) [6—24], 591 Дидонато (DiDonato A. R.) [4—49], 388 Джарнагин (Jarnagin M.P.) 4—49, 388 Джекобе (Jacobs I. M.) [2—27], 124; [4—18), 293, 322, 416, 420, 438, 444, 446; [4—86], 457; [7—2], 726 Джековиц (Jakowitz C. V.) [7—47], 727 Джексон (Jackson J. L.) [6—4], 574 Джефф (Jaffe R.) [6—51], 656 Джонсон (Johnson R. A.) [3—23], 241 Дим (Dym H.) [4—72], 423, 425, 440, 448 Диторо (DiToro M. J. ) [7—44], 727 Долз (Doelz M.) [4—81], 447 Дольф (Dolph C. L.) [6—22], 590 Дунин-Барковский И. В. (Dunin- Barkovsky I. V.) [2—39*], 41 Дэвис (Davis M. C. ) [6—14], 586 Дюг (Dugue D.) [2—31], 76 Дюрки (Durkee A. I.) [4—52], 393 Заде (Zadeh L. A.) [3—221,224; [4—35], 360, 363; [4—36], 360; [6—24], 591; [7—7], 726; [7—8], 726, 727 Зоммерфельд (Sommerfeld A.) [2— 321 89 Зиберт (SiebertrW. M.) [4—38], 368 Зубаков В. Д. (Zubakov V. D.) [4— 15], 293, 322, 403 Зусман (Sussman S. M.) [4—90], 444 Идеи (Eden M.) [7—8], 726, 727 Йец (Yates F) [2—19], 118 Инкстер (Inkster W. J.) [4—52], 393 Йовиц (Yovits M. C.) [6—4], 574 Иогансен (Johansen D. E.) [4—50], 388; 6—41, 641, 644 Каванах (Kavanaugh R. J.) [6—15], 586] Кадота (Kadota T.T.) [4—45], 344 Кайзер Kaiser J. F.) [6—9], 583 Кайлат (Kailath T.) [3—35], 273; [4 — 32], 342; [7 — 8], 726, 727; [7_60], 728 Кальман (Kalman R. E.) [2—38], 167; (6—23], 590, 617, 629, 646 Кан (Cahn С R.) [4—73], 426; [6—5], 574 Канефски (Kanefsky M.) [7—27], 726; [7—30], 726 Келли (Kelly E. J.) [3—24], 258, 262;-[4—311,340, 342 Кендал (Kendall M. . G.) [2—11], 74, 155; [7—24], 726 Кендал (Kendall W.) [7—19], 726 Клоуз (Giose С. М.) [6—27], 591, 603, 670, 671, 674 Коддингтон (Coddington E. A.) [6— 29], 603 Коллинз (Collins L. D.) [4—74], 428; [4—79), 441; [4—91], 429; [6—42], 641; [6—43], 644; [6—53], 580 Колмогоров A. H.iKolmogoroff A.N). [П—6], 10; [6—2], 557 Корбато (Corbato F. J.) [3—19], 230 Костас (Costas J. P.) [6—50], 654 Котельников В. A. (Kotelnikov V. Α.) [4—12], 293; [4—13], 293, 322, 328 Коулз (Coles W. J.) [6—35], 617
Кошман (Koschmann Α. Η.) [7—34), 727 Кракауер (Krakauer С. S.) [7—168], 728 Крамер (Cramer H.) [2—9], 74, 76, 82, 89, 152 Круиз (Cruise T. J.) [7—63], 728; [7—76], 728 Курант (Courant R.) [3—3], 216; [4—33], 358, 359 Kypu (Kurz L.) [7—32], 726; [7—53], 727 .Ландау (Landau H. J.) [3—16], 229, 231; [3—17], 229, 231; [4—71], 423 Лаки (Lucky R. W.' ) [7—36], 727 Левин (Levin J. J.) [6—32], 617, 619 Левинсон (Levinson N.) [6—29], 603 Лежандр (Legendre A. M.) [II—2], 10 Леман (Lehmann E. L.) [2-Й, 102; [7—25], 726 Ленинг (Laning J.) H. [3—11], 224; [4—54], 360 Лернер (Lerner R. M.) [4—67], 417; [7—8], 726, 727; [7—51], 727; [7—54], 727; [7—66], 728 Ли (Lee H. C.) [6—19], 586 Ли (Lee R. C.) [7—40), 727 Линде (Leondes С. Т.) [6—17], 586 Линдсей (Lindsey W. C.) [4—85], 494; [4—89], 457; [6—8], 620 Литтл (Little J. D.) [3—19], 230 Ловитт (Lovitt W. V.) [3—5), 216; [4—34], 358 Лоусон (Lawson J. L.) [4—6], 293 Лоутон (Lawton J. G.) [5—2], 505; [5—3), 505; [7—35], 727 Лоэв (Loeve M.) [3—26], 218; [3—30], 218 Маккракен (McCracken L. G.) [6— 18], 586 'Маклаклан (McLachlan N. W.)[6—31] 617 Макникол (McNicol R. W. Ε ) [5—57], 401 Маллинкродт (Mallinckrodt A. J.) [4—25], 328 Маркум (Marcum J.) [4—46], 388, 453; [4—48], 388 Маркус (Marcus Μ. Β.) [7—14], 726; [7—20], 726 Мартин (Martin D.) [4—81], 447 Массани (Massani P.) [6—16], 586 Массе (Massey J.) [7—8], 726, 727 Мейджилл (Magill D. T.) [7—37], 727 'Мейзонсон (Masonson M.) [4—55], 398 Миддлтон (Middleton D.) [3—2], 211; [4—10]; 293; [4—47], 293, 360, 435; [7— lis], 726; [7—39], 727; [7-42], 727; [7-55], 727 Миллард (Millard J. B.) [7—32],726 Миллер (Miller K. S.) [4—36], 360 Могаджери (Mohajeri M.) [4—29], 327; [6—20], 666 Морзе (Morse P. M.) [3—19], 230 Муллен (Mullen J. A.) [7—42], 727 Мэнас (Manasse R.) [4—26], Э28 Мюллер (Mueller G. E.) [7—8], 726, 727 Наги (Nagy B.) [3—4], 216 Найквист (Nyquist H.) [4—4], 290 Нейман (Neyman J.) [II—5], 10 Никольс (Nichols Μ. Η.) [5—8], 521 Нолт (Nolte L. W.) [7—41], 727 Норт (North D. O.) [3—34], 2£4; [4—20], 296 Ньютон (Newton G. C.) [6—9], 583 Омура (Omura J. K.) [7—59], 727 Остин (Austin M.) [7—9], 727 Пагурова В. И. (Pagurova V. I.) [2—42*], 118 Папулис (Papoulis A.) [3—29], 214; [6—55], 658, 659 Парцен (Parzen E.) [3—20], 231; [4—40], 344 Пирс (Pierce J. W.) [2—22], 123; [4— 80], 443 Пирсон (Pearson E. S.) [II—5], 10 Пирсон (Pearson K.) [2—21], 118; [2—37], 157 Питерсон (Peterson W. W.) [4—9], 293; [7—5], 626; [7—8], 726; [7— 11], 626 Поллак (Pollak H. O.) [3—15], 229, 231, 272; [3—16], 229, 231; [3—17] 229 230 231 Прайс (Price R.)[4—59], 401; [7—7], 726; [7—8], 726, 727 Проакис (Proakis J. G.) [4—61], 403; [4—83], 448 Рагазини (Ragazzini J. R.) [3—22], 224; [4—35], 360, 363 Райе (Rice S. O.) [3-7], 222; [4-60], 401 Pao (Rao С R.) [2—12], 76 Payx (Rauch L.L.) [5—5], 505; [5—6], 505; [5—8], 521 Рейд (Reid W. T.) [6—33], 617; [6— 34], 617 Рейффен (Reiffen B.) [4—68], 417; [7—52], 727 Ректин (Rechtin E.) [6—51], 656 Рид (Reed I. S.) [4—31], 340, 342; [7—17], 726; [7—19), 726; [7—21], 726
Рисе (RieszF.) [3—4], 216 Рой (Roy R. J.) [6—27], 591, 603, 670, 671, 674 Розенблат (Rosenblatt F.) [3—21], 231 Рут (Root W. L.) [II—8J, 11; [2—1],~\ 42, 88; [3—1], 212, 214, 215, 216, 224, 264; [3—24], 258, 262; [4—2], 287, 394, 431; [4—31], 340, 342; [4_42], 373 Севидж (Savage I. R.)[7—26], 726 Селин (Seliπ I.) [7—21], 726; [7—22], 726 Силверман (Silverman R. A.) [4—51], 393 Скол ник (Skolnik M.I.) [4—27], 328 Скудер (Scoudder H. J.) [7—46], 727; [7—50], 727 Слепян (Slepian D.) [3—9), 224; 229; [3—15], 229, 231, 272; [4—11], 293; [4—71], 423; [7—8], 726, 727 Смирнов Η. Β. (Smirnov Ν. V.) [2— 39*], 41; [2—41*], 118 Снайдер (Snyder D. L.) [6—6], 574; [6—21], 584; [6—39], 666; [7—70], 728 Солленбергер (Sollenberger Т. Е.) [4—25], 328 Стегун (Stegun I. A.) [2—3], 49, 118 Стейн (Stein S.) [4—76], 436, 437; [4 92] 435 Стиффер '(Stiffer J. J.) [4—19], 293, 309 , Стрэттон (Stratton J. A.) [3—19], 230 Стюарт (Stuart A.) [2—11], 74, 155 Томас (Thomas J. B.) [4—64], 405; [5—9], 523; [6—10], 586; [6—45), 651; [7—28], 726; [7—38), 727 Трикоми (Tricomi F. G.). [3—6], 216 Турин (Turin G. L.) [4—56], 398, 401, 402, 403; [4—78], 441; [7—8], 726, 727; [7—15], 727; [7—64), 728 Уайт (White G. M.) [7—47], 727 Уивер (Weaver С S.) [4—22], 310 Уилкс (Wilks S. S, ) [2—10], 74 Уленбек (Uhlenbeck G. E.) [4—6], 293 Уолмен (Wallman H.) [4—1], 287 Урбано (Urbano R. H.) [4—21], 308 Фальб (Falb P. L.) [6—26], 591 Фано (Fano R. M.) [2—24], 124; [4—66], 416; [7-3], 726 Фараон (Faraone J. N.) [7—56), 727 Фейгенбаум (Feigenbaum E. A.) [7—8],726, 727 Феллер (Feller W.) [2—30], 52; [2— 33], 131 Фелдман (Feldman J. R.) [7—56], 727 Филипс (Philips M. L.) [4—58], 401 Фишер (Fisher R. A.) [II—4], 10;l [2—5], 74; [2—6], 74, 76; [2—7], 74; [2—8], 74; [2-19], 118 Флэммер (Flammer C.) [3—18], 22& Фокс (Fox W. C.) [4—9], 293; [7—11], 726 Фразье (Frazier M.) [6—56], 6831 Фрейзер (Fraser D. A. S.) [7—23], 726 Фридленд (Friedland B.) [6—28],, 591, 603 Хаан (Hahn P.) [4—84], 457 Харман (Harman W. W.) [4— 16L, 293 ч Хартли (Hartley H. O.) 12—4), 49 Хейджек (Hajek J.) [4—41], 3441 Хелстром (Helstrom С Ε.) [3—Ι3], 224; [3—14], 224; [4—3], 363;' [4—14], 293, 358, 404, 452; [4—77],' 440; ^[6—57], 574; [7—18], 7261 Хенрич (Henrich С. J.) [5—3], 505) Хилд (Heald Ε.) [4—82], 448 Хорстейн (Horstein Μ.) [7—62], 728' Xoy (Ho Y. С.) [7—40], 727 Хси (Hsieh Η. С.) [6—17], 586 Хуанг (Huang R. Υ.) [3—23], 241 Чанг (Chang Т. Т.) [5—3], 505 Чернов (Chernoff Η.) [2—28], 124, 128 Чу (Chu L. J.) [3-19], 230 Шварц (Schwartz Μ.) [4—92], 435; [6—49], 652 ι Шварц (Schwartz R.J.) [6—28], 591, 603 · Швепп (Schweppe F.) [7—73], 728; [7—74], 728; [7—75], 728 Шверлинг (Swerling P.) [4—28], 328* [4—53], 393; [7—7), 726; [7—14], 726 Шелквик (Schalkwijk J. P.M.) [7—· 60], 728; [7—61], 728 Шеннон (Shannon С. Е.) [2—23]; 124; [2—25], 129; [4—22], 310; [4—23], 310; [6-3], 557 Шерман (Sherman Η.) [4—68], 417; [7—52], 727 Шерман (Sherman S.) [2—20], 70 Штиглиц (Steiglitz К.) [7—38], 727 Шу (Shuey R. L.) [7—47], 727- Экр (Ekre Й.) [7—29], 726 -Злиас (Elias P.) [7-7], 726 Эрдели (Erdelyi A.) [4—75], 453 Эспозито (Esposito R.) [7—42], 727 Эстерлинг (Easterling M. F.) [4—19], 293, 309 Юдкин (Yudkin H. L.) [2^-34], 138; [4—39], 342 Юла (Youla D.) [3-10], 224; [4-37]> 360; [5-1], 503; [6—11], 586 '