Текст
                    Ф И 3 И К О-
Математическая
Библиотек а
И нженер а
А. А. СВЕШНИКОВ
ПРИКЛАДНЫЕ МЕТОДЫ
ТЕОРИИ
СЛУЧАЙНЫХ ФУНКЦИЙ
ИЗДАНИЕ ВТОРОЕ,
ПЕРЕРАБОТАННОЕ И ДОПОЛНЕННОН
ИЗДАТЕЛЬСТВО «НАУКА>
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 196*


517.8 С 24 УДК 519.2 Прикладные методы, теории случайных функций, Свешников А. А., издание 2-е, переработанное и дополненное. Главн. ред. физ.-матем. лит. изд-ва «Наука», 1968. Систематически изложены основные положения теории случайных функций, находящие применение в различных приложениях. Дается корреляционная теория случайных процессов, а также основы теории марковских процессов и их применение к ряду типичных задач: определению вероятности невыхода ординат случайной функции за -«пределы данной области, среднего числа выбросов за данный уровень, длительность которых превышает заданную, и др. Большое внимание уделено определению вероятностных характеристик динамических систем, на вход которых поступают случайные функции с известными характеристиками. Помимо динамических систем, описываемых обыкновенными дифференциальными уравнениями, исследуются также системы, характеризуемые дифференциальными уравнениями в частных производных (системы с распределенными параметрами). Рассматривается определение передаточной функции линейной системы, обеспечивающей минимум дисперсии ошибки при заданных характеристиках полезного сигнала и помехи. Излагаются теоретические основы и наиболее рациональные практические приемы обработки реализаций случайных процессов. В книге используется только математический аппарат, входящий в общий курс математики, а содержание иллюстрируется большим числом примеров, представляющих интерес для ряда приложений. Библ. — 58 назв. 2-2-3
ОГЛАВЛЕНИЕ Предисловие 6 Глава 1. Общие свойства случайных функций 9 § 1. Теория случайных функций как раздел теории вероятностей 9 § 2. Основные обозначения и формулы теории вероятностей .... 10 § 3. Законы распределения и моменты случайной функции 18 § 4. Типичные задачи, решаемые с помощью теории случайных функций 20 § 5. Свойства корреляционной функции 29 . § 6. Дифференцирование и интегрирование случайных функций ... 34 § 7. Действие линейного оператора на случайную функцию 46 § 8. Система случайных функций. Взаимная корреляционная функция 59 § 9. Задачи о выбросах: среднее число выбросов случайной функции за данный уровень, средняя длительность выброса . . . . 65 Глава II. Спектральная теория стационарных случайных функций 82 § 10. Спектральное разложение стационарных случайных функций 82 § 11. Примеры вычисления спектральной плотности стационарного случайного процесса 95 § 12. Спектральная плотность линейной комбинации стационарной случайной функции и ее производных. Стационарное решение дифференциального уравнения с постоянными коэффициентами 101 § 13. Примеры нахождения спектральных плотностей и корреляционных функций в более сложных случаях ПО § 14. Определение корреляционной функции решения неоднородного дифференциального уравнения с постоянными коэффициентами при нестационарной правой части 122 § 15. Линейное дифференциальное уравнение с переменными коэффициентами 129 § 16. Вероятностные характеристики решений системы линейных уравнений ••• • 133 Глава Ш. Метод огибающих . . 149 § 17. Идея метода огибающих и вывод общих формул 149 § 18. Применение метода огибающих в случае узкополосного спектра 164
4 ОГЛАВЛЕНИЕ Глава IV. Определение оптимальных линейных динамических систем 180 § 19. Постановка задачи определения оптимальных динамических систем 180 § 20. Общее решение задачи определения оптимальной динамической системы, осуществляющей операцию сглаживания, экстраполирования и дифференцирования 194 § 21. Расчетные формулы для определения оптимальной передаточной функции динамической системы в случае дробно-рациональных спектральных плотностей сигнала и помехи 205 § 22. Расчетные формулы для оптимальной передаточной функции динамической системы с запаздыванием 211 § 23. Оптимальное сглаживание, упреждение и дифференцирование при конечном времени наблюдения 215 § 24. Примеры нахождения оптимальных динамических систем при конечном времени наблюдения 227 § 25. Простейшие нестационарные задачи 233 § 26. Оптимальные многоканальные динамические системы 242 Глава V. Основы теории марковских процессов 245 § 27. Определение и общие свойства марковских процессов 245 § 28. Уравнения Колмогорова 250 § 29. Решение уравнений Колмогорова для простейших случаев. . . 260 § 30. Определение вероятности достижения границ и закона распределения времени пребывания случайной функции вне заданной области 267 § 31. Многомерные марковские процессы 285 § 32. Замена реальных процессов марковскими 300 Глава VI. Нелинейные методы теории случайных функций 306 § 33. Особенности исследования нелинейных динамических систем 306 § 34. Определение закона распределения случайной функции на выходе линейной части системы 310 § 35. Приводимые нелинейные системы • 322 § 36. Примеры приводимых нелинейных систем 333 § 37. Нелинейные системы с обратной связью 341 § 38. Метод статистической линеаризации 352 § 39. Применение теории марковских процессов к исследованию нелинейных систем 360 Глава VII. Экспериментальные методы определения характеристик случайных функций . 368 § 40. Общие принципы нахождения оценок. Оценка математического ожидания 368 § 41. Оценка корреляционной функции • • • . . 382
ОГЛАВЛЕНИЕ 5 § 42. Оценка спектральной плотности 40! § 43. Оценка закона распределения ординаты стационарною процесса 413 Глава VIII. Некоторые дополнительные вопросы теории случайных функций 422 § 44. Случайные последовательности . . . . • 422 § 45. Случайные функции нескольких переменных (случайные поля) 429 § 4$. Вычисление вероятностных характеристик динамических систем с непрерывно распределенными параметрами . 443 § 47. Канонические разложения случайных функций 453 Литература 458
ПРЕДИСЛОВИЕ Предлагаемая книга ставит перед собой задачу помочь широкому кругу инженеров и научных работников, использующих методы теории вероятности, овладеть прикладными методами теории случайных функций. Поэтому целый ряд вопросов, интересных с общетеоретической точки зрения, оставлен без внимания, а математическая строгость изложения учтена только в той мере, в какой это необходимо для сознательного применения теории к различным прикладным задачам По этой же причине в книге используется только тот математический аппарат, который изучается в общем курсе высшей математики высших технических учебных заведений. Общий курс теории вероятностей предполагается известным читателю, однако для удобства чтения в начале книги приводится общая сводка формул теории вероятностей, используемых в дальнейшем. Для облегчения усвоения содержания книги все основные положения теории иллюстрируются примерами, которые могут представлять и самостоятельный интерес в различных прикладных задачах (в книге рассмотрено около 100 примеров). Таким образом, целевая направленность книги не отличается от целевой направленности первого издания «Прикладных методов теории случайных функций», выпущенного в свет в 1961 году «Судпром- гизом». При переработке книги, помимо устранения всех замеченных недостатков и погрешностей, ее содержание было существенно дополнено. Во-первых, в книгу введено рассмотрение ряда новых вопросов. Добавлена глава о марковских процессах, глава о нелинейных задачах теории случайных функций, существенно дополнена глава .об экспериментальных методах определения вероятностных характеристик случайных функций. В других главах также внесено рассмотрение ряда новых вопросов: расширен параграф о случайных полях, рассмотрены некоторые нестационарные задачи теории оптимальных линейных систем, рассмотрены системы с непрерывно распределенными параметрами и др. Во-вторых, подбор примеров, число которых во втором издании значительно увеличено, производился так, чтобы по возможности
ПРЕДИСЛОВИЕ 7 охватить широкий круг задач, связанных с теорией автоматического регулирования, оценкой точности различных динамических систем и тому подобными задачами, возникающими в технике. Для того чтобы содержание примеров сделать интересным для широкого круга инженерно-технических работников, примеры, как правило, не формулируются как решение узкой задачи специального раздела техники (электроники, радиотехники и т. д.). Формулировка примеров в большинстве случаев имеет достаточно общий характер, а их прикладное содержание определяется существом решаемой задачи и методами ее решения. Книга не содержит библиографии по теории случайных функций, а в списке литературы, приложенном в конце книги указаны только источники, обращение к которым поможет читателю получить более подробные сведения по отдельным вопросам прикладной теории случайных функций, не получившим в книге достаточно подробного освещения. Исходя из основного назначения книги, в список литературы сознательно не включены книги по теории случайных функций, написанные для математиков и трактующие этот раздел теории вероятностей как абстрактную математическую дисциплину. Также сведены к минимуму ссылки на оригинальные работы, хотя в списке и указаны источники, содержащие достаточно подробную библиографию по теории случайных функций. Первые четыре главы книги посвящены в основном вопросам корреляционной теории случайных процессов. Особое внимание при этом уделено методам спектральной теории, поскольку они находят особенно широкое применение в технике, в частности, при исследовании линейных систем автоматического регулирования. Определение оптимальных динамических систем, рассмотренное в четвертой главе, производится также в рамках корреляционной теории, т. е. рассматриваются только линейные системы, а в качестве критерия оптимальности принято требование обращения в минимум дисперсии ошибки системы. Глава пятая посвящена рассмотрению основных вопросов теории марковских процессов, представляющих существенный интерес для приложений, поскольку ряд интересных для практики вопросов, не поддающихся простому решению для случайных процессов общего вида, легко могут быть решены, если предположить, что процесс является марковским. С другой стороны, для того чтобы считать процесс марковским, достаточно допустить, что процесс является нормальным и имеет дробнорациональную спектральную плотность, т. е. не требуется дополнительных допущений сравнительно с теми, которые обычно делаются в технике. Поэтому теория марковских процессов, существенно упрощая решение ряда задач, может найти широкое применение в приложениях.
8 ПРЕДИСЛОВИЕ В шестой главе рассматриваются методы исследования нелинейных динамических систем, а в седьмой главе изложены основные вопросы статистики случайных процессов. Рассматривается получение вероятностных характеристик оценок, исследуется вопрос о применении критериев согласия к статистическим законам распределения ординат случайных процессов. Наконец, в последней, восьмой, главе кратко рассмотрены вопросы, которые также представляют интерес для приложений, но более подробное рассмотрение которых оказалось невозможным в данной книге: случайные последовательности, случайные поля» системы с распределенными параметрами и др. Предлагаемая книга может оказаться полезной как инженерно- техническим работникам, сталкивающимся с необходимостью исследования случайных процессов при решении различных практических и теоретических задач, так и студентам старших курсов втузов ряда специальностей. Автор выражает благодарность всем лицам, приславшим свои замечания по первому изданию книги и особенно благодарен сотрудникам Лаборатории статистических методов исследования МГУ, давшим ряд замечаний по рукописи второго издания, которые автор стремился учесть при окончательном редактировании текста книги. А А Свешников
ГЛАВА I ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ § 1. Теория случайных функций как раздел теории вероятностей Теория вероятностей возникла и первое время развивалась как наука о вычислении вероятностей появления различных случайных событий на основании предположений о механизме их возникновения или данных опыта. В таком именно виде основы теории вероятностей были заложены в XVII веке (трудами Паскаля, Ферма и Гюйгенса), а к началу XVIII века, после установления Я. Бернулли первой предельной теоремы, теория вероятностей получила известное логическое завершение. Первое время такое содержание теории вероятностей удовлетворяло потребности науки и практики. Однако примерно с середины XIX в, наука и техника поставили перед теорией вероятностей ряд новых задач, решение которых уже не могло быть получено на базе исчисления вероятностей случайных событий. Кроме рассмотрения случайных событий, возникла настоятельная необходимость в изучении явлений, характер которых определялся не фактом появления или непоявления того или иного случайного события, а зависел от некоторых величин, могущих принимать случайные значения, что имеет место, например, при различных измерениях. Таким образом, в теории вероятностей возник новый объект исследования — случайные величины. Понятие случайной величины является в известном смысле обобщением понятия случайного события, так как с каждым случайным событием можно сопоставить случайную величину, принимающую значение 1, когда это событие имеет место, и 0 — в противоположном случае. Следовательно, все результаты, которые могут быть получены в схеме случайных событий, также могут быть получены и в схеме случайных величин. Однако понятие случайной величины более содержательно, чем понятие случайного события. Долгое время все практически интересные задачи, возникающие при исследовании случайных явлений, полностью укладывались в схему
10 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. ! случайных величин. Исключение, собственно говоря, представляло только одно явление, открытое еще в 1827 г. английским ботаником Р. Броуном и заключающееся в том, что легкие частицы, взвешенные в жидкости, совершают беспорядочные движения. Как было выяснено значительно позднее, причина броуновского движения заключается в хаотическом движении молекул жидкости, случайные удары которых заставляют взвешенную в жидкости частицу описывать случайные траектории. Для исследования процессов, аналогичных броуновскому движению, потребовался новый математический аппарат, дающий возможность количественного анализа не случайных величин, а случайных функций. Число технических задач, требующих для своего решения привлечения аппарата теории случайных функций, особенно возросло в последнее время с развитием систем автоматического регулирования и управления. Поэтому естественно, что теория случайных функций, возникновение которой относится к XX в., в настоящее время является одним из наиболее быстро развивающихся разделов теории вероятностей. Таким образом, развитие теории вероятностей с момента ее возникновения характеризуется не только усовершенствованием вычислительных методов этой науки, но и расширением объектов ее исследования. Начав с изучения случайных событий, теория вероятностей перешла к изучению случайных величин, а затем — к изучению случайных функций. При этом каждое новое расширение объекта исследования, наряду с использованием старых методов, потребовало разработки и применения новых методов, специфических только для данного случая. § 2. Основные обозначения и формулы теории вероятностей Для удобства чтения основного текста книги представляется целесообразным условиться об обозначениях и дать краткую сводку основных формул теории вероятностей, используемых в дальнейшем. Вывод этих формул, а также содержание основных понятий теории вероятностей предполагается известным читателю в объеме, например, [41, [7] или [16]. Будем обозначать случайные величины по возможности большими буквами латинского алфавита, стоящими в конце алфавита, например: X У, W, V и т. д. Возможные значения случайных величин, или значения, полученные в результате опыта, будем обозначать соответствующими малыми буквами, т е. х, у, w, v и т. д. Для полной характеристики случайной величины необходимо задать ее закон распределения. Интегральный закон распределения, или функцию распределения, т. е. вероятность того, что рассматриваемая случайная величина имеет
§ 2] ОСНОВНЫЕ ОБОЗНАЧЕНИЯ И ФОРМУЛЫ I 1 значение меньше заданного, мы будем обозначать буквой F, т. е. положим, например, B.1) Так как нам придется иметь дело с законами распределения ряда случайных величин, то будем условно считать, что вид функции распределения определяется аргументом у функции F. Таким образом, F (x), F (у), F(z) означают не одну и ту же функциональную зависимость, в которой произведена замена аргумента, а функции распределения случайных величин X, У и Z соответственно, которые могут иметь совершенно различные математические выражения. Функция распределения пригодна как для характеристики непрерывных случайных величин, так и для характеристики дискретных величин, т. е. таких, которые могут принимать только определенные числовые значения. В дальнейшем будут использованы в основном непрерывные случайные величины*), которые удобнее характеризовать плотностью распределения вероятности (иногда говорят просто «плотность распределения» или «дифференциальный закон распределения»), являющейся производной от соответствующей функции распределения. Для обозначения плотности вероятности всюду будет использована буква f, причем так же, как для функции распределения, аргумент у функции f будет условно обозначать и вид этой функции. Таким образом, в соответствии с введенными обозначениями B.2) Исключения из принятых выше обозначений мы будем делать только тогда, когда они могут привести к недоразумению. В этих случаях функции F и / мы будем снабжать индексами, указывающими, к какой случайной величине относится данный закон распределения. Так, например, Fx(y) и fx(y) будут обозначать функцию распределения и плотность вероятности случайной величины X, взятые при аргументе у. Совокупность нескольких случайных величин, или, как говорят в теории вероятностей, система случайных величин может быть охарактеризована или многомерной функцией распределения (например, F(x,y, z) = P { Х<^х; У<^у; Z<^z\ для системы случайных величин X, Y} Z), или — для непрерывных величин — многомерной *) Как известно из общего курса теории вероятностей (см., например, [7]), непрерывной случайной величиной называется такая случайная величина X, для которой существует неотрицательная функция f(x), удовлетворяющая х при любом х равенству F (х) = \ f (xt) dxt.
12 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I плотностью вероятности (f(x, у, z) в данном примере). Если случайные величины независимы, то плотность вероятности системы распадается на произведение плотностей вероятности отдельных случайных величин, например B.3) Если между случайными величинами имеется зависимость, то плотность вероятности системы нельзя представить в виде произведения плотностей вероятности отдельных случайных величин, и формулы типа C)*) не будут справедливы. Если одна или несколько зависимых случайных величин, входящих в систему, заданы, то закон распределения остальных величин системы меняется. Плотность вероятности в этом случае будем обозначать по-прежнему буквой /, указывая в качестве аргументов значения случайных величин, оставшихся неопределенными, и отмечая справа от вертикальной черты те величины, значения которых заданы. Например, если из трех случайных величин X, У, V задана V=vy то условная плотность вероятности величин X и К будет обозначена f(x,y\ V = v) или просто f(x, y\v). Как известно из курса теории вероятностей, условная плотность вероятности f(x \y) определяется формулой B-4) где для получения плотности вероятности f{y) достаточно проинтегрировать f{x,y) по аргументу х /00 = $ f{x,y)dx. B.6) — 00 Понятие условной плотности вероятности имеет смысл и в том случае, когда часть случайных величин, входящих в систему, предполагается зафиксированной, однако значения этих величин считаются случайными. В этом случае условная плотность вероятности будет зависеть от случайной величины, и, следовательно (при фиксированных значениях своих аргументов), будет случайной величиной. Формулы типа D) по-прежнему остаются в силе, однако зафиксированные случайные величины, в соответствии с принятыми обозначениями, в этом случае мы будем обозначать большими буквами (так, в формуле D) вместо у будем писать У). Вместо законов распределения случайных величин во многих задачах достаточно указать только «моменты» случайных величин, т. е. *) В книге при ссылке на формулы того же параграфа первая цифра, обозначающая номер параграфа, опускается.
§21 ОСНОВНЫЕ ОБОЗНАЧЕНИЯ И ФОРМУЛЫ 13 математические ожидания соответствующих степеней случайных величин (начальные моменты) или степеней отклонения случайной величины от ее математического ожидания (центральные моменты), т. е. величины, определяемые равенствами mt = М [X1], ц, = М [(X — m{f\ B.6) Для характеристики свойств одной случайной величины наиболее важными являются моменты первого и второго порядка, т. е. величины Ш\ и ть определяемые равенствами mt = M [X]f тъ = М [X2], B.7) где М обозначает операцию нахождения математического ожидания. Наряду с моментом /я2 часто рассматривается второй центральный момент, т. е. величина ^ = М[(Х-тгП B.8) Первый начальный и второй центральный моменты соответственно называются математическим ожиданием и дисперсией случайной величины*' Математическое ожидание случайной величины мы будем обозначать малой буквой, соответствующей обозначению случайной величины, с чертой сверху, а дисперсию или буквой D, указывая в скобках, о дисперсии какой величины идет речь, или о3, снабжая в случае возможной путаницы букву о (обозначение среднего квадра- тического отклонения) индексом, указывающим, к какой величине относится эта дисперсия. Таким образом, например, для случайной величины X будем иметь Х = тх = М[Х1 B.9) D [X] = о^ = p3 = М [(X - Я)*). B.10) Полезно заметить, что между дисперсией и вторым начальным моментом т<ь существует соотношение a% = mz — Z\ . B.11) являющееся частным случаем (при /=2) соотношения между центральным моментом \l1 порядка / и начальными моментами mk (A = = 1, 2, ..., /): i «*' = 2 щ/%1(-1)к *k m^ BЛ 2) о Для системы случайных величин, помимо дисперсии и математического ожидания каждой величины, первостепенное значение для характеристики системы имеют корреляционные моменты случайных величин, или математические ожидания произведений отклонений случайных величин от их математических ожиданий, которые мы будем
14 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. ! обозначать буквами k, снабжая их индексами, указывающими, между какими величинами находится корреляционный момент. Например, если имеется система п случайных величин Хь ЛГо,/..., Хю то корреляционные моменты определятся формулой kn = M \{Xj - JCj) (Хг - хг)\ /, /= 1, 2, ..., л. B.13) Очевидно, что при / = / формула A3) обращается в выражение для дисперсии. Совокупность всех чисел kjt при /, /=rl, 2, ..., п, можно представить в виде матрицы !|ft/f||, которая называется корреляционной матрицей. Если плотность распределения случайной величины задана, то вычисление моментов этой величины сводится к вычислению определенных интегралов. Например, оо Х = 5 xf(x)dx, B.14) о% = $ (х — X)* f(x) dx, B.1 б) —00 где предполагается, что соответствующие интегралы существуют (для существования математического ожидания X необходимо, чтобы интеграл A4) сходился абсолютно, т. е. чтобы существовал интеграл I \x\f(x)dx). —со Аналогично вычисляются и моменты для системы случайных величин, однако порядок интегрирования повышается. Например, для корреляционного момента случайных величин X и У имеем Ьх,*=1Ъ(* — *)(У —У)/(*, У)dxdy. B.16) —ОО Кроме функции распределения или плотности вероятности, исчерпывающей характеристикой случайной величины или системы случайных величин является характеристическая функция, определяемая равенствами: для одной случайной величины eiax —00 ? (и) = М [*'«*]« \ eiaxf{x)dx> B.17) для системы случайных величин Б(их, иь .„, ия)=М[ехр(/ п 55— J «жр С* Е ujXj)f{Xi, Xp ...^n)dxidxi...dxm B.18) —во /-Г
§ 2) ОСНОВНЫЕ ОБОЗНАЧЕНИЯ И ФОРМУЛЫ 15 где иь иъ ...) ип — вспомогательные (неслучайные) вещественные параметры, а представление математических ожиданий в виде интегралов написано для непрерывных случайных величин. Удобство применения характеристических функций связано с тем, что все моменты\ случайных величин (если они существуют) могут быть получены из (характеристической функции путем дифференцирования. Ряд выкладОк проще выполнять, пользуясь не плотностями вероятности, а характеристическими функциями, зная которые всегда можно найти нлотнбсти вероятности случайных величин, применив обратное преобразование Фурье. Например: e~iltxE{n)du, B.19) 21 B.20) Приведем несколько формул, которые будут использованы в дальнейшем. Начальный момент т1 случайной величины X определяется равенством и, = М[*']=-^?(я) в-о. B.21) Смешанный начальный момент rnjji...i системы случайных величин Хь Хь ..., Хп определяется равенством *) d>l*J,+-+Jn B.22) *) Формулы B1) и B2) имеют место только в том случае, если соответствующие моменты существуют, т. е. И-Л \x{*x]?...xbi\f(Xu *2, •••, xn)dxt dx2 ... dxa<co. - 00 Если Я/ = 0 G=1, 2, ..., n), то B1) я B2) определяют соответствующие .центральные моменты.
16 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Характеристическая функция системы независимых случайных величин равна произведению характеристических функций этих величин, взятых со своими аргументами. Например, если X и У—независимые случайные величины, то характеристическая функция системы В (щ, щ) = Ех («О By (и,), B.23) где индексы х и у поставлены для того, чтобы отметить, к какой случайной величине относится эта характеристическая функция. Для нахождения характеристической функции суммы независимых случайных величин достаточно перемножить характеристические функции слагаемых, взятые при одинаковом аргументе. Так, например, если Z = X+Y, B.24) а Л' и К независимы, то характеристическая функция ЕЛп)=шЕх(*)Еу(цу. B.25) Обращение последней формулы по Фурье дает для плотности вероятности суммы Z выражение /Л*)- f fA*-y)fy(y)dy. B.26) —00 Формула B6) показывает, что плотность распределения суммы независимых случайных величин является «сверткой» плотностей распределения слагаемых. Эта формула может быть выведена и без использования B5). Для нахождения характеристической функции подсистемы случайных величин достаточно в характеристической функции системы лишние переменные uj заменить нулями. Например, если дана система случайных величин Х%, Х^ Х& то характеристическая функция подсистемы, состоящей из двух случайных величин Хх и Хь определится равенством В(иь и$ш*В{щ, иь 0). B.27) Из законов распределения непрерывных случайных величин наиболее распространенным является нормальный закон распределения. Если система случайных величин Х\, Хь ..., Хп подчиняется нормальному закону, то характеристическая функция системы определяется равенством Е{иХ) иь ..., иЛ) и *=* Формула B8) показывает, что в том случае, когда все корреляционные моменты kji (элементы корреляционной матрицы с различ-
§21 ОСНОВНЫЕ ОБОЗНАЧЕНИЯ И ФОРМУЛЫ 17 ными индексами) равны нулю, то Е {иь иь ..., ип) распадается на произведение характеристических функций, и, следовательно, если нормальные случайные величины не коррелированы, то они и независимы (в общем случае это утверждение перестает быть верным). Преобразование, по Фурье B8) дает для я-мерного нормального закона распределения формулу хп)= v * ехр[— 1 v ехр[— 1 B.29) где Д — определитель корреляционной матрицы \\kjt\\, a AJt — алгебраическое дополнение элемента kjt этого определителя. В частном случае одной случайной величины (л=1) B8) и B9) упрощаются и принимают вид -*•*¦ + * B.30) B.31) где о3 — дисперсия X. Для функции распределения в этом случае: B.32) где 44~~^ B.33) — интегральная функция Лапласа (интеграл вероятности). Если две случайные величины Y и X связаны функциональной зависимостью B.34) то характеристическая функция Еу(и) случайной величины Y может быть выражена через плотность вероятности случайной величины X по формуле \ е**М*/х(х)Aх. B.35) Обращение последней формулы по Фурье дает для плотности вероятности случайной величины Y со оо B.36)
I 8 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Переменив в последнем равенстве порядок интегрирования, можно доказать, что в том случае, когда функция о(х) монотонна, B.37) Из законов распределения дискретных случайных величин в приложениях наиболее часто встречается закон Пуассона, согласно которому вероятность того, что случайная величина X примет значение, равное т (т — целое число), определяется формулой Рт=^ е~а, B*38) где ~ К Я f"V"l _ ГЧ Г \ГЛ /Г) QQ\ и IVI [Л. J === LI [у\ J» {Z,Os3j § 3. Законы распределения и моменты случайной функции Будем называть случайной функцией X(t) такую функцию своего аргумента, значение которой при любом значении t является случайной величиной. Аргумент t будем считать величиной неслучайной. Во многих практически интересных задачах роль аргумента случайной функции играет время. Поэтому мы в дальнейшем переменную t условно будем называть временем. При исследовании случайных функций приходится различать два случая: а) аргумент случайной функции t может принимать любые значения в заданном интервале (конечном или бесконечном); б) аргумент случайной функции может принимать только определенные дискретные значения. В первом случае X(f) обычно называют случайным процессом, во втором — случайной последовательностью. Особенности, связанные с изучением случайных последовательностей, будут рассмотрены в гл. VIII, в остальных же главах под случайной функцией мы будем понимать случайный процесс, не всегда оговаривая это специально. Также всюду в дальнейшем случайные функции мы будем считать непрерывными функциями своего аргумента, т. е. будем считать, что за малые промежутки времени ордината процесса может получить заметное приращение только с малой вероятностью. Процесс X(t) называется непрерывным по вероятности, если при любом s (s ^> 0) НтР- Наряду с понятием непрерывности процесса по вероятности часто используется понятие непрерывности процесса в среднеквадратиче- ском (см. § 6).
ЗАКОНЫ РАСПРЕДЕЛЕНИЯ И МОМЕНТЫ 19 Случайные процессы возникают во многих задачах, имеющих непосредственный практический интерес. Например, текущие координаты цели, определяемые радиолокатором, вследствие неизбежных ошибок измерение являются случайными функциями непрерывного времени. Также случайными функциями времени являются: ордината поверхности моря в1 данной точке, текущие значения углов качки корабля на волнении и т. п. Не менее часты примеры, когда аргументом случайной функции является не время, а другой непрерывный параметр. Примерами таких случайных функций могут служить: ордината волнового профиля поверхности моря для фиксированного момента времени как функция координаты точки моря, скорость ветра над заданной точкой земной поверхности как функция высоты рассматриваемой точки и т. п. Для всех приведенных примеров характерно, что при фиксированных значениях аргументов значения соответствующих функций являются случайными величинами, т. е. все они — случайные функции. Рассмотрим случайную функцию X(t) и предположим, что для ее исследования произведено п независимых опытов. В каждом опыте будет получена определенная функциональная зависимость или, как принято говорить в теории случайных функций, реализация случайной функции X (t). Условимся обозначать реализации случайных функций соответствующими малыми буквами, отмечая индексом номер опыта Следовательно, в нашем случае мы получим п реализаций ¦МО. -МО. ••¦> -МО» (зл) представляющих пучок кривых, в какой-то степени характеризующих свойства случайной функции X(f). Действительно, например, пучки Рис. I. реализаций, изображенные на рис. 1 — 3, показывают, что три случайные функции, соответствующие этим реализациям, обладают весьма различными свойствами. В то время как пучок реализаций на рис. 1 позволяет предполагать, что свойства случайной функции являются в том или ином
20 ОБШИБ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ !ГЛ. смысле слова устойчивыми во времени, на рис. 2 и 3 подобной устойчивости не наблюдается. Однако подобно тому как статистический ряд, получаемый в результате серии опытов для определения свойств случайной величины, только приближенно характеризует эту величину, так и пучок реализаций случайной функции может характеризовать ее свойства только с той или иной степенью приближения. Прежде чем установить рациональные методы обработки реализаций случайной Рис# 2* функции для получения ее характеристик, рассмотрим один из теоретических способов задания этой функции. Зафиксируем значение аргумента случайной функции t, положив, например, t = tt. C.2) Очевидно, что если бы нас интересовало значение случайной функции только в момент времени tl9 то достаточно было бы задать закон распределения случайной величины C.3) о Рис. 3. Будем считать Хх непрерывной случайной величиной и обозначим ее плотность вероятности f(xx\tx)> где tx за чертой обозначает, что речь идет о плотности вероятности ординат случайной функции в момент времени tt. Во многих задачах знание плот- ' ности вероятности f(xt | tx) является достаточным. Например, если X(t) дает величину отклонения управляемого снаряда от требуемой траектории, то, выбрав в качестве tt время полета снаряда до цели, с помощью плотности вероятности f(xx | tx) мы получаем возможность характеризовать закон отклонения снаряда от цели. Однако плотность вероятности f(xx \ tx) не может служить полной характеристикой случайной функции, поскольку она никак не отражает взаимную зависимость ординат случайной функции. Для получения более детальной характеристики случайной функции выберем два значения аргумента: tx и t%. Соответствующие им ординаты X(tx) и будут случайными величинами Хх и X* которые полностью могут
§3] ЗАКОНЫ РАСПРЕДЕЛЕНИЯ И МОМЕНТЫ 21 быть охарактеризованы соответствующей двумерной плотностью вероятности f(xb лг21 th ti), где ti и t4 указывают моменты времени,, для которых взяты ординаты случайной функции. Выбрав для аргумента t три значения th ?2 и ?8 и указав соответствующую трехмерную плотность вероятности f(xb х^, xs \ tl9 tv tb), мы получим еще более подробную характеристику случайной функции. Этот процесс можно продолжать и далее, вводя четырехмерные, пятимерные и т. д. законы распределения *). Случайную функцию будем считать заданной, если заданы все многомерные законы распределения для любых значений tlt tb..., tn из области изменения аргумента t Хотя, как это мы увидим ниже, во многих случаях может быть указан простой способ построения многомерных законов распределения, рассмотренный способ определения случайной функции не всегда удобен вследствие своей громоздкости. Поэтому вместо самих многомерных законов распределения в большинстве случаев ограничиваются заданием соответствующих числовых параметров этих законов, подобно тому как в теории случайных величии часто вместо закона распределения этих величин указывают соответствующим образом выбранные параметры этих законов. В качестве таких параметров можно выбрать различные величины, однако наиболее удобными являются начальные fnjji99mj (или центральные fyva.,./ ) моменты различных порядков, т. е. математические ожидания произведений соответствующих степеней ординат случайной функции, определяемые равенствами . ln = М lxh ft)xh ft) • • • Х'я (<я)Ь . Jn = M {[X ft) - MX ft)]* [* ft) - MX ft)]/.... C.4) (n=l9 % 3,...), где порядком момента называется сумма показателей степеней Из бесконечного числа моментов наиболее важными с точки зрения характеристики случайной функции являются моменты первого и второго порядка. Момент первого порядка, определяемый в соответствии с D) формулой C.5) *) Эти законы распределения иногда называют законами распределение первого, второго и т. д. порядка.
22 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. 1 является математическим ожиданием ординаты случайной функции в произвольный момент времени. Так как это математическое ожидание, вообше ! своря, зависит от выбранного значения ih ю для дальнейшею мм будем обозначать его соответствующей малой буквой с чертой сверху, отмечая явно функциональную зависимость от f, т. е в нашем случае положим x(t)=M[X(t)]f C.6) где индекс 1 у t опущен. Функция x(f) уже не является случайной и в соответствии с понятием математического ожидания полностью определяется одномерной плотностью вероятности: *(*)=» \ xf(x\t)dx. C.7) — ОО Начальные моменты второго порядка могут быть двух типов, моменты второго порядка одной из ординат случайной функции, определяемые в соответствии с D) формулой C.8) и смешанные моменты второго порядка C.9) Очевидно, момент т± зависит от одного аргумента tb а смешанный начальный момент тц — от двух аргументов tx и ?2. Вместо начальных моментов чаще применяют центральные моменты второго порядка, определяемые равенствами D \Х{Щ = М {{X(t) -х(t)]% (ЗЛО) К (th U) = М {[X (*,) - X (h)] [X (h) - X (Щ}. C.11) Как ясно из определения, D[X(f)] является дисперсией случайной величины X (t)> a K(ti, (?) — корреляционным моментом случайных величин A^j) и X{t^ Функцию К (tlf t*) в теории случайных функций называют корреляционной функцией или, иногда, автокорреляционной функцией. В соответствии с известными соотношениями между начальными и центральными моментами второго порядка имеем C.12) «1.1 = *(* *) + *(*) *(*)
§ 8] ЗАКОНЫ РАСПРЕДЕЛЕНИЯ И МОМЕНТЫ 23 Записывая в A0) и A1) явное выражение для математического ожидания, для дисперсии D[X@] и корреляционной функции K{th t,), получим оо D{X(l)}= J [x — x(t)]lf(x\t)dx, C.14) — ОО со K(tu *0= Ц[х1 — Х(^)][х^ — Х(^]/(хь xi\tu tjdxtdxb C.15) т. е. из рассмотренных моментов только корреляционная функция зависит от двумерного закона распределения. Раздел теории случайных функций, оперирующий только с моментами первых двух порядков, носит название корреляционной теории случайных функций. Как мы увидим в дальнейшем, многие технические задачи могут быть решены в рамках корреляционной теории, изложение которой будет занимать основную часть этой книги. В заключение данного параграфа установим классификацию случайных функций, отражающую некоторые общие их свойства. Наиболее важным свойством случайной функции, определяющим возможность применения особых методов исследования, является зависимость или независимость свойств случайной функции от начала отсчета времени. В соответствии с этим различают стационарные и нестационарные случайные функции. Для случайных функций первого типа все многомерные законы распределения зависят только от взаимного расположения моментов времени tb t.2, tZi...y tnt но не от самих значений этих величин. Иными словами, для стационарности случайной функции при любом п должно выполняться соотношение f(xh хь..., xn\th tb ..., tn) = — f(xh xb...t Xniti + to, *з+ *<>•••> *« + *o). C.16) где t0 — любое число В частом случае при п=\ и я = 2, полагая to = —th для стационарных функций будем иметь C.17) f(xb xAth t,) = т. е. одномерный закон распределения ординаты случайной функции не зависит от момента времени, для которого эта ордината выбрана, а двумерный закон распределения зависит только от разности моментов времени, для которых выбраны ординаты случайной функции.
24 общие свойства случайных функций [гл. i Подставив A7) и A8) в G), A4) и A5), определяющие математическое ожидание, дисперсию и корреляционную функцию случайной функции X(t), получим со x(t) = \ xf(x)dx = const, C.19) — 00 00 D[X(t)]= J (x — Xff{x)dx = const, C.20) ~°° C.21) т. е. математическое ожидание и дисперсия стационарной случайной функции являются постоянными, а корреляционная функция зависит только от разности моментов времени t% — tv Легко убедиться, что соотношения A9), B0) и B1), будучи необходимыми условиями для стационарности функций, не являются условиями достаточными, так как они могут быть выполнены, но условия A6) могут не выполняться, и, следовательно, функция будет нестационарной. Однако, учитывая, что во многих случаях ограничиваются применением корреляционной теории случайных функций, целесообразно несколько расширить понятие стационарности, приняв A9), B0) и B1) за основу определения стационарности. Такое определение стационарности, предложенное впервые А. Я- Хинчиным, носит название стационарности в широком смысле. Согласно вышеизложенному случайная функция X(t) называется стационарной в широком смысле, если ее математическое ожидание и дисперсия постоянны, а корреляционная функция зависит только от разности моментов времени, для которых взяты ординаты случайной функции. (Напомним еще раз, что рассмотрение t в качестве времени носит условный характер, поскольку аргумент случайной функции может иметь и другую физическую природу.) Вторым признаком, который может быть также положен в основу классификации случайных функций, является вид законов распределения ординат случайной функции. Наиболее часто встречающимся законом распределения является 'нормальный закон (закон Гаусса). Кроме того, наличие нормального закона распределения для ординат случайной функции позволяет применить некоторые специальные методы расчета, которые неприменимы в других случаях. Поэтому целесообразно выделить клаас случайных функций, ординаты которых подчиняются нормальному закону распределения. Такие функции мы будем называть нормальными. Исследование нормальных случайных функций существенно облегчается тем, что для определения закона распределения сиаемы
$3) ЗАКОНЫ РАСПРЕДЕЛЕНИЯ И МОМЕНТЫ _ 25 нормальных величин достаточно знать только их математические ожидания и их вторые моменты. Поэтому для нахождения законов распределения ординат нормальной случайной функции любого числа измерений нужно располагать значением математического ожидания ординаты случайной функции для любого момента времени t и значением корреляционного момента любых двух ординат случайной функции, взятых в произвольные моменты tt и tb т. е. достаточно знать математическое ожидание x(t) и корреляционную функцию K(jth t^ Таким образом, исчерпывающей характеристикой нормального случайного процесса является его математическое ожидание и корреляционная функция. Рассмотрим нормальную случайную функцию, стационарную в широком смысле. Выберем п произвольных моментов времени ti9 ил fa..., tn. Вследствие нормальности случайной функции полученная система случайных величин будет также нормальной и, следовательно, ее закон распределения полностью определится значениями математических ожиданий этих случайных величин и корреляционной матрицей, элементы которой — tj). Так как математическое ожидание постоянно, а элементы корреляционной матрицы зависят только от разностей моментов времени tj — tv то закон распределения случайной функции, стационарной в широком смысле, оказывается независимым от начала отсчета времени. Таким образом, для нормальных случайных функций понятие стационарности в широком и узком смысле совпадают. Особый интерес для приложений представляют случайные функции, закон распределения ординат которых в будущий момент времени полностью определяется значением ординаты процесса в настоящий момент времени и не зависит от значений ординат процесса в предыдущие моменты времени. Такие случайные функции называются марковскими, по имени А А Маркова, впервые рассмотревшего последовательности такого типа. Более четкое определение марковского процесса будет дано в главе V; здесь же отметим только, что двумерные функции распределения процессов такого типа определяются уравнениями общего вида, нахождение коэффициентов которых обычно не связано с большими трудностями. Поэтому решение ряда задач, представляющих существенные трудности для процессов общего вида, для марковских сводится к решению дифференциальных (или интегро-диффе- ренциальных) уравнений, что хотя и может в отдельных случаях представлять чисто вычислительные трудности, не связано с принципиальными затруднениями. Свойства стационарности (или нестационарности) процесса, вид закона распределения его ординат, а также принадлежность процесса
26 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. I к классу марковских случайных процессов, являются независимыми. Поэтому, например, стационарная функция может быть нормальной или не быть нормальной (быть гауссовской или не быть гауссовской); марковская случайная функция может быть как стационарной, так и нестационарной и т. д. Например, координата броуновской частицы, движущейся в жид- костк имеющей постоянную температуру, является нормальной не- стационарьой функцией времени немарковского типа, в то время как составляющая скорости этой частицы является нормальной стационарной функцией времени марковского типа. Действительно, движение частицы описывается дифференциальным уравнением второго порядка, не содержащим слагаемого, соответствующего восстанавливающей силе Поэтому для определения закона распределения координаты частицы в будущий момент времени недостаточно знать положение частицы в начальный момент времени, а нужно знать и скорость частицы в этот момент, т. е. координата частицы не является марковским случайным процессом. Составляющая же скорости частицы удовлетворяет дифференциальному уравнению первого порядка; закон ее распределения в будущий момент времени однозначно определяется значением составляющей скорости в начальный момент времени, и следовательно, процесс является марковским. § 4. Типичные задачи, решаемые с помощью теории случайных функций Прежде чем переходить к систематическому изложению основных положений теории случайных функций, целесообразно рассмотреть несколько типов задач, решение которых требует привлечения теории случайных функций, чтобы выяснить тот круг вопросов, которые имеют непосредственный практический интерес. Практически интересные задачи, требующие привлечения аппарата случайных функций, могут быть разбиты на три основные группы. К первой группе можно отнести задачи, в которых по известным свойствам случайных функций требуется определить те или иные вероятностные характеристики процесса, представляющие непосредственный интерес в данном вопросе. В качестве наиболее простой задачи подобного типа можно привести определение дисперсии ординаты случайной функции в заданный момент времени, к которому, например, сводится определение добавочного рассеивания начальных скоростей снаряда при стрельбе с качающегося судна. Более сложной является задача определения вероятности того, что ордината случайной функции в заданный момент времени не выйдет за пределы некоторого интервала. К решению этой задачи, например, сводится определение вероятности попадания в цель управляемого снаряда.
§ *, ТИПИЧНЫЕ ЗАДАЧИ 27 В то время как для решения задачи о добавочном рассеивании скоростей снаряда достаточно располагать результатами корреляционной теории случайных функций, для решения задачи определения вероятности попадания в цель необходимо знать закон распределения ординаты процесса в данный момент. Наконец, еще более сложной задачей является определение вероятности того, что случайная функция в течение заданного интервала изменения своего аргумента не выйдет за определенные пределы. Эта задача о «выбросах случайной функции» за заданный уровень будет рассмотрена далее более подробно. Здесь же мы только отметим, что для ее решения уже недостаточно знать одномерный закон распределения ординат случайной функции. К задачам первого тина относятся также задачи определения вероятностных характеристик ординат случайной функции в определенный момент времени при условии, что в какие-то другие моменты времени эти ординаты имели заданные значения. К задаче такого типа,, например, сводится исследование различных типов упредителей залпз при стрельбе с качающегося судна. Для всех перечисленных выше задач характерно, что для их решения- необходимо располагать теми или иными вероятностными характеристиками случайных функций, причем для решения простейших из них достаточно знать только моменты второго порядка случайной функции, в то время как для решения задачи о выбросах необходимо иметь более подробную информацию о свойствах случайной, функции. Ко второй группе относятся задачи, связанные с определением вероятностных характеристик случайных функций по экспериментальным данным. Наиболее часто встречающейся задачей этого типа, как мы увидим в гл. VII, является определение корреляционной- функции по реализациям случайной функции. Иногда может возникнуть задача определения соответствующих законов распределения для ординат случайной функции. При решении задач этого типа используют обычные приемы обработки опытного материала, излагаемые в теории случайных величин, однако в данном случае возникают некоторые специфические особенности, связанные с наличием зависимости между ординатами реализаций случайных функций. Наконец, к третьей группе следует отнести задачи, связанные с определением вероятностных свойств случайных функций, получаемых путем применения к известным случайным функциям (случайным функциям с известными вероятностными характеристиками) определенных математических операций. Задачи подобного типа весьма распространены в технике, так как исследование поведения различных динамических систем (систем автоматического регулирования и т. п.) обычно сводится к определению вероятностных характеристик случайных функций, получаемых на «выходе» системы по вероятностным характе-
2b ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I ристикам случайных функций, поступающим на «вход» системы, и динамическим свойствам самой системы. С точки зрения математической, задачи этого типа обычно сводятся к определению свойств решения системы дифференциальных уравнений, в которые наряду с неслучайными коэффициентами и функциями времени входят случайные функции, характеристики которых предполагаются известными. Задачи третьего типа весьма разнообразны как вследствие различных свойств рассматриваемых динамических систем, так и вследствие того, что в некоторых случаях свойства таких систем предполагаются заданными; в других же случаях задача как раз и состоит в том, чтобы так определить свойства , системы (обычно свойства закона регулирования), чтобы получить результат, оптимальный в том или ином смысле слова. Например, при определении поведения судна на нерегулярном волнении (при вероятностном расчете качки корабля) геометрические и механические свойства судна обычно предполагаются заданными. Наоборот, при проектировании различных систем успокоителей качки возникает задача о выборе закона управления оптимальным образом. Аналогичную картину мы наблюдаем и при исследовании поведения других систем автоматического регулирования. К задачам, требующим определения свойств динамической системы, относятся, в частности, задачи об оптимальном экстраполировании и фильтрации случайных функций, которые будут разобраны далее. Большинство задач третьего типа решается в рамках корреляционной теории, так как для их решения обычно требуется только определение дисперсий соответствующих случайных функций. В некоторых же задачах интерес представляет и определение закона распределения случайной функции, получающейся на выходе динамической системы. Решение таких задач, как правило, представляет <5блыыие сложности, чем решение первых. Итак, разделы теории случайных функций, представляющие непосредственно практический интерес, должны содержать изложение методов, позволяющих по соответствующим вероятностным характеристикам случайных функций определять вероятностные характеристики тех или иных случайных явлений, связанных с наличием этих случайных функций, давать методы определения вероятностных характеристик случайных функций по их реализациям и, наконец, находить воздействие случайных функций на различные динамические системы или с целью определения поведения заданной динамической системы, или в целях выбора оптимальных параметров этой системы. Для решения этих вопросов необходимо прежде всего установить некоторые общие свойства случайных функций, к рассмотрению которых мы и перейдем.
§б] СВОЙСТВА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 29 § 5. Свойства корреляционной функции В предыдущих параграфах, хотя это и не было сказано явно, мы предполагали, что случайная функция X (t) при вещественных значениях аргумента имеет вещественные ординаты. При решении многих задач можно упростить расчет, вводя в рассмотрение случайные функции, ординаты которых при вещественном t являются комплексными величинами. Данное выше определение корреляционной функции как второго смешанного центрального момента случайных величин X(t{) и X{to) целесообразно изменить таким образом, чтобы при tx = t<i получилось вещественное значение корреляционной функции, аналогичное дисперсии вещественной случайной величины. Пусть X(t) при вещественном t (а только такие случаи мы и будем рассматривать) имеет комплексные значения. Тогда, отделяя вещественную и мнимую части, можно написать E.1) где U(f) и V(t)— вещественные случайные функции, ординаты которых могут быть как независимыми, так и зависимыми случайными величинами. Находя математическое ожидание обеих частей равенства A) и пользуясь при этом теоремой о математическом ожидании суммы, получим *(О = Я0) + Й(О, E.2) где й@ = М [U(f)]> v(t) = M[V(t)\. E.3) Определим теперь корреляционную функцию X(f) как второй смешанный центральный момент случайных величин X*(tt) и X(t%), где звездочкой отмечена комплексно сопряженная величина, т. е. положим *) K(tx> U) = М {[X* (to - я* (to] [X fa) — х (Щ. E.4) Для вещественной случайной функции это определение совпадает с определением, данным ранее. При ^ = 12 формула D) дает вещественное выражение, так как под знаком математического ожидания будет стоять произведение комплексно сопряженных величин, дающее квадрат модуля разности X(tO — Jc(^i), т. е. K(tb to = M{\X(to-х(toП F.5) *) Иногда корреляционную функцию определяют как второй смешанный центральный момент X(tt) и X*(t2). В этом случае корреляционная функция будет сопряженной с D).
3U ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. 1 Выражение D) при различных значениях tx и ?а, вообще говоря, не будет вещественным. Действительно, подставляя вместо X(tt) и X(t2) их выражения из A), отделяя вещественную и мнимую части под знаком математического ожидания и применяя теорему о математическом ожидании суммы, будем иметь К fa, у = М {[Ufa) - п fa)) [Ufa) - а (Щ + + ( V fa) - * fa)) [ Vfa) - vfa)}} - iM {[Vfa) - v fa))[Ufa) - Ufa)) - - [ Vfa) - v fa)) [Ufa) - п fa)]}. E.6) Очевидно, что мнимая часть полученного выражения обращается в нуль при любых значениях tY и ?2 только в том случае, когда функции U{t) и V(t) удовлетворяют некоторым специальным условиям. Поясним сказанное примером. Пример 5.1. Пусть где а — неслучайный вещественный параметр, а Л — комплексная случайная величина, математическое ожидание которой равно нулю. Покажем, что в этом случае корреляционная функция X{t) будет комплексной. Действительно, в соответствии с D), учитывая, что имеем К fa, *0— М sin X(f, — т. е. комплексное выражение. Итак, будем исходить при определении корреляционной функции из D) и установим несколько основных свойств, которым должна удовлетворять корреляционная функция любой случайной функции X(t). Свойство 1. Переставив аргументы tx и ?2 в D), переставляя одновременно порядок множителей под знаком математического ожидания, получим К fa, tl) = M{\Xfa)-Xfa)] [*•&)-*•(«]}. F.7) Правая часть G) является выражением, комплексно сопряженным с правой частью D) и, следовательно, K(tbtd = Km(tht^ E.8) т. е. перестановка аргументов у корреляционной функции дает выражение, комплексно сопряженное с исходным.
§5] СВОЙСТВА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 31 В частном случае вещественной случайной функции, когда корреляционная функция, естественно, также будет вещественным выражением, вместо (8) получим )i E.9) т. е. корреляционная функция вещественной случайной функции является симметричной функцией своих аргументов. Свойство 2. Рассмотрим выражение I Vk ft, и) [х ft) - x ft)] ± VK(tl9 u) [x (t,) - x (щ\\ которое, естественно, является вещественным и никогда не может быть отрицательным. Математическое ожидание этого выражения также не может быть отрицательным и, следовательно, можно записать* м {| Vk ft, и) [х ft) — z (ад ± Vk ft, tt) [x &) — x ft)] Г} ^ o. Раскрывая под знаком математического ожидания скобки и пользуясь теоремой о математическом ожидании суммы, получим 2 VK{thtx)K(tbu) ± \к (*„ *о + ^ (U, h)] ^ о, т. е. ;«Ks | Re *(*„*,) |, E.10) где символом Re /Сft, ^)> как обычно, обозначена вещественная часть комплексного выражения /С ft, ^) Так как для любых вещественных а и b справедливо неравенство \Ь, то К (th tJ+KiU, ^K*2 K/Cft, ^) /С ft, ^)» и на основании A0) получим К ft, *0 + /С (^ fe) ^ 2 | Re К ft, *,) |. E.11) Если слз'-чайная функция вещественная, то неравенство A0) можно переписать в виде )\. E.12) Можно доказать, что последнее неравенство сохраняет силу и для комплексных случайных функций (см. вывод формулы (8.9), из которой при X (t)=Y(t) следует A2)). Наличие неравенства A2) позволяет вместо размерной корреляционной функции ввести безразмерную нормированную корреляционную функцию ft, U) = *d.'t) =r EЛ 3) модуль которой не превосходит 1. Если случайная функция X (t) вещественная, то — 1 k(
32 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Свойство 3. Рассматривая математическое ожидание квадрата ь модуля интеграла $[ЯЧ0— X(t)]fi(t)dty где ?](*) — произвольная (не- а случайная) функция, а пределы интегрирования — заданные числа, можно установить следующее неравенство, вывод которого будет дан в § б после установления понятия интеграла от случайной функции (см. пример 6.4): ь ь \ J *)* ft) ij (U) К ft, к) dtt dU S* 0. F.14) a a Неравенство A4) накладывает определенные ограничения на вид корреляционной функции и может быть использовано для проверки пригодности замены /Cft>^) различными аппроксимирующими выражениями. Полученные три свойства корреляционной функции справедливы для любых случайных функций. Если случайная функция обладает стационарностью (в широком смысле), то эти свойства приобретают более простой вид вследствие того, что корреляционная функция является функцией одного аргумента x = tf2 — tt. Действительно, учитывая это замечание, перечисленные выше свойства можно переписать в виде: Свойство 1. /f(t) = /f»(_t) E.15) или, для вещественных функций, просто /С(т) = К(-т), F.16) т. е. К(?) — функция четная. Свойство 2. |Re/C(<c)| E.17) или, на основании A2), более сильное неравенство *|*(t)|, E.18) т. е. ординаты вещественной корреляционной функции по модулю не больше дисперсии случайной функции. Свойство 3. ъь \ \ Ч* ft) Ч ft)*ft - h) dtx dt%Zz0. E.19) aa Соотношения A6) и A8) показывают, что для вещественной случайной функции корреляционная функция будет четной функцией своего аргумента, у которой начальная ордината имеет наибольшее
§51 СВОЙСТВА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ гз значение. На знак корреляционной функции при tt Ф t2 общие ее свойства не накладывают никакого ограничения. В приложениях случайные функции обычно возникают вследствие непрерывного воздействия на динамическую систему различных случайных факторов. Поэтому при достаточно большом значении К(Т) интервала времени х==^ — tx отклонение ординаты случайной функции от ее математического ожидания в момент времени ?2 становится практически независимым от значения этого отклонения в момент времени tv, В этом случае функция /C(t), дающая значение корреляционного момента между X(t2) и X (ti)> ПРЙ \х\—>°° будет стремиться к нулю. Поэтому /С(т) может или монотонно убывать, как это изображено на рис. 4, или стремиться к нулю по более сложному закону, нигде, однако, не превосходя по модулю К@), например, как это представлено на рис. 5. Функция вида (рис. 4) может быть аппроксимирована, например, выражением или выражением /С(т)^о9е-«Г«, E.21) а функция вида (рис. 5) — выражением /C(T)^cV-a'^cospT E.22) или выражением К(т)я^о-?~ а?т2 cos р,т. E.23) Рис. 5. В заключение отметим, что добавление к случайной функции неслучайной величины или неслучайной функции не изменяет значения корреляционной функции. Действительно, пусть Y(t) = X (t) -f 9 @> E-24) где X (t) — случайная функция, имеющая корреляционную функцию Kx(ti>td> а <р(?) — неслучайная (или, как иногда говорят, «детерминированная») функция. Найдем корреляционную функцию K/tv Q. В соответствии с определением корреляционной функции имеем Ку(th у = М 2 А. А. Свешников — 13CS К* E.25)
3,4 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Заменяя в этом выражении Y{t) через X (?) + <? (О по B4) и замечая, что в соответствии с теоремой о математическом ожидании суммы .Р (9 = ¦*(*) + ?(*)> E.26) получим Ку (th U) = М {[X* (tj - х* &)] [X fo) - х (У]} = /С* &, *2). E.27) Положим ?(*) = —¦*(*)• E.28) Тогда функция К (О = Х (*) — *(*), E.29) имеющая нулевое математическое ожидание, будет обладать той же корреляционной функцией, что и X (t). Следовательно, при выводе общих свойств корреляционных функций без нарушения общности можно считать математическое ожидание случайной функции равным нулю. Этим обстоятельством мы широко будем пользоваться в дальнейшем для сокращения выкладок. § 6. Дифференцирование и интегрирование случайных функций Введем понятие производной от случайной функции. Условимся под пределом последовательности случайных функций (и случайных величин) понимать такую случайную функцию (величину), второй начальный момент разности между которой и элементами последовательности при определенных условиях стремится к нулю. Предел в указанном выше смысле слова называется пределом в среднем квад- ратическом. Для его обозначения вместо символа lim употребляют символ 1. i. m. (см., например, [33]). В данной книге предел случайной последовательности понимается только в смысле среднего квад- ратического и для его обозначения используется обычный символ lim, как это часто делается для простоты (см., например, [44]). Такое определение предела, являющееся наиболее удобным с точки зрения дальнейшего изложения, согласуется с практическим пониманием предела, поскольку на основании теоремы Чебышева можно утверждать, что большие отклонения ординат случайной функции от функции, рассматриваемой в качестве ее предела, могут быть сделаны сколь угодно маловероятными. Будем говорить, что случайный процесс X (t) дифференцируем в точке t} если для любой сходящейся к нулю последовательности чисел ех, е3, е3> ••• последовательность случайных величин б
§6] ДИФФЕРЕНЦИРОВАНИЕ И ИНТЕГРИРОВАНИЕ 35 сходится к одной и той же случайной величине, которую мы в этом случае будем называть производной процесса X(t) в точке t и обозначать ^Р или X'(t). Установим условия, при которых случайная функция имеет производную. Очевидно, для этого прежде всего необходимо, чтобы функция X(t) была непрерывна*). Легко убедиться, что функция X(t) будет непрерывной, если непрерывна ее корреляционная функция относительно своих аргументов. Действительно, так как М {|( +) @П ( + + + @ -K(t + A,t)-K(t,t + M F.2) то из непрерывности K(tbt^ следует, что F.3) т, е. случайная функция X(f) непрерывна. В частном случае стационарной функции для непрерывности X(t) достаточно, чтобы функция /С(т) была непрерывной при ? = 0. Однако непрерывности случайной функции еще недостаточно для ее дифференцируемости, так как необходимо еще существование предела выражения A). Возьмем два независимых приращения Ai и Д> и рассмотрим отношения В соответствии с условием дифференцируемости процесса при независимом стремлении к нулю Aj и А>2 отношения D) должны иметь одинаковые пределы, т. е. разность этих отношений должна иметь предел, равный нулю. Следовательно, должно выполняться условие {\Х^^Х^Х^^Х^\H. F.5) *) В соответствии с данным выше определением предела функцию X(t) мы будем считать непрерывной, если lim М {| X (t + A) —X(t) | *} «О.
36 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ 1ГЛ. I Применяя основные теоремы о математическом ожидании, получим -*(*,* +ДО]. F.6) Выражение, стоящее справа, не содержит никаких случайных величин или функций и поэтому предельный переход при Дх —¦ 0 и д2 —> о может быть выполнен обычным для анализа путем. Считая, что частные производные дК?и'ш) Щ 011 б 12 существуют, после несложных преобразований будем иметь lim М \ I х 1 f = Полученный результат позволяет сделать весьма важный для приложений теории случайных функций вывод: для того чтобы случайная функция имела производную, достаточно существования второй смешанной частной производной от корреляционной функции при равных значениях ее аргументов. Для стационарных случайных функций K(tvU) = К (h - h) = K(x) FЯ) и, следовательно, («Л) dtx dt3 Поэтому, для того чтобы стационарная случайная функция была дифференцируема, достаточно существование второй частной производной от корреляционной функции К(*) при нулевом значении ее аргумента. Непрерывные случайные функции, не имеющие производных, довольно часто встречаются в приложениях. Подобные функции возникают, например, в тех случаях, когда ордината случайной функции получается в результате суммирования бесконечно большого числа бесконечно малых взаимно независимых приращений. Для пояснения
§ 61 ДИФФЕРЕНЦИРОВАНИЕ И ИНТЕГРИРОВАНИЕ 37 такого механизма возникновения недифференцируемой случайной функции предположим, что случайная функция получает в определенные моменты времени независимые случайные приращения Ар обладающие нулевыми математическими ожиданиями и равными дисперсиями а3. Примем, что скачки функции происходят через равные интервалы времени, причем на единицу времени приходится v скачков. Примем, кроме того, число v настолько большим, чтобы даже для весьма малого интервала времени \t число скачков п = чЫ можно было считать целым. Тогда приращение функции X(t) за время Д? может быть представлено в виде суммы LX(t) = j]Aj. F.10) / = i Увеличивая число v и уменьшая одновременно дисперсию каждого слагаемого в A0), в пределе можно рассматривать функцию X(t) как непрерывную, однако ее приращение не будет пропорциональным приращению аргумента А/, как это имело бы место для обычных (неслучайных) непрерывных функций. Действительно, находя дисперсии обеих частей равенства A0) и учитывая независимость Ар получим F.11) т. е. первой степени Д? пропорционален (в среднем) квадрат приращения функции, а не само приращение, что было бы в том случае, если бы функция Х(?) имела производную. Приведенный пример не только поясняет математический механизм появления недифференцируемых случайных функций, но и в основном правильно отражает физическую природу возникновения недифференцируемых случайных функций, с которыми приходится иметь дело в приложениях, так как многие из этих функций вызываются независимым воздействием большого числа отдельных молекул (или электронов), каждое из которых играет ничтожную роль в общем эффекте. Некоторые примеры недифференцируемых случайных функций нам встретятся далее при изучении стационарных случайных процессов. Вернемся к примерам корреляционных функций стационарного процесса, приведенным в § 5. Легко убедиться, что из четырех приведенных там функций а*е- а Iт', оV- а?т2, Лг- * ITI cos (k и о*е~ а!х2 cos ptT F.12) первая и третья соответствуют случайным функциям, не имеющим производных, а вторая и четвертая — функциям дифференцируемым. Действительно» вследствие наличия знака абсолютного значения у х, при х = 0 первые производные от а^-*^ и а'3е ~а^ cos [te терпят
38 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I разрыв, меняясь скачком на — 2с2а (рис. 6 и 7), и, следовательно, вторая производная в этой точке не существует. Наоборот, первые производные от функций о**"**** и a2<?~~aix2 cos ptx остаются непрерывными и дифференцируемыми при любых значениях т и, следовательно, корреляционные функции подобного вида соответствуют дифференцируе- бг мым случайным процессам. В качестве следующего примера корреляционной функции дифференцируемого процесса можно привести выражение Рис. 6. F.13) первая производная от которого 1 sin F.14) в нуле непрерывна и дифференцируема. Дифференцируемому процессу также соответствует корреляционная функция Рис. 7 К(т) = а-е а т A+а|т|), F.13') получаемая из A3) путем предельного перехода $—+ 0. Продолжим изучение производной от случайной функции. Если X{t) дифференцируема, то ее производная в свою очередь является случайной функцией времени, имеющей свои многомерные законы распределения и свою корреляционную функцию. Законы распределения ординат производной от случайной функции легко определяются только в некоторых частных случаях, тогда как корреляционная функция J\ ¦ просто выражается через корреляционную функцию любой дифференцируемой функции X(t). Действительно, обозначая для краткости F.15)
§ 6] ДИФФЕРЕНЦИРОВАНИЕ И ИНТЕГРИРОВАНИЕ 39 в соответствии с определением производной, имеем F.16) Будем отмечать для дальнейшего корреляционную функцию индексом, показывающим, для какой случайной функции она вычисляется, и будем считать для простоты х = 0. Тогда, в соответствии с определением корреляционной функции, для Kv(tv t%) будем иметь Kv(t»b)=M[V*(ti)Vm F.17) Легко показать, что операцию нахождения предела и операцию нахождения математического ожидания можно менять местами Поэтому после подстановки A6) получим = tern -г—г- SV1 \ [у( ' (ti —J— Aj) — л (^i)j i.^* (^'2 "t~ $) *— ^ \^$)j Ь (b.l 8) Aj —> 0 * 2 Д2 -¦ 0 где множитель l/AjA^ вынесен за знак математического ожидания, так как приращения Aj и Д2 не являются случайными. Перемножая квадратные скобки под знаком математического ожидания и находя математическое ожидание полученной таким образом алгебраической суммы, будем иметь Kv (tb t%) = lim д-д- [Kx {tx 4~ Ab t% -J~ A2) — /C^ (^ -j- Ax, f2) — — Kx ifb k + A2) + K^ (^, ед F.19) что после перехода к пределу дает kv (tv h) = ¦д*к*{{1; h), F.20) т. е. корреляционная функция производной равна второй смешанной частной производной от корреляционной функции дифференцируемой случайной функции *). В том случае, когда функция X(t) стационарна, Кх (fh ^я) ==:: Кх (^'2 — Ч) :==: Кх \t)> & *) Как было доказано выше, вследствие дифференцируемости X (t) про- изводная—>•* V/—^- существует при ^ = ^1 однако можно доказать что в этом случае будет существовать —?+ 1\—— и при любых значениях аргументов tx и t%.
40 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ 1ГЛ. I и вместо B0) для корреляционной функции производной будем иметь Kv(tvt^ = -^^9 F.22) т. е. выражение, зависящее только от х. Следовательно, производная от стационарной случайной функции является также стационарной случайной функцией, и можно вместо B2) написать . F.23) Перейдем к рассмотрению интеграла от случайной функции. Интеграл где т] (t) — неслучайная функция, а а и Ь — постоянные, будем понимать как предел соответствующей интегральной суммы так же, как это делается в обычном анализе, т. е. положим Ь п \ т] @ X @ dt = lim ? Ч С/)х Су) (*J ~ *У-1> F-24) где при п—>со длина каждого интервала ft— tj__t) стремится к нулю, а предел понимается в смысле среднего квадратического. Рассуждая примерно так же, как при выводе условий дифференцируемости случайного процесса, можно убедиться, что предел суммы B4) существует, если дисперсия этой суммы имеет конечное значение. Выразим эту дисперсию через корреляционную функцию Кх (tv t.2). В соответствии с определением дисперсии имеем*) D[lim i> = М {j lim |] i\(tj)X(tj) (tj - tj л) Р \ = = M { iim 2 S 4* @)A^ Су) Ч ft) Jf ft) ft - *y_ i) ft - ^ л) \ = = lim 2 2 ^* ft) 4 ft) M [Jf* ft) ^ ft)] ft - O-i) ft - 'i-i) = bb =И *) Считаем для простоты # =
§6] ДИФФЕРЕНЦИРОВАНИЕ И ИНТЕГРИРОВАНИЕ 41 Полученный результат показывает, что для существования интеграла от случайной функции вида B4) должен существовать интеграл от корреляционной функции вида B5). Переход от определенного интеграла B4), взятого в конечных пределах, к несобственному интегралу, у которого один или оба предела бесконечны, может быть сделан так же, как и в обычном анализе, т. е. под несобственным интегралом следует понимать предел интеграла B4) при стремлении одного или обоих его пределов к бесконечности (например, а —* — оо, Ь —> -\- оо). Очевидно, что для существования такого несобственного интеграла должен существовать интеграл B5), у которого в пределах интегрирования произведен соответствующий предельный переход. Переменность предела интегрирования не вносит ничего принципиально нового в определение интеграла от случайной функции, однако делает значение интеграла случайной функцией своего предела. Рассмотрим этот вопрос подробнее на примере интеграла, с которым часто приходится встречаться в приложениях. Положим t Y(f) = \X(t')dt, F.26) о где Х(к) — случайная функция, корреляционная функция которой предполагается известной, а математическое ожидание ее без нарушения общности будем считать равным нулю. (Переменная интегрирования в B6) обозначена буквой f, чтобы отличить ее от переменного верхнего предела t.) В соответствии с B5) для существования интеграла B6) в определенной области изменения верхнего предела t должен существовать в той же области двойной интеграл t t \ \Kx(t\t")dt'dt". F.27) о о Предположим, что это условие выполнено, и определим корреляционную функцию случайной функции Y(t). Используя формулу B5), для корреляционной функции Kv{tl7 t^) получим Ку (tv *0 = М [ У •(*,) Y№ = М { f \Х* (ПХ(Г) dfdtr } . F.28) Л о о Меняя местами операцию интегрирования и операцию нахождения математического ожидания, получим окончательно о о
42 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. I В частном случае, когда функция, стоящая под знаком интеграла, стационарна, вместо B9) будем иметь f -f)dfdf. F.30) Выражение, стоящее справа, зависит в отдельности от tx и tb а не от их разности и, следовательно, интеграл от стационарной функции не обладает свойством стационарности. Однако вследствие стационарности X(f) формулу C0) можно несколько упростить. Действительно, вводя вместо переменных интегрирования f и f переменные 5, tq, coot- ветствующие прямоугольным координатам, оси которых повернуты на 45° относительно осей f, f (рис. 8), вместо C0) получим (для определенности считаем ti/V Kv(tvh)= J 0 ° F.31) что после выполнения интегрирования по I и перехода от т\ к новой переменной т = т)УТ F.32) дает s "j \ - и - -с) к, Полагая в последнем равенстве tl = ti = t, для дисперсии интеграла Y(t) получим выражение, явно зависящее от t и тем самым показывающее» что в общем случае интеграл от стационарной функции свойством стационарности не обладает: F.34)
§ 6] ДИФФЕРЕНЦИРОВАНИЕ И ИНТЕГРИРОВАНИЕ 45 или для вещественной случайной функции t D [ УЧО] = 2 $ (< — т) Кх (т) dx. F.35) При выводе формул для корреляционной функции производной и интеграла от случайной функции мы считали, что математическое ожидание исходной функции равно нулю. Если бы это условие не выполнялось, то, как было отмечено в конце предыдущего параграфа, формулы для корреляционной функции остались бы без изменения. значение же x{t) нужно было бы учесть только при вычислении математического ожидания производной и интеграла. Для этого учета вернемся к исходным формулам. В случае дифференцирования, находя математическое ожидание от обеих частей равенства (б.Зб) и учитывая, что операцию нахождения математического ожидания и операцию дифференцирования можно менять местами, получим ^p. F.37) Для интегрирования случайной функции, применяя операцию нахождения математического ожидания к обеим частям равенства получим $!. F.39) Таким образом, можно сформулировать общее правило: математическое ожидание производной (интеграла) от случайной функции равнс производной (интегралу) от математического ожидания этой функции. Все результаты данного параграфа получены без каких-либо предположений о характере законов распределения ординат случайных функций. Следовательно, они применимы как к нормальным случайным функциям, так и к функциям, не являющимся нормальными. Однако у нормальных случайных функций имеется одна особенность, существенно облегчающая использование полученных соотношений. Дело в том, что операции дифференцирования и интегрирования случайных функций сводятся к суммированию ординат случайной функции и последующему переходу к пределу. С другой стороны, из общего курса теории вероятностей известно ([4], [7]), что сумма
44 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I любого числа слагаемых, образующих систему нормальных величин, дает нормальную величину. Поэтому можно утверждать, что как производная, так и интеграл от нормального случайного процесса являются также нормальными процессами, которые полностью могут быть охарактеризованы их математическими ожиданиями и корреляционными функциями. Следовательно, выведенные выше формулы для нормального случайного процесса позволяют характеризовать производную и интеграл от случайного процесса не только в рамках корреляционной теории, но и дают исчерпывающую характеристику этих функций. Поясним сказанное примерами. Пример 6.1. Определить вероятность того, что производная V{t) от нормальной стационарной функции X(t) будет иметь значения, большие а = \^Ъ м/сек, если *=10 м, Кх(*) = °%е-*Hl(cospt+ j sin (J| где о| = 4 м\ а=1 1/сек, Р = 2 1/сек. В соответствии с B3) имеем i(cos рх - — I - i(cos рх - j sin По C7) получим v — 0. Так как V(f) нормальная, то плотность вероятности f(v) будет Искомая вероятность оо р == ^ /(г.) oft» = ~ [l — Ф (^jj = 1 [1 — Ф @,5)J = 0,3085. а Пример 6.2. о Определить дисперсию Y(t) при t = 20 сек, если Кх (х) = eie- * I' A + а | т |), с? = 10 cM*Jcetc\ а = 0,5 1/сек.
I 6| ДИФФЕРЕНЦИРОВАНИЕ И ИНТЕГРИРОВАНИЕ 45- Применяя C5), имеем = -ф [Bа* — 3) + е~" (at + 3)] = 1 Збб см\ Пример 6.3. V(t) = -gr- , X (t) стационарна. Проверить, будет л» стационарной J о В соответствии с B3) имеем Применяя C5) и учитывая, что для дифференцируемой функции X(t) К'х@) = 0, после интегрирования получим Полученное выражение зависит от t, и, следовательно, Y(f) нестационарна. Этот результат кажется на первый взгляд парадоксальным, поскольку к стационарной функции были применены две взаимно обратные операции — дифференцирование и интегрирование, результатом которых как будто бы должна быть та же стационарная функция X(t). Причиной этого результата является то, что для получения X (t) по ее скорости V(t) необходимо учесть начальные условия, т. е. X @ = $1/(^)^ + ^@), о что отличается от Y(t). Можно проверить, что последнее выражение обладает свойством стационарности. Пример 6.4. Доказать, что корреляционная функция Кх любого случайного процесса X(t) удовлетворяет неравенству где if] (t) — произвольная (неслучайная) функция, а а и Ь — заданные числа (см. формулу E.14)).
46 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Для доказательства рассмотрим интеграл Дисперсия этого интеграла в соответствии с B5) равна ьъ Ъ\Л = \\ Vft)ч<*0Кхft, «оdtxdt* аа Так как, с другой стороны, дисперсия не может быть отрицательной, то получим окончательно ьь § 7. Действие линейного оператора на случайную функцию Кроме операций дифференцирования и интегрирования, в приложениях приходится исследовать случайные функции, получающиеся в результате применения более сложных математических операций к случайной функции, характеристики которой известны. Пусть функция Y(t) получается из функции X(t) путем выполнения определенных математических операций. Тогда можно записать Y(t) = LX(f), G.1) где L условно обозначает те операции, которые нужно совершить над ординатами функции X(t), чтобы получить ординаты функции Y(t). Символическое обозначение математических операций, совершаемых над функцией X (t) (в нашем случае L), будем называть оператором, и, следовательно, равенство A) можно прочитать так: Y(t) есть результат применения оператора L к функции X(t). В некоторых случаях, например, когда функция, к которой применяется оператор, зависит от нескольких аргументов, оператор снабжают соответствующим индексом, показывающим, функцией какого аргумента считается выражение, к которому применяется оператор, или отражать этот факт в самом обозначении оператора. Дифференцирование функции, рассмотренное в предыдущем параграфе, может быть представлено как применение оператора дифференцирования -г- к случайной функции X (t): Y(f) = jtX{t). G.2) В этом случае Ь = ^т-
§ 7] ДЕЙСТВИЕ ОПЕРАТОРА НА СЛУЧАЙНУЮ ФУНКЦИЮ 47 Аналогично можно говорить об операторах интегрирования, умножая на некоторую функцию, возведения в степень и т. п. Все операторы делятся на операторы линейные и нелинейные, резко отличающиеся по своим свойствам и требующие применения различных методов при их исследовании. Линейным однородным называется оператор, который удовлетворяет следующим двум свойствам: 1. Результат применения оператора к произведению постоянного коэффициента на функцию равен произведению этого коэффициента на результат применения данного оператора к этой функции, т. е. если А — постоянная, то G.3) Иными словами, постоянные множители можно выносить из-под знака линейного однородного оператора. 2. Результат применения оператора к сумме функций равен сумме результатов применения этого оператора к каждому слагаемому в отдельности, т. е. если <?i(t) и <р3(?) — произвольные функции, то L [?i @ + <р* @] = Цч @ + Lcp2 @. G.4) Линейным неоднородным оператором называется сумма линейного однородного оператора и некоторой заданной функции. Следовательно, если L является линейным однородным оператором, а ср(?) — некоторая функция, то оператор Lv определяемый равенством LlX(t) = LX(t)^?(t)y G.5) будет линейным неоднородным оператором, который уже не будет обладать указанными свойствами. Однако из всякого линейного неоднородного оператора можно образовать однородный путем вычитания слагаемого, делающего его неоднородным. Для дальнейшего существенной будет линейность оператора, а не его однородность. Операторы, которые не удовлетворяют указанным выше условиям, называются нелинейными. В данном параграфе мы будем рассматривать только линейные операторы. Очевидно, приведенный выше в качестве примера оператор дифференцирования является линейным однородным, так как G.6) ЛЮбЫХ фуНКЦИЙ if(t), fxif), <f%(f) И ПОСТОЯННОЙ А
48 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Линейным является и оператор интегрирования (в иГостоянных или переменных пределах), оператор умножения (на /неслучайную функцию или постоянную), а также оператор, соответствующий последовательному применению различных линейных ^ераторов. Примером линейного однородного оператора является и оператор нахождения математического ожидания; его линейность непосредственно следует из основных теорем о математическом ожидании, согласно которым неслучайный множитель можно выносить за знак математического ожидания, а математическое ожидание суммы равно сумме математических ожиданий. В качестве примера нелинейного оператора можно привести оператор возведения в степень, оператор нахождения дисперсии случайной величины и большое число других операторов, находящих свое применение в приложениях. Весьма важный класс линейных операторов может быть • представлен в виде =$Pft tx)X(tx)dtv G.8) где X (f) — функция, к которой применяется данный оператор, а p(U ti) — заданная функция, вид которой и определяет свойства оператора. В частном случае, когда функция p(t, tt) является функцией разности своих аргументов, т. е. формула (8) приобретает вид t Y(f) = ]p(t — tdX(tddtv G.10) to Важность операторов такого вида обусловливается тем, что к ним «сводится нахождение интеграла линейного неоднородного дифференциального уравнения, правой частью которого является функция X(t). Оператор (8) соответствует решению линейного дифференциального уравнения с переменными коэффициентами, а оператор вида A0) — решению дифференциального уравнения с постоянными коэффициентами. Рассмотрим этот вопрос подробнее. Пусть дано линейное неоднородное дифференциальное уравнение G.11)
§7] ДЕЙСТВИЕ ОПЕРАТОРА НА СЛУЧАЙНУЮ ФУНКЦИЮ 49 где х (t) будем считать заданной функцией времени. Из общей теории линейных дифференциальных уравнений известно, что решение уравнения A1), удовлетворяющее некоторым начальным условиям (при t = tQ), может быть представлено в виде суммы решения соответствующего однородного уравнения, удовлетворяющего этим начальным условиям, и частного решения неоднородного уравнения, удовлетворяющего нулевым начальным условиям, т. е. можно написать y(t)=y,(t)+yi(tl G.12) где уо(О — упомянутое выше решение однородного уравнения, а y\(t) — частное решение неоднородного уравнения. Вследствие линейности уравнения, yo(t) может быть представлено в виде где yj(f) (/==1, 2,..., п — 1, п) — система независимых интегралов однородного уравнения, a с у — постоянные, определяемые начальными условиями. Во многих задачах начальные условия являются случайными. Тогда Cj будут случайными величинами, вероятностные свойства которых необходимо учитывать при определении корреляционной функции решения уравнения. Покажем, что функцию p(ty tt) можно выбрать так, чтобы частный интеграл у\ (t), удовлетворяющий нулевым начальным условиям, мог быть представлен в виде t Л (9 = $/>(* tt)x(t0dtv G.14) Дифференцируя y\(t) no t и учитывая двоякую зависимость правой части равенства A4) от переменной, по которой производится дифференцирование, получим J^L-=p(t, t)x(t)~]- ^ ".pit, tJxVJdh G.15) 'о dy{ (t) По условию —-g-— обращается в нуль при t=tQ. Интеграл, стоящий справа, в этом случае исчезает из-за равенства пределов интегрирования, поэтому p(t0, to)x(to) — O, а так как x(f) — произвольная функция, то в нуль должна обращаться функция p(ty tx) при t = t1 = t9. С другой стороны, ?0 может быть любым, следовательно, функция р (tf t) должна обращаться в нуль тождественно. Аналогично можно показать, что у всех производных y[k) (f) при k = 1, 2,... .., п—1 внеинтегральные члены также должны обращаться в нуль.
50 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Отсюда следует п — 1 равенств, которым должна удовлетворять функция p(t, tj при t=t1: а для последовательных производных от у\ (t) будем иметь dtJ t G.17) Подстановка этих соотношений в исходные уравнения после объединения интегралов в один дает G.18) Полученное равенство может удовлетворяться при любом x(t), если G.19) G-20) Первое условие означает, что jp (^, ^), рассматриваемая как функция t, яйляется решением однородного дифференциального уравнения, соответствующего исходному неоднородному уравнению, т. е. должна быть линейной комбинацией независимых частных интегралов этого уравнения: МО. МО,.... j/Л*). Следовательно, можно записать: G.21) Подставляя это выражение в A6) и B0), получим п линейных уравнений для определения п неизвестных bj(f). Решая эти уравнения, после подстановки в B1), получим окончательное выражение для
S7J ДЕЙСТВИЕ ОПЕРАТОРА НА СЛУЧАЙНУЮ ФУНКЦИЮ 51 функции p(t> tt) в виде отношения двух определителей, составленных из частных интегралов соответствующего однородного уравнения yi(ti) ...л(У У[ (*i) '"У'пУх) Pit, ](ti) G.22) Можно показать, что значение p(t, tx) не зависит от выбора системы независимых интегралов yj(t). В том случае, когда дифференциальное уравнение имеет постоянные коэффициенты, частные интегралы однородного уравнения имеют вид еJ (считаем для простоты, что все корни характеристического уравнения различны — наличие кратных корней не меняет окончательного результата) и непосредственная подстановка в B2) показывает, что р {t, ^) будет линейной комбинацией (с постоянными коэффициентами) выражений вида ех^"^\ т. е. будет функцией разности t — tx Таким образом, в этом случае = \ p(x)x(t—z)dx. G.23) Для устойчивых систем функция /?(т) быстро затухает с ростом своего аргумента. Поэтому во многих задачах верхний предел интегрирования по т можно считать равным оо. В этом случае иногда удобно бывает перейти от соотношения между у\ (t) и х (t) к соотношению между преобразованиями но Фурье этих функций. Умножив для этой цели обе части равенства B3) на еш, интегрируя по t в бесконечных пределах и считая, что при ^ получим eiaiyi(f)dt= G.24) Меняя в правой части порядок интегрирования, после простых преобразований будем иметь оо Г оо ~|Г оо  \ ешух (t) dt=\ I e™p (x) «ft И е^х ft) dtt , G.25) —00 I 00 -II 00 J т. е. для получения преобразования Фурье от частного интеграла линейного неоднородного уравнения с постоянными коэффициентами
52 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ |ГЛ. I достаточно преобразованную по Фурье правую часть этого' уравнения 00 умножить на функцию \ ei<ox р (т) dzy являющуюся преобразованием о Фурье от функции р(т). со Интеграл ^ еЫхр (т) di в теории автоматического регулирования о называют передаточной функцией системы, описываемой линейным дифференциальным уравнением. Для нахождения передаточной функции в явном виде достаточно применить преобразование Фурье к обеим частям исходного уравнения A1), считая коэффициенты aj постоянными, заменив в нем предварительно у (t) на у\ (t). Выполнив эти преобразования и воспользовавшись в левой части равенства интегрированием по частям (с учетом того, что yi(t) удовлетворяет нулевым начальным условиям), получим 00 e'«yi (t) dt=^-L-j J e*'x @ dt, G.26) —00 где Qn (/<*>) = (/о))я -f- ax (t) (/со)" -f-... -f" ал (Q, т. е. полином, получающийся из левой части A1) путем замены оператора дифференцирования на /». Сравнивая B6) с B5), замечаем, что О Формула A4) и частный случай этой формулы — формула B3) — имеют наглядный физический смысл, состоящий в том, что произведение p(t, ti)x(ti)dt% можно рассматривать как учет воздействия внешнего «импульса» интенсивностью x{t^)dt\y поступившего на вход динамической системы в момент времени tlt на «выход» системы в момент t. Так как уравнение линейное, то для получения окончательного решения достаточно просуммировать воздействие всех этих элементарных импульсов за промежуток времени (?0, t), что и осуществляется путем интегрирования. Вследствие наличия такого физического смысла формулы A4) функцию р (t, ty или соответственно р (t — t{) часто называют «импульсной переходной функцией»; иногда ее называют также функцией веса или весовой функцией. Последнее название мы и будем употреблять в дальнейшем. Перейдем к рассмотрению действия линейного оператора на случайную функцию с известными вероятностными характеристиками. Пусть X(t) — случайная функция, математическое ожидание которой x{t), а корреляционная функция Kx(fi> 'я)«
f 7| ДЕЙСТВИЕ ОПЕРАТОРА НА СЛУЧАЙНУЮ ФУНКЦИЮ 53 Пусть К @ — другая случайная функция, получающаяся из Л'(^) путем применения некоторого линейного оператора L, который будем считать пока однородным, т. е. Y(t) = LX(t). G.28) Полная вероятностная характеристика случайной функции К (О может быть получена только с учетом всех многомерных законов распределения случайной функции X(t) и находится, как правило, весьма сложно (исключение представляет нормальный случайный процесс, который будет подробнее рассмотрен ниже). Однако в рамках корреляционной теории вероятностные характеристики функции У(t) могут быть получены весьма просто, причем для этого не требуется знания даже первых двух законов распределения случайной функции X(t), а достаточно воспользоваться общими свойствами математического ожидания случайных величин. Действительно, находя математическое ожидание обеих частей последнего равенства, получим y(t)=M[LX(t)]. G.29) При применении линейного оператора L функция X(t) рассматривается как функция U в то время как оператор нахождения математического ожидания, являясь также _ линейным, производит усреднение ординат случайной функции (при фиксированном t) по всему множеству возможных значений случайной величины X(t). Поэтому порядок применения этих операторов можно менять местами и вместо B9) написать у {t) = L М [X (t)] = Lx @, G.30) т. е. для нахождения математического ожидания результата применения линейного оператора к заданной случайной функции нужно этот оператор применить к ее математическому ожиданию. Перейдем к нахождению корреляционной функции Ky{tb t$. В соответствии с определением корреляционной функции имеем y G.31) Подставляя в эту формулу вместо Y(i) и J7(f) их выражения из B8) и C0), получим M}. G.32) где операторы снабжены индексами tt и Uj чтобы отметить, что в первом случае выражение, к которому применяется оператор, рассматривается как функция переменной tv а во втором случае — переменной ti9 а звездочка над оператором показывает, что в том случае, когда этот оператор содержит комплексные величины, их надо заменить на комплексно сопряженные. Пользуясь линейностью однородного
54 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I оператора L и линейностью операции нахождения математического ожидания, вместо C2) получим Ку ft, t,) = M {L,* Lt2 [X* ft) - х* ft)] [Xft) - z it,)]} = = LTt UM M {[X* ft) - ** ft)] [X ft) - л: ft)]}, G-33) т. е. Ку ft, *0 = L,* L,, AT*ft, h) G.34) или, для вещественных операторов, ft, **), G.35) т. е. для нахождения корреляционной функции результата применения линейного однородного оператора к случайной функции необходимо этот оператор применить дважды к корреляционной функции исходной случайной функции, рассматривая сперва ее как функцию первого аргумента, а потом — как функцию второго (заменив в первом случае оператор комплексно сопряженным, если он не является вещественным). Неоднородный линейный оператор может быть получен из однородного путем прибавления слагаемого к однородному линейному оператору. Такое прибавление не отражается на величине корреляционной функции, а при нахождении математического ожидания должно быть учтено добавочным слагаемым. Поэтому C4) и C5), полученные для линейного однородного оператора, остаются в силе и для линейного неоднородного оператора. Итак, математическое ожидание и корреляционная функция результата применения линейного оператора к случайной функции однозначно определяются ее математическим ожиданием и корреляционной функцией безотносительно к тому, каков характер многомерных законов распределения этой функции. Для нелинейных операторов такой простой результат не получается, так как на значение корреляционной функции результата применения оператора существенное влияние оказывает вид законов распределения ординат исходной случайной функции. Полученный вывод особенно упрощает исследование воздействия различных линейных операторов на нормальные случайные процессы, так как в результате действия линейного оператора на нормальную случайную функцию также получается нормальная функция, математическое ожидание и корреляционная функция которой полностью ее характеризуют. Действительно, вследствие линейности оператора функция LX(t) может быть получена только в результате линейной комбинации конечного или бесконечного числа ординаг функции X (t). С другой стороны, из теории вероятностей известно *), что линейная комбинация нормальных случайных величин подчиняется нормальному *) См., например, [4].
§ 71 ДЕЙСТВИЕ ОПЕРАТОРА НА СЛУЧАЙНУЮ ФУНКЦИЮ 55 закону распределения независимо от того, являются ли эти величины зависимыми или независимыми. Если X (t) не является нормальной случайной функцией, то Y(t) = LX(t) не будет иметь тот же закон распределения, что X (t) Также не сохраняется нормальный закон распределения, если оператор L не является линейным. Поясним найденное выше общее правило нахождения корреляционной функции на примерах. Очевидно, что полученные в предыдущем параграфе результаты для дифференцирования и интегрирования случайной функции являются частными случаями выведенной выше общей формулы и могут быть получены из нее. Действительно, пусть L — оператор дифференцирования L=4- G.36) Тогда для корреляционной функции V{f) = LX (t) = 4>Х @ G-37) at на основании C5) сразу получим Kv ft, h) = -^щ Кх ft, U) G.38) или, для стационарной функции, д* d2 Kv Kh> h) = dt dts A* {h — ?!) = —- ^ Kx (т). G.d9) Общую формулу можно аналогично применить и для интеграла от случайной функции. Здесь (о и для t К@ = $ X(tx)dU G.41) to формула C5) сразу дает Kv ft, *0 =\ J Kx (f, П dt df\ G.42) h to т. е. тот же результат, который мы имели в § 6.
56 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Для оператора A4), также применяя общую формулу, для корреляционной функции будем иметь ку (tv t,)=$ \Р (tv о р (*„ о кх (f, n df dr, G.43) Mo я математическое ожидание определится по формуле t 9iV)=*lp(t,ti)X(ti)dtt- G.44) Рассмотрим еще несколько конкретных примеров. Пример 7.1. Определить математическое ожидание и корреляционную функцию частного интеграла дифференциального уравнения - . —aHY(t) = bX(t) при нулевых начальных условиях, если Так как искомый интеграл может быть представлен в виде t tt J a*t2dt2 t - J a42dt% t ° \ ° db о о то в соответствии с общими формулами C0) и C5) имеем j? it) = beam/2 \ е-*2'*'2 tx dU = — К A — ea*r2<2); а о а о о где Ф (jc) — интегральная функция Лапласа, определяемая равенством о Пример 7.2. Найти дисперсию стационарного решения дифференциального уравнения
§7] ДЕЙСТВИЕ ОПЕРАТОРА НА СЛУЧАЙНУЮ ФУНКЦИЮ 57 где X(t) — стационарная случайная функция, Jc = O, /CAr(x) = al^"a!t!(cos fh + 4- sin pi x|); ox> a, p— известные постоянные. Находя весовую функцию p(t — х) по B2) и выражая явно Y{t) через X(t), имеем t Y(t) = -[e-h«-^X(х) sin oH(f — т где a>0 = j/?* — /г9. Полагая в этой формуле, согласно условию задачи, tQ = — оо, получим *-*> AT (т) sin о> На основании C5) при tt = t4 = t имеем — оо t I — ОО — 00 Переходя в последней формуле к новым переменным заменяя произведение синусов полуразностью косинусов и воспользовавшись четностью подынтегрального выражения относительно переменной tv получим 00 00 D [ У @] = щ J J е- ht* (cos a>0 tt — cos со01,) ^ (<0 Л, Л* что после интегрирования по t2 и подстановки выражения для Кх (t{) дает 9 оо D [ У @] = -g^ J *-^+a)^ (^cosaH^ + sin a>0*i) (cosp<! + ~sinp^) Л,. 0 Выполняя интегрирование по th получим * - a» - p« - 2Л2]2 + 4 [a> (ft» - 2A2) - _ 2Л2 _ «2 - 02) 2_|_ 4 (a2ft8 _ 2a2A2 + A*)]« -f 2 (Pa - a2 - A?2J + 4 ft2 (« °X Динамические системы, описываемые уравнением, рассмотренным в данном примере, часто встречаются в приложениях и могут иметь совершенно различную природу. Например, к подобной задаче сводится задача определения вероятностных характеристик качки корабля на волнении (в этом случае Y(f) — угол, определяющий наклон
58 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ | ГЛ. I палубы корабля, а X (t) — так называемый «угол волнового склона», т. е. угол наклона касательной к поверхности моря в данной точке). К такой же задаче сводится исследование поведения различных гироскопических устройств (в этом случае Y(t) — угол отклонения оси гироскопа, X{f) — внешнее возмущение), поведения чувствительных элементов различных измерительных приборов и ряд других технических задач. Пример 7.3. -^Р + Ьх J ег^ X (tt)dtt + су где X, а0, ар Ьь с — постоянные. Определить корреляционную функцию Kv (th tq), если корреляционная функция Кх (tb tq) известна. Так как Y (t) получается из X (t) путем применения линейного (неоднородного) оператора t +b о то по общей формуле C5) имеем гл (± J- \ Т Т V D- 4- А у ^Ц, 1%) — JLtfg Jb^j Ад; \ь1> 1\ Раскрывая произведение операторов во Ьх ^ е- «" df'X + «А щ ^ е- «' dfX + U t2 U \ И получим окончательно K,(tu tt) = atKx(tutt i ? Ад: ^ , ij^ ttt —j— \ 6 Ад- ^*1j ? j ui и о
§ 81 ВЗАИМНАЯ КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ 59 § 8. Система случайных функций. Взаимная корреляционная функция До сих пор мы говорили об одной случайной функции. Рассмотрим теперь систему двух случайных функций X (t) и Y{t). Для их вероятностной характеристики можно поступать так же, как и в случае одной случайной функции, т. е. рассматривая ординаты этих случайных функций в различные моменты времени как систему случайных величин, вводить в рассмотрение соответствующие многомерные законы распределения. Систему случайных функций таким способом можно охарактеризовать с любой степенью подробности, однако оперирование с многомерными законами распределения делает весь анализ весьма громоздким, а получающаяся при этом полная характеристика случайных функций обычно не бывает нужна для решения практических задач. Поэтому для системы случайных функций, так же как и для одной функции, обычно ограничиваются только вычислением первых двух моментов ординат этих функций, т. е. пользуются корреляционной теорией случайных функций. Так как первый и второй моменты каждой случайной функции в отдельности являются математическими ожиданиями и корреляционными функциями, рассмотренными выше, то остается рассмотреть второй смешанный момент ординат различных случайных функций, взятых в разные моменты времени tx и t%. Так как этот момент будет зависеть от выбранных значений tt и U, то для характеристики системы двух случайных функций в рамках корреляционной теории необходимо ввести еще одну функцию двух переменных, определяемую равенством (t,) -у (Щ. (8.1) Функция Rxy (tly t$, называемая взаимной корреляционной функцией, характеризует степень коррелированности ординаты функции X(t), взятой в момент времени tv и ординаты функции Y(t), взятой в момент времени t%. Очевидно, что корреляционная функция, рассмотренная нами ранее, является взаимной корреляционной функцией ординат этой функции с ординатами той же функции, что и объясняет употребляемое иногда вместо названия корреляционная функция название автокорреляционная функция *). Рассмотрим основные свойства взаимной корреляционной функции. Существенно, что взаимная корреляционная функция X(t) и Y(t) не равна взаимной корреляционной функции Y(f) и X(t). Действительно, написав, согласно определению A), выражение для Ryx(tv t%) и переставив сомножители под знаком математического ожидания, получим Ryx &> h) = M{ [X (*о - х (t,)) [ г* (to -у* №}. (8.2) *) Вместо термина взаимная корреляционная функция в литературе встречается также термин корреляционная функция связи.
60 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Правая часть B) после перестановки аргументов tx и ?3 и переход^ к комплексно сопряженному выражению совпадает с правой •частью A), откуда следует первое свойство взаимной корреляционной функции ; т. е. перестановка индексов у взаимной корреляционной функции с одновременной перестановкой ее аргументов дает выражение, комплексно сопряженное исходному. В частном случае для вещественных случайных функций получим RXy(tbh) = Ryx{t*h), (8.4) т. е. перестановка индексов при одновременной перестановке аргументов не меняет значения взаимной корреляционной функции. Установим неравенства, связывающие корреляционную функцию -связи Rxy(tpt<i) с дисперсиями Kx(tvtt) и Kv(tbt^. Рассмотрим для этого выражение А = | VKyiUjU) [X 0,) — х (*,)] ± VKAtvU) [ У 00 -У 00112> -которое является вещественным и никогда не может стать отрицательным. Следовательно, Раскрывая под знаком математического ожидания скобки и пользуясь основными теоремами о математическом ожидании, получим 2/С, 0i, *i) Ку 0» ^0 ± 2 VKAt»h)Ky(U,U) Re Rxy (tv U) ^ 0, ¦т. e. I Re Rxy 0i, U) | < VKx(tbti)Ky{h,ti). (8.5) Из последнего неравенства путем простых алгебраических преобразований можно получить, что I Re Rxy 0i, УКу [Кх 0i, h) + Ку 0* *0]. (Щ С другой стороны, рассматривая формулу, определяющую значение корреляционной функции связи Rxy ('«. *>) = И ^ — хд О'» — J0 /¦(¦*!» JM rfjfi d^> (8.7) — со где /(jcj,j/O — плотность вероятности случайных величин <Y0i) и У 00» можно установить связь между модулем |/^y0i>?OI и дисперсиями Kxitlyti), Ky(t*t$.
§8! ВЗАИМНАЯ КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ 61 Действительно, применяя к интегралу G) неравенство Бупяков- ского (справедливое для интегралов любой кратности) , (х) ft (х) dx f < E ? (х) dx) ($ g] (x) dx), (8.8) S о положив (хх — xx) Vf(Xi>yd вместо gt и (у% —JO Vf(*i> Уд вместо gb будем иметь | J J (ati — *i) СУ* —JO f{xx, — oo ^ [ И(Xi - ^»K ^(Xi> y*>dXi dA {И (у* -уу Заменяя в последнем неравенстве интегралы на Rxy(thU), Kx(tXitx) и Kv (tb 12)> соответственно, получим IRxVit* U)| ^ VKx(tbti)Ky(t»t& (8.9) Наличие последнего соотношения позволяет вместо размерной взаимной корреляционной функции Rxy (th t^ ввести безразмерную нормированную взаимную корреляционную функцию *ч>{tli h) . (8.10) Для вещественных Х0) и K(f) величина rxy(thti) заключена в интервале (—1, -f-1) и более наглядно характеризует степень коррели- рованности ординат X(tt) и К(^.2)- Если система функций X (t) и К 0) стационарна, то вторые моменты ординат этих функций не зависят от начала отсчета времени. Поэтому и взаимная корреляционная функция не может зависеть от значений tt и ?2 в отдельности, а определяется исключительно величиной разности т==^ — tx. Следовательно, для стационарной системы функций Rxy (*Ъ '0 = Rxy ft ~ 'l) = ^v (Т>> (8.1 1) и указанное выше свойство (см C)) примет вид Rxv(*) = Rh(-*) (8.12) или, для вещественных функций, Rxy(x) = Ryx(-*)- (8.13) Так же как для одной случайной функции, в корреляционной теории в качестве определения стационарности систем случайных функций в широком смысле целесообразно принять зависимость вторых моментов ординат случайных функций только от разности
62 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I моментов времени и постоянство математических ожиданий случайных функций. Таким образом, если х= const; у = const; Kx(tlt *0 = Я* (*« — *i); Ky{tb t$ = Ky(U — t& Rxy(tb k)=Rxy(ts — t& (8.14) то мы будем говорить, что система случайных функций X(t), Y(t) стационарна в широком смысле. Наличие стационарности в широком смысле еще не гарантирует наличия стационарности в узком смысле (исключая нормальные функции). Следует также иметь в виду, что если каждая из случайных функций X(t) и Y(t) стационарна (или стационарна в широком смысле), то из этого не следует, что корреляционная функция связи зависит только от разности моментов времени. Поэтому если две стационарные функции удовлетворяют еще и условию (И), то говорят, что эти функции стационарны и стационарно связаны или что рассматриваемая система функций обладает свойством стационарности в широком смысле. Если, кроме того, можно утверждать, что все законы распределения ординат рассматриваемой системы случайных функций не зависят от начала отсчета времени, данная система функций обладает свойством стационарности. Для системы п случайных функций в корреляционной теории, помимо их математических ожиданий и корреляционных функций, необходимо указать взаимные корреляционные функции между любыми парами этих функций. Таким образом, если имеется п функций ХЛ*)> Х,@,...> XnQt), (8.15) то для их характеристики необходимо указать п функций одного переменного %(t),...9 xn(t), (8.16) п функций двух переменных КхЛЬ Ч КхЛ*ь 'О— Kxn(fv h) (8.17) и еще п (п—1)/2 взаимных корреляционных функций RxlXt{tb t&..., RXn_iXn(th t& (8.18) В том случае, когда все функции стационарны и стационарно связаны, A7) и A8) становятся функциями разности (tq — tt). Рассмотрим вычисление взаимных корреляционных функций для нескольких случаев, которые нам будут нужны в дальнейшем. Взаимная корреляционная функция случайной функции и ее производной. Пусть =^. X(t), (8.19) где X(t) — любая дифференцируемая случайная функция.
§ 8| ВЗАИМНАЯ КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ 63 Для нахождения взаимной корреляционной функции будем исходить из ее определения Rxv(fv *д = М {[X* fa) - х* (*,)] [V{h) - v(Щ. (8.20) Подставив сюда вместо V(t) ее выражение из A9) и учитывая, что на основании F.37) v (t) = -тгX(t), получим Rxv Уь '0 = М {[X* (*,) - X* (tO) I; [X (h) - X (Щ}. (8.21) Меняя порядок дифференцирования и нахождения математического ожидания и обозначая операцию дифференцирования как частную производную по tb поскольку tx при этом рассматривается как постоянная, получим R**(ti, 4) = J; М {{X* (h) - х* (*,)] \X{h) - X (Щ, (8.22) т. е. окончательно Для стационарной случайной функции (8.23) (8-24) где i = U — tb и вместо B3) получим RxvW = ^Kx(*). (8.25) Как было показано выше, для вещественного стационарного случайного процесса Кх(ъ) является четной функцией своего аргумента. Поэтому—|-" при т = 0 обращается в нуль и, следовательно, Rxv@) = 0, (8.26) т. е. для дифференцируемого стационарного вещественного процесса ордината случайно;) функции и ее производная, взятая в тот же момент времени, являются некоррелированными (а для нормального процесса, значит, и независимыми) случайными величинами. Это является отражением того факта, что для стационарной случайной функции, достигшей заданного уровня, вероятность ее увеличения с некоторой скоростью должна в среднем равняться вероятности ее уменьшения с такой же скоростью. Взаимная корреляционная функция случайной функции и ее второй производной. Предположим, что случайная функция X(t) дифференцируема дважды и, следовательно, ее вторая производная (ускорение случайного процесса) имеет смысл.
64 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I Положим ? (8.27) и найдем взаимную корреляционную функцию Rxw(tit ^). Исходя из определения взаимной корреляционной функции и рассуждая так же, как и при выводе выражения для Rxv(tv t^), получим RxwQv Ъ)=щКЛ*ь U\ (8.28) что для стационарного случайного процесса дает Rxw (fb U) = ? Кх (т) = -Kv (т> (8.29) Формула B9) показывает, что при t^ = t^ Rxw отрицательна и имеет наибольшее абсолютное значение, равное D [X (t)]. Взаимная корреляционная функция между линейными комбинациями случайных функций. Пусть, например, Ух V) = *i (t) Хх (t) + я3 (О X* (О, Г2 (t) = bx it) Xt (t) + h (t) X, (t), (8.30) где я^), a%(f)y bi(t) и b^(t) — неслучайные функции времени, а корреляционные функции KXl (tv t^), Kx2 (h* t<d и взаимная корреляционная функция RXiX2 (tv t^ предполагаются известными. Из определения взаимной корреляционной функции имеем $ъ « = М {[< (h) К (to + a* (h) X* (to - a* (to x* (to - - < (to A &)] [*i (to x, (to + b, (to x, (to - h (to ^ (to - (8.31) где Y\ (t), Yo (t) и математические ожидания J7j (t), у.г (t) заменены их выражениями через X\(t), X*(t), xx(t) и X^(t) на основании C0). Представив последнее равенство в виде Ryiy> (tv tO = М [{at (tO [X] (to - X* (h)] + a\ (to [X\ (h) - X* (ЩХ X {h (to [Xi (to - xx (to) + h (to [X, (td - x* Щ], (8.32) раскрывая под знаком математического ожидания фигурные скобки и пользуясь основными теоремами о математическом ожидании, получим + a* (/,) bt (tj RXlXi (tu <0 + at (tO h (tO RXiXl (tv k)- (833) Аналогично могут быть вычислены взаимные корреляционные функции и более сложных выражений.
§ 9] ЗАДАЧИ О ВЫБРОСАХ 65 § 9. Задачи о выбросах: среднее число выбросов случайной функции за данный уровень, средняя длительность выброса Необходимость определения вероятностных характеристик процесса пересечения случайной функцией заданного уровня (решение «задачи о выбросах») возникает во многих приложениях. В качестве примера можно привести задачу определения среднего времени, в течение которого электростанция не в состоянии обеспечить заявки потребителей тока вследствие случайных колебаний потребной мощности. Вторым примером является определение запаса прочности детали, работающей под воздействием случайной нагрузки, для нахождения которого необходимо вычислить вероятность того, что в течение заданного времени нагрузка ни разу не превзойдет допустимого предела. Как было отмечено в § 4, получение исчерпывающих вероятностных характеристик выбросов случайной функции (вероятностей заданного числа выбросов в течение данного промежутка времени, закона распределения времени пребывания случайной функции выше заданного уровня) в общем случае представляет значительные математические трудности (исключая марковские процессы, для которых эта задача будет более подробно рассмотрена в гл. V), однако вычисление таких характеристик, как среднее число выбросов в единицу времени, среднее время пребывания выше заданного уровня и т. п., не представляет принципиальных затруднений. Общие формулы для их определения, которые были получены еще в 1944—1945 гг. Райсом [54] и будут приведены ниже, применимы для любых (дифференцируемых) случайных процессов, хотя числовой результат может быть получен просто только для нормальных процессов *). Итак, пусть X (t) — дифференцируемый случайный процесс, о свойствах которого мы никаких специальных предположений пока делать не будем. Пусть а — значение ординаты функции X (t), «выбросы» за которое нас интересуют. Рис. 9. Определим прежде всего вероятность того, что в бесконечно малый промежуток времени dt, непосредственно следующий за моментом времени t, произойдет выброс Для того чтобы при указанных условиях выброс действительно имел место (см. рис. 9, на котором для наглядности изображена одна из *) Строгое доказательство приводимых в данном параграфе результатов можно найти, например, в статье Е. В. Б у л и н с к о й «О среднем числе пересечений некоторого уровня стационарным гауссовским процессом»— Теория вероятностей и ее применения, VI, 4, 1961. 3 А. А. Свешников ~ |Г^З
66 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. ! реализаций случайной функции), нужно, чтобы осуществились два события: во-первых, в момент времени t ордината случайной функции должна быть меньше ау т. е. (9.1) и, во-вторых, в момент времени t-\-dt ордината случайной функции должна быть больше а, т. е. X(t + dt)>a. (9.2) Следовательно, вероятность выброса в интервале времени dt может быть записана как (9.3) Пользуясь условием дифференцируемости ординат случайной функции, неравенства C), налагающие ограничения на ординаты случайной функции в двух смежных точках, можно заменить неравенствами, наложенными на ординату случайной функции и ее производную (скорость изменения ординат функции) в одной точке. Действительно, учитывая малость интервала времени dt с точностью до бесконечно малых второго порядка, получим X(t + dt) = X @ + V (t) dt, V(t) = X (*> (9.4) Следовательно, неравенство X(t + dt)>a (9.5) эквивалентно неравенству a— V(f)dt<X(t), (9.6) и вместо двух неравенств, обусловливающих в C) наличие выброса в интервале времени dt, можно написать одно двойное неравенство a-V<t)dt<X(tXa (l/@>0). (9.7) Для вычисления вероятности осуществления этого неравенства введем в рассмотрение двумерный закон распределения ординаты случайной функции и ее производной в один и тот же момент времени t: f(x, v\t). (9.8) Тогда л л я искомой вероятности выброса получим оо а P[a—V(t)dt<X(t)<a]=l $ f(x, v\t)dxdv, (9.9) О a—v dt где пределы интегрирования охватывают все значения X (t) и V(t)> удовлетворяющие неравенству G). Внутренний интеграл в (9) может быть вычислен сразу, так как у него пределы интегрирования отли-
§ 9| ЗАДАЧИ О ВЫБРОСАХ 67 чаются на бесконечно малую величину vdU и, следовательно, пользуясь теоремой о среднем, получим а \ /(лг, v\t)dx = dtvf(a, v\t). (9.10) a — v dt Подстановка равенства A0) в (9) дает со Р[а— V(t)dt<ЛГ(t)<^a] = dt $ f(a, v\t)vdv. (9.11) о Полученная формула показывает, что вероятность выброса в течение бесконечно малого интервала времени dt пропорциональна величине этого интервала. Поэтому целесообразно ввести понятие временной плотности для вероятности выброса, обозначив p(a\f) вероятность выброса за уровень а в момент времени U рассчитанную на единицу времени, т. е. положив Р[а— V(t)dt<X(tXa] = o(a\t)dt (9.12) Сравнение A2) с A1) дает для плотности вероятности o(a\t) окончательное выражение 00 ) = \f(ay v\t)vdv (9.13) о Аналогично может быть подсчитана и временная плотность вероятности р' {а | f) пересечения случайной функцией уровня а сверху вниз. Повторяя приведенные выше рассуждения для данного случая, получим о o'(a\t) = — \ f(a, v\t)vdv. (9.14) — 00 Складывая и вычитая A3) и A4), получим оо o(a\t)-\-p'{a\t)= ^ f{a> v\t)\v dv, (9.15) — 00 00 D(a\f)—p'(a 0= \ /(a, v\t)vdv. (9.16) — 00 Так как, с другой стороны, /(a, v\t) = f(v\a, t)f(a\t), (9.17) то правые части последних двух равенств можно выразить через условные математические ожидания скорости V изменения процесса и 3*
68 ОБШИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИИ ГЛ. I ее абсолютной величины, т. е. переписать эти равенства в виде p(a\t)-\-p'(a\t) = f(a\t)M[\ V(t)\\X{t) = a\ (9Л8) a) (9.19) Пользуясь выражением A3), можно получить для любого промежутка времени Т среднее время пребывания случайной функции выше заданного уровня. Действительно, разобьем промежуток Т на п равных по величине малых интервалов dtj, каждый из которых расположен вблизи момента времени tj (/=1, 2,..., п). Вероятность того, что ордината случайной функции X(tj) будет выше заданного уровня: Р \Х (*,) > а) = \ f{x 11,) dx (9.20) а Будем считать величины интервалов dtj настолько малыми, чтобы можно было при подсчете суммарного времени пребывания случайной функции выше заданного уровня пренебречь случаями, когда внутри интервала функция [X(t) — а\ меняет знак. Введем в рассмотрение систему случайных величин А/, каждая из которых равна соответствующему интервалу dtj или 0 в зависимости от того, будет ли в этом интервале случайная функция больше или меньше а. Тогда очевидно, что общее время пребывания Та случайной функции выше заданного уровня а равно сумме А/, т. е. Та= 2 Д/. (9.21) Для определения среднего времени пребывания ta случайной функции выше заданного уровня а в течение времени Т найдем математическое ожидание обеих частей равенства B1). Применяя теорему о математическом ожидании суммы, находим <a=SM[A,J. (9.22) Случайная величина Ау, по определению, может принимать только два значения {dtj и 0), следовательно, ее математическое ожидание равно произведению dt/ на вероятность B0), т. е. 00 М [Ду] = dt, I f(x 11,) dx. (9.23) a Подставляя B3) в B2) и переходя к пределу при п->оо вместо п 2 получим интеграл, а для среднего времени пребывания случайной
§ 9] ЗАДАЧИ О ВЫБРОСАХ 69 функции выше уровня а, рассчитанного для промежутка времени 7\ будем иметь Гоо ta= \\f{x\t)dxdt (9.24) О а Обычно представляет интерес среднее время пребывания случайной функции выше заданного уровня в течение одного выброса. Для определения этого среднего времени т время ta необходимо разделить на среднее число выбросов па> имевших место в течение времени Т. Для определения па снова разобьем промежуток Т на п равных интервалов dtj и введем вспомогательные случайные величины Nj, каждая из которых равна единице, если внутри соответствующего интервала имел место выброс (вследствие малости интервалов dtj с возможностью возникновения более одного выброса можно не считаться), и нулю — в противоположном случае. Тогда полное число выбросов Na за промежуток Т будет равно сумме величин Л// (9.25) Находя математическое ожидание обеих частей равенства B5) и учитывая при этом, что математическое ожидание каждой из величин Nj численно равно вероятности выброса в /-м интервале, т. е. Р (а I tj) dtj, будем иметь п ~ (9.26) Увеличивая число интервалов dtj до бесконечности и подставляя вместо p{u\t) его выражение A3), получим ~па=\\ vf(a, v\t)dvdt (9.27) о о Наконец, деление B4) на B7) дает искомую среднюю продолжительность выброса 7 оо f{x\t)dxdt , v\t)dvdt Полученные формулы имеют наибольший интерес для стационарных процессов, так как только для установившихся по времени процессов средняя продолжительность выброса имеет непосредственное
70 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ |ГЛ. I наглядное значение. Для стационарных процессов эти формулы упрощаются, так как и плотность распределения ординат случайной функции f(x 11), и плотность распределения ординат и скоростей f\(x, v\t) не зависят от времени. Обозначая эти плотности распределения соответственно через f(x) и f(x, v), замечаем, что интегрирование по t в B4), B7) и B8) сводится к умножению на Т и, следовательно, для среднего времени пребывания стационарной случайной функции выше заданного уровня в течение времени 7, среднего числа выбросов за этот же промежуток времени и средней длительности выброса получим 00 ia=T\f(x)dx, (9.29) а со па=Т \vf(a, v)dv, (9.30) о Ч=-± (9.31) [ vf(a,v)dv о Как и следовало ожидать, для стационарного процесса ta и па пропорциональны рассматриваемому промежутку времени Г, а средняя продолжительность выброса от этого промежутка времени не зависит. Поэтому для стационарных процессов можно ввести понятие среднего числа выбросов в единицу времени va> полагая v« =Ц- (9.32) Очевидно, для стационарного процесса 00 ve = \vf(a, v)dv, (9.33) о т. е. не отличается от вероятности выброса в единицу времени. Так как во все выведенные формулы входят плотности вероятности f(x \ t) и f(x> v 11) (f(x) и f(xy v) для стационарного процесса), то для получения окончательных числовых результатов необходимо располагать этими плотностями. Для нормального процесса, наиболее важного с точки зрения приложений, могут быть получены простые расчетные формулы. Для нормального процесса (будем рассматривать только стационарный случай) закон распределения ординат случайной функции
§ 9j ЗАДАЧИ О ВЫБРОСАХ 71 однозначно выражается через математическое ожидание случайной функции jc и ее дисперсию а*х = Кх@), (9.34) так как (х—хJ Скорость изменения ординаты случайной функции, как это было показано в § 8, и ордината случайной функции для того же момента времени являются некоррелированными случайными величинами, а для нормального случайного процесса, следовательно, и независимыми величинами. Поэтому двумерная плотность распределения вероятности f(x, v) распадается на произведение нормальных плотностей распределения для X и V, и можно будет написать * ~ V ~*Т\ (9.36) где дисперсия скорости изменения ординаты случайной функции <з$ равна значению корреляционной функции скорости в нуле, т. е. в соответствии с F.21) *S*MI (937) а математическое ожидание V(f) вследствие стационарности случайного процесса равно нулю. Подстановка C6) в C3) дает для среднего числа выбросов в единицу времени va, или, что то же самое, для временнбй плотности вероятности р (а | t)=p(a): a ) ^ Ч . (9.38) Аналогично после подстановки в C1) будем иметь где Ф(х) — интегральная функция Лапласа. В частном случае, когда (9.39) (9.40)
72 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИИ 1ГЛ. Г т. е. когда рассматриваются «выбросы за нулевой уровень», последняя формула упрощается и дает (9.41) Кроме va и % сравнительно просто могут быть определены и некоторые другие величины, характеризующие выбросы случайной функции за данный уровень. Найдем, например, среднюю площадь st ограниченную реализацией случайной функции выше заданного уровня а во время выброса, считая по-прежнему X (t) стационарной. Введем для этой цели вспомогательную функцию /(х), определяемую равенством 1 при лг^>0, у при х = 0, (9.42) О при дг<^0. Тогда площадь 5 всех выбросов, имевших место в течение времени Т, может быть представлена в виде т -аюаТ, (9.43) так как первый множитель в подынтегральном выражении в течение выброса равняется единице и равен нулю во всех остальных случаях. (Случаи, когда 1=-^, не имеют значения при вычислении 5). Выразим явно функцию 1(х). Для этого воспользуемся известным из анализа интегралом Дирихле if sin их dx 1 при х^>0, ~ при х = О, — 1 при х оо Покажем, что если рассматривать интеграл — \ ешх — в смысле его главного значения, то 1С ™J^dx = ± я J и ni (9.44)
ЗАДАЧИ О ВЫБРОСАХ 73 Действительно, так как в последней формуле интеграл понимается в смысле главного значения, то 1 С «О ?-*oo I ~L где е и L — положительные величины, стремящиеся к' своим пределам независимо друг от друга. Положим в фигурных скобках &?iux = = cos их ± i sin их. Так как lim е-* О -I ^l = ~+ J COSUX^l =0, ТО лих da т. е. формула D4) действительно имеет место. Учитывая D4), функцию /(л:) можно представить в виде Подставляя последнее выражение в D3), получим т г (9-45> ^dt — awaT. (9.46) *0 0 -co Применяя к обеим частям полученного равенства операцию нахождения математического ожидания и учитывая, что М [S] = &аТ — а^аЪ (9.47) а операцию нахождения математического ожидания и интегрирование можно менять местами, получим 7 Г оо s%T О Математическое ожидание, стоящее в D8) под знаком интеграла, может быть выражено через характеристическую функцию Е (и) процесса X(t)y так как ОО 00 -j- ^ Е (и) = | й J <?''"Л / W <** = $ «""Jt/W ^ = М [е'"х ('> ^@1- —ОО —00 (9.49)
74 ОБШИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ !ГЛ. I Подставляя D9) в D8), выполняя интегрирование по U поскольку Подынтегральные выражения не зависят от времени, и сокращая обе части равенства на 7, получим Интеграл du и v f может быть выражен через fx(x\ Действительно, рассматривая J как функцию а и дифференцируя обе части равенства по а (считая допустимым дифференцировать под знаком интеграла), получим где fx (a) — плотность вероятности случайной величины X(t), взятая при аргументе а. Интегрируя E2) от — ос до текущего значения а, получим а J(a)= $ xfx(x)dx-\-c, (9.53) —00 где переменная интегрирования обозначена х. Для определения постоянной интегрирования с подставим E3) в E0) и положим а = оо. Так как в этом случае sva = O (вероятность выброса за очень высокий уровень стремится к нулю), получим <г= —\х* (9.54) 1 е а s% = X— $ xfx {x) dx — axva. (9.55) —оо Для дальнейших вычислений необходимо задать вид закона распределения ординат случайной функции X(t). Если процесс нормальный, то (9.56) и интеграл в E5) может быть вычислен.
§ 91 ЗАДАЧИ О ВЫБРОСАХ 75 Выполняя вычисления, получим что с учетом C8) для средней площади выброса 5 дает ^^^\ (9.58) Примерно таким же методом может быть вычислена и дисперсия общего времени пребывания Та случайной функции выше заданного уровня в течение времени Г. Действительно, в соответствии с D2) имеем т Ta = \l[X(t) — a]dt. (9.59) о Подставляя сюда D5), получим О — Находя математическое ожидание обеих частей последнего равенства, получим Т оо e-laaE{u) d-?dt. (9.61) -оо Возводя равенство F0) в квадрат и находя математическое ожидание, после простых преобразований получим со —00 Т оо И где E(uv щ) — характеристическая функция системы случайных величин X (t{) и X (t^), зависящая вследствие стационарности процесса только от т = г<ъ — tv Интегралы, входящие в F1) и F2), могут быть вычислены тем же методом, что и интеграл E0) (или путем замены характеристических функций интегралами от соответствующих плотностей вероятности,
76 ОБЩИЕ СВОЙСТПА СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. I после чего ряд интегрирований может быть выполнен). Выполнив соответствующие преобразования, получим ia=T[l—F(a)], (9.63) т М [ П] = 2 $ (Т — т) F (a, a) dx + Г2 [1 - 2F (в)], (9.64) о где F(a) — функция распределения X(t), взятая при аргументе a, a F(a, а)— функция распределения системы X(t)9 Х(? + т), взятая при аргументах, равных а. Вычитая из последнего равенства (ta)\ в соответствии с E3) и E4) получим т D [Гв] = 2 $ (Г — т) F (а, а) dx — Г'Я (а). (9.65) о Столь же просто вычисляется и дисперсия числа выбросов Мф имевших место в течение времени Т. Возводя для этой цели в квадрат обе части равенства B5) и определяя математическое ожидание обеих частей полученного равенства, находим М[Л«]= 2 M[NjMil (9.66) Так как произведение вспомогательных случайных величин NjNt может иметь только два значения: 1, если выбросы имели место одновременно на элементарном у-м интервале и на элементарном 1-й интервале, и 0 во всех остальных случаях, то М [NjNt] равно вероятности осуществления указанного выше первого события, т. е. М [NjNt] = Р (а — Vxdtx<Хх<a; a— V^<X*<а), (9.67) где через tt обозначен момент времени, соответствующий /-му элементарному участку длиной dtv через ?а и dt^ — аналогичные величины для /-го участка, X1=X(t1)9 Vi= V(tt), X2 = X(^3), 1/,= V(t& Вероятность, входящую в формулу F7), можно выразить через четырехмерную плотность вероятности f{xb хъ vh v2 \ tiy t^) системы случайных величин Хь Х2, Vi, V* Действительно, рассуждая так же, как при выводе формулы A3), получим Р(а— Vi<#i<*i<a; а— ^2 00 ОО (9.68)
ЗАДАЧИ О ВЫБРОСАХ 77 Подставляя последнее выражение в F6) и замечая при этом, что после устремления п -> оо двойная сумма по / и / обращается в двойной интеграл по tx и tb получим 7 Т со оо М [NZ] = J j И ^(а' а> Vl> v* I ^ **> ^^ ^ ^ Л* dt* (9>69) оооо Если случайный процесс X(t) нормальный, то плотность вероятности f(xb хь vh Vi\tb t<t) может быть явно выражена через корреляционную функцию Кх(х) = о%кх(ъ) и ее производные Действительно, для системы нормальных случайных величин закон распределения однозначно определяется их математическими ожиданиями и элементами корреляционной матрицы. С другой стороны, нумеруя случайные величины Xly X^ V\, V% в порядке их написания и учитывая формулу (8.20), для элементов корреляционной матрицы будем иметь О - ojft, @) - а»Ах(т) — e^W — «i*,@) . (9.70) Подставляя G0) в формулу B.29) для плотности вероятности системы нормальных случайных величин, получим f(x%, vv Возвращаясь к интегралу F2), замечаем, что два интегрирования могут быть выполнены. Наконец* используя соотношение между вторым начальным моментом и дисперсией, получим - ПЪ (9.72) Определение закона распределения длительности выброса, как это было отмечено в начале параграфа, является более сложной задачей, чем нахождение числовых характеристик, рассмотренных выше. Решение этой задачи хотя и получено в общем виде [40], [48], однако сложность окончательных формул заставляет признать, что она требует добавочного исследования. Столь же сложной является и задача нахождения вероятности того, что в течение данного интервала времени будет не более заданного числа выбросов.
78 ОБШИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. 1 Некоторые результаты, которые могут быть получены методами теории марковских процессов, будут рассмотрены в гл. V, а сейчас только отметим один частный случай, для которого удается получить простую приближенную формулу. Во многих задачах практический интерес представляет частный случай, когда появление последовательных выбросов можно считать независимыми «редкими» событиями и принять, что число выбросов в течение времени Т подчиняется закону Пуассона. Так как вероятности Рт появления события т раз в этом случае, в соответствии с формулой B.38), зависят только от математического ожидания числа выбросов па в течение времени Т, определяемых формулами B7) и C0) (для стационарного процесса), то вычисление Рт может быть доведено до конца* Например, для вероятности Ро того, что за время Т не произойдет ни одного выброса, получим Гоо И о о или для стационарного процесса = ехр [— \\ vf(a, v\t)dv dt] (9.73) Ро = ехр [— Т \ vf(a, v) dv]. (9.74) Для нормального стационарного процесса в соответствии с C8) получим Указать ошибку, которая возникает при использовании закона Пуассона для вычисления вероятности заданного числа выбросов, затруднительно. Однако некоторую уверенность в допустимости применения этого приближенного способа расчета можно получить, убедившись, что за среднее время между выбросами l/va корреляционная связь между ординатами процесса практически исчезает и, следовательно, ординаты для нормального процесса становятся независимыми. Пример 9.1 Корреляционная функция угла крена судна в (t) определяется формулой = a^-a"cl(cosPx + ~ sin р| Считая процесс качки нормальным, определить, сколько раз в среднем за 20 минут хода судна угол крена будет выходить за пределы ± 25°> если ejj= 100 град\ a = 0,1 l/cetc, C = 0,7 I/сек
§ У] ЗАДАЧИ О ВЫБРОСАХ 79 Определяем о % = /С, @) = - ^ Кь (т) = а) (а* Искомое число выбросов па = 2Тча, где коэффициент 2 появляется вследствие того, что в данной задаче надо учитывать как выбросы снизу вверх за уровень а = 25°, так и выбросы сверху вниз за уровень — а. Подставляя условия примера в C8), получим Пример 9.2. В условиях предыдущего примера определить вероятности Ро, Рь Р2 того, что за 2 минуты не будет ни одного выброса, будет один выброс, два выброса. Считая допустимым приближенно пользоваться законом Пуассона, получим = 0,362, Некоторой проверкой допустимости применения закона Пуассона в данном случае может служить тот факт, что для среднего времени между выбросами —=100 сек, нормированная корреляционная функ- ция , , ч е~а\х\(со В -4-а -•¦¦ ^ . Л _ш / ... п i 1 \ у sin р|т| = <?~10 ( cos 7-f ~ sin Пример 9.3. Прямоугольные координаты X, У точки на плоскости — независимые стационарные нормальные случайные функции времени, имеющие нулевые математические ожидания и одинаковые корреляционные функции (sBt + |- sin P Определить среднее время t пребывания случайной точки внутри круга радиуса а, центр которого совпадает с началом координат. Обозначив /?(О = 1/Х2(О+ Г2@> Vr{t) = ?~[^-i в соответствии с C1) для. среднего времени выброса случайной функции R(t) за уровень (среднего времени пребывания случайной точки вне круга) а
80 ОБЩИЕ СВОЙСТВА СЛУЧАЙНЫХ ФУНКЦИЙ {ГЛ. 1 имеем \f(r)dr оо vrf(a, vr)dvr где /(a, vr) — плотность вероятности системы случайных величин /?, Vn взятая при аргументе Rsma. Для определения среднего времени t пребывания точки внутри круга рассмотрим произвольный промежуток времени 7\ В течение этого времени в среднем будет ЧаТ выбросов, и точка в среднем будет находиться вне круга время 1ЧаТ. Следовательно, внутри круга точка будет находиться время (F — *?в7), что дает для среднего времени пребывания точки внутри круга формулу т. е. с учетом C1) \f(r)dr 00 rf(a, vr)dvr Для определения плотности вероятности /(г) рассмотрим систему случайных величин X=*X(f) и Y= Y(t). Так как эти величины независимы и нормальны, то плотность вероятности Так как 2n r+dr TO ^ (закон Рэлея). Для определения плотности вероятности /(г, vr) рассмотрим систему нормальных величин и _dX(t) _dY(t) v*— ~~dt~> Уу — ~1Г%
* 9] ЗАДАЧИ О ВЫБРОСАХ 81 Все эти величины взаимно независимы, причем дисперсии Vx и Vy одинаковы и равны Следовательно, компоненты Vx и Vy вектора скорости точки не зависят от координат точки и подчиняются круговому нормальному закону распределения. Поэтому и проекция вектора скорости на направление R имеет нормальный закон распределения с дисперсией *22 a двумерный закон распределения /(г, vr) имеет вид Подставляя найденные законы распределения в формулу для tf получим Пример 9.4. Генератор тока рассчитан на постоянную мощность а, потребляемую в сети. Действительное потребление тока характеризуется мощностью W(f), которая является нормальной стационарной случайной функцией времени. В том случае, когда потребляемая мощность W превосходит расчетную, включается резервный генератор, мощность которого практически не ограничена. Определить среднюю энергию, затрачиваемую резервным генератором в течение одного выброса функции W(f) за уровень а, если математическое ожидание w = M[W(t)] = a, а корреляционная функция На основании E8) в данном случае имеем dW (t) где о% — дисперсия * '. В соответствии с F.22) имеем следовательно, 5= к 2те—#
Г Л А В А II СПЕКТРАЛЬНАЯ ТЕОРИЯ СТАЦИОНАРНЫХ СЛУЧАЙНЫХ ФУНКЦИЙ § 10. Спектральное разложение стационарных случайных функций Стационарные случайные процессы вследствие неизменности их вероятностных характеристик во времени имеют квазипериодический характер. Это позволяет заменить исследование стационарной функции времени исследованием случайной функции некоторой вспомогательной переменной, которая во многих приложениях имеет размерность частоты. Полученные таким способом результаты оказываются полностью эквивалентными результатам, получаемым с помощью корреляционной функции случайного прогресса, однако применение этого способа во многих случаях позволяет значительно упростить выкладки и добиться большей наглядности. Поэтому данный способ получил широкое применение как в теоретических исследованиях, так и в различных технических приложениях. Для уяснения физического смысла этого способа исследования стационарных случайных функций предположим сначала, что случайная функция X(t), математическое ожидание которой без нарушения общности можно считать равным нулю, может быть представлена в виде суммы гармонических колебаний с различными частотами о>/ (не обязательно кратными) и случайными амплитудами, т. е. предположим, что п х (О = 2 (Aicos ^+Bisin v)> (юл) где At и Вг — случайные величины. Имея в виду дальнейшие преобразования, перейдем от тригонометрических функций к показательным, воспользовавшись известными формулами Эйлера cos со,* = I(e*V+ *-'"''), sin <o/==l(e'V-«--<<V). (Ю.2)
§ 10| СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 83 Выполнив простые преобразования, получим X(t) = 2 (Vе'' + Qfi'^l (Ю.З) где случайные величины Рг и Qb линейно выражаются через величины Ах и Bv Введем новую нумерацию величин со,, обозначая величину (— ®i) буквой со с отрицательным значением индекса (т. е. полагая — 0^ = 0)^). В этом случае последнюю формулу можно записать в более компактном виде «)=±ф^> (]04) где при положительном значении / случайная величина Ф^ совпадает с Рь а при отрицательном — с Qn{. Очевидно, что вследствие того, что математическое ожидание х (t) мы приняли равным нулю, математические ожидания <DZ также обращаются в нуль. Выясним, каким условиям должны удовлетворять случайные величины Ф1У для того чтобы X(t) удовлетворяла условиям стационарности в широком смысле. Определяя для этой цели корреляционную функцию X (t) по общим правилам, получим где индекс суммирования во второй сумме заменен другой буквой, что всегда допустимо. Представляя E) в виде двойной суммы и применяя теорему о математическом ожидании суммы, получим (Ю.6) — п ] Для стационарности процесса необходимо, чтобы в полученной сумме сохранились только те слагаемые, у которых индексы / и / одинаковы, так как только в этом случае в показателях степени появится разность (tq — ^i), которая должна быть единственным аргументом корреляционной функции стационарного процесса. Следовательно, случайные величины Ф, должны удовлетворять условиям М (Ф?Ф/) = 5Ду, М (Ф,) = 0, A0.7) где St — некоторый неслучайный положительный коэффициент, а Ьц — множитель, обращающийся в единицу для равных индексов и в нуль для различных значений индексов: 1 при /=у, A0.8) и при i -ф. /.
84 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ (ГЛ. II Случайные функции часто реализуются в технике в виде напряжения или силы электрического тока. В этом случае коэффициенты St (э^дут пропорциональны энергии, приходящейся в среднем на гармоническое колебание частоты o)j, так как энергия электрического тока пропорциональна квадрату амплитуды соответствующей гармоники. Эту электродинамическую аналогию часто имеют в виду и тогда, когда случайная функция X(t) не является характеристикой какого-либо электрического процесса, называя совокупность чисел St энергетическим спектром процесса. Сохраняя в сумме F) только отличные от нуля слагаемые, окончательно получим Kx(ti, '0= S V'"'1'= **('.-to 00-9) что для дисперсии случайного процесса дает A0.10) Итак, для стационарности случайной функции, заданной в виде ряда D) или эквивалентного ему ряда A), необходимо, чтобы коэффициенты ряда удовлетворяли условиям G). Попытаемся теперь обобщить выражение D), отказавшись от дискретности частот гармонических колебаний ш/ и от конечности их числа, сохраняя по-прежнему конечной дисперсию случайного процесса. Очевидно, это обобщение можно получить, разбив весь интервал изменения частот на неперекрывающиеся интервалы Д«о, а затем, сохраняя неизменной «энергию», приходящуюся на каждый интервал, и увеличивая число дискретных частот o>z, приходящееся на интервал Ао), перейти к соответствующему пределу. При этом нужно только иметь в виду, что каждая частота дает свой положительный вклад в выражение дисперсии A0) и, следовательно, при таком предельном переходе нужно обеспечить соответствующее убывание дисперсий, происходящих от каждой из частот, заключенных в этом интервале. Для стационарности процесса, как это было показано выше, по-прежнему необходимо, чтобы комплексные амплитуды гармонических колебаний с различными частотами были между собой не коррелированы, и, следовательно, корреляционные моменты между суммами амплитуд приходящихся на неперекрывающиеся интервалы частот, должны обращаться в нуль. После этих качественных соображений естественным представляется следующее обобщение конечной суммы D) в указанном выше направлении. Рассмотрим бесконечно малый интервал частот (о)у, wy-f-^*0/) Так как интервал rfcoy предполагается бесконечно ма лым, то для всех частот, заключенных внутри этого интервала, пока-
§ 10] СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 85 зательные функции е *t можно считать равными eliaf и, следовательно, вместо суммы гармонических колебаний, частоты которых заключены в интервале (coy, юу + ЛоД можно написать У°/ф(йо)у), где через Ф(йо)у) обозначена сумма всех комплексных амплитуд Ф/? попадающих в выбранный интервал. Производя теперь в D) суммирование по всем бесконечно малым интервалам dcoy, получим где суммирование в отличие от D) производится уже не по дискретным значениям частот, а по всем интервалам, на которые разбита область изменения со (coy в A1) обозначает частоту, среднюю для у-го интервала). Вместо случайной функции интервала Ф (du>j) для дальнейшего удобнее рассматривать случайную функцию точки, положив ф(о))== 2 ®г В этом случае формулу A1) можно переписать в виде где йФ(о)у) обозначает приращение функции Ф(со) при изменении аргумента о)у на du>y. Устремляя в AГ) все интервалы d^j к нулю, вместо суммы получим интеграл Стилтьеса X(t)= \ г*"'йФ(ш), A0.12) — со который отличается от обычного интеграла Римана тем, что под знаком интеграла стоит не приращение аргумента dco, а приращение некоторой функции йФ(<о), соответствующее приращению dco. Переход от интеграла Стилтьеса к обычному интегралу возможен только тогда, когда функция Ф (о>) дифференцируема. В данном случае функция Ф (со), как функция, имеющая независимые приращения, не имеет производной (см. § 6), и, следовательно, сохранение интеграла Стилтьеса для дальнейшего неизбежно. Остается выяснить, какими свойствами должны обладать дифференциалы ^Ф(ш). Исходя из отмеченной выше некоррелированности приращений йФ (о>у), относящихся к неперекрывающимся интервалам rfcoy, и учитывая требование конечности дисперсии X (t)9 можно показать *), что М [Ф (со)] = 0; М [<*Ф* (о>) аФ К)] = 5 (со) 8 (со — Wj) da) dvv A0.13) *) См., например, [44].
86 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II где S(u>) — положительная функция своего аргумента, являющаяся аналогам положительных величин St для дискретного случая, а Ь (х) — обозначение так называемой дельта-функции Дирака. Дельта-функция обладает следующими основными свойствами: ( = { оо при x = 0t к A0.14) $ l(x)dx=l, A0.15) —00 00 lf(y)b(x—y)dy=f(x), A0.16) —ОО где f(y) — непрерывная в точке у — х функция. Определенная так дельта-функция принадлежит к классу так называемых обобщенных функций, понятие о которых вводится в современном анализе (см., например, [6]). Не останавливаясь на общем определении обобщенной функции, введем понятие дельта-функции, производных от дельта-функции и интеграла от дельта-функции путем соответствующих предельных переходов. При этом в окончательных выражениях интегралы в бесконечных пределах мы будем всегда понимать как их главные значения, т. е. будем считать, что для любой функции <р(х) оо L \ <р (х) dx = lim \ ср (х) dx. A0.17) -оо ?-*со — L При выводе некоторых формул будет применяться дифференцирование и интегрирование по параметру под знаком интеграла. В рассматриваемых случаях указанные операции являются допустимыми, что мы примем без доказательства. Дельта-функция может быть получена как предел плотности вероятности для закона распределения случайной величины при стремлении к нулю ее дисперсии, так как условие A5) для люббй плотности распределения выполняется автоматически, а обращение в нуль дисперсии обратит в нуль область изменения аргумента, для которой плотность распределения отлична от нуля. Подобный подход к определению дельта-функции позволяет установить еще несколько ее свойств, которые будут использованы в дальнейшем. Действительно, определим дельта-функцию как предел плотности распределения вероятности нормальной случайной величины при обращении в нуль дисперсии, т. е. положим A0.18)
§ lOj СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 87 Так как характеристическая функция нормального закона Е(и>) = е-°2<»2/*, A0.19) а плотность распределения связана с характеристической функцией обратным преобразованием Фурье, то в нашем случае A0.20) где во втором интеграле изменение знака у мнимой единицы возможно вследствие вещественности всего интеграла. Переходя к пределу о —- 0 в обеих частях равенства B0), получим интегральное представление для дельта-функции *) 00 8 (х) = ~ [ ei(»x dux A0.21) —00 Если до перехода к пределу обе части равенства B0) продифференцировать т раз по х, то получим со j (« = гГ \ е™хе-°2"*!* (/o>)CT tfo>. A0.22) —00 Произведя теперь предельный переход о-—0, получим интегральное представление для производной от дельта-функции 00 ^ [Ь (х)\ = j-% ^ eimx (/со) dm. A0.23) —00 Отметим еще одно свойство дельта-функции, справедливое для любой функции f(x), имеющей в окрестности точки х = у непрерывные производные до т-го порядка: об \f^^i\bb> — x)\dx = ~hf(y). A0.24) —00 ¦) Более тонкие рассуждения показывают, что справедлива и формула О-
88 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ {ГЛ. II Последнее свойство без труда доказывается с помощью интегри- рфания по частям, если учесть, что при х ф 0 все производные дельта-функции Ь(х) обращаются в нуль, и воспользоваться свойством A6). Свойство B4), в частности, позволяет формально записывать дифференциальный оператор как оператор интегрирования с соответствующей функцией веса. Действительно, пусть, например, A0.25) где Qn (р) — полином степени п, т. е. Qn(p) = aoPn + *xPn-i + ..--\-an, (Ю.26) г р — оператор дифференцирования по t Заменяя в последнем равенстве каждую из степеней оператора р «а соответствующую производную от дельта-функции, на основании {24) можем записать Y(f) = \ [ao§<"> (t - т) + fllJ<»-i> {t - х) +... + anl (t - х)] X (т) dx, A0.27) где a<^t<^b, а производные от b{t — т) взяты по аргументу L Пользуясь дельта-функцией, можно ввести понятие производной ют функции, терпящей в данной точке разрыв первого рода (конечный скачок). Действительно, рассмотрим функцию = aF(x), A0.28) где F(x) — функция распределения случайной величины Ху имеющей математическое ожидание х = 0. Предположим для определенности, что X подчиняется нормальному закону. В этом случае ] (Ю.29) где Ф(#) — интегральная функция Лапласа, При стремлении о к нулю функция F (х) будет стремиться к ступенчатой функции 1(х), имеющей скачок, равный единице в точке х = 0. С другой стороны, как это было отмечено выше, f(x)== .'*' ъ этом случае обратится в Ь(х). Следовательно, Проинтегрировав B0) по х от 0 до х, получим 1 Ф(^ = ±-. I ****-"-/« ^-^Л е--/«^. A0.31)
10| СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 89 Добавляя к обеим частям равенства 1/2, переходя к пределу —* 0 и учитывая, что функция 2®\) ПРИ таком предельном переходе обращается в ступенчатую функцию, изменяющую свое значение скачком с —1/2 на -(-1/2 при х = 0, получим ^] A0.32) —00 т. е. формулу (9.45), которая была получена ранее другим способом. Сравнивая C2) с C0), получим = J »<*,)<«*, =4[l + ± I «*•*?]. (Ю.ЗЗ) —00 Все формулы, полученные выше для дельта-функции, ее производных и интеграла путем предельного перехода а—-*0 в соответствующих формулах для нормального закона распределения, могут быть получены, естественно, и исходя из любого другого закона распределения (симметричного или асимметричного), имеющего конечную дисперсию и соответствующие моменты более высокого порядка — нормальный закон распределения взят только для удобства выкладок. В том случае, когда функция F(x) непрерывна во всех точках, кроме x = xh где она имеет скачок а, %?1 <^, A0.34) где Ft (х) — непрерывная функция, получающаяся из функции F(x) путем уменьшения ее ординат для х^>Х\ на а. Вернемся к A2). Физический смысл этого выражения состоит в том, что случайный процесс рассматривается как суперпозиция (сумма) гармонических колебаний с различными комплексными амплитудами ^Ф(о)), которые можно рассматривать как произведение их модулей (вещественных амплитуд) на экспоненциальный множитель, учитывающий фазу гармоники. Так как фаза гармоник случайна, то при интегрировании различные гармоники частично погашаются и формула A2), позволяющая рассматривать случайную функцию X(t) как преобразование Фурье некоторой функции частоты, имеет смысл для любого интервала изменения t, хотя интеграл Фурье для бесконечной реализации случайного процесса и не существует, поскольку для любой (не равной тождественно нулю) реализации x(t) не выполняется основное условие существования интеграла Фурье ]\x{t)\dt<co.
90 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ {ГЛ. II Комплексные амплитуды d<D(o>) были введены путем предельного перехода от сумм комплексных амплитуд <DZ> входящих в формулу D). Так) как эти амплитуды для различных значений / (для различных значений частот u>t) не коррелированы, то величины йФ(ш), взятые для неперекрывающихся интервалов частот, должны быть также не коррелированы, поскольку не содержат слагаемых Фг с одинаковыми индексами, что и учитывается формулой A3). Наконец, обращаясь снова к указанной выше электродинамической аналогии, заметим, что общая «средняя энергия» процесса может быть получена путем суммирования квадратов вещественных амплитуд, соответствующих всем частотам, т. е. путем интегрирования по всем возможным значениям (о и и>х. Выполнив это интегрирование, с учетом A3) и A6) получим ОО 00 М [^Ф* (со) ЛФ К)] = J 5 (со) d< A0.35) т. е. спектральную плотность 5 (со) в указанном выше смысле слова можно рассматривать как «плотность энергии на единицу частоты». Приведенные выше рассуждения не являются строгими и имеют целью только показать физический смысл формулы A2), которая является основной в теории стационарных процессов. Строгий вывод этой формулы можно найти в ряде источников, например в [44]. Приводить этот вывод мы не будем, а только перечислим основные положения, на которых он базируется, и несколько уточним свойства A3) дифференциалов йФ(а>), получаемые как следствие этого более строгого вывода. Основным положением, позволяющим перейти к спектральному разложению стационарной случайной функции, является теорема А. Я- Хинчина, доказанная им еще в 1934 г. Эта теорема является следствием того, что корреляционная функция стационарного случайного процесса есть положительно определенная функция (см. § 5, свойство 3), т. е. для любой функции ф (t) 00 \\ K(h — to ф* (to <|> (*,) dUdU ^ 0. A0.36) —00 Исходя из соотношения C6), можно доказать, что любая функция, удовлетворяющая условию , A0.37)
§ 10) СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 91 где S(co) — вещественная неубывающая ограниченная функция своего аргумента, является корреляционной функцией соответствующего стационарного случайного процесса и, наоборот, корреляционная функция любого стационарного случайного процесса, обладающего конечной дисперсией, может быть представлена в виде C7). Функция ?(<о) называется спектральной функцией, причем в наиболее важных дАя практических приложений случаях, когда корреляционная функция убывает с ростом своего аргумента достаточно быстро, чтобы оо $ |/С(т)|Л<оо, A0.38) —ОО функция «S (о>) может быть продифференцирована. Действительно, условие C8) совпадает с условием разложимости функции в интеграл Фурье и, следовательно, должна существовать возможность разложения 00 К{$ = \ е™ 5(о>) do>, A0.39) сравнение которого с C7) на основании единственности разложения позволяет заключить, что ^), A0.40) т. е. что 5(ш) дифференцируема. Функция 5 (со) называется спектральной плотностью. В соответствии с тем, что 5(со) — неубывающая функция, спектральная плотность не может принимать отрицательные значения, т. е. S(w)s*0. A0.41) Теорема Хинчина явилась отправным пунктом для доказательства возможности спектрального разложения самой случайной функции, на существование которого впервые указал А. Н. Колмогоров в 1940 г. Связь случайной функции Ф(со) со спектральной функцией ?(<о) получается автоматически на основании теоремы Хинчина. Действительно, подставляя спектральное разложение A2) в общую формулу для корреляционной функции /С(х), получим (х — 0) /00 00 \ = М [X* (О X (t + х)] = М | I *-*>!'rf€>* (coj) J в™* С-И^ф (<о9) = 1—00 —ОО ' = М Ш ^«ах+Дша-ш^^ф* (щ) AФ @J)| . A0.42)
92 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. И Меняя порядок интегрирования и нахождения математического ожидания, будем иметь )]. (Ю.43) —00 Сравнение полученного выражения с C7) показывает, что в общем случае М [<1Ф* (a)j) AФ (со,)] = 8 (о>2 — щ) йщ dS ((Dj), A0.44) а соотношение A3) имеет место только тогда, когда существует спектральная плотность, т. е. когда корреляционная функция удовлетворяет условию C8). Этот случай у нас только и будет встречаться в дальнейшем. Итак, всякий стационарный (в широком смысле) случайный процесс может быть представлен в виде интеграла Стилтьеса: 00 X(t)= $ etai'd<&(<o)-\-X, A0.45) —00 где Ф («)) — случайная функция, дифференциалы которой удовлетворяют соотношению М [Ф (©)] = 0; М [йФ* ((*>) йФ (аH] = 5 (<*>) 5 (ш — A0.46) а спектральная плотность 5 (со) — неотрицательная функция своего аргумента. Следствием D5) и D6) является соотношение между корреляционной функцией и спектральной плотностью, полученное Хин- чиным еще до того, как была доказана возможность разложения D5) К(т) = J e*«xS (ю) Л». A0.47) Действительно, достаточно в выражение D3), являющееся прямым следствием спектрального разложения случайной функции, вместо математического ожидания произведения дифференциалов йФ*(со1)^Ф(о),2) подставить его значение из A3) и выполнить одно из интегрирований, пользуясь свойством A6) дельта-функции, чтобы получить D7). Формула D7) показывает, что задание спектральной плотности эквивалентно заданию корреляционной функции. Преобразуя эту формулу по Фурье, получим 00 ^ J -*» /C(tL% A0.48)
§ 10| СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 93 т. е. справедливо и обратное утверждение — знание корреляционной функции процесса эквивалентно знанию его спектральной плотности. До настоящего времени мы не делали никаких предположений о вещественности случайной функции. Если же X{f) вещественна, то можно показать, что спектральная плотность ?((*>) будет четной функцией, и соотношениям между корреляционной функцией и спектральной плотностью можно придать несколько иной вид. Действительно, как мы видели в § 5, при вещественном X(t) К(ч) является вещественной четной функцией своего аргумента. В этом случае ?(со) также будет четной функцией со. Действительно, заменяя в D8) со на — со, а переменную интегрирования х на t% = — х, после перестановки пределов интегрирования получим выражение, не отличающееся от правой части D8), т. е. 5 (со) = 5 (—со). A0.49) Четность функций ^(х) и 5 (со) позволяет в D7) и D8) избавиться от комплексных выражений. Действительно, подставляя в эти формулы **»* = cos сох 4-1 sin сох, <?-"°т = cos сох — / sin <ох, A0.50) замечаем, что мнимые части интегралов уничтожаются (вследствие нечетности стоящих под знаком интеграла выражений), а в вещественных слагаемых из-за четности S(w)coscox и /f(x)coscox можно интегрировать от 0 до оо, а окончательный результат удвоить. Следовательно, вместо D7) и D8) будем иметь 00 /С(х) = 2 $ 5 (со) cos cox tfco, A0.51) о 00 5 (со) = 1 С tf(x) cos cox rfx. A0.52) Иногда спектральной плотностью называют не 5 (со), а ^ (со) = = 25 (со). В этом случае вместо последних двух равенств получим 00 /С(т) = J 5*! (со) cos сох flfx, A0.53) о со Si (со) = 1 С К (т) cos сот rfx. A0.54) о Существуют и другие нормировки спектральной плотности, на что следует обращать внимание, применяя расчетные формулы, получаемые из разных источников. Мы всюду под спектральной плотностью
94 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. П будем понимать выражение, обозначенное выше 5 (со). Поэтому, полагая в D7) т = 0, получим 00 /С@)= $ SO0)*0» A0.55) —00 т. е. дисперсия стационарной случайной функции равна площади под кривой спектральной плотности без каких-либо нормировочных коэффициентов, формула E5) показывает, что если случайная функция имеет конечную дисперсию, то ее спектральная плотность должна убывать с ростом о> не медленнее, чем or1"", где а^>0. В заключение перечислим основные свойства спектральной плотности, которые отмечались выше по ходу изложения: /. Спектральная плотность не может иметь отрицательные ординаты, т. е. S(u>)^0 при любом «>. 2. При росте абсолютного значения w ?(<*>) стремится к нулю 00 настолько быстро, что \ S («>) d<*> <^ со. — ©О 3. Для вещественных случайных процессов спектральная плотность является четной функцией, т. е. S(&) = S(—<*>). 4. Спектральная плотность связана с корреляционной функцией соотношениями 00 ОО — 00 причем частным случаем последней формулы является выражение дисперсии случайного процесса через спектральную плотность Первые два свойства являются следствием теоремы Хинчина, а третье следует из четности корреляционной функции вещественного случайного процесса. Спектральное разложение оказывается эффективным и при исследовании системы стационарных случайных функций. Рассмотрим для примера две стационарные случайные функции X(t) и Y{t). Для каждой из этих функций (считаем для простоты jc ===== J7 ===== 0) справедливо интегральное представление D5), т. е. можно записать ОО Xit)= \ et(*ld<3>x(<»)> A0.56) оэ Y(t)= $ е»"»<*Ф,(ш> A0.57) — ОО
* ID, СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 95 где каждая из случайных функций Фх(м) и Ф^(^) удовлетворяет A3) Подставляя в общую формулу (8.2) для корреляционной функции связи вместо X(t) и Y(t) их спектральные разложения E6) и E7) и меняя местами операции интегрирования и нахождения математического ожидания, получим Rxy (tv t,) = $ i 1Ш2/2 - miti)M [с1Ф*х (t«,) йФу (ш2)]. A0.58) — ОО Если предположить теперь, что случайные функции X (t) и Y{t) являются не только стационарными, но и стационарно связанными, то последний интеграл должен зависеть только от разности т = t.2 — tv что будет выполнено только в том случае, если произведение дифференциалов dФ* (coj) d<by (оJ) удовлетворяет соотношению, аналогичному A3), т. е. если М [<1Ф% (о>0 d% (со2)] = Sxy (^>0 8 (щ - со,) da>t du* A0.59) В этом случае одно 'лз интегрирований в E8) выполняется, и мы получим ОО RxyW= \ «"^ (»)</«, A0.60) т. е. соотношение, аналогичное соотношению между корреляционной функцией и спектральной плотностью. Введенная таким образом функция Sxy(u>) носит название взаимной спектральной плотности. Обращая по Фурье равенство F0), для взаимной спектральной плотности получим ОО ^ \ -l™Rxy(x)dx. A0.61) Вычисляя комплексно сопряженные выражения обеих чаетей последнего равенства и пользуясь общими свойствами корреляционной функции связи Rxy(t)> получим Siy(^) = Syx(^ A0.62) Если случайные функции X(t) и Y(t) вещественны, то, заменив в F1) о) на —о) и одновременно перейдя от переменной интегрирования Т К Tj явш — т, ПОЛуЧИМ Sxy (—«>) = Si, (">), A0.63) т. «. для вещественных случайных функций S$, (ш) = Sxy (- ш) = Syx (u>). A0.64)
96 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II § 11. Примеры вычисления спектральной плотности стационарного случайного процесса Связь между спектральной плотностью и корреляционной функцией удобнее всего проследить на конкретных примерах, к рассмотрению которых мы и перейдем. Пример 11.1. Рассмотрим корреляционную функцию вида К(т) = Лг-а1Ч <х>0, A1.1) где а2 является дисперсией случайной функции, а коэффициент а, имеющий размерность, обратную размерности времени, может служить характеристикой быстроты убывания корреляционной связи между ординатами случайной функции при увеличении разности аргументов эшх ординат т. Пользуясь формулой A0.48), получим 00 -imK(x)dx=^ J в-1-х— 14 rft. (Ц.2) — 00 Так как [ х | ===== х при положительных т и | т | = — х при отрицательных, то, разбивая интеграл B) на сумму двух интегралов по отрицательным и положительным значениям т, получим что после приведения к общему знаменателю дает При увеличении а быстрота убывания ординат функции К(т) увеличивается. Вместе с тем при увеличении а начальная ордината спектральной плотности, равная о2/тса, уменьшается, а так как площадь под кривой &(о>) всегда равна дисперсии о2, то функция S(v), имеющая вид, напоминающий кривую плотности распределения нормального закона, с ростом а будет прижиматься к оси со, становясь одновременно более пологой, как это показано на рис. 10, а и 10, & где приведен ход функций /С(т) и ?(«>) для трех значений а. Такое поведение функции ?(ш) при увеличении а позволяет ввести весьма часто встречающееся в приложениях понятие «белого шума», т. е. случайной функции с постоянной спектральной плотностью. Действительно, предположим, что мы будем увеличивать параметр а до очень больших значений. При этом /С(т) превратится в конце
s 111 ПРИМЕРЫ ВЫЧИСЛЕНИЯ СПЕКТРАЛЬНОЙ ПЛОТНОСТИ 97 концов в пикообразную функцию, отличную от нуля только в очень узкой области значений т вблизи нуля- Одновременно с этим кривизна функции S(u>) при малых частотах будет все более уменьшаться и в конце концов в весьма широкой области значений а> можно будет считать спектральную плотность постоянной. Как мы увидим в дальнейшем (впрочем, это ясно и из физических сообра- жений, так как всякая реальная система обладает инерцией), очень высокие частоты не могут оказывать заметное воздействие на реальные динамические системы. Поэтому функцию, имеющую достаточно большой параметр а, можно считать обладающей постоянной спектральной плотностью: 5 (со) = б- = const, A1.5) где 'постоянная с, характеризующая интенсивность белого шума, в нашем случае связана с дисперсией о3 и а так: S(w) : — =Ь. (ил) Ф Рис. 10. СО Потребуем, чтобы при а—*со отношение F) оставалось постоянным. Покажем, что в этом случае корреляционная функция процесса становится пропорциональной дельта-функции. Действительно, интегрируя A) по т от ~оо до +с» и переходя к пределу а—+оо, получим Urn \ A1.7) Таким образом, при указанном выше предельном переходе 2Й- A1.8) а так как функция /С(т) в соответствии с A) не может иметь отрицательных ординат и при а—»со стремится к нулю при всех значениях х ф 0, то равенство (8) возможно только в том случае, если 4 А. А. Свешников
98 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II /С(т)|т==0 = со. Таким образом, для белого шума функция К(ъ)/2пс обладает всеми свойствами дельта-функции, и следовательно, можно написать A1.9) Физический смысл полученного результата состоит в том, что ординаты белого шума, взятые для любых различных моментов времени, являются некоррелированными случайными величинами. В соответствии с (9) дисперсия ординаты «белого шума» обращается в бесконечность, что является естественным следствием сделанного предположения о постоянстве спектральной плотности (см. E)) для всех значений частоты <*>. Как отмечалось выше, это предположение не выполняется у физически реализуемых случайных процессов, однако является весьма полезной абстракцией в том случае, когда для диапазона изменения частоты (*>, являющегося существенным для рассматриваемой динамической системы, спектральную плотность процесса можно считать постоянной. Подобные процессы возникают во многих физических явлениях, связанных с воздействием отдельных молекул или электронов на макроскопические системы, например во всех явлениях, родственных броуновскому движению. Подобные процессы называют белым шумом, так как слово «белый» напоминает их сходство с белым светом, у которого спектральный состав примерно однороден, а слово «шум» возникло потому, что подобные процессы исторически впервые привлекли к себе внимание в радиотехнике, где их наличие приводит к возникновению паразитных шумов в линиях радиопередач. Как ясно из вышеизложенного, один и тот же процесс в одной задаче можно считать белым шумом, а в другой приходится учитывать зависимость 5(ш) от частоты. Абсолютно белый шум, естественно, существовать не может, так как для постоянной во всей области изменения частоты спектральной плотности, в соответствии с A0.55), получается бесконечная дисперсия, что для реальных процессов не имеет смысла. В заключение отметим, что корреляционная функция «белого шума», полученная в данном примере путем предельного перехода из корреляционной функции вида A), может быть получена путем соответствующего предельного перехода из корреляционной функции любого вида, лишь бы при этом переходе область значений т, при которых ()\^>0у стремилась к нулю. Пример 11.2. В качестве второго примера рассмотрим корреляционную функцию вида /С(т) = Лг-а'т! cospx, а>0, ХИЛО) которая отличается от только что рассмотренной функции наличием множителя cos fk, придающего AT(t) вид затухающего гармонического
§ И] ПРИМЕРЫ ВЫЧИСЛЕНИЯ СПЕКТРАЛЬНОЙ ПЛОТНОСТИ 99 колебания. Заменяя cos (k на -j (е®*-\-е~ $*) и применяя A0.48). получим 1^ { jV1*" —"| A1.11) Интегралы A1) могут быть получены из интеграла B) путем вамены о) на (о) — C) и (<*> -j- C) соответственно. Поэтому, делая эту замену в окончательном результате D) и беря полусумму полученных выражений, для нашего случая будем иметь что после приведения к общему знаменателю дает °V ; ic (со2 + _ад2 со2 + а^ + ^ _ttqi ч — те @,2 ^ а2 _ р2J _|_ 4а2р2 те (»«—.р1_а«J 4.4а8©яв 111ЛО^ Пример 11.3. В качестве третьего примера рассмотрим корреляционную функцию ( ) a>0, A1.14) которая, как это было отмечено в § б, является корреляционной функцией дифференцируемого случайного процесса. Заменяя в этом выражении sin p |т| показательными функциями, для спектральной плотности будем иметь — 00 00 A1.15) Первое слагаемое равно A3), а каждый из интегралов, заключенных в квадратные скобки, может быть получен из B) путем замены а на (а — /f3) и соответственно на (a-f-^). Выполнив эти преобразования, будем иметь 2/ Р [ а>2 + (а — #)я «» + (а + Ф)я" Г U
100 СТЛиИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. I! что после алгебраических упрощений дает п (со2 Пример 11.4. В качестве следующего примера рассмотрим корреляционную функцию tf(T) = aV-a^acos(k, A1.18) Выражая и в этом случае cos fk через показательные функции, для спектральной плотности будем иметь . 01.19) Каждый из полученных интегралов может быть сведен к интегралу типа Пуассона, если показатель степени в выражении, стоящем под знаком интеграла, преобразовать к виду Вычисляя эти интегралы, получим окончательно 2 5(о>) = -^— [е ^ +е~ &* ]. A1.20) Пример 11.5. В качестве последнего примера рассмотрим корреляционную функцию вида *) /С(х) = а0Чт) + а1^2)(^ + ... + ^Bл)(х). A1.21) Отличие этого примера от предыдущих состоит в том, что /С(х) при т = 0 обращается в бесконечность, т. е. обращается в бесконечность дисперсия рассматриваемого случайного процесса Физически реализуемые случайные процессы имеют конечную дисперсию, однако выражения типа B1) иногда имеют место в том случае, когда при аппроксимировании корреляционной функции, полученной из опыта, было использовано выражение, соответствующее недифференцируемому процессу, а по ходу решения задачи приходится иметь дело не только с самой случайной функцией, но и с ее производными Рассмотрение выражения такого вида имеет и теоретический интерес. Преобразуя *) Предполагается, что постоянные Яу имеют значения, при которых выражение B1) удовлетворяет общим свойствам корреляционной функции.
$ 12) СПЕКТРАЛЬНАЯ ПЛОТНОСТЬ Ю1 корреляционную функцию по Фурье, в данном случае для спектральной плотности будем иметь S О"**1*»]¦ A1 -22) Число рассмотренных примеров можно было бы значительно увеличить. С некоторыми более сложными выражениями для корреляционной функции мы встретимся еще в дальнейшем. § 12. Спектральная плотность линейной комбинации стационарной случайной функции и ее производных. Стационарное решение дифференциального уравнения с постоянными коэффициентами Пусть стационарная случайная функция X (t) имеет производную. Следовательно (см. § 6), первая производная рт ее корреляционной функции непрерывна при т = 0, а вторая производная *: *' ' при т = 0 существует. В соответствии с A0.47) имеем Кх(?)= $ eleiS,(<»)da». A2.1) — 00 Как было показано в § 6, производная A2.2) также стационарна, а ее корреляционная функция определяется равенством Дифференцирование A) дает 00 <<ота)^(а))</а). A2.4) С другой стороны, вследствие стационарности V(t) между ее корреляционной функцией и спектральной плотностью имеется соотношение, аналогичное AУ т. е. оо /<„(*)= [ etanSv(<»)di». A2.5)
102 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II Сравнивая правые части D) и E) и учитывая единственность разложения функции в интеграл Фурье, заключаем, что выражения, стоящие под знаком интегралов в этих формулах, должны совпадать и, следовательно, 5„(ю) = ю*5,(ш). A2.6) Таким образом, если дифференцирование интеграла A) по т как по параметру является допустимым, то спектральная плотность производной стационарной случайной функции равна спектральной плотности этой функции, умноженной на квадрат частоты. Не останавливаясь на доказательстве допустимости подобного дифференцирования, отметим только, что во всех случаях, встречающихся в данной книге, дифференцирование под знаком интеграла по параметру является возможным. Формулу F) можно вывести и другим путем, который в некоторых задачах является более удобным. Будем исходить не из выражения для корреляционной функции, а из спектрального разложения самой случайной функции (считаем для простоты, что «? = 0) X(t)= l в**<*Ф(ео). A2.7) —00 Дифференцируя это равенство и считая возможным дифференцирование по t под знаком интеграла как по параметру, получим 00 У^р- = V @ = \ еш /to d<t> (ш). A2.8) — 00 Для корреляционной функции /СДт) имеем ОО 00 /С„(*) = М{[— \ e-to»'/»,rf®»(«»i)][ \ е(^1<+т'/«>3й?Ф(о)а)]}. A2.9) —00 —00 Представляя произведение интегралов как двойной интеграл, меняя порядок интегрирования и нахождения математического ожидания и используя свойства дифференциалов ^Ф(ш), т. е. поступая так же, как и при выводе A0.47) из A0.12), получим 00 ?„00= \ еш\т\^х(ш)Aш. A2.10) —ОО Сравнение A0) с D) дает Sv (со) = | /ш |2 5, (со) = a>*S, («>), A2.11) что совпадает с F).
ft 12) СПЕКТРАЛЬНАЯ ПЛОТНОСТЬ 103 Для того чтобы Sv(&), определенная F) или A1), действительно могла быть спектральной плотностью какого-либо случайного процесса, необходимо, чтобы оо \ aK^(o))rfa)<co. A2.12) —оо Выполнение последнего условия эквивалентно требованию дифферен- цируемости функции X (t), для чего необходимо, чтобы корреляционная функция Kx(t) имела бы вторую производную в нулевой точке. Итак, можно сформулировать следующее правило: если стационарный случайный процесс имеет производную, то для получения спектральной плотности этой производной достаточно умножить спектральную плотность процесса Sx(u>) на а>9. Свойства произведения <u*Sx(®) позволяют судить о дифференци- руемости процесса X(t): если интеграл от этого произведения ограничен, то процесс дифференцируем, если нет, то X (t) не имеет производной. Проверка выполнимости условия A2) обычно не связана с какими-либо трудностями, так как для этого достаточно составить себе представление о поведении функции <o2Sy(<o) при больших значениях аргумента. Например, случайные функции, спектральные плотности которых — 1 аа2 °>2 +<*2 + Р2 V оJ + а2 И Т" (со3 + а2 + р2J -—4,32со2 вычислены в § 11, в примерах 1 и 2, очевидно, недифференцируемы, так как при росте ш произведение о>85*(<*>) ДЛя этих процессов стремится к постоянной, а следовательно, интеграл от <&*SX (со) расходится. Наоборот, спектральные плотности примеров 3 и 4 § 11 соответствуют дифференцируемым процессам, так как в первом случае w*S*(«>) при больших со убывает как 1/со2, а во втором убывание спектральной плотности идет по экспоненциальному закону, т. е. весьма быстро. Сформулированное выше правило нахождения спектральной плотности производной случайного процесса позволяет получить формулу и для производных высшего порядка, так как, применяя это правило п раз, для спектральной плотности Y(ft = %X{& A2.13) получим SyD>) = m^Sx(<o), A2.14)
104 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II если только интеграл в бесконечных пределах, взятый от последнего выражения, сходится, т. е. если производная A3) существует. Перейдем к рассмотрению линейных выражений с постоянными коэффициентами, содержащих производные различных порядков. Пусть X{t) + bX(t) + + bX(t) A2.15) или, вводя обозначение оператора дифференцирования р= — Z(t) = Pm(p)X(t), A2.16) где Рт (р) — полином от р степени т> коэффициентами которого являются постоянные величины ?0, Ьь ... , Ьт. Пусть X (t)— стационарная случайная функция, а все производные, входящие в A5), существуют. Подставим в A5) вместо X (t) спектральное разложение A0.12) и, пользуясь тем, что соответствующие производные X (t) существуют, будем дифференцировать под знаком интеграла по t как по параметру Выполнив это дифференцирование и объединив полученную сумму интегралов в один интеграл, будем иметь оо Z(t)= $ !М*°Г + *1 ('«Г+ .-. + **] «•*<** <«•>). A2.17) -СО т. е. выражение, которое отличается от спектрального разложения случайной функции наличием под знаком интеграла добавочного множителя \ЬъA<о)т-\- Ь^Aш)тА -)-. .._j~#m], получаемого из правой части A5) путем формальной замены оператора дифференцирования на /о> Вычисляя корреляционную функцию /?*С0» получим (- i^I"'1 -f...+«у <rto'r <*ф* («о X X $ I^Mffl + *.('<'' + - + W^l/+tl^D A2.18) —00 Представим произведение интегралов в виде двойного интеграла и переменим порядок нахождения математического ожидания и интегрирования. Тогда, учитывая соотношения A0.13) для произведения дифференциалов йФ* (a)t) d® (u>), будем иметь Кгсо = \\ \ъг(- ы,Т + *}(-i^r-1 + ...+%]X X [*« (i*)m + h (/<-¦ +... + bm\ x -i«,r $x (a,) 8 (Ш — toj) da) rfo)j. A2Л9)
in?1 спектральная плотность 105 Наличие под знаком интеграла в качестве множителя дельта-функции S(o) — Wj) позволяет выполнить интегрирование по wv что дает оо /Сж(х)= $ eim\b()(i«>)m + bl(lo>r-i + ... + bm\iSA<»)d<». A2.20) — ОО С другой стороны, между корреляционной функцией Кг(ъ) и ее спектральной плотностью ^(w) существует соотношение 00 Кг(х)= $ «*•"$, (»)<*»• A2.21) — CO Сравнивая B1) и B0), получим для спектральной плотности S2 (<*>) окончательный результат |* 5, (о>> A2.22) Итак, если Z(t) = Pm(p)X(t), A2.23) где X (t) — стационарная случайная функция, а Рт(р) — полином степени т от оператора дифференцирования р = -~ то для получения спектральной плотности случайной функции Z(t) достаточно умножить спектральную плотность Sx(®) на квадрат модуля полинома, получаемого из Рт(р) путем замены р на /со, 5жН=|Ыл)|а5,(со). A2.24) Применим полученный результат к нахождению спектральной плотности стационарного решения неоднородного линейного дифференциального уравнения с постоянными коэффициентами, содержащего в правой части стационарную функцию. Рассмотрим дифференциальное уравнение вида A2.25) или, в символической записи, A2.26) где Qnfy) и Рщ(Р) — полиномы степени п и соответственно т, а X @ — стационарная случайная функция. Если предположить, что решение B6) обладает свойством стационарности, то B4) позволяет сразу выразить спектральную плотность Sv(w) через спектральную плотность Sx(u>)
106 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. I! Действительно, на основании этой формулы левая часть B6) имеет спектральную плотность | Qn(i<*>) \*Sy (<*>), а правая — спектральную плоуюсть | Рт (т) |2 Sx (о)). Следовательно, можно написать I Qn (/«>) i2 Sy (о)) = | Рт (/о>) |* Sx («)). A2.27) Полученное равенство является обычным алгебраическим уравнением, решение которого относительно Sy (<*>) дает s>W=\q^WSA@)' A2-28) т. е. для нахождения спектральной плотности стационарного решения линейного дифференциального уравнения, соответствующего динамической системе, обладающей передаточной функцией Рт (i^)/Qn (fa), достаточно умножить спектральную плотность стационарной функции, поступающей на вход этой системы, на квадрат модуля передаточной функции системы. Для применения полученного правила остается выяснить, в каких случаях решение B6) можно считать стационарной случайной функцией. Представим для этой цели решение B6) в виде суммы общего интеграла однородного уравнения, удовлетворяющего заданным начальным условиям, и частного интеграла неоднородного уравнения, удовлетворяющего нулевым начальным условиям, т. е. в виде fi A2.29) где yj(t) — независимые интегралы однородного уравнения, а tlt A2.30) где весовая функция зависит только от разности (t — ^) вследствие постоянства коэффициентов уравнения. Так как мы предположили коэффициенты aj исходного уравнения постоянными, то частные интегралы yj(t) будут иметь вид е1/, где Ху — корни характеристического уравнения *) Хл4-«1^ + ... + ^ = 0. A2.31) В том случае, когда система, описываемая дифференциальным уравнением, устойчива, все корни характеристического уравнения имеют *) Если среди корней Ху имеются кратные, то некоторые из независимых интегралов будут иметь вид е I R(t)f где R (t) — многочлен относительно U Дальнейшие рассуждения остаются в силе и в этом случае.
I 12] СПЕКТРАЛЬНАЯ ПЛОТНОСТЬ 107 отрицательные вещественные части, и следовательно, при достаточно большом значении времени общий интеграл однородного уравнения можно отбросить вследствие его малости. Для исследования свойств частного интеграла обозначим 02.32) после чего будем иметь $ —'0 Функция Z(t) является стационарной, так как дифференцирование стационарной случайной функции не нарушает стационарности. Для доказательства возможности считать также стационарной и Y{ (t) сделаем замену переменных интегрирования, положив *1==*_т, A2.34) после чего получим t S -Otft. 02.35) Функция р(х), в соответствии с формулой G.22), является суммой показательных функций вида gV и, следовательно, при достаточно большом значении аргумента % может быть принята равной нулю. Поэтому, если t достаточно велико, то без большой ошибки верхний предел в C5) можно заменить на оо, написав о Полученное выражение обладает свойством стационарности, поскольку вероятностные свойства функции Z(t) вследствие ее стационарности не зависят от начала отсчета времени и, следовательно, Z(t — т) так же стационарна, как и Z(t), а пределы интегрирования в C6) постоянны. Итак, мы получили следующий результат: решение B5) можно считать стационарным в том случае* когда момент времени, для которого отыскивается решение этого уравнения, достаточно велик для того, чтобы можно было принять, что все переходные процессы, связанные с начальными условиями, затухнут. В этом случае в качестве спектральной плотности решения уравнения получим простое выражение B8). Во многих практических задачах условия, необходимые для установления стационарного режима динамических систем, описываемых дифференциальным уравнением типа B5), выполняются
108 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ | ГЛ. П достаточно хорошо. Однако бывают случаи (например, автономно- управляемые объекты при резко переменных внешних возмущениях), когда эти условия не выполняются, и следовательно, B8), как и само понятие спектральной плотности, теряет смысл. Дифференцируемость случайных функций, возникающих в техник ческах приложениях, обычно не вызывает сомнений. Однако аналитические выражения, используемые для аппроксимации корреляционных функций и спектральных плотностей различных случайных функций, характеристики которых определяются из опыта, обычно соответствуют или недифференцируемым случайным процессам, или процессам, дифференцируемым один, максимум два раза. Например, для углов качки корабля, так же как и для ординат волнового склона, корреляционная функция достаточно хорошо аппроксимируется выражениями К(т) = <Л?-аМ cospx A2.37) или ^ j A2.38) Первое из этих выражений, как мы уже отмечали ранее, соответствует недиффереицируемому случайному процессу, а второе — процессу, имеющему только первую производную. Поэтому существенно отметить, что B8) остается применимой не только в том случае, когда правая часть рассматриваемого уравнения 02.39) имеет спектральную плотность (т. е. когда взятая аппроксимация для Sjei®) соответствует случайному процессу, дифференцируемому т раз), но и тогда, когда это условие не выполняется, но выражение B8) достаточно быстро убывает с ростом w, чтобы его можно было рассматривать в качестве спектральной плотности, т. е. Для того чтобы это показать, преобразуем интеграл C6) к такому виду, чтобы в подынтегральное выражение не входили производные от X (t). Для этого подставим вместо Z(t) выражение C2) и разобьем полученный таким образом интеграл на сумму интегралов A2<40>
«12| СПЕКТРАЛЬНАЯ ПЛОТНОСТЬ 109 Интегрируя каждый из интегралов, в котором под знаком интеграла имеется производная от случайной функции А^), по частям и учитывая при этом, что все внеинтегральные члены обращаются в нуль, так как первые (п — 2) производные от p(t) при z = 0 и т = оо обращаются в нуль вследствие свойств функции р(х) (см. § 7), получим частный интеграл Yx (t) в виде (при т<^п) оо A2.41) Умножая Y\{f) на Y\(t-\-x) и находя математическое ожидание произведения, после перемены порядка интегрирования и нахождения математического ожидания будем иметь о о X *, (т — т, + *i) Л, dxb A2.42) Выражая корреляционную функцию Кх(ъ) через ее спектральную плотность Sx(u>) согласно A0.47) и меняя порядок интегрирования, получим Каждый из интегралов, стоящих в фигурных скобках, может быть упрощен, если слагаемые в подынтегральных выражениях, содержащие производные от р* (tj) или р (т2), проинтегрировать по частям и учесть при этом, что все внеиитегральные члены обращаются в нуль. Выполнив эти преобразования, получим = \ I31 S S (т^^^^т, |^ 5Х (со) ^ш. A 2.44) О Интеграл 00 \р(х)е**Ч% A2.45)
1 10 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II является преобразованием Фурье функции р (т), соответствующей левой части B5) и, следовательно, согласно формуле G.27) равен 07Щ- <12-46> Подставляя D6) в D4), получим представление /Cyi(t) в виде интеграла Фурье оо — 00 откуда непосредственно следует, что (см. B8)). Так как при выводе D8) мы исходили из интеграла D1), для существования которого не требуется диффершцируемости случайной функции X(t), го полученный результат показывает, что B8) применимо и в том случае, когда для принятой аппроксимации спектральной плотности Sx(u>) произведение | Рт (/о>) |2 Sx (<*>) не может рассматриваться как спектральная плотность правой части исходного дифференциального уравнения. Полученный выше результат показывает, что в этом случае неточность в аппроксимации Sx(<*>) не приводит к существенным ошибкам при определении спектральной плотности выходного процесса, которая может быть найдена по B8) формально так же, как если бы спектральная плотность входного процесса соответствовала дифференцируемой случайной функции. В заключение отметим, что из D8) для спектральной плотности Y\(t) следует формула для спектрального разложения самой случайной функции где дифференциалы йФ(<*>) связаны со спектральной плотностью $х(&) соотношением A0.13). Действительно, из D9) и соотношения A0.13) для спектральной плотности Sy\ («>) следует D8), а так как стационарная случайная функция имеет единственное спектральное разложение, то тем самым наличие разложения D9) можно считать доказанным. § 13. Примеры нахождения спектральных плотностей и корреляционных функций в более сложных случаях Рассмотрим несколько примеров приложения формул предыдущего параграфа. Пример 13.1. Прохождение белого шума через динамическую систему первого порядка.
§ 13] БОЛЕЕ СЛОЖНЫЕ ПРИМЕРЫ i 1 1 Пусть дано дифференциальное уравнение первого порядка A8Л) где а — постоянная, 5 (t) — случайный процесс, обладающий свойством белого шума, для которого в диапазоне частот, существенном для рассматриваемой динамической системы, можно считать S^ (со) = с = const. A3.2) В соответствии с A2.28) для спектральной плотности стационарного решения уравнения A) будем иметь Ординаты полученной спектральной плотности убывают с ростом частоты о). Поэтому постоянство спектральной плотности входного процесса должно быть обеспечено только для тех значений со, для которых множитель 1/((о2-)-а2) не стал еще заметно меньше его значения при ш==0, т. е. шум должен быть «белым» в области, определяемой постоянной а уравнения. Оценим, например, ошибку Д в вычислении дисперсии D[Y(t)] = = tzc/olj возникающей вследствие того, что случайная функция ? (t) считается белым шумом, в то время как спектральная плотность S, (<*>), принятая, согласно B), постоянной, заметно убывает, начиная со значения | 0) | = Шо. Очевидно, что если при | о> | ^> ш0 положить 5? (ю) = 0, то мы тем самым завысим ошибку А. Следовательно, можно написать — со =4? Выполняя интегрирование и переходя к относительной ошибке в дисперсии, получим A3.5) Следовательно, если, например, аH=10а, то относительная ошибка в определении дисперсии будет меньше 6%. Аналогично может быть оценена ошибка из-за допущения постоянства спектральной плотности S^ (w) и в других задачах, связанных с использованием формулы C). В § 11 было показано (см. пример 1), что корреляционной функции /C(t) = oV-M A3.6)
112 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. I соответствует спектральная плотность 5(«) A3.7) Сравнивая C) с G), замечаем, что эти выражения не будут отли- чатьея друг от друга, если положить 0* = ?- 03.8) Следовательно, стационарное решение уравнения, описывающее поведение динамической системы первого порядка, на вход которой поступает белый шум, имеет корреляционную функцию вида F). При рассмотрении корреляционной функции вида F) было отмечено, что она соответствует недифференцируемому случайному процессу. Сейчас можно дать объяснение этому явлению. Действительно, обращаясь к уравнению A), мы видим, что производная —-±± является разностью \{?) — dY{t)s где Y(f)— случайная функция с конечной дисперсией, а спектральную плотность случайного процесса I (t) мы приняли постоянной. Однако физически осуществимого процесса с постоянной спектральной плотностью быть не может, ибо такой процесс должен обладать бесконечной дисперсией. Функция же Y(t) обладает конечной дисперсией, следовательно, разность t(t) — aY(t) будет иметь бесконечную дисперсию, и если ограничиться рассмотрением только физически реализуемых процессов, то следует признать, что производная —-±1~ не существует. Полученный результат является следствием замены реально осуществимой случайной функции l(t) белым шумом, т. е. процессом, обладающим постоянной спектральной плотностью. Несмотря на физическую неосуществимость такого процесса, его применение для данной задачи дает решение Y(f)> имеющее физический смысл вследствие того, что поведение спектральной плотности вне некоторого интервала частот не оказывает влияния на поведение спектральной плотности решения дифференциального уравнения, однако применение понятия «белый шум» уже заметно искажает свойства производной от этого решения. Следовательно, в тех задачах, в которых представляет интерес не только исследование самого решения дифференциального уравнения вида A), но и поведение производной от этого решения, необходимо или уточнить свойства корреляционной функции /С(т) процесса, являющегося входным возмущением для рассматриваемой динамической системы, или уточнить вид дифференциального уравнения, описывающего поведение системы. Динамические системы, описываемые уравнением A), часто встречаются в приложениях. Исторически первой задачей такого типа яви-
«5 13] БОЛЕЕ СЛОЖНЫЕ ПРИМЕРЬ! 1П лась задача о броуновском движении легкой часпшы, взвешенной в жидкости. В этом случае роль случайной функции Y(t) играет компонента скорости частицы, постоянная а характеризует сопротивление среды движению частицы, случайная функция ; (t) пропорциональна компоненте силы, вызываемой случайными ударами молекул жидкости о частицу, а уравнение A) выражает второй закон Ньютона. Так как удары различных молекул о частицу можно считать независимыми и весьма кратковременными, то случайная функция Е (t) имеет ординаты, корреляционная связь между которыми весьма быстро убывает и, следовательно, корреляционная функция /С (t) может приближенно рассматриваться как дельта-функция и функцию %{t) можно рассматривать как белый шум. Кроме разнообразных задач, родственных броуновскому движению (шумы в радиолампах, дрожание зеркальца чувствительного гальванометра вследствие броуновского движения электронов и т. п.), имеется ряд задач, совсем не связанных с броуновским движением, для которых уравнение A) является также достаточно хорошим приближением. К таким задачам относится исследование всех звеньев первого порядка в системах автоматического регулирования, для которых время затухания корреляционной связи между ординатами входной случайной функции заметно меньше времени переходного процесса рассматриваемого звена, а также и исследование более сложных динамических систем, которые в технике часто оказывается возможным приближенно рассматривать как динамические системы первого порядка. Пример 13.2. Прохождение белого шума через динамическую систему второго порядка. Рассмотрим дифференциальное уравнение второго порядка *?+2й^ + Л«К=Е(Э. *>0, A3.9) где h и k — постоянные, а Е (t) — стационарная случайная функция. Уравнение подобного типа возникает всегда, когда при отклонении системы от положения равновесия, характеризуемом величиной Y(t), возникает «восстанавливающая сила» —k*Y(t), пропорциональная Y(t), и «сила торможения» — 2h——-J-, пропорциональная скорости изменения отклонения Y(t). Для того чтобы подобная система была устойчива, как известно, необходимо, чтобы постоянная h была положительна. При этом в случае отсутствия «возмущающей силы» Е (t) движение системы будет носить характер затухающего апериодического или колебательного движения в зависимости от того, будет ли h больше или меньше k. Уравнение (9) описывает многие практически интересные процессы, имеющие совершенно различную физическую природу. К процессам такого типа относятся колебательные явления в электрических цепях
1 14 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II простейшего вида, качка корабля, движение различных гироскопических систем. Кроме того, в некоторых случаях дифференциальные уравнения более высокого порядка, описывающие поведение динамических систем, приближенно могут быть заменены уравнением второго порядка, что еще более повышает интерес к уравнению указанного вида* Согласно общей формуле A2.28) имеем Пусть I (t) обладает свойством белого шума, т. е. 56(ш)я^с = const. A3.11) Тогда формула A0) может быть представлена в виде 5у(о>) = — -г-!—Mg>+aS , , ш 2, A3.12) Уv ' п (аJ — р2 — а2J -|- 4сг со2' v ' где введены обозначения (считаем = h, p = l/A« —ft», о« = 2|у, A3.13) Выражение A2) совпадает с A1.17), полученным в § 11 в качестве спектральной плотности для корреляционной функции вида )Spx + у sin Р | т |V A3.14) Следовательно, стационарное решение (9) имеет корреляционную функцию A4), где постоянные а2, а и р определяются формулами A3). Как было отмечено выше, корреляционная функция A4) соответствуег дифференцируемому случайному процессу, однако второй производной этого процесса не существует, так как (o45y(w) стремится к постоянной при со —> оо. Недифференцируемость первой производной случайного процесса объясняется теми же причинами, что и отсутствие производной от самого решения дифференциального уравнения первого порядка, рассмотренного в предыдущем примере. Полученная корреляционная функция, помимо а2, зависит от двух параметров аир, значения которых существенно влияют на свойства процесса и предопределяют общий характер его реализаций. Параметр а, как и в примере 1, характеризует быстроту убывания корреляционной зависимости между ординатами процесса (чем больше а, тем связь убывает быстрее); значение отношения а/р характеризует «степень нерегулярности процесса»: при малом значении этого отношения ординаты процесса, взятые через промежутки времени 2тс/р, оказываются сильно коррелированными, и реализация процесса ста-
I 13] БОЛЕЕ СЛОЖНЫЕ ПРИМЕРЫ 115 новится похожей на синусоиду; при большом значении а/р периодичность с частотой р становится незаметной. Пример 13.3. В качестве следующего примера рассмотрим определение корреляционной функции стационарного решения дифференциального уравнения где р — обозначение оператора дифференцирования, ? (t) — случайная функция, обладающая свойствами белого шума, a Qn (p) и Рт (р) — многочлены Qn (Р)=РП + агР"'1 + ." + ** О ЗЛ 6) Pm(W = V" + VM + .¦• + *«> 03.17) коэффициенты которых являются постоянными вещественными числами (т<^п). Согласно общей формуле A2.28) в данном случае будем иметь Sy№— \0,г(ш)\*> A3Л8) где с — спектральная плотность Е (t). Для нахождения корреляционной функции Ку(ъ), применяя преобразование Фурье, получим A3.19) Наличие в знаменателе многочлена более высокой степени, чем в числителе (а только в этом случае (IS) можно рассматривать как спектральную плотность стационарного случайного процесса), позволяет вычислить интеграл A9) в конечном виде с помощью вычетов. Действительно, обозначим корни характеристического уравнения <?„(*) = О A3.20) через Xj, Xq, ..., \nV Хл, которые будем считать различными. В этом случае знаменатель выражения, стоящего в A9) под знаком интеграла, можно представить в виде /?*(«))/?я(а))э A3.21) где через Rn(^) обозначено f] A3.22)
116 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ (ГЛ. И а R* @J) — полином, получающийся из Rn (со) путем замены всех произведений tkj их комплексно сопряженными выражениями (— А*). Так как вследствие устойчивости рассматриваемой системы вещественные части всех корней Ху отрицательны, то мнимые части произведений i\j будут также отрицательны и, следовательно, многочлен Rn(z) комплексного переменного z будет иметь корни, расположенные только в верхней полуплоскости комплексного переменного г, в то время как многочлен R%(z) будет иметь корни, лежащие только в нижней полуплоскости. Рассмотрим вместо интеграла A9) интеграл от функции комплексного переменного z Rn(z)R%(z) A3.23) где под Pm(iz) понимается полином от zy получающийся при замене со на г в полиноме Р, Рис. х = е~ух — еу! т I в нижней ницы, а модуль дроби m(/to), а в качестве контура интегрирования L взят контур, состоящий из отрезка вещественной оси, замкнутого полуокружностью радиуса г, расположенной в нижней полуплоскости (рис. 11). Так как /<Г (т) = /С* (—т), а для вещественных случайных процессов /С(т) = = К(—1)> то достаточно рассмотреть т одного знака. Если считать *<^9> т0 М°ДУЛЬ показательной функции \е?*х\ = \е*х{х+*Я\ = полуплоскости (при у<^0) меньше еди- Rn(z)R*(z) при росте \z\ стремится к нулю быстрее, чем lf\z\. В этом случае при г—*оо интеграл по полуокружности будет стремиться к нулю, и следовательно, интеграл B3) будет стремиться к интегралу A9). С другой стороны, под знаком интеграла в B3) стоит аналитическая функция комплексной переменной. Следовательно, его значение равно сумме вычетов c_t (у) относительно полюсов этой функции, лежащих в нижней полуплоскости, умноженной на — 2тс/ (знак минус (—) появляется оттого, что контур L обходится по часовой стрелке). Так как корнями знаменателя, дающими эти полюсы, будут корни полинома R%(z), т. е. значения zj = lk*> то для нахождения вычета с_л (у), соответствующего /-му полюсу, достаточно умножить интегрируемую функцию на (г — tkf) и положить затем z = A*.
13| БОЛЕЕ СЛОЖНЫЕ ПРИМЕРЫ 117 Выполнив эти преобразования, для х <^ О получим + р*{-Урш(Ч> я A3.24> i"Rn№J) П (if-if) i Для нахождения Ку (х) при положительных значениях т достаточна взять вместо B4) его комплексно сопряженное выражение, заменив, одновременно х на —т. Таким образом, для определения корреляционной функции стационарного решения дифференциального уравнения A5) необходимо только- определить корни его характеристического уравнения. Для нахождения дисперсии этого решения можно получить окончательный результат, минуя решение характеристического уравнения, так как, положив в B4) х = 0, получим 2 ^(-^(Х;) , A3.25). П аг- т. е. алгебраическое выражение, содержащее такие комбинации корней характеристического уравнения, которые могут быть выражены- через коэффициенты этого уравнения. Необходимые расчетные формулы можно найти в ряде источников [13J, C3j. Очевидно, что формула A9) для корреляционной функции решения уравнения A5), полученная для ?(?), обладающей свойствами белого шума, остается применимой и в том случае, когда спектральная плотность случайной функции \ (t) не является постоянной, но может быть выражена в виде отношения полиномов частоты о>. Отличие будет заключаться в данном случае только в том, что в A9) под \Qn(lu>)\* и !^/п (•'<») Г2 нужно будет понимать не полиномы, соответствующие левой и правой частям исходного уравнения, а произведение этих полиномов на знаменатель и соответственно числитель спектральной плотности & (<*)). Применим B4) в качестве иллюстрации к нахождению корреляционной функции, соответствующей спектральной плотности, полученной в примере 2, Д I- A3.26) 2 v ' В соответствии с рассмотренным выше способом нахождения корреляционной функции решаем характеристическое уравнение = 0, A3.27)
1 1 8 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II корнями которого будут (k ^> h) — /г3==~/г — /р. Подставляя эти корни в B4), будем иметь (для т (—2А) ~^е (—А — /ЭЧ-А — /В) (—Л — /р — А— /р) (—2Л) %с h~ 2 (В cos Вт — h sin Вт) пс hx ! 0 h . A3.28) Для т любого знака отсюда получаем ' A3'29) что совпадает с результатом, полученным в примере 2 другим способом. Пример 13.4. В заключение рассмотрим вычисление спектральной плотности полинома относительно нормальной случайной функции и ее производных. В отличие от предыдущих примеров, для решения которых закон распределения ординат случайных функций не играл роли, в данном случае предположение о нормальности процесса является необходимым условием для получения простого результата. Рассмотрим сначала выражение Y(f) = X*(f) + c9 A3.30) где X(t) по условию — нормальная стационарная функция, которую для простоты будем считать вещественной и пока положим х = 0. Так как в правую часть C0) функция X(t) входит нелинейным образом, то Y(f) уже не будет нормальной функцией, однако ее стационарность сохраняется, и следовательно, можно определить Sy (со). Действительно, обозначая для краткости A3.31) в качестве корреляционной функции Y{t) будем иметь Ку (т) = М {[XI - М (XI)} \Х\ - М [ХЩ. A3.32) Вследствие стационарности процесса М (XI) = М (XI) = Кх @). A3.33)
I 18] БОЛЕЕ СЛОЖНЫЕ ПРИМЕРЫ 1 19* Следовательно, раскрывая скобки в C2) и пользуясь теоремой о математическом ожидании суммы, будем иметь Ку М = М [Х\Х\] - [Кх (О)]4. A3.34) Так как Хх и Х% являются нормальными случайными величинами, то характеристическая функция этой системы величин имеет вид = ехр {— i- (knz\ + кшг\ + Zk^z,)}, A3.35) где для удобства обозначено ku = kn = KA0), kn = Kx{t)- A3.36) Согласно общим свойствам характеристической функции имеем *) ..' A3-37) что после подстановки C5) для E(zv z%) и дифференцирования даег М (Х&Ъ = 2kU + *ii*« = 2 [/Сл (т)]2 + [Кх (О)]2. A3.38) Следовательно, для корреляционной функции C4) получим окончательное выражение Ку(?) = 2 [Кх (?)?• A3.39) Применяя к последней формуле преобразование Фурье, для спектральной плотности случайного процесса Y(t) получим оо 5><ш) = й S е-*[КЛ*)?*х. A3 40) — ОО Подставляя в последнюю формулу вместо Kx(i) ^e выражение через спектральную плотность Sx(&) Кх(*)= J ^^5,@H^1 A3.41) — оо и рассматривая квадрат интеграла D1) как двойной интеграл, получим оо 5,, (ш) = ^ И i ег («1 + ^ - «) -с ^ (coj) Sx (со2) rfo)lflfa)9 Л. A3.42) *) Выполнение дифференцирования в C7), не связанное с принципиальными трудностями, при вычислении моментов высокого порядка становится утомительным. Расчеты можно существенно упростить, если воспользоваться общими соотношениями, существующими между моментами случайных величин и коэффициентами разложения In E (семиинвариантами). (См. статью: В. П. Леонов и А. Ш и р я е в, К технике вычисления семиинвариантов, Теория вероятностей и ее применения, т. IV, 3, 1959.) В рассматриваемом случае нормального процесса эти соотношения позволяют сразу написать формулу C8).
120 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II Выполняя в последней формуле сначала интегрирование по т и учитывая формулу A0.21) для дельта-функции n jj x, A3.43) - оо получим 00 Sy (ш) = 2 $ $ Sx («,) Sx (ш,) 8 (ш, -f a), - ш) tfco, tfco,. — OO Наличие дельта-функции под знаком интеграла позволяет выполнить интегрирование по <*>2, после чего получим со 5У(«>) = 2 I Sx(^)Sx(^ — ^)d4>1. A3.44) — 00 В том случае, когда X -ф 0, выражение C0) можно преобразовать к виду х] + х*-{-с, A3.30') где функция X(9 — Я имеет нулевое математическое ожидание и, следовательно, функция [X (t) — xf имеет спектральную плотность, определяемую D5). Так как для нормального процесса функции [X(t) — х]- и [X(t) — х] не коррелированы, то спектральная плотность УA) равняется сумме спектральных плотностей первых слагаемых в C0'), т. е. ,при X 9^ О 00 (o). A3.44*) Аналогично можно вычислять спектральные плотности и более ¦сложных выражений, содержащих нормальные случайные функции. Пусть, например, U(t)r=X(t)?>?L = ±.*ix*(t). A3.45) В соответствии с общими правилами нахождения спектральной плотности производной для нахождения спектральной плотности -t-A^@ достаточно умножить спектральную плотность D4') на со2, вследствие чего, учитывая коэффициент в D5), получим окончательно *SA»)- 03.46)
13) БОЛЕВ СЛОЖНЫЕ ПРИМЕРЫ Наконец, рассмотрим выражение 12 г A3.47) где случайные функции X (f) и Y(t) будем считать нормальными и вещественными, а их математические ожидания х и у — равными нулю Обозначим спектральные плотности X(t) и Y(i) через Sx(m) и Sy(^y а взаимную спектральную плотность X(t) и Y(t) — через Sxy(u>). Находя корреляционную функцию W(t) как математическое ожидание произведения \W(t) — w (t)\[W(t-{-x) — w (t-\- x)], получим М * M M т) Г2 @ Y(t+ x)] + c3 M I Г2 @ K2 p + x)] — — [^л- @) + bRxy @) + cKy (O)]2. A3.48) Каждое из математических ожиданий, стоящих в правой части равенства D8), можно рассматривать как соответствующий момент си стемы нормальных случайных величин АГ, = ДГ(^ + т), tfg=K@. Xl=Y(t-\-%), A3.49) A3.50} корреляционная матрица которой имеет вид К АО) Кх(х) Rxy@) Rxy(x) Кх@) RXy(—*) Rxy@) К, @) Kv (x) Kv@) Находя эти моменты путем дифференцирования характеристической функции системы нормальных случайных величин *) после сокращения получим Кю (х) = а*-2 [Кх (х)? + ft« 1К„ (т) /^ (т) + Rxy (x) Rxy (- х)] + + с4 • 2 IK, (t)]« + 2 [^ (х) + /^ (- т)] [аЬКх (х) + *c/Cv (x)] + i, (—*)]• A3.52) *) См. сноску на стр. 119. Дифференцирование в данном случае дает
1 22 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ (ГЛ. II Применяя к обеим частям последнего равенства преобразование Фурье и повторяя рассуждения, аналогичные выводу формулы D4), получим + Sxv (со,) Syx (со - ш,)] + 2c*Sy (со,) Sy (со _ ш,) -}- + Ы [Sxv Ы + Syx (со,)] [aSx (со — со,) 4- cSy (со - -f 2а* [5,у (со - со,) Sxy (со,) + Syx (со _ о),) Syjt (со,)]} rfco,. A3.53) Аналогично могут быть вычислены спектральные плотности и более сложных выражений, составленных из нормальных стационарных функций. § 14. Определение корреляционной функции решения неоднородного дифференциального уравнения с постоянными коэффициентами при нестационарной правой части Определение корреляционной функции решения дифференциального уравнения ^ *^ (ИЛ) где Z(t) — нестационарная случайная функция, а начальные значения Y(t) и первых (п—\) ее производных заданы, является значительно более сложной задачей, чем исследование стационарного решения уравнения с постоянными коэффициентами. Однако и эта задача в ряде случаев может быть решена сравнительно простыми средствами. В большинстве задач, возникающих в приложениях, нестационарность правой части уравнения, определяющего поведение системы, возникает не вследствие того, что исходные возмущения носят нестационарный характер, а потому, что влияние стационарных возмущений на поведение системы меняется со временем. Это приводит к тому, что стационарные случайные функции входят в правую часть уравнения движения системы с переменными коэффициентами. Поэтому большой практический интерес представляет рассмотрение такой задачи, когда случайная функция Z(t) является линейной комбинацией стационарных случайных функций, взятых с переменными коэффициентами. Вследствие линейности уравнения и стационарности производных от стационарной функции достаточно рассмотреть в правой части равенства одну случайную функцию, положив A4.2)
§ 14] ОПРЕДЕЛЕНИЕ КОРРЕЛЯЦИОННОЙ ФУНКЦИИ РЕШЕНИЯ 123 где X(t) стационарна, а <р(?) — заданная функция времени, и исследовать только свойства частного интеграла уравнения Y{ @> удовлетворяющего нулевым начальным условиям, поскольку для получения общего интеграла к Yx (t) достаточно прибавить общий интеграл однородного уравнения, удовлетворяющий заданным начальным условиям, как правило, независимым от случайной функции Z(t). Заменив функцию X (t) ее спектральным разложением \ A4.3) — со функцию Z(t) можно представить в виде Z(t)= I (p(O^^W + cp(OJ?. (H.4) Подставляя это выражение в исходное уравнение A), видим, что правая часть его распадается на сумму функции y(t)X и сумму (интеграл) функций ^, A4.5) коэффициенты оФ(<о) которых не зависят от времени и при решении уравнения должны рассматриваться как постоянные величины. Поэтому частный интеграл уравнения, соответствующий функции Z(f), может быть представлен в виде суммы ух (t) и суммы (интеграла) частных интегралов, соответствующих функциям у(?)ешУ взятым с коэффициентами с1Ф (ю), т. е. 00 ад= J .у о». — оо где у(и>, t) — частный интеграл уравнения, в правой части которого вместо случайной функции Z(t) стоит неслучайная функция у(г)еы\ т. е. функция у (со, t) определяется уравнением ¦дзгД'К *) + -я*=гУ(<»> O + '-' + ^-VK 0 = ?@^. A4.7) Примем для простоты, что начальные значения Y(t), Yf{t)y ... ..., Y^n~l) (f) — заданные (неслучайные) числа. Тогда можно считать, что начальные условия удовлетворены при определении общего интеграла однородного уравнения, и следовательно, решение у(ш, f) уравнения G) нужно искать при нулевых начальных условиях. Уравнение G) решается просто в двух основных случаях: 1) когда ср @ является целой положительной степенью t, г. е. Р, т = 09 1, 2,...; A4.8)
124 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ |ГЛ. II 2) когда <р (t) является показательной функцией времени, т. е. <p(Q = e*. A4.9) Рассмотрим оба эти случая. Случай 1. Частный интеграл уравнения G) может быть представлен в виде полинома относительно t> умноженного на ei<sit. Действительно, положив у (<«, t) равным (#»+ #"-*+... +4.)«"". A4-10) можно подобрать коэффициенты /0, 1Ь ..., 1т таким образом, чтобы G) удовлетворялось тождественно, так как после сокращения на еш* в обеих частях равенства мы получим многочлены относительно t одинаковой степени, приравнивая коэффициенты которых можно определить все коэффициенты lj как функции <о. Однако выражение A0) не удовлетворяет нулевым начальным условиям. Поэтому в качестве решения уравнения G) нужно взять у (a), t) = (// 2 /—1 +23^4 A4.11) «где Рт (to, t) — многочлен степени т относительно t, коэффициенты которого выражаются через коэффициенты уравнения и являются функциями частоты о), Ху — корни характеристического уравнения а постоянные cj могут быть выражены через коэффициенты Lr полинома Рт(«>> 0» ^сли воспользоваться начальными условиями, и следовательно, вообще говоря, являются функциями о>. Учитывая (б), для частного интеграла Yx(t) исходного дифференциального уравнения получим спектральное разложение К, (9= \ \Рт("> 0^+51 СГ/вА'Г]^Ф(»)+Л(О. (Н.13) которое позволяет просто вычислить корреляционную функцию Ку (tv tz). Ограничимся рассмотрением случая, когда дифференциальное,уравнение A) соответствует устойчивой динамической системе, я время i достаточно велико (больше времени переходного процесса), чтобы частные интегралы однородного уравнения е * можно было считать равными нулю, и следовательно, ^ cie^ B 0^) можно было
§ 141 ОПРЕДЕЛЕНИЕ КОРРЕЛЯЦИОННОЙ ФУНКЦИИ РЕШЕНИЯ 125 бы отбросить. Подставляя в этом случае A3) в формулу, определяющую корреляционную функцию К,, (*i. '*) = М {[ КГ (*,) -у* {Щ {К, (^ -д &)]}, A4.14) и пользуясь свойствами дифференциалов а!Ф (to) (т. е. повторяя выкладки, которые были выполнены в § 10 при выводе A0.47)), получим К,, (Ь h) = J Р? (ш, f,) Pm (со, f0 в* ft -'»> 5, (со) Йсо, A4.15) — оо а для дисперсии Yl{t) будем иметь 00 D IК, @] = КУ] it, t)=\ \Рт(ш, 0 |«5, (и) Л). A4.16) — 00 Случай 2. Аналогично получается выражение для корреляционной функции Y{ (t) тогда, когда в правую часть уравнения входит произведение показательной функции ем на стационарную функцию времени. Частный интеграл уравнения G) в этом случае может быть представлен в виде у(ш, t) = A (u>)eik+ ia»'-\- ^cje^f, (H.I 7) так как подстановка A7) в G) показывает, что при )«-* + ... + ап A4Л8> это уравнение удовлетворяется тождественно, а коэффициенты Cj можно выбрать так, чтобы удовлетворить нулевым начальным условиям. Ограничиваясь и здесь только рассмотрением достаточно больших значений времени t и рассматривая частный интеграл Y\(t) как суперпозицию интегралов A7), получим спектральное разложение для Y\(t) <50 К, (t) = J <.<ft+'"»' -q^—j^ <«> (») + Ji @. (ИЛ 9) — 00 где через Qn(p) обозначен полином, получающийся из левой части A) путем формальной замены операции дифференцирования на р Qn (Р)=РП + alPn-1 +... + а„. A4.20) Вычисляя для данного случая корреляционную функцию /<у (tx> t%)> долучим формулу оо J |QJ*yto)|, *о, A4.21)
126 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II которая несколько напоминает выражение для корреляционной функции стационарного решения неоднородного линейного дифференциального уравнения с постоянными коэффициентами и стационарной правой частью A2.47), отличаясь от него следующим: во-первых, перед интегралом стоит добавочный множитель ек** + к**1 A4.22) и, во-вторых, в выражении „ ¦ для передаточной функции /со заменено на (/со -\- k). При чисто мнимом k (k = tk1) множитель B2) обращается в ?**i('2-*i), корреляционная функция Ку (tlt t%) будет зависеть только от разности моментов времени (t.2 — tx) и, следовательно, будет стационарна. В этом случае Y\(t) будет иметь спектральную плотность, определяемую равенством V">eJTt?Wr- A4-23) При комплексном или вещественном k стационарность функции Y\(t) исчезает, так как множитель еы* + к*\ стоящий перед знаком интеграла в B1), в этом случае не является функцией т = (?2— tt), и следовательно, корреляционная функция Ку (tv t%) уже не может быть представлена в виде функции разности (?2 — ^). Если время t нельзя считать большим, то подстановка A3) в A4) дает — 00 /=1 A4.24) Кроме рассмотренных выше двух случаев, простая окончательная формула для корреляционной функции решения уравнения A) может быть получена и тогда, когда в правой части A) имеется линейная комбинация выражений вида tmeMX(t), т. е. когда г Z @ = 2 bjtmiekfx (t). A4.25) /=i В этом случае частный интеграл уравнения G) может быть представлен в виде суммы полиномов от t, умноженных на показательные функции ekf\ коэффициенты которых просто выражаются через коэффициенты cij уравнения A). Подстановка полученных таким образом частных интегралов у (со, t) в F) позволяет получить спектральное разложение случайной функ-
§ 14j ОПРЕДЕЛЕНИЕ КОРРЕЛЯЦИОННОЙ ФУНКЦИИ РЕШЕНИЯ 127 ции Y\(t), а затем и выражение для корреляционной функции процесса. Наличие в правой части B5), кроме самой стационарной функции X(t), ее производных не усложняет решения задачи. При рассмотрении уравнения A) мы считали, что начальные значения искомой функции Y(f) и ее производных не случайны. Если эти значения являются случайными величинами, то ход решения задачи не изменится, однако вместо формулы F) решение уравнения A) будет иметь вид 00 П Y(t)=\y (ш, 0йФ(<о) + 2 C,eV + j, (Q, A4.26) —00 /—1 где Ху — по-прежнему корни характеристического уравнения A2), п а ^?jCjeK/ — решение однородного уравнения, соответствующего A), для которого в качестве начальных значений УA) и ее производных взяты заданные начальные условия. Рассмотрим несколько примеров. Пример 14.1. Определить для момента t дисперсию частного интеграла уравнения *Ш+аУ(9 = Щ*), A4.27) удовлетворяющего нулевым начальным условиям, если спектральная плотность X(t) задана 5*(<о) = ?_. хк ' те со2 -f- а2 Частный интеграл у (ш, t) в данном случае будет иметь вид A4.28) Если а^>0 и считать, что t больше времени переходного процесса, согласно общей формуле A6) получим 00 (со2 -}- а2) (<* + а —оо Вычисляя интеграл с помощью вычетов, получим окончательно (И-31) В общем случае, когда t нельзя считать большим и а любое, подставляя B9) в F) и вычисляя дисперсию полученного спектрального
128 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. П разложения, после выполнения интегрирования будем иметь Очевидно, при а)>0 и достаточно большом U когда можно положить еа/^0, C1) совпадает с C2). Пример 14.2. Определить корреляционную функцию решения уравнения ^^ A4.33) если Sx(") = — * , , A4.34) k ^> h ^> 0; К h — вещественные постоянные, а переходный процесс можно считать закончившимся. Согласно B1) имеем Ку, ('!»'») = 00 J со а2) [а>4 + 4Л (k + h) и>* + W (k + ЛJ ] ' Используя и в этом случае теорему о вычетах, получим ! — 2?* — 6h {k + h)) cos jk -f |x|]#-^+*h^}, A4.36) где р = |^Ла — h\ x = U — tv Пример 14.3. Найти корреляционную функцию решения уравнения (при нулевых начальных условиях) y$) A4.37) если a, bQ> bt — вещественные постоянные, а (ш)=в—-j4-j. A4.38) v ' я о»8 -)- a8 v '
§ 15) ЛИНЕЙНОЕ УРАВНЕНИЕ С ПЕРЕМЕННЫМИ КОЭФФИЦИЕНТАМИ 129 В качестве частного интеграла у(<*>, f) в данном случае нужно взять частный интеграл уравнения, в правой части которого стоит выражение (Ь0-{-ШЬ{)е, т. е. _ ? (а + коJ Подстановка этого выражения в F) дает со +Ле "Т (а + ш? Х t. A4.39) X (еШ — e'at)\ d® («)) + Э\ @. A4.40) где свойства ^Ф(ш) определяются заданной спектральной плотностью S,(<o). Вычисляя корреляционную функцию обычным способом, получим Интегрирование и здесь может быть выполнено с помощью вычетов, однако окончательное выражение получается довольно громоздким. § 15. Линейное дифференциальное уравнение с переменными коэффициентами Рассмотренные в предыдущем параграфе методы допускают обобщение на случай, когда коэффициенты линейного дифференциального уравнения являются заданными функциями- времени, а в правой части уравнения стоит выражение, получающееся в результате применения линейного оператора к стационарной случайной функции, характеристики которой известны. Действительно, пусть имеется дифференциальное уравнение A5.1) где X(t) — стационарная случайная функция, L—однородный линейный оператор, а начальные значения Y(t) и ее первых (п— 1) производных будем считать заданными (не случайными) величинами. Подставив вместо X(t) ее спектральное разложение со X(t)=\ eMd<f> (о)) + X A6.2) —ОО б А. А. Свешников — 1388
130 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II и предполагая, что порядок применения оператора L и порядок интегрирования по to можно менять местами, правую часть A) можно представить в виде оо ЬЛ?Ф(и>). A5.3) Следовательно, если обозначить частный интеграл уравнения A), соответствующий правой части уравнения Ъеш A5.4) и нулевым начальным условиям, через у («>, t), то частный интеграл уравнения A) может быть представлен в виде 00 Y\ (t)—\y (», t)d<b(ш)-f5>@. A5.5) —оо где у it) удовлетворяет A) после замены X(t) на X и заданным начальным условиям. Рассуждая так же, как мы это делали в аналогичных случаях, для корреляционной функции Ку (tv t%) будем иметь КУ] (tl9 t,) = \ у* (о), tx)y (о), U) Sx (о)) *о. A5.6) —00 Следовательно, для определения Ку (tv t%) достаточно найти частные интегралы у («>, t), поскольку спектральная плотность Sx (w) предполагается заданной. Функцию у (ш, ?), как правило, не удается получить в виде конечного аналитического выражения, так как решение линейного уравнения с переменными коэффициентами не может быть найдено в общем виде. Однако при наличии вычислительных машин (цифровых или моделирующих) определение у (w, t) не представляет принципиальных трудностей, так как случайная функция X (t)K заменена показательной функцией еш> и следовательно, задача сводится к решению уравнения, в котором коэффициенты и правая часть уравнения — заданные функции времени. Так ^как при таком решении удобнее иметь дело с вещественными величинами, то вместо комплексной функции егЫ можно воспользоваться тригонометрическими функциями cos is>t и sin Ы. Обозначив частные интегралы, соответствующие замене в A) X(t) на cos ®t и sinotf, через ус ((*>, f) и ys(w, t) соответственно, вследствие наличия соотношения еш = cos ^ -f / sin tot, A5.7) линейности уравнения A) и линейности оператора L будем иметь У К О =ус ^ t) + iys (o>, t), A5.8)
§ 151 ЛИНЕЙНОЕ УРАВНЕНИЕ С ПЕРЕМЕННЫМИ КОЭФФИЦИЕНТАМИ 131 что после подстановки в F) дает 00 = I [Ус (<°. У — 1У, («>. Щ [Уо (»> «О + ty, К «01 Sx («) *•• A5.9) —00 Во многих задачах достаточно знать дисперсию случайного процесса Yx(t) в определенный- момент времени. Полагая в этом случае tx = t% = U получим D[Y](t)]= J [yS(«,O + -VS(«>. t)]SA«>)d«>- A5.10) —to Формула A0) показывает, что для нахождения дисперсии частного решения A) нет необходимости в определении значений функций Ус (ю» О и ys (Ш> О ДЛЯ различных значений t> а достаточно знать ординаты этих функций только для того момента времени, для которого требуется найти дисперсию. Это значительно упрощает решение задачи и делает данный способ весьма удобным на практике. Пример 15.1. Рассмотрим пример, позволяющий определить j/(o), t) в конечном виде. Пусть дано уравнение rjxeX(t) — стационарная случайная функция, имеющая за аанную спектральную плотность S* (<*>), а при ? = 0 0. A5.12) Однородное уравнение, соответствующее ^неоднородному уравнению A1), есть уравнение Бесселя и, следовательно, в качестве его независимых частных интегралов можно взять Л @ = Л @> У* @ = Wv @, A5.13) где </v (t) — функция Бесселя 1-го рода, Nv@~ функция Бесселя 2-го рода (функция Неймана), a v — порядок функции. Подставляя эти выражения в G.22) для весовой функции р (t, tx) и пользуясь свойствами функций Бесселя, получим p{Utl) = ^tl[Uk)N^t)- NAh)Ut)\ A5.14) Таким образом, для искомого частного интеграла уравнения получим явное выражение через его правую часть n(9=-Jjj hVAh)KV)-KVOJAm-^1 Mt. A6.16) 8»
132 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. И Подставляя сюда вместо Х(г{) ее спектральное разложение и находя корреляционную функцию обычным способом, получим ti t2 оо ъ2 С СС О 0 —оо - ^v (о л со] г [л <п лг, (ад - a^v (О л (ад] s, и ш*<*о <й"^. о ел в) Рассмотренный пример показывает, что даже для линейных уравнений с переменными коэффициентами, допускающих аналитическое нахождение независимых интегралов соответствующего однородного уравнения, вычисление корреляционной функции интеграла неоднородного уравнения сопряжено с большими вычислительными трудностями. Поэтому расчеты подобного рода в настоящее время, как правило, производят на электронных вычислительных машинах. При этом наряду с изложенным выше способом определения частных интегралов уравнения, получающегося после замены стационарной случайной функции в правой части уравнения показательной функцией (нахождение решений, которые мы обозначили выше у(и>, ?)), используются и другие методы. Некоторые из этих методов можно найти в [28], [33], [17]. В заключение отметим, что (б) и F), полученные в этом параграфе для дифференциального уравнения с переменными коэффициентами, остаются в силе и для уравнений с постоянными коэффициентами, однако в последнем случае эти формулы упрощаются. Упрощение состоит в том, что для уравнений с постоянными коэффициентами частный интеграл у(®> t), требующий для своего получения в случае уравнения с переменными коэффициентами, как правило, числовых вычислений (или применения вычислительных машин), имеет простую аналитическую форму. Например, если оператор L является дифференциальным оператором с постоянными коэффициентами L = Pm(p), A5.17 где Рт (р) — полином степени т, а р — оператор дифференцирования, то AбЛ8) где Qn (/(о) — многочлен, получающийся из оператора дифференцирования, стоящего в левой части уравнения, путем замены оператора дифференцирования умножением на 1% Xj — корни характеристического уравнения (для простоты корни считаем разными) (Ш = а A5Л9
& 16) ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ РЕШЕНИЙ 133 а коэффициенты Cj(<*>) должны быть выбраны так, чтобы у(и>, t) и (п—1) производные ее по времени обращались в нуль при t = 0. Для этого необходимо, чтобы Cj удовлетворяли следующей системе линейных уравнений: 2с,—. /-i /=i /~1 В том случае, когда t достаточно велико (переходный процесс можно считать закончившимся), сумму в A8) можно отбросить и вместо E) получим оо — 00 что для спектральной плотности &,(<*>) дает то же выражение A2.27) которое было получено в § 12 для этого случая другим способом. § 16. Вероятностные характеристики решений системы линейных уравнений Всякая система линейных дифференциальных уравнений может быть заменена одним линейным уравнением более высокого порядка. Поэтому при исследовании вероятностных характеристик решений системы линейных уравнений можно свести ее к одному уравнению и затем воспользоваться теми результатами, которые были даны выше для этого случая. Однако такой способ действия не является наиболее экономным, так как в большинстве случаев исходной является система уравнений и ее приведение к одному уравнению требует добавочных выкладок. Кроме того, при исследовании одного уравнения, эквивалентного системе уравнений, мы не можем просто учесть два обстоятельства, являющиеся существенными при решении практических задач: во-первых, обычно представляет интерес не одна неизвестная функция, являющаяся решением уравнения, а ряд (или все) случайных функций, образующих набор решений системы уравнений, для которых необходимо определить не только корреляционные функции, но и корреляционные функции связи. При замене же системы уравнений одним уравнением мы по необходимости получим
13-1 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ iiJl. 11 решение только для одной неизвестной функции; во-вторых, в различные уравнения системы, как правило, входят различные случайные функции, которые являются заданными (т. е. вероятностные характеристики которых являются известными). При сведении системы к одному уравнению в правой части его мы получим более или менее сложную комбинацию этих функций и их производных, вероятностные характеристики которой нужно определять предварительно по вероятностным характеристикам исходных случайных функций. Поэтому целесообразно рассмотреть методы, позволяющие исследовать поведение решений системы линейных дифференциальных уравнений без сведения системы к одному уравнению более высокого порядка. Начнем решение этой- задачи с рассмотрения системы линейных дифференциальных уравнений с постоянными коэффициентами, причем, прежде чем ставить задачу в общем виде, рассмотрим два уравнения с двумя неизвестными функциями, у которых переменные разделены, т. е. рассмотрим систему вида X1(t)> 06.1) **@. A6.2) Так как рассматриваемые уравнения линейны, то достаточно рассмотреть случай, когда начальные условия нулевые; переход к любым другим начальным условиям эквивалентен изменению правых частей равенств A) и B) на некоторые слагаемые, которые будут числовыми (не случайными) функциями времени, если начальные условия не случайны, и случайными функциями времени, если начальные значения Y(t)} Z(() и их производных — случайные величины. В обоих случаях вид уравнений остается без изменения, а изменяются только математические ожидания или математические ожидания и корреляционные функции правых частей равенств. Будем считать, что математические ожидания, корреляционные функции и корреляционные функции связи случайных функций Xx(t) и X%(t) известны. Предположим пока, что эти функции стационарны и стационарно связаны. В этом случае известными предполагаются: xv хъ KXl (*)> Кх2 (t)> Rxtx2 (T)- Искомыми являются функции y(t), z(t), Ky(tv U) Kgifv *0 и RyzVb *«)• Введя оператор дифференцирования р, заданные уравнения можно переписать в виде Xi(t), A6.3) X,(t), A6.4) ряе QniP) и Рщ(р)—полиномы от р степени п и соответственно т. Каждое из рассматриваемых уравнений определяет неизвестную функцию как результат применения линейного оператора к правой
% 16] ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ РЕШЕНИЙ 135 части уравнения. Поэтому в соответствии с общими правилами, изложенными в § 7, для нахождения математических ожиданий у (t) и z(t) нужно правые части A) и B) заменить их математическими ожиданиями Хх и j?2 и решить эти уравнения при заданных {нулевых) начальных условиях. Очевидно, что, несмотря на постоянство х^ и х& до тех пор, пока не затухнет переходный процесс, y(t) и z{t) будут зависеть от времени. После затухания переходного процесса установятся равенства j; = l^, 2 = ^-jc* A6.5) Поскольку учет влияния математических ожиданий правых частей уравнений не представляет каких-либо трудностей, для простоты в дальнейшем будем считать, что j^ = je2 = 0. Для нахождения корреляционных функций решений будем по-прежнему исходить из спектрального разложения случайных функций Х\ (t) и <Y2@> т. е. положим 00 Xi(t)= $ в"* «№,(«* A6.6) — 00 00 *,(Q= $ *""а!Ф,(тХ A6.7) — 00 где дифференциалы d<&i(w) и d<D.2(«>) удовлетворяют соотношениям М [<*Ф? (о)) йФ, (<!>!)] = 8 ((о — о)^ 5^А (со) ico rfa)^ A6.8) М [?/Ф? (О)) ЙФ, @H] = 8 (СО — (Oj 5Л2 @)) rfO) flfO)!, A 6.9) М \AФ} (со) ^Фд (шО] = 8 (<о — оо^) 5Л^2 (оо) rfa) du>v A6.10) Обозначим, как и при исследовании решения одного уравнения, интегралы, получаемые для каждого из рассматриваемых уравнений (при нулевых начальных условиях) после замены случайной функции, стоящей справа, показательной функцией еш, через у (со, t) и г(о), t) соответственно Тогда, повторяя рассуждения предыдущего параграфа, для искомых случайных функций будем иметь оо Y(f)= \ y(w, Q<*<Di(">). A6.11) — СО 00 Z(t)= \ г(ш,0^Ф,(«> A6.12) — 00 Подставляя эти выражения в формулы для корреляционной функции и для корреляционной функции связи, после перестановки
1 36 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II операции интегрирования и операции нахождения математического ожидания и учета соотношений (8), (9), A0) получим сю Ку (*» к) = \ у* (о), tx)y (ш, t%) SXl (ш) (Но, A6.13) — 00 00 KjiU h)= \ «•(». tt)z(w, <4)S*2(a>)tf<», A6.14) — 00 CO RvAh> k) = \ У* К h) z (to, tj SXlX3 (a)) dm. A6.15) В рассматриваемом случае уравнений с постоянными коэффициентами функции у(о>, t) и г(ш, t) имеют простые аналитические выражения (см. конец § 15) п v(Wj ° = Q^Wf еШ + 2С/(@)вV' A6Л6) г (a), t) = p е1Ш -f У Gk (a>) erv, A6.17) где X/ и \xk — корни характеристических уравнений Qn(X)=:O, Pm(|A)=0, A6.18) а функции частоты С/О») и Gk(u>) определяются из систем линейных алгебраических уравнений, получающихся из условия обращения в нуль при ^ = 0 функций у(о), t)y <г(ш, t) и их производных по t до (п— 1)-го и соответственно (т—1)-го порядка. При достаточно большом значении времени t> при котором можно считать все показательные функции eXft и е^ равными нулю (т. е. при котором переходный процесс можно считать законченным), A3), A4) и A5) принимают вид Ш \ О(Ы) I2 d% A6.19) Таким образом, в этом случае решениями уравнений являются стационарные и стационарно связанные функции, спектральные плотно-
% 16] ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ РЕШЕНИЙ 137 сти Sy (<*>) и Sz (о)) и взаимная спектральная плотность SV2 (<*>) которых определяются алгебраическими выражениями ^>=жйт« A6-22) 5 (цл — S^(a>) A6.23) ^Ц)- A6-24) Если случайные функции Xv(f) и -#3(?) получаются в результате применения различных дифференциальных операторов (коэффициенты которых не зависят от времени) к одной и той же стационарной случайной функции X(t)> то последние формулы несколько упрощаются. Пусть, например, X1(f) = Ml(p)X(f)J A6.25) A6.26) где Mt (p) и Nkip) — полиномы с постоянными коэффициентами степени / и k соответственно,/? — оператор дифференцирования, а X(t) — стационарная случайная функция. Легко убедиться, что в этом случае B2), B3) и B4) примут вид Ms*^> <16-27> N. Когда правые части A) и B) не являются стационарными или коэффициенты уравнений зависят от времени, решения этих уравнений, естественно, не будут обладать свойством стационарности при любом t. Однако если Х\ (t) и Х% (t) являются результатом применения линейных операторов к стационарным случайным функциям, формулы A1) и A2) остаются в силе, но только функции у (о>, t) и z (<*>, t) будут иметь более сложное выражение. Для некоторых операторов, например для линейной комбинации стационарной функции и ее производных, коэффициентами которой служат полиномы от t, в случае постоянства коэффициентов уравнений, функции j/(co, f) и 2(оо, t) могут быть выражены сравнительно "просто, для других операторов формулы получаются более сложными.
138 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II Перейдем к рассмотрению общего случая системы линейных дифференциальных уравнений с постоянными коэффициентами. Пусть задана система уравнений в каноническом виде /=1, 2, .... л, A6.30) где первый индекс у постоянного коэффициента а/т показывает номер уравнения, к которому он относится, а второй индекс показывает, у какой неизвестной функции он является коэффициентом. Будем считать случайные функции Xj(t) стационарными и стационарно связанными друг с другом. Известными предполагаются все математические ожидания, все корреляционные функции и все корреляционные функции связи функций Xj(t)y /=1, 2, .... я, а также начальные условия, которые будем считать нулевыми. Так как для нахождения математических ожиданий случайных функций Yj{t), в соответствии с общей теорией линейных операторов, применяемых к заданным случайным функциям, достаточно в системе уравнений все случайные функции заменить их математическими ожиданиями, то для определения J7y (t) будем иметь систему уравнений =Ь2, .... я, A6.31) которая решается обычными методами, разработанными для решения систем дифференциальных уравнений с постоянными коэффициентами. Таким образом, задачу определения математических ожиданий искомых функций Yj (t) можно считать решенной, а поскольку значение математического ожидания функции, к которой применяется линейный оператор, не оказывает влияния на значения корреляционных функций и корреляционных функций связи, при нахождении этих корреляционных функций мы будем считать все J7y = 0 и все Xj = 0. Заменим каждую из случайных функций Xj(t) ее спектральным разложением Xj(t)= $ е*"<Я>/(«>), A6.32) — оо где дифференциалы rf<Dy(o>) удовлетворяют соотношениям М [dOJ (о)) d®} (coj)] = 8 (со —- wj) SXf(<*>) day rfcoj, A6.33) M [tfOJ ((o) d<bt К)] = В (со — coj) SXfXl (o)) flfa d(ov A6.34) /, /=1, 2, ..., n. Вследствие линейности системы уравнений C0) для получения искомого интеграла системы достаточно найти частные интегралы новых
§ 1в] ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ РЕШЕНИЙ 139 систем уравнений, получающихся из C0) путем замены нулем правых частей во всех уравнениях, кроме одного (например, /-го уравнения), и суммирования полученных таким образом выражений. С другой стороны, частный интеграл каждой из этих новых систем 4Фавнений может быть получен путем суммирования (интегрирования) с коэффициентами с1Ф1 (<*>) частных интегралов, соответствующих замене Xt (t) на е1ЫУ а всех остальных Xj (t) (для ] ф I) нулями. Таким образом, получается следующая схема расчета, которая мало отличается от схемы расчета, подробно рассмотренной выше на примере двух уравнений: 1. Заменяем все случайные функции Xj(f) нулями, кроме Xt{f\ которую заменяем показательной функцией егЫ. 2. Находим частный интеграл полученной таким образом системы уравнений, удовлегворяющий нулевым начальным условиям. Обозначим этот частный интеграл, соответствующий искомой у'-й случайной функции, через у д (о), t), где второй индекс /необходим в обозначениях, чтобы отметить тот факт, что правая часть сохранена только в /-м уравнении. 3. Определяем частный интеграл системы, у которой в /-м уравнении сохранена в правой часги случайная функция Xt(t), а все остальные правые части уравнений заменены нулями. В соответствии с вышеизложенным этот частный интеграл имеет вид 00 $ JV/K *)<*Ф/(<°)> U j=h % ...> * A6.35) — 00 4. Наконец, суммируя по индексу / все выражения вида C5), находим случайные функции Y/ (t)9 являющиеся решениями исходной системы уравнений п со Y,(t) = 2 \ уп(и, О^Ф^ю), /=1,2,..., л A6.36) /=1 -со Полученная формула является решением поставленной задачи, так как выражение C6) дает спектральное разложение искомых случайных функций; пользуясь C6), можно определить все необходимые корреляционные функции и корреляционные функции связи. Действительно, подставляя это выражение в формулу для корреляционной функции Kyj (tv U) = М [ Yf (tx) Yj Ш A6.37) меняя порядок нахождения математического ожидания с суммированием и интегрированием и используя соотношения C3) и C4), получим Kyj(tlt f,) = S $ j>JK», l /=1 —00 E S S У№> *дУ»И*> *0$гл(«)<*», /=1, 2, .... я. A6.38) fe = l _oo
! 40 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ (ГЛ. II Аналогично для корреляционных функций связи п оо l=\ —00 S l?}ii»'tdymk(".tdSx.(»)dm, A6.39) 1 —oo /, m = l, 2, ..., я. Полученные формулы имеют довольно сложный вид, однако в ряде случаев они упрощаются вследствие того, что некоторые исходные уравнения могут не содержать случайных функций в правых частях равенства и вследствие этого ряд слагаемых в C8) и C9) исчезает. Для того чтобы полученные формулы можно было применить практически, необходимо еще выписать в явном виде функции уд ((*>, f)y входящие в эти формулы. Система уравнений, определяющая эти функции, имеет вид ^ 2 A6.40) где Ъд обозначает, как обычно, единицу, если / = /, и нуль, если j ф /, а со играет роль параметра (а не независимой переменной системы уравнений). Как известно из общей теории систем дифференциальных уравнений с постоянными коэффициентами, частное решение, удовлетворяющее системе уравнений D0), можно получить в виде Апеш, A6.41) где Ад — постоянные, не зависящие от t. Действительно, подставив D1) в D0), после сокращения на еы получим систему алгебраических уравнений + S ufmAml = hv / = 1, 2, ..., Л, A6.42) m = l которая имеет решение*) An = h-U, A6.43) *) Считаем, что исходная система дифференциальных уравнений соответствует устойчивой динамической системе, и, следовательно, характеристическое уравнение системы D6) не может иметь чисто мнимых корней. Поэтому т при любом (о не может быть корнем характеристического уравнения. В противном случае в D1) вместо постоянных Л# надо было взять полиномы от t.
§ 16] ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ РЕШЕНИЙ 141 где А — определитель системы ап ... а1п AU2J /<*> -\- Яад ... <Хъп ела лл\ = , A0.44) a Ajy — алгебраическое дополнение этого определителя, соответствующее элементу, стоящему на пересечении 1-й строки и у-го столбца* Таким образом, частный интеграл системы D0) найден. Однако D1) не удовлетворяет нулевым начальным условиям. Поэтому к ним надо добавить линейные комбинации независимых частных интегралов однородной системы уравнений, соответствующей системе D0), т. е. окончательно будем иметь У Л К 0 = Ал («>) еш + 2 Ст (со) ек*, A6.45) 1 где Cjiki^) — постоянные относительно t, определяемые таким образом, чтобы уд(м, t) обращались в нуль при ? = 0, а ХЛ — корни характеристического уравнения системы ... а1п апХ = 0. A6.46) При достаточно большом ty вследствие устойчивости системы, слагаемыми вида CjlkeXkt можно пренебречь, и вместо D5) получим Уу/(ц>, г) = Апеш. A6.47) Подставляя эти значения в C8) и C9), получим Kyj{tbt?= \ { /=1 A6.48) ш) Лтй (ш) .49) k 1фк
142 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II т. е. случайные функции Yj(f) оказываются стационарными и стационарно связанными. Их спектральные плотности и взаимные спектральные плотности на основании D8) и D9) определяются алгебраическими выражениями /— 1 Immlk— 1фк И Am И 2 Л*< <w) Amk («) $*„* К A6.51) i Итак, система линейных дифференциальных уравнений со стационарными правыми частями исследуется теми же методами, что и одно уравнение с постоянными коэффициентами. В том случае, когда коэффициенты системы не являются постоянными, C6), C8) и C9), естественно, остаются в силе, однако входящие в эти формулы частные интегралы Ул(и>, t) уже не могут быть определены так просто. В некоторых простейших случаях их также удается вычислить аналитически, однако в большинстве случаев приходится прибегать к числовым методам расчета или к помощи электронных вычислительных машин, которые для решения подобных эадач оказываются весьма эффективными. Когда случайные функции Xj(t), входящие в правые части заданной системы уравнений, не являются стационарными, но образованы путем применения линейных операторов к стационарным случайным функциям, исходная формула C6) также останется справедливой, однако вид системы D0), определяющей значения интегралов уд (о>, t), изменится вследствие того, что коэффициентами у дифференциалов оказательные функции е, а более сложные / у (со) теперь будут не показательные выражения. Пусть, например, правой частью /-го уравнения служит выражение t $^*,W A6.52) Тогда, заменяя Xt(t) ее спектральным разложением, это выражение можно представить в виде — 1)-|-**•>«""'] ««М»), A6.53)
§ 18] ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ РЕШЕНИЙ 143 и следовательно, в правой части системы уравнений D0) для данного значения / нужно будет взять не показательную функцию emt, a выражение (JL л- ть)еш — 4-. A6.54) Если коэффициенты системы уравнений постоянны, а операторы, действующие на стационарные функции в правых частях системы, не особенно сложны, то нахождение частных интегралов у^ (о>, f) и в этом случае обычно удается довести до конца аналитическим способом; для уравнений с переменными коэффициентами приходится обращаться к вычислительным машинам. Наконец, в том случае, когда правые части уравнений не являются стационарными и не могут быть получены из стационарных случайных функций путем применения линейных операторов, изложенные выше методы, основанные на использовании спектральных разложений стационарных случайных функций, естественно, перестают, быть применимыми. В этом случае для получения вероятностных характеристик решений линейной системы уравнений можно или явно выразить каждую из искомых функций через правые части уравнений (в виде интегралов, содержащих соответствующие весовые функции системы) и определить математические ожидания, корреляционные функции и корреляционные функции связи, пользуясь общими формулами для линейных операторов, действующих на заданные функции, или пользоваться методом канонических разложений случайных функций, о котором несколько подробнее будет сказано в § 47. Однако в случае произвольных случайных функций оба эти метода приводят к достаточно громоздким вычислениям, выполнить которые практически удается только с привлечением современных вычислительных машин. Для большинства задач, с которыми приходится иметь дело в технических приложениях, этих общих, но более громоздких методов удается избегать, используя методы, изложенные выше. В заключение данного параграфа отметим, что в том случае, когда нас интересуют решения заданной системы уравнений не при нулевых начальных условиях, а при определенных начальных значениях искомых функций Yj @), вместо C6) в качестве решений заданной системы уравнений нужно взять yj @=2 I Уп 0й' 0 <Я>1 («О + 2 слв v' У = 1. 2, .... я, /=1—00 /=*1 A6.55) где постоянные Cjt определяются по начальным условиям и, следовательно, линейно выражаются через начальные значения КДО) ординат искомых случайных функций.
144 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ {ГЛ. 1! При вычислении корреляционных функций и корреляционных функций связи Yj(t)y в соответствии с E5), необходимо располагать корреляционными моментами величин Yj(Q) как между собой, так и со случайными функциями Xj(t). Если по условию задачи величины п Yj(O) не являются случайными, то слагаемое 2 Cjie*1* B E5) изме- i = \ яяет только математическое ожидание Yj{t). Рассмотрим несколько примеров, поясняющих нахождение вероятностных характеристик решений системы линейных дифференциальных уравнений. Пример 16.1. Дана система где Х\ @ и Xq (t) — стационарные случайные функции, а Определить спектральные плотности и взаимные спектральные плотности стационарных решений системы. Для приведения системы к каноническому виду введем новые обозначения, положив Z(f)=Y%(f). Y(t)=Y3(t), после чего система примет вид В соответствии с D4) имеем О 9 — 1 0 4 О
§ 16) ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ РЕШЕНИЙ 145 откуда находим нужные для решения задачи алгебраические дополнения А/у- и по D3) определяем Ац Дв = 0, Д.21 = — /со, Ди = B + /ш)« и т. д., Подставляя найденные значения Alt в E0) и E1) и учитывая, что ?*3 0°) = «W, (">) = SXiXt (<») = 0, получим о^_ол.л 1 jeJK + 81) ¦ Щ _, ¦ 2а К-9 К-2J] > ,(а)) = 5У2(со)=-—- — Sy3y2 (со) = [ 2°! Пример 16.2. Дана система дифференциальных уравнений где t дано в секундах. Определить дисперсии Y\ и К2 для ? = 0,5 сек, если при? = 0 Kj (f) и Кз(О — случайные величины, не коррелированные со случайными функциями Xt(t) и ^@» Df К! @I=1, D[K2@)] = 2, корреляционный момент а стационарная функция #(?) имеет спектральную плотность Корни характеристического уравнения системы 3 + Х —1 ' =0, ll = — I 1/cw, X.2 = ~~2 1/cw. Следовательно, за время ? = 0,5 сек переходный процесс еще не затухает, и для определения дисперсии по C8) необходимо определять частные интегралы yjt (со, t) по общей формуле D5).
146 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ [ГЛ. II Применение этой формулы к данному случаю дает: У\л (w> 0 = х №Ш + О» — 20 б"' — 2 (ш — 0 г"*'], Л.« 0* 0 = т 1^ -' (ш - 2/> *"' + '(«> — 0 ^*]. Л.1 К 0 = тI -*Ш + /(<* — 2Q *^ — /(« —о*"*], Аа (о), 0 = 4" [О0 — 30 *Ш — 2 (ш - 2/) <г' + (а) - 0 е-*'1, где А = — (со — /) (со — 2/). Решением однородной системы уравнений У}0)@ и yjo>(Oi соответствующим заданной неоднородной системе, будет КГ @ = - [ П @) - К2 @)] <г< + [2 Y, @) - Г, @)] **, У^ @ = 2 [ Г2 @) - П @)] ^ + [2 Ух @) - К2 @)] е-*. Находя дисперсии этих выражений и прибавляя к полученному результату дисперсию частного интеграла неоднородного уравнения, удовлетворяющего нулевым начальным условиям, вычисленным по C8) для ^ = ^ = ^ = 0,5 сек, получим D [ У, @] = {2е~* — e-*f • 1 + (е-* — er*f. 2 -f 2 Be~9j — е-4) {е* — е~< ОО 00 + \ |Л.1(». Ol'5,1(«o)*e+ \ — О У*,Л<»< 9Л.«С». -f — 00 D [ Г8 @] = Bе"й — 2е-*? • 1 + (в' — 2e'lf • 2 I2 ^ W rf<» + J I л« (ш О Is .1 (». О I2 ^i W rf<» + J I л.« (ш. О I —оо 00
§ 16] ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ РЕШЕНИЙ 147 где, согласно условию, Данную задачу можно решить и иначе: подставив в исходную систему вместо Xx{f) и X^{t) функции X(t) и X(t), получим систему, содержащую только одну случайную функцию, что позволяет найти частные интегралы системы ух (<о, t) и у2 (о), t), соответствующие замене X (t) на еШу и вместо четырех функций ylt v ylt 2, у% v у%« будет две: ух (о>, t) и j/2 (со, t). Очевидно, У\ О»* 0 = /«Л. 1 — «>Vi. з> Уз (ш» 0 = **>Л. , — оJу2 ,. Для получения численного ответа необходимо в полученных выше формулах для дисперсий вычислить интегралы, что может быть произведено или численно, или с помощью вычетов, применение которых к данному случаю хотя и сопряжено с утомительными выкладками, однако позволяет получить ответ в аналитическом виде. Пример 16.3. Для системы уравнений, данной в предыдущем примере, определить D[Ki(O] и D[K2@]> если а начальные условия нулевые. В данном случае yit х (<*>, f) и y%i(<*>,f) являются частными интегралами системы ayi'ldfrt) + 3Л., (ш, 0 - у% l (to, t) = te1**, J!b±t Решая эту систему, получим i Д2 • Д2 T"»J „-I I * I — * Д2 C T" Д2 где А = —-((о — /)(o) — 2/).
148 СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ФУНКЦИИ (ГЛ. II Подставляя уь х (со, t) и у% t (со, t) в C8), полагая t1 = ti = t и выполняя необходимые интегрирования, получим
ГЛАВА III МЕТОД ОГИБАЮЩИХ § 17. Идея метода огибающих и вывод общих формул Для нормальных стационарных случайных функций, имеющих спектральную плотность с резко выраженным максимумом, оказывается весьма эффективным метод исследования, разработанный В. И. Бунимовичем и называемый методом огибающих [3]. Сущность этого метода состоит в том, что вместо исходной нормальной случайной функции X{t), которую в этом параграфе будем считать вещественной и обладающей нулевым математическим ожиданием *), вводятся две новые независимые между собой функции A (t) и Ф (t), значительно более удобные для исследования, чем функция X (f). При* этом функция A (t), играющая роль амплитуды, оказывается подчиненной закону распределения Рэлея с плотностью вероятности ?*-» (а^О), A7.1) а функция Ф (t)y играющая роль фазы, — закону равномерного распределения с параметром 2гс. Для доказательства возможности подобного перехода положим A7.2) т. е. будем рассматривать X(t) как проекцию вектора A (t)y составляющего угол Ф с осью х, на эту ось. Формула B), связывающая две функции A(t) и Ф(^) с функцией X{f)y не определяет эти функции однозначно. Поэтому на них можно наложить добавочное условие, выбор которого в известных пределах произволен. В качестве добавочного условия потребуем, чтобы вторая проекция Y(t) вектора A (t), взятая в тот же момент времени, была также *) Допущение Х=0 не ограничивает общности, так как, если бы это условие не выполнялось, то всегда от случайной функции X(t) можно перейти к ее отклонению от математического ожидания X(t) — X, для которого все последующие формулы остаются в силе.
150 МЕТОД ОГИБАЮЩИХ [ГЛ. IH нормальной стационарной случайной функцией, независящей от но имеющей те же вероятностные характеристики, что и X(t). Иными словами, потребуем, чтобы при A7.3) выполнялись условия Rxy@) = 0. A7.5) Если рассматривать X(t) и Y(t) как прямоугольные координаты случайной точки на плоскости, то вероятность того, что эта точка попадет внутрь бесконечно узкого кольца, заключенного между окружностями с радиусами а и a-\-da, определится равенством $$ f(x,y)dxdy, A7.6) где f(x, y) = ^Le-<**+yW A7.7) — плотность вероятности системы нормальных случайных величин {X, Y). Переходя в правой части F) от прямоугольных координат х, у к полярным а, ср, получим a~\-da 2тс f(a) da = ~ i {е- а*№ dya da. A7.8) а 0 Последнее равенство можно переписать в виде f{a) da= $ $ /(а, ср) d<? da, A7.9) а 0 где f(af(o) — плотность вероятности системы случайных величин A (t), ), определяемая формулой Ая>?)=2^-в2/2я2- 07.10) Отсутствие в правой части A0) переменной ср показывает, что ) не зависит от A(t) и подчиняется закону равномерного распределения вероятности в интервале @,2тг): /0р)=1, 0 ^ ср ^ 2тг. A7.11)
§ 171 ИДЕЯ МЕТОДА ОГИБАЮЩИХ И ВЫВОД ОБЩИХ ФОРМУЛ 15Г Интегрируя A0) по ср от 0 до 2ти, получим плотность вероятности случайной величины А Итак, при сделанном выше способе введения функций A (t) и ординаты этих функций при одинаковом значении аргумента t взаимно независимы, причем A(t) подчиняется закону (Н)> называемому законом распределения Рэлея, а фаза Ф it) подчиняется закон> равномерного распределения. Способ введения случайной функции A(t) показывает, что причем знак равенства имеет место только при Ф(г) = Продифференцировав B) по времени, находим A7.13) или 180° Так как при Ф(?) = 0° или Ф(/)=180с второе слагаемое в A4) исчезает, a |cosO(f)| = l, то при совпадении ординат функции X (t) и функции A (t) абсолютное значение скорости изменения случайной функции X @ совпадает со скоростью изменения функции A (t). Данное обстоятельство позволяет называть функцию A(t) огибающей случайной функции. Реализация a (t) будет играть роль огибающей реализации x(t), и при записи результатов опыта мы будем иметь картину, изображенную на рис. 12. Все изложенное выше применимо для любых стационарных нормальных случайных функций. Однако если спектральная плотность функции X (t) имеет острый максимум, то реализации случайной функции имеют характер колебательного движения с почти постоянным периодом и медленно меняющейся амплитудой, причем сходство графика х (t) с синусоидой будет тем большим, чем более острый максимум имеет функция Sx (<*>). В этом случае функция A (t) будет медленно (сравнительно с изменением функции X (t)) меняться со временем, а функция Ф(?) будет мало отличаться от линейной, что позволяет применить ряд упрощений, не приемлемых в общем случае. В данном параграфе мы рассмотрим общие закономерности, которым подчиняются функции A(f) и Ф(?), а в следующем параграфе Рис. 12.
152 МЕТОД ОГИБАЮЩИХ [ГЛ. Ill исследуем, какие упрощения можно сделать в том случае, когда спектральная плотность Sx(u>) имеет резкий максимум. Для определения корреляционных функций амплитуды и фазы огибающей представим исходную стационарную функцию X (t) в виде ее спектрального разложения 00 X(t)= \ ешAФ(и>) A7.15) — 00 и убедимся, что в качестве спектрального разложения функции Y(t) можно взять интеграл со), A7.16) где случайная функция Ф^со) при отрицательных значениях со совпадает с Ф(со), а при о>^>0 отличается от нее знаком, т. е. Ф,(со) = -Ф(со)т^. A7.17) Действительно, и функция X (t), и функция Y(t) стационарны и обладают одинаковыми спектральными плотностями и корреляционными функциями. Кроме того, можно показать, что функция Y(t) является нормальной. Действительно, учитывая A7) и переписав A5) и A6) в виде 0 -00 0 — со оо \еш 0 00 0 </Ф («)), d® (со), A7. A7. 18) 19) замечаем, что X(t) равняется сумме тех же независимых величин, разность которых равняется функции Y(f), Однако из теории вероятностей известно, что сумма двух независимых случайных величин может иметь нормальный закон распределения только в том случае, если каждое слагаемое нормально. Следовательно, каждый из интегралов в A8) является нормальной случайной величиной, а в этом случае нормальной будет и разность этих интегралов, т. е. функция Y(t). Остается доказать, что ординаты нормальных случайных функций X (t) и Y(t) при одинаковых аргументах независимы. Для этого достаточно доказать, что корреляционная функция связи /?*уСОпри ^ = 0 обращается в нуль.
f 17) ИДЕЯ МЕТОДА ОГИБАЮШИХ И ВЫВОД ОБЩИХ ФОРМУЛ 153 Подставляя A5) и A6) в Общую формулу для корреляционной функции связи, получим оо Rxy (х) = М { \\ е~ */+/«! ('+*)/ </Ф* (ш) аФ1 Ю} = — оо 00 ОО = _ l С е*шх -р^- S* (ш) rfco = 2 J Sx (<о) sin ox <*ш. A7.20) — оо О Полагая в последнем выражении х = О, получим Rxy@) = 0, A7.21) т.е. условие независимости нормальных случайныхвеличин X(t) и Y(f). Таким образом, определенные выше случайные функции X(t) и Y(t) могут рассматриваться как независимые прямоугольные координаты случайной точки на плоскости, подчиняющиеся двумерному нормальному закону распределения. Расстояние этой точки до начала координат в соответствии с B) и C) совпадает с ординатой огибающей A(t) стационарного процесса X (t), т. е. Л3 @ = X2 @ + Г2 (t), A7.22) где A (t) в соответствии с доказанной независимостью нормальных случайных величин X (t) и Y(t) подчиняется эакону Рэлея A2), а угол Ф@» составленный радиусом-вектором этой точки с осью х, подчиняется закону равномерного распределения вероятности. Для более детального исследования поведения огибающей A(t) и фазы Ф(?) найдем четырехмерный закон распределения системы случайных величин Аг = А @> А« = A (t + т), Ф, = Ф (О, Ф, = Ф (t + т). A7.23) Это определение проще всего может быть выполнено, если сначала найти четырехмерный закон распределения системы нормальных случайных величин а затем перейти от системы величин B4) к системе случайных величин B3). Так как случайные величины B4) нормальны, а их математические ожидания по условию равны нулю, то закон распределения f{x\y х%> У\> Уч) однозначно определяется корреляционной матрицей этой системы величин, которая имеет вид с* с*?(х) 0 oV(x) a*k(>z) с* — oV(x) О oV(x) 0 aAk{x) о2
154 МЕТОД ОГИБАЮЩИХ (ГЛ. Ill где через о2 обозначена дисперсия X (t); k(z) — нормированная корреляционная функция X (t), а г (т) — нормированная корреляционная ^функция связи X (t) и У (t), т. е. ** КЛ0) К@) А(х) /С() 1^() r(*) = ^R*y(*)> A7.26) а в качестве элементов k^ и &зч матрицы B5) взято —aV(t), а не ъ1г (— т), поскольку на основании B0) г(-т)=-г(т> A7.27) Четырехмерный нормальный закон распределения, соответствующий корреляционной матрице B5), имеет вид f(Xv yv Xoj у$ = \y A7.28) где обозначено р* = 1 — № (т) — г2 (т) = 1 — № — т\ A7.29) Выражение B8) дает плотность вероятности для точки в четырехмерном пространстве с прямоугольными координатами (Xv Yv X& К.2). Поэтому для получения четырехмерного закона распределения f(av a2, ср1? ср2) нужно в этой формуле от двух пар прямоугольных координат (xv yt) и (х$У у%) перейти по B) и C) к соответствующим полярным координатам (аь ср±) и (а%, ср2) и умножить полученное выражение на ага^ так как элемент площади в полярных координатах равен a dy da. Выполнив эти преобразования, получим ехр {~2^ ^ + п* — 2kuiu* C0S (срз ~ *д ~ sin (Ъ — ?1)]| A7.30) или, если ввести обозначение T==arctg~, A7.31) f(av а» ср1? <Р2) = A7.32)
§ 17j ИДЕЯ МЕТОДА ОГИБАЮЩИХ И ВЫВОД ОБЩИХ ФОРМУЛ 155 Полученная формула позволяет вычислить двумерные плотности вероятности f(av a2) и /(cpi, cp4). Действительно, интегрируя выражение C2) по <pi и <р2> получим 2% 2п X COS (ср2 — ср! | [а^Р') ), A7.33) где /0 (х) — обозначение функции Бесселя первого рода нулевого порядка от мнимого аргумента. Интегрируя C2) по at и av получим двумерную плотность вероятности для фазы =В [тЬ+jd^ (-+arcsin x)] • ° 7-34> тгТЬ L 1 ~~~" л. ^ I л, J \i, где y.= yi—pl cos (cp2 — cpj — f) @^ср1^2тс, O^cp.2^27c). A7.35) Учитывая найденные выше законы распределения для амплитуды A(f) и для фазы Ф@> из C3) и C4) можно найти условные законы распределения амплитуды и фазы в момент времени (^-(-т), если значения этих величин в момент времени t заданы. Действительно, используя общую формулу для нахождения условной плотности вероятности случайной величины по плотности вероятности системы случайных величин и учитывая A2) и A1), получим f^ 2тс L1 — х2^A— х2 Воспользуемся найденными выше двумерными законами распределения амплитуды и фазы огибающей для нахождения корреляционных функций A(t) и Ф@- В соответствии с определением корреляционной функции имеем оо оо оо Ка ОО = $ $ f(av а2) аха2 dat da% — [J f(a) a da]\ A7.38) 0 0 0 0 0
3 56 МЕТОД ОГИБАЮЩИХ (IJl. ill Подставляя в C8) найденные выше законы распределения и производя интегрирование, получим ^ A7.39) и E{k*) — полные эллиптические интегралы первого и второго рода, т. е. выражения, определяемые равенствами тс/2 к/2 . A7.40) Таким _же образом для корреляционной функции фазы будем иметь 2тс 2тс ^<ДТ) = $ ^ /(?i'?0?i?«<*Pi <*?* — **• A7.41) о о Интегрирование здесь не может быть выполнено так просто, как •я C8). Единственное, что можно сделать в общем виде — это, воспользовавшись тем, что /(<pi> <ра) зависит только от разности (ср2 — ср4), «вести новые переменные интегрирования, положив A7.42) после чего интегрирование по I может быть выполнено. Действительно, обозначая плотность вероятности /(cpi, cp2), выраженную как функцию т], через /(?]) и выполняя интегрирование по 5, •будем иметь 2тс (-^)]^-7и2, A7.43) однако дальнейшее интегрирование может быть выполнено только численно. Проще вычисляется корреляционная функция cos Ф (?), которая тоже может служить некоторым показателем быстроты убывания корреляционной связи между фазой случайного процесса. Выполнив необходимые преобразования, для этого случая получим A7.44) где Е и К — полные эллиптические интегралы, определяемые D0) *). *) Плотность /(<pi, <рг) в соответствии с C4) зависит только от разности ?8—"?i)- Поэтому при вычислении М [cos Ф1 cos Ф&\ = f f cos <pi cos cp8/ (<?i, <p2) ^? и о
§ 17) ИДЕЯ МЕТОДА ОГИБАЮЩИХ И ВЫВОД ОБЩИХ ФОРМУЛ 157 В заключение найдем плотность вероятности производной от фазы Ф(?) по времени. Так как производная Z(t) случайной функции Ф@ определяется формулой = iim у^^-м^ A7Л5) то для определения искомой плотности вероятности нужно от плотности вероятности C4) системы случайных величин Ф1 = Ф(?) и Ф2 = Ф (t -j- *) перейти к плотности вероятности системы случайных величин (Ф2 — ®i)/t и Ф1? проинтегрировать полученное выражение по всем возможным значениям Фх и перейти к пределу т = 0. Так как плотность вероятности /(<pi> <p3) является только функцией разности (ср.2 — <р1) = ,гт, а при бесконечно малом значении т можно считать, что cpi меняется от нуля до 2тг (при конечном т верхний предел был бы 2tc-|-zt или 2тс — <гт), интегрирование по <pi сводится к умножению на 2тс, и для - плотности вероятности получим f(z)= Iim ?lTj — 1 i_^(!l-]-arcsinxU, A7.46) nO ll 8/1 2\ /2 \ О /I где ^ дано B9), x определяется C5), а множитель х возникает при замене rf(cp.2 — cpt) на тй^. Так как при т->0 /?~>0, а х->1, то, приводя выражение, стоящее в фигурной скобке, к общему знаменателю, замечаем, что D6) представляет собой неопределенность вида ~-. Для раскрытия полученной неопределенности проще всего разложить р\ х, arcsinx и A—хJ по степеням т и устремить после этого т к нулю. На основании B9), C1) и C5), учитывая, что ?@)=1, г @) = 0, к @) = 0, с точностью до величин второго порядка малости относительно т имеем х« ^ 1 _ {[* - г (О)]2 — [к @) + (^ (О))'2]} т2, A7.48) 1 _ х* ^ {[0 _ / (о)]« _ [к @) + (Г @))*]} т», A7.49) где предполагается, что ? @) существует, т. е. случайная функция дифференцируема. Подставляя эти выражения в D6), после сокращения на т3 и перехода к пределу получим flz)= -fe(Q)-[r(Q)] A7б0) 2{[zf@))*k@)[t@)]*}*bm можнсГввести новые переменные интегрирования 6 = ( и выполнить сначала интегрирование по §, после чего интегрирование по /?ает D4).
158 МЕТОД ОГИБАЮЩИХ (ГЛ. Ill Величины ?@) и f@), определяющие вид плотности распределения f(z), однозначно определяются нормированной спектральной плотностью исходного случайного процесса **(*) = ?-$* (<о). 07.51) Действительно, на основании соотношения между спектральной плотностью и корреляционной функцией, формулы A0.47) и обозначений B6) имеем sx(i»)d% A7.62) г (т) = 2 J sx (со) sin ок rf(o. A7.53) —00 00 Дифференцируя E2) и E3) по т и полагая после дифференцирования т = 0, получим 00 00 — k @) = \ sx (со) co2rfco = р ? Sx (о)) aJdco, A7.54) О — оо со во = 2 f аMл(со)йо) = 1 С О —оо A7.55) Формулы E4) и E5) показывают, что закон распределения скорости изменения фазы Ф(?) однозначно определяется первыми двумя моментами функции sx(u). Поэтому, вводя для второго момента этой функции обозначение <о* (второй центральный и второй начальный моменты этой функции совпадают вследствие ее четности) и обозначая ее первый абсолютный момент буквой и>19 получим . ш« = — k @), а>! = t @), A7.56) и выражение E0) можно будет записать в виде ife!07.57) Разность А2 = со| — а)}, входящая в E7), может быть представлена в виде интеграла 00 ш| — ш» = 2 $ (со — coj)* sx W (/о) A7.58) о
§ 17| ИДЕЯ МЕТОДА ОГИБАЮЩИХ И ВЫВОД ОБЩИХ ФОРМУЛ 159 и, следовательно, может рассматриваться как «средняя ширина спектра» *). Формула E7) показывает, что плотность вероятности /(ф) скорости изменения фазы симметрична относительно значения y = inv которое является математическим ожиданием Ф (f), но не симметрична относительно начала координат и, следовательно, вероятность возрастания фазы Р[Ф@^>0] не равна вероятности ее убывания Р [Ф (О <С 0]- Обозначив эти вероятности Р+ и Р_ соответственно, путем интегрирования E7) получим U+<]} A7.59) П ^=^ Р =Р(Ф<0) = Н _Mz^f) rfz=l (!_=!). A7.6O) Аналогично может быть найден и закон распределения скорости изменения амплитуды огибающей. Действительно, считая в выражении C3) для двумерной плотности вероятности амплитуды, что значения амплитуд аг и а% относятся к бесконечно близким моментам времени t и \t-\~x) и полагая на этом основании = ах @ + хах (Q, A7.61) будем иметь U ^ a2p2 J ' Для получения двумерной плотности вероятности f(av а{) амплитуды огибающей и ее скорости аналогично тому, как это было сделано при выводе D6), нужно f(av a2) умножить на х и устремить т к нулю, т. е. При т->0 в соответствии с D7) р1 стремится к нулю, как х\ и следовательно, аргумент у функции Бесселя обращается в бесконеч- *) Напомним еще раз, что в различных источниках вследствие отличия в обозначениях спектральные плотности могут отличаться постоянными множителями. Обозначения, принятые в данной книге, отличаются от обозначений, принятых в [3].
160 МЕТОД ОГИБАЮЩИХ [ГЛ. III ность. Так как для больших значений х справедливо асимптотическое представление функции /о(лг) в виде ^* A7.64) где ошибка уменьшается с ростом х, то вместо F4) можно написать (индекс 1 у ах и ах опускаем) /(а, О) = lim %п ^ \ &т) е~ °-х2/2°-Р* е~а(а + аг)/а2р2 ^а (а + ?х) yyZTfiivtpi X °Р A7.65) что после перехода к пределу с учетом D7) и E6) дает /(а, 4) = 1 e-^^__L_-e-ilV(-l--I.. A7.66) а2 а у <о| — of у 2п Полученное выражение показывает, что двумерная плотность вероятности /(а, а) распадается на произведение плотности вероятности амплитуды огибающей и плотности вероятности скорости изменения амплитуды огибающей, т. е. а и а являются независимыми случайными величинами, и для искомой плотности вероятности /(а) будем иметь f{a) = г_1_ е- «2/2*2 {1 ^f >. A7.67) Аналогично могут быть получены плотности распределения и в более сложных случаях. Так, например, полагая в C0) а* = ах -f- axx, <р2 == cpj —|— cpix> умножая полученное выражение на т3 и устремляя i к 0, после перехода к пределу будем иметь (индекс 1 опускаем) 7^ (а)| — cof) Интегрирование последнего выражения сначала по а и ср» а затем по а и ф дает еще две плотности вероятности /2*2 (©I - ©f) , (] 7 59j «ft • A7.70) В ряд формул данного параграфа входит значение нормированной корреляционной функции связи г (х), определяемой E3). Интеграл E3) для наиболее распространенных случаев, когда $*(<*) является дробно рациональной функцией своего аргумента, вычисляется довольно сложно.
% 17J ИДЕЯ МЕТОДА ОГИБАЮЩИХ И ВЫВОД ОБЩИХ ФОРМУЛ 161 Вычисления можно упростить, если нормированную спектральную плотность представить в виде суммы таких функций, для каждой из которых интеграл E3) может быть просто вычислен. В качестве таких функций, например, можно взять ортогональные функции, связанные с полиномами Чебышева — Лагерра Z,v (х) и определяемые формулами и^х) = ^е--1ПЛх)=^ех12^-{х^х)у v = 0, 1, 2, ... A7.71) Функции щ(х) в интервале @, сю) образуют ортогональную нормированную систему функций, т. е. для любых целых (i и v удовлетворяют соотношениям [ 1 при p. = v, uOt(x)u,(x)dx=\ n _^ A7.72) J ¦*v v v ' [ О при р ф v. v / Поэтому спектральную плотность Sx(u>) для о>^0 можно представить в виде оэ 2(^) A773) где множитель 2j^l у со в аргументе функции hv выбран с таким расчетом, чтобы первый член разложения G3) и Sx (w) имели одинаковые значения отношений первых абсолютных моментов к площади, ограниченной осью абсцисс и графиком функции Sx(®) и соответственна аощ Bа)/со1). Для определения коэффициентов av достаточно умножить обе части равенства G3) на ^B^/^) и проинтегрировать полученное равенство в пределах @, сю), что с учетом G2) дает A^)^[~)d^ v = 0, 1/2, ... A7.74) Интегралы G4) вычисляются проще, чем интегралы E3), а подстановка G3) в E3) дает сумму интегралов, имеющих вид 00 7V= J и,(-^-) sin (ox da, v = 0, 1, 2, ... A7.75) Эти интегралы вычисляются элементарно, так как, положив — = х, A7.76) с учетом G1) получим интеграл ** ~Тх> (**е~"*) sin '^T~dx> ^7'77^ Т) А. А. Свешников — 13S8
162 МЕТОД ОГИБАЮЩИХ [ГЛ. III вычисление которого сводится к вычислению интегралов вида 2 х? sin ^~ dx = Im \ е- *0 - A7.79) Рассмотрим несколько примеров. Пример 17.1. Определить плотность вероятности скорости изменения фазы нормальной случайной функции, спектральная плотность которой т. е. нормированная корреляционная функция случайного процесса имеет вид &(т) = ?~а|Т|. Так как в этом случае X(f) недифференцируема, E0) не может быть использована, и необходимо вернуться к исходному выражению D6). При малом т: k (т) я« 1 — а | т |. Анализ E3) показывает, что при т->0 г(т) убывает быстрее, чем Vi . Следовательно, при малом т, сохраняя только главные члены разложения, р - = 1 — № — г3 я^ 2ат, у = arctg -r?^r, 1 - *2 **р* + (к* + г*) (Ь - ТJ Подставляя эти разложения в D6) и переходя к пределу, получим .3/2 = О, т. е. для рассматриваемого процесса равновероятны любые значения скорости изменения фазы в пределах от —оо до -f" °°* Этот результат является следствием недифференцируемости исходнвго случайного процесса. Пример 17.2. Для нормальной случайной функции, имеющей корреляционную функцию К (т) = а V а| х «(COS px + j sin р| т |), определить закон распределения скорости изменения фазы.
§ 17] ИДЕЯ МЕТОДА ОГИБАЮЩИХ И ВЫВОД ОБЩИХ ФОРМУЛ 163 Спектральная плотность в-этом случае имеет вид Так как процесс дифференцируем, то возможно применение E7). Учитывая E2), E3) и обозначения E6), получим что вместе с E7) полностью определяет искомый закон распределения. Пример 17.3. Дана корреляционная функция нормального случайного процесса Кх (х) = Л2^2, a = V2 1/ сек. Определить корреляционную функцию собФ^для т=1/2 сек, где Ф(^) — фаза случайной функции. В соответствии с D4) для нахождения /СсозфСО необходимо определить функции г(т) и р2(-с). Так как нормированная спектральная плотность 00 1 1 ТО Г (х) = 2 ? 5Л (о)) sin шх dco = -4=- J а/2„ \ ll iax/Y'2 1 [ Положив x = lt, получим Последний интеграл может быть выражен через табулированную функцию комплексного переменного (см. [39])
164 МЕТОД ОГИБАЮЩИХ [ГЛ. Ш Выполняя очевидные преобразования, получим где v (ху у) — мнимая часть функции w (x -j- (у)« Подставляя найденную функцию в выражение для получим все исходные данные для нахождения /СсозфС0- Подставляя заданное значение т, будем иметь р*=\—е 4 — г;3 Ш = 1—0,6065 — 0,4789*= 0,164, что после подстановки в D4) дает § 18. Применение метода огибающих в случае узкополосного спектра Выведенные в предыдущем параграфе формулы применимы к .любым стационарным нормальным случайным процессам, однако их использование оказывается особенно эффективным в том случае, когда спектральная плотность исходного случайного процесса имеет отличные от куля ординаты только в сравнительно узкой полосе частот, или, как говорят сокращенно, случайная функция X (t) обладает узко- лолосным спектром. Спектральные плотности случайных функций, появляющихся в приложениях, никогда не бывают узкополосными в строгом смысле этого слова, поскольку ординаты спектральной плотности меняются непрерывно и нельзя указать такую область частот, вне которой Sx (<*>) = 0. Однако в тех случаях, когда спектральная плотность обладает резким максимумом, спектр можно приближенно рассматривать как узкополосный В данном случае, так же как и для узкополосного спектра в собственном смысле этого слова, амплитуда огибающей может рассматриваться как медленно меняющаяся функция времени, фаза огибающей будет зависеть от времени почти линейно, а большинство формул предыдущего параграфа может быть заменено более простыми выражениями. Вывод этих приближенных выражений основан на том, что разность (со| — о)|) в соответствии с A7.58) аналогична дисперсии, если 25 (ш) при ш^О рассматривать как плотность вероятности, и еле-
§ 181 СЛУЧАЙ УЗКОПОЛОСНОГО СПЕКТРА 165 довательно, может характеризовать ширину спектра. При узкополосных спектрах величина Д* = ш22 — о)? A8.1) мала сравнительно с u>f, а случайная функция приобретает характер почти периодического процесса с медленно меняющейся амплитудой. Для того чтобы в этом убедиться, рассмотрим закон распределения скорости изменения амплитуды огибающей. Согласно A7.67) и A) l 2, A8#2) аД у 2 т. е. скорость изменения амплитуды подчиняется нормальному закону с нулевым математическим ожиданием и средним квадратическим отклонением, равным о А, т. е. тем меньшим, чем меньше ширина спектра А. С другой стороны, плотность вероятности /(ф) на основании A7.57) и обозначения A) имеет вид 2 [(¦- т. е. при малом А плотность имеет острый максимум вблизи значения ф = (*>!, причем с уменьшением А вероятность получения отрицательных значений ф уменьшается. Действительно, несколько преобразуя A7.60), для вероятности получения отрицательных значений ф имеем ом) Учитывая острый максимум плотности вероятности /(ф), вместо случайной фазы Ф(?) имеет смысл ввести новую случайную функцию © (t), положив Ф@ = ^+в@> A8.5) т. в. рассматривать не саму случайную фазу, а ее отклонение от фазы гармонического колебательного движения. Плотность вероятности 6 в соответствии с C) имеет вид 2 (» т. е. имеет тем более острый максимум в начале координат, чем меньше А. Итак, для узкополосных спектральных плотностей Sx (<*>) случайную функцию X(t) можно представить в виде X @ = A {t) cos [ш4< + в @J, A8.7)
166 МЕТОД ОГИБАЮЩИХ |ГЛ. Ill где A (t) и 0 (t) — случайные функции, медленно меняющиеся сравнительно с периодом Т\, соответствующим частоте ^i(Tt = 2>к/т1). Полученный результат позволяет решать ряд задач приближенными способами. Задача 1. Определение закона распределения времени пребывания стационарной случайной функции выше уровня математического ожидания. Определение плотности вероятности времени т, в течение которого случайная функция X(t) — X имеет положительные значения, в общем случае весьма сложно*), однако при сделанном предположении о виде S(w) приближенный результат может быть получен сравнительно просто, так как случайная функция 0 (t) медленно меняется в течение одного периода, а следовательно, начав отсчет с произвольного момента времени t в G), для определения времени 7, в течение которого фаза изменится на 2тс, будем иметь [<лх (Г-J-1) -f 0 (Г+ f)] — [^+ ® (*)] = 2те или, считая Ф (* + Т) ъ 0 (Q + 0 (t) T, A8.8) т. е. период случайной функции приближенно определится равенством ТA8.9) Тъ* —. «1+ в (t) ' а для времени пребывания т случайной функции X (t) — X выше (ниже) нулевого уровня приближенно можно написать: |Л A8.10) т = |г= —. =-Л- 2 «, + е {t) ф (t) • т. е. интересующая нас случайная величина отличается от обратного значения скорости изменения фазы только постоянным множителем тс. Применяя общую формулу B.36) для плотности вероятности функции случайной величины к нахождению плотности вероятности обратной величины, получим, что плотность вероятности /(т) связана с плотностью вероятности /(<?) случайной величины Ф (t) формулой ф-т, A8-11) что после подстановки в C) дает — , A8.12) *) Исключение представляют только марковские процессы, которые будут рассмотрены в гл. V. В общем случае просто определяется только среднее время пребывания случайной функции выше заданного уровня (см. § 9).
I 18) СЛУЧАЙ УЗКОПОЛОСНОГО СПЕКТРА 167 где, как указывалось выше, Тг = ^. A8.13) Выполнив очевидные преобразования, /(х) можно представить в виде*) -.. Л —-, 0^xt A8.14) 2it(i+s2K/2 [7 L_\ j-_i!_J где для краткости введены обозначения * —-. X—J- — -X. A8.15) Полученная плотность вероятности имеет максимум при x = xlt определяемый равенством =l-4S'2 + ^_... A8.16) При росте х плотность вероятности /(х) убывает как 1/х*. Сле- 00 довательно, интеграл J т/(т) dx расходится, и математическое ожидание о ? не существует. Также не существует и дисперсия времени пребывания случайной функции выше уровня математического ожидания. Последние выводы противоречат результату, найденному в § 9, где для математического ожидания времени пребывания нормальной случайной функции выше заданного уровня была получена формула (9.35), которая в данном случае (а = х) для дифференцируемого процесса дает конечное выражение nax/av. Полученное противоречие объясняется приближенностью формулы A4), которая при больших значениях т дает порядок убывания плотности вероятности с ростом х более медленный, чем это имеет место в действительности. •) Формула A1) получена как плотность вероятности величины, обратной Ф, и, следовательно, справедлива для —оо<х<оо. Вследствие этого 00 J/(x)flfx^l. Поэтому, рассматривая A4) как приближенную формулу для неотрицательной величины х, в правую часть равенства необходимо ввести оо множитель k = 1/J f (z) dx, значение которого тем ближе к единице, чем о меньше б. Так как A4) выведена в предположении 5 < 1, то этот множитель обычно не учитывается.
168 МЕТОД ОГИБАЮЩИХ [ГЛ. III При сделанных выше допущениях плотность вероятности /(х) имеет вид, изображенный на рис. 13, где представлены графики /(т) для нескольких значений параметра &, характеризующего ширину спектра. Задача 2. Определение корреляционной функции производной. Определение корреляционной функции производной случайного процесса осуществляется просто и, как это было показано в § 6, достигается путем повторного дифференцирования корреляционной функции заданного процесса. Однако при узкополосном спектре иногда можно пользоваться приближенным способом, основанным на медленном изменении амплитуды Л @ и нелинейной части фазы 0@ огибающей случайной функции. Дифференцируя обе части равенства G), получим 0,950,, f(t) 5,0 iff 3,0 2,0 го ' 0,98 0,99 Щ %П W2 Щ 1t04 v sin [«>!<+0@] + Щ cos 4=0,05 6=0,10 A8.17) Первое слагаемое отличать— ется от случайной функции 0,4 0,6 0,8 1,0 1,2 14 1,6 18 ^ К @ (см. A7.3)), являющейся 6) x^"Wf1 проекцией радиуса-вектора A(t) на ось у, только множителем — оI# Второе и третье слагаемые содержат —-л1-* которые для рассматри- Рис. 13. множителями производные А- ваемого в данном параграфе случая не должны быть большими, поскольку А @ и 9 (t) — медленно меняющиеся функции. Поэтому представляется естественным отбросить эти два последних слагаемых и написать A8.18)
$ 18] СЛУЧАЙ УЗКОПОЛОСНОГО СПЕКТРА 169 Так как функция Y(t) имеет ту же корреляционную функцию, что и X(t), то из A8) следует, что Для проверки точности сделанного допущения определим дисперсию отброшенных в A7) членов. Так как в соответствии с A7.70) A (t) и Ф (/) являются независимыми величинами, М [A (t)] = 0 и в соответствии с A7.11) D[cos<?@] = l/2, то Ш cos Ф (/)] = D [^уЗ-] D [ cos Ф @] = ^ А V. A8.20) Для нахождения дисперсии последнего слагаемого в A7) используем закон распределения A7.69). Учитывая независимость Ф(/) от A(t) и Ф (t), получим = |^. A8.21) Учитывая B0) и B1), а также и то, что последние два слагаемых в A7) взаимно не коррелированы, в качестве дисперсии разности точного и приближенного значения производной X(t) получим D [X @ — (— о>! Y @)] = с2Д*. A8.22) Таким образом, отношение дисперсии ошибки приближенного значения производной, определяемого формулой A8), к дисперсии этого выражения равно Д3/а)* = 82. При узкополосном спектре &<^1 и, следовательно, формула A9) действительно дает малую ошибку в дисперсии производной от случайной функции, что служит известной проверкой точности этого приближенного соотношения. Однако в тех случаях, когда при решении задачи существенное значение имеет не только величина начальной ординаты /С^(т), но и весь ход этой функции, указанной выше аппроксимацией следует пользоваться осторожнее, так как, заменяя производную X(t) выражением A8), как этЪ следует из A9), вместо спектральной плотности производной случайной функции <*>*Sx(w) мы получим a>lSx (w), что может дать существенное отличие при больших значениях <*> и при о) = 0. Задача 3. Определение точности прогнозирования момента прохождения случайной функции через нуль. Задача такого типа возникает в том случае, когда будущий момент прохождения случайной функции через нуль определяется, напри-, мер, на основании определения моментов прохождения случайной
170 МЕТОД ОГИБАЮЩИХ [ГЛ. Ill функции через нуль в прошлом и прибавления к последнему моменту прохождения через нуль ожидаемого времени пребывания случайной функции выше или ниже нулевого уровня (уровня математического ожидания). В качестве примера можно привести задачу определения момента прохождения палубы судна при качке через горизонт, возникающую в гаде случаев использования судовой техники. Рассмотрим самый простой случай, когда время предполагаемого прохождения нормальной случайной функции X(t) через нуль (считаем для простоты Х = 0) назначается через Для узкополосного спектра скорость изменения огибающей можно считать малой сравнительно со скоростью изменения фазы, так как в соответствии с A7.67) Поэтому можно принять, что обращение в нуль X{t) имеет место только вследствие обращения в этот момент фазы Ф (t) в тс/2. Значение случайной функции в момент предполагаемого повторного ее прохождения через нуль будет равно Т* ) = А (' + Т Т* ) cos [Ф (' +Т Т* )} A8'23> и, следовательно, для определения ошибки прогнозирования нужно определить дисперсию B3) при условии, что Ф(?) = тс/2. Обозначая вначения амплитуды и фазы в моменты t и t^Tx/2 через av <p1? а% и fS соответственно и определяя для этой цели из A7.32) условную плотность вероятности /(а2, ср21 cpj = тс/2), получим —7)]}rfa, = sin 9 (T. - T)]} • A8-24)
§ 18| СЛУЧАЙ УЗКОПОЛОСНОГО СПЕКТРА 171 Используя найденную условную плотность вероятности для вычисления дисперсии B3), характеризующей ошибку прогнозирования, будем иметь cos ФИ <* 2я оо = J j I ?i = у] а\ cos2 <pa da* Жр3 — ?i = у) 8.25) Интегрирование в полученном выражении не может быть выполнено в конечном виде, однако нахождение результата методами численного интегрирования не представляет особых трудностей. Если момент предполагаемого обращения в нуль функции X(t) определяется не на основании среднего времени Т\, а путем усреднения нескольких интервалов времени между моментами обращения в нуль X(t)y то задача в принципе может быть рассмотрена примерно теми же методами, но ее решение значительно усложняется. В заключение отметим, что при вычислении нормированной корреляционной функции связи г (т) в случае узкополосного спектра удобнее пользоваться не таким разложением нормированной спектральной плотности sx(i*>) по ортогональным функциям, какое было сделано в § 17 для общего случая. Пусть <о0 — абсолютное значение частоты <о, для которого спектральная плотность Sx(w) имеет резкий максимум. Рассмотрим вместо sx(w) вспомогательную функцию f (a>) при ^0, \ /П 08.26) 0 при со<^0 При замене функции ^(w) на sx(<*>) в формуле A7.53) для г(х) нижний предел интегрирования можно считать равным —оо: оо г (т) = 2 $ s'x (ю) sin (ox rfx, A8.27) — оо так как $i (<*>) = 0 при «><^0. Это позволяет получить удобные расчетные формулы. Разложим для этой цели функцию s'x (со) по ортогональным функциям Эрмита, т. е. по функциям z>v(u>), которые определяются равенствами \ lyJL-te-*), v = 0, 1, 2,... A8.28)
172 МЕТОД ОГИБАЮЩИХ [ГЛ. III Функции t;v (х) ортогональны и нормированы в интервале (— оо, оо), т. е. удовлетворяют условиям A8.29) 0 ПрИ (А ф V и связаны с полиномами Чебышева — Эрмита соотношениями] v4 (х) = 1 *-*2/2 я, (*). A8.30) У 24 Vn Если при разложении функции s'x(<u) за начало координат взять точку о) = оH, то получим 1 f^) A8.31) где Ьч — коэффициент разложения функции s'x((u), а множитель 1/щ взят у аргументов функции для того, чтобы «дисперсии» функции 5^(о)) и первого члена разложения C1) были одинаковы. Для определения коэффициентов #v умножим обе части C1) на ?-(<о-<о0J/2<4 н (@~"<0о) и проинтегрируем полученный результат по а) в бесконечных пределах. Учитывая B9) и C0), получим К=^пт^ \ e~v~s* № + ш°>я» ^ л <! 8-32> где через 5 обозначено (со — соо)/аJ. Интеграл C2) обычно не может быть вычислен в конечном виде, однако его численное нахождение не связано с трудностями. Подставляя ряд C1) в B7), получим 00 00 г (х) = 2 ^ К \ е-<т-ш<»2/2о>! Д, i^^j sin шх da. A8.33) v=0 —oo Введя новую переменную интегрирования и воспользовавшись тем, что S)=-/W$), A8-35>
§ Щ СЛУЧАЙ УЗКОПОЛОСНОГО СПЕКТРА 173 C3) можно преобразовать к виду СО 00 г (х) = 2оJ sin а>от 2 ЬЧ \ е~*2/2 ИЧ © cos со«х6 & + |х=0 —оо 00 00 + 2св2 cos (вот 2 4+1 $ «~e2/2%+i (?) sin ш9т5 Л A8.36) (х=0 — оо Каждый из интегралов, входящих в C5), вычисляется элементарно, однако в том случае, когда sx(u>) обладает острым максимумом, существенное значение имеют только несколько первых членов полученной суммы. В заключение рассмотрим несколько примеров. Пример 18.1. Корреляционная функция угла крена судна на нерегулярном волнении имеет вид spx-f -^ sin р| где о зависит от интенсивности волнения, а определяется параметрами судна и характером волнения, а р в основном зависит от собственного периода качки судна. Пусть ос =0,1 \/сек, C = 0,7 1/сек. Определить возможность применения метода огибающих, если рассматривать угол качки корабля как нормальную случайную функцию, обладающую узкополосным спектром. Так как в данном случае в соответствии с A1.17) * W ~ те [(со2 — то, применяя A7.55), получим Формула A7.56) дает <о| == аа —j— p9. Следовательно, ширина спектра А, определяемая A), будет равна Подставляя в полученные выражения числовые значения, будем иметь о)! = 0,65 l/сек; щ = 0,50 l/сек4; А2 = ш| — ^ = 0,0775 \/сек> А = 0,278 1/сек.
174 МЕТОД ОГИБАЮЩИХ [ГЛ. Сравнение A cmj показывает, что хотя спектр и узкополосный, однако ширина его сравнима с щ и, следовательно, формулы, вывод которых основан на предположении о малости Д, могут давать заметную ошибку. Тем не менее, используя A4) для закона распределения времени т между последовательными нулями функ- приближенное ции, получим выражение /O0=i 0,0148* 4 х график которого изображен на рис. 14. Сравнение полученного графика с результатами обработки натурных записей качки примерно при тех же параметрах корреляционной функции угла крена дает заметное расхождение при больших значениях т, что объясняется, по-видимому, недостаточной в данном случае малостью ширины спектра А. Пример 18.2. Дана спектральная плотность нормального случайного процесса X(t) где оH=10 1/сек, а=1 l/сек, с = const. Определить Г^ )] i = —, где если X(f) = O, 00 (Oj = 2 [ 0M (to) i 0 Для решения задачи определим, насколько данный процесс можно считать узкополосным. Поделив ?(со) на дисперсию процесса о\ находим нормированную спектральную плотность Так как в нашем случае 20с2 О k {[l +Ф N =
I 18] СЛУЧАЙ УЗКОПОЛОСНОГО СПЕКТРА 176 ТО Подставляя 5 (со) в формулы A7.54) и A7.55) для и>§ и toj и выполняя интегрирование, получим = 2 ? {^^« + За») [l +Ф (? Относительная ширина спектра ^ =0,0986, т. е. величина малая и можно применить формулу B4) для узкополосного спектра. Для применения этой формулы находим прежде всего г (т). Подстановка 5 (со) в A7.53) дает sin md@ = = =?г \ е-«о-<ооJ/2 О = 4j/2" ^ Re {(со0 — УТ" а/2 Преобразуя последнее выражение, используя табличную функцию w(z), определение которой дано в примере A7.3), получим окончательно Г (х) = *У**С% \ре-*%М (со0 sin со0т + ah cos со0т) + а>вгм—==, —J=]—а2тм -—=, —J= e-^/ где v(x, у) и м(лг, jv) — вещественная и мнимая части функции w(x-\-iy) (см. [39]).
176 МЕТОД ОГИБАЮЩИХ [ГЛ. III Так как заданной спектральной плотности соответствует корреляционная функция оо К (т) = 2е2 \ е~(@ ~ <°оJ/2а2 о) cos ( о 00 -|-2с2аH ^?-<»-»о: о б то, используя функцию w(z)y для нормированной корреляционной функции получим ? (т) = 5LVJl?! |а |/ ?-а)§/2а2 ^ 2 (со0 cos со0т — аЧ sin со0 ax d)n \ I о / ах /2а2 Подставляя в полученные выражения для г (х) и А (х) х = Ti/2 = = и/оI = 0,311 с^л: и учитывая формулы A7.30) и A7.32), получим все числовые параметры, входящие в условную плотность вероятности после чего плотность вероятности /(а2, ср31 <р± = ти/2) может считаться определенной. Подстановка этого выражения в B5) и численное интегрирование даст значение искомой дисперсии D [л, cos Ф9 !©!=-!!¦¦]. Пример 18.3. Для случайного процесса, спектральная плотность которого дана в примере A8.1), определить нормированную корреляционную функцию связи г(х) между случайными функциями X(t) = = А @ cos Ф@ и Y(t) = Ait) sin Ф(t), если а = 1 l/сек, р= 10 1/сек. В соответствии с общей формулой A7.53) имеем tt f [(а>2 — р2 + а2J+4а2р2] ' При заданных значениях аир функция j-z—2 , J,2, A 2Q2 имеет острый максимум при со = иH = |^ра — а2. Поэтому, представив эту функцию в виде
§ 18] СЛУЧАЙ УЗКОПОЛОСНОГО СПЕКТРА 177 разложив показатель степени у экспоненты в ряд по степеням о> около точки а)=гш0 и ограничиваясь при этом только первыми тремя членами ряда, получим * ^^ 1 л—О)л(й>—йHJ/а2C2 Bр2|2J^42р2~42р2 * Подстановка последнего выражения в формулу для г(т) дает о Полученный интеграл заменой sin сот = -^ (е*шх — е~Ых) приводится к виду СО 00 О О С другой стороны, положив t = —/ 0Vo Q—^ i— и выпол- няя элементарные преобразования, получим 0)q ш| Re Ltoo, С 1 J —а—/со >o7t J +ib -a+i где для краткости введены обозначения Переходя к функции Лапласа от комплексного аргумента w(z) и учитывая свойства этой функции (см. [39]), получим Va, Ь)\. При заданных числовых значениях а = -——т, ^== — /99 10 Следовательно, окончательно получим , 9,9)}, где V (—Дг-, 9,9) для любого т может быть найдено в таблице. \3/11 / 1Q А. А. Свешников — 1388
178 МЕТОД ОГИБАЮЩИХ [ГЛ. III Полученный результат является приближенным, так как основан на приближенной замене (сй2_с02J + 4а2р2 ~* Н^О). Строгая оценка точности полученного выражения для г(т) представляет определенные трудности, однако представление о порядке 0,5 Г 11 1 л \ \ (aJ-a)$J+4oc2j32 возможных ошибок может быть получено путем сравнения графиков функций 4а2В2 2 @J _ 0JJ _)_ 4авр* И е Щ Ш °>0 Л * Как показывает рис. 15, при заданных числовых значениях а и р эти функции довольно сильно уклоняются друг от друга. Однако точность аппроксимации выражения экспонентой можно улучшить, если в показатель экспоненты ввести добавочный числовой множитель. В рассматриваемом примере в качестве этого множителя можно взять у, так как функция ?-о>5(и>-«оо)«/«в*Р* менее уклоняется от функции 2__JJ i ^%а% (см- рис. 15, пунктир).
§ 18] СЛУЧАЙ УЗКОПОЛОСНОГО СПЕКТРА 179 Дальнейший ход вычисления функции г(т) останется без изменения, однако числовые значения коэффициентов, естественно, изменятся. Применение изложенных в данном параграфе методов к исследованию случайных процессов, возникающих в различных электрических линиях, обычно дает лучшее совпадение, чем в задачах механики и теории автоматического регулирования, так как там лучше выполняется условие узкополосности спектра. На этом мы закончим рассмотрение задач, решаемых с помощью огибающих. Применение этого метода к ряду других задач можно найти в [3], [25].
ГЛАВА IV ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНЫХ ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ § 19. Постановка задачи определения оптимальных динамических систем В предыдущих параграфах были рассмотрены задачи, связанные с определением вероятностных характеристик случайной функции, получаемой на выходе линейной динамической системы, по вероятностным характеристикам функций, поступающих на вход системы. При этом свойства самой системы (дифференциальные уравнения, описывающие эту систему) предполагались заданными. Однако в технике не менее часто встречается другая задача, состоящая в том, чтобы по заданным вероятностным характеристикам случайных функций, поступающих на вход системы, определить параметры динамической системы таким образом, чтобы функция, получаемая на выходе этой системы, наилучшим образом аппроксимировала функцию, которую желательно получить, т. е. определить оптимальную динамическую систему. Для того чтобы эта задача приобрела точную количественную формулировку, необходимо прежде всего установить, что следует понимать под наилучшей аппроксимацией функции, которую желательно получить на выходе динамической системы. Здесь, как при всякой аппроксимации одной функции другой, можно дать различные определения наилучшего приближения. Вследствие случайного характера функции, получаемой на выходе, условия наилучшего ее приближения к желаемой функции должны иметь вероятностный характер. Поэтому можно, например, наилучшим приближением считать такое, при котором в определенной области изменения аргумента вероятность того, что разность между аппроксимируемой и аппроксимирующей функциями больше по абсолютной величине некоторого заданного значения, имела бы наименьшую величину *). *) В данной главе все сл>чайные функции мы будем считать вещественными.
9 19) ПОСТАНОВКА ЗАДАЧИ 181' Наилучшим приближением можно считать и такое, при котором математическое ожидание абсолютной величины разности между ординатой заданной функции и ординатой аппроксимирующей ее функции было бы минимальным. Наконец, можно потребовать, чтобы условию минимума удовлетворяло математическое ожидание квадрата этой разности. Если обозначить функцию, получение которой желательно на выходе динамической системы, через Z(t), а функцию, которая в действительности получается на выходе, через Y(t), то перечисленным выше трем условиям наилучшего приближения функции Y(f) к функции Z(t) можно придать следующую математическую форму. Для обеспечения минимальной вероятности отклонения, большего заданного е0, необходимо, чтобы P[|r@-Z@|>e0] = min; A9.1) требование минимума математического ожидания абсолютной величины разности между Y(t) и Z(t) означает выполнение условия М[| Y(t) — Z(f)\] = mini A9.2) наконец, требование минимальной величины математического ожидания квадрата разности (требование минимума второго начального- момента) приводит к условию М {[Y(t) — Z(t)f) = min. A9.3) Если математические ожидания случайных функций Y(t) и Z(t) не равны нулю, то условие C) обычно целесообразно бывает дополнить требованием Z@] = 0, A9.4). которое означает отсутствие систематической ошибки системы. В этом случае условие C) может быть переписано в виде D[Y(t) — Z(t)] = min A9.5 и соответствует простому физическому условию обращения в минимум среднего квадра'гического отклонения. Несмотря на различную математическую формулировку оптимального приближения функции Y(t) к функции Z(f) (можно было бы указать и другие возможные критерии наилучшей аппроксимации), физически все эти критерии близки между собой, так как их выполнение означает, что функция Y(t), как правило, не сильно отклоняется от функции Z(t). Поэтому следует ожидать, что свойства динамической системы, построенной с учетом любого из этих требований, будут не сильно различаться, что и подтверждается расчетами
182 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV для ряда случаев. Это позволяет из большого числа возможных критериев выбрать наиболее простой критерий минимума среднего квадратического отклонения. Кроме того, в том случае, когда функции Y{t) и Z(t) являются нормальными и математическое ожидание разности Y{t) — Z(t) равно нулю, это требование гарантирует одновременное выполнение также и условий A) и B). Действительно, если разность e,(t)=Y(t) — Z(t) является нормальной величиной, •обладающей нулевым математическим ожиданием и дисперсией а2, то вероятность A) выражается через а формулой где Ф (х) — интегральная функция Лапласа, а математическое ожидание B) отличается от а только постоянным множителем М [ | Y(t) — Z(t) | ] = 1/ ~o. A9.7) Оба эти выражения монотонно возрастают с ростом а, и поэтому •их минимум достигается одновременно с обращением в минимум а. Если же разность Y(t) — Z(t) имеет математическое ожидание, отличное от нуля (практически это означает, что при аппроксимации функции Z(t) функцией Y(t) возникают систематические ошибки, устранить которые в данной системе не представляется возможным), условия A), B) и C) уже не будут математически эквивалентны даже для нормального закона распределения. Несмотря на то, что требование минимума среднего квадратического отклонения в большинстве случаев и дает достаточно хорошее приближение к оптимальной системе, возможны случаи, когда этот критерий может оказаться недостаточно надежным. Окончательный •ответ о пригодности того или иного критерия точности аппроксимации функции Z(t) функцией Y(t) для нахождения оптимальной динамической системы может быть сделан только на основании более детального анализа решаемой технической задачи, учитывающего дальнейшее использование функции Y(t), получаемой на выходе динамической системы. Итак, в качестве критерия наилучшего приближения функции Y(t) к функции Z(t) мы примем для дальнейшего условие C) — требование обращения в минимум среднего квадратического отклонения. Задача определения оптимальной динамической системы имеет различное физическое содержание в зависимости от того, какие -случайные функции поступают на вход системы и для воспроизведения какой функции Z(t) эта система должна служить. Оставляя рассмотрение систем, на вход которых поступает несколько случайных функций («многоканальные динамические системы»), до § 26, ограничимся пока случаем, когда на вход системы поступает
I 19) ПОСТАНОВКА ЗАДАЧИ 183 только одна случайная функция, т. е. система работает по схеме, изображенной на рис. 16. Рассмотрим наиболее типичные задачи, приводящие к отысканию оптимальных динамических систем. 1. Экстраполирование (упреждение). В этой задаче заданными являются значения ординат реализации случайной функции X^t^) для моментов времени tx ^ t, а искомым является значение ординаты функции X{t) в момент времени — *v + (>0 Ш1 {) + (т>0). Таким образом, в данной задаче н Рис. 16. Z(t) = X(t + x) A9.8) и требуется найти такой оператор L, применение которого к функции X (f) давало бы новую функцию Y(t) = LX(t), A9.9) удовлетворяющую условию C). Если при определении функции Y(t) мы можем располагать ординатами случайной функции X (f) только за ограниченный промежуток времени 7, то говорят об экстраполировании на основании наблюдения случайной функции в течение конечного интервала времени; если при экстраполировании можно использовать значения ординат X(tx) для всех моментов времени ti^t, то говорят об экстраполировании по всему прошлому случайной функции. Как мы увидим дальше, математическое решение задачи определения оптимальной динамической системы для этих двух случаев существенно отлично, причем задача экстраполирования по всему прошлому решается более просто Поэтому во всех случаях, когда промежуток времени Т достаточно велик, обычно пользуются результатами, получаемыми для Т=оо. С задачей экстраполирования случайной функции сталкиваются, например, при конструировании различных «упредителей», т. е. приборов, которые должны обеспечить подачу команды в такой момент времени, чтобы в момент ее исполнения (с учетом инерционности рассматриваемой системы) случайная функция X(t) имела бы заданное значение (например, равнялась бы нулю). 2. Фильтрация (сглаживание). Здесь случайная функция X(t) является суммой двух случайных функций X(t)=U0)+V(t\ A9.10) из которых только U(f) представляет для нас интерес, а функция V(t) появляется на входе помимо нашего желания и является «помехой» или «шумом». Необходимо так выбрать динамическую систему, чтобы на ее выходе получить нужную нам ординату случайной функции U(t),
184 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV наименее искаженную помехой V(t). В соответствии с поставленной таким образом задачей на выходе желательно получить функцию , A9.11) где значение х может быть как отрицательным, так и положительным. В первом случае обычно говорят о фильтрации при интерполировании случайного процесса, во втором — о фильтрации при экстраполировании. Задача фильтрации является более общей, чем простая задача экстраполирования. При этом также следует различать случай, когда нам известно поведение функции X(t) только за ограниченный промежуток времени, предшествующий данному моменту времени t> и случай, когда этот промежуток является неограниченным. В качестве примера задач подобного типа можно привести обработку экспериментальных записей случайного процесса с целью исключения ошибок измерительных или записывающих устройств, выделение полезного сигнала в линиях радиопередающих устройств «а фоне помехи, предсказание угла крена качающегося судна в будущие моменты времени, если углы крена измеряются прибором, дающим заметную ошибку, и т. п. К этой же задаче сводится и построение систем автоматического регулирования, назначением которых является «фильтрация» случайных возмущений, получаемых регулируемой системой. 3. Дифференцирование случайной функции, В этом случае на вход системы по-прежнему поступает случайная функция X(f)= ?/@ + V(t), но требуется определить не саму случайную функцию U(t)t а ее производную соответствующего порядка, т,е. $ A9.12) ИЛИ ^pL A9.13) где х может быть положительным или отрицательным в зависимости от того, требуется ли определить значение производной в будущий или прошедший момент времени. Задача подобного типа возникает, например, при проектировании приборов управления стрельбой, когда на основании текущих координат цели, искаженных ошибками измерительных приборов, необходимо наилучшим образом определить скорость цели для нахождения положения цели в момент встречи с ней снаряда. Перечисленные выше три задачи определения оптимальных динамических систем не исчерпывают всех возможных задач подобного типа, так как во многих случаях появляются смешанные задачи, связанные, например, с нахождением производных различного порядка, •с упреждением и сглаживанием, так что само деление их на задачи
I 19] ПОСТАНОВКА ЗАДАЧИ 185 экстраполирования, сглаживания и дифференцирования носит довольно условный характер и сделано нами только для того, чтобы с большей наглядностью пояснить их физическую сущность. В дальнейшем мы этого разделения делать не будем, сформулировав следующим образом задачи экстраполирования, сглаживания и дифференцирования как одну: по значениям случайной функции X{t)=U(t)+V(f) A9.14) на конечном (Т) или бесконечном интервале времени, предшествующем моменту времени t, и известным вероятностным свойствам случайных функций U(t) и V {t) необходимо определить оператор L, результат применения которого к функции X(t) наилучшим образом (в смысле минимума среднего квадратического отклонения) аппроксимировал бы функцию , A9.15) т. е. удовлетворял бы условию М {[LX(t) — N?/tf + T)]2} = min, A9.16) где значение т и вид оператора N заданы. Задача, поставленная в таком общем виде без каких-либо предположений о виде операторов L и N и свойствах функций U(t)n V(t)r не может быть решена. Однако при решении большинства практически важных задач можно идти на допущения, которые позволяют получить окончательный результат простым способом. Основными условиями, которые упрощают решение поставленной* задачи, являются: 1. Операторы L и N линейны и не зависят от времени. 2. Функции U(f) и 1/@ стационарны и стационарно связаны*). 3. Ординаты реализации функции X(t)=U(t)-{-V(t) известны за неограниченно большой промежуток времени, предшествующий моменту времени t Последнее условие на первый взгляд существенно ограничивает применение излагаемой теории, так как никогда не бывает возможности использовать ход случайного процесса за бесконечный интервал времени; однако увеличение используемого интервала времени более некоторого определенного значения практически не может сказаться на точности получаемого результата, поскольку для достаточно большого интервала связь между ординатами случайной функции X(t) на его концах становится практически несущественной. Поэтому условие 3 нужно понимать в том смысле, что время, в течение которого ход случайной функции X(t) предполагается известным, *) В §§ 24 и 25 будут рассмотрены некоторые простейшие случаи нестационарных задач.
186 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ (ГЛ. IV должно быть достаточно большим, Чтобы ордината корреляционной функции за это время практически обратилась в нуль. Подобное условие во многих задачах может быть принято. Кроме того, выбрав оптимальную динамическую систему, соответствующую использованию всего прошлого случайного процесса X(t), и оценив при этом среднюю квадратическую ошибку аппроксимации, мы тем /самым можем получить оценку предельной точности, которую нельзя превысить при аппроксимации по конечному отрезку времени. Допущение линейности операторов L и N, принятое в условии 1, требует более подробного пояснения. Очевидно, что предположение ?> линейности этих операторов является неизбежным, если мы хотим оставаться в рамках корреляционной теории случайных функций, а только такая теория не связана с предположением о виде закона распределения случайной функции и вследствие этого имеет широкое применение в технике. Если бы ограничение теории только линейными операторами не охватывало основных технических приложений, рассмотрение задачи в рамках корреляционной теории утратило бы в значительной мере свою ценность. Однако в действительности линейная теория охватывает значительный процент практически интересных случаев. Происходит это потому, что нелинейные операторы обычно могут быть с достаточной точностью аппроксимированы линейными операторами N, примененными к функции U(t). Допущение линейности оператора L имеет другие оправдания. Во-первых, в большинстве технических задач оператор L проще всего осуществляется с помощью линейных устройств. Во-вторых, легко убедиться, что для нормального процесса X(t), при выполнении критерия минимума среднего квадрэтического отклонения, оптимальный линейный оператор является вообще оптимальным .оператором, т.е. нельзя улучшить аппроксимацию функции Z(t) путем перехода от линейного выражения LX(t) к любому другому нелинейному выражению. Убедимся в этом на простейшем примере экстраполирования случайной функции без фильтрации и примем для простоты, что мы располагаем значениями случайной функции X(t) в дискретные моменты времени ti^:tci^i...^tn. Предположим, что в качестве оценки интересующей нас ординаты Х(гп-\-%) следует взять не линейную комбинацию ординат ^Y(^), Xfa),..., X(tn), как это предполагается в том случае, когда оператор L является линейным, а некоторую произвольную функцию F(X\, Хъ ..., Хп)У где для сокращения обозначено A9.17) Эта функция, согласно условию A6), должна быть выбрана так, б М {[F (Я* Хь .. „ Хп) - X (tn + т)]*} = min. A9.18)
% 19) ПОСТАНОВКА ЗАДАЧИ 187 Обозначим математическое ожидание случайной величины Хп+1 = = X(tn-\-i), вычисленное при условии, что п случайных величин приняли значения Хъ Хь ..., Хп, через М (Хп+11 Хь Хь ..., Хп). Тогда, представив условие A8) в виде М [ \[F (Xv X» .. , *я) - М (Хп+1 \Х1}..., Хп) + [M(Xn+l\Xh...,Xn)-Xn+l]}*] = min, A9.19) раскрывая скобки и воспользовавшись теоремой о математическом ожидании суммы, получим М {[Хп+1 — М (Хп+1 \ХЬ..., Xn)f) + + М {[F(Xlt Хь ..., Xп) - М (Хп+1 \ХЬ..., Хп)]*} + + 2M{[F(XvX»...iXn)-M(Xn+1\Xb...,Xn)]\M(Xn+l\Xh...yXn)-- A9.20) Последнее слагаемое в этой сумме равно нулю, так как при вычислении математического ожидания выражения, содержащего п-\-\ случайную величину Хь Х%, ..., Хп+Ь можно сначала найти условное математическое ожидание при закрепленных значениях первых п величин, а потом найти математическое ожидание полученного таким образом условного математического ожидания. Однако при выполнении первой операции первый множитель не является случайным и может быть вынесен за знак условного математического ожидания, условное же математическое ожидание второго множителя тождественно равно нулю, так как обращается в разность одинаковых выражений М(Хп+1\Хь ..., Xn)-M(Xn^\Xv ..., Хп) = 0. A9.21) Таким образом, условие A8) можно переписать в виде М {[*„+! - М (Хп+11 Хь ..., Xn)f} + M {[F (Хь Хь ..., Хп) - — М (Хп+11 Хь ..., Хп)]*} = min. A9.22) Меняя вид функции F (Xv Хъ ..., Хп), мы можем изменять только второе слагаемое в выражении, стоящем слева от знака равенства. Это слагаемое является математическим ожиданием квадрата разности {F (Хь Хь ..., Хп) — М (Хп+1 \XV ..., Хп)} и, следовательно, имеет минимальное значение, равное нулю, которое достигается при F №, Хь ..., Хп) = М [Хп+г I Хъ Хь ..., Хп]. A9.23) Следовательно, мы доказали, что при любом законе распределения ординат случайной функции X(t) функция F(Xlt X& ..., Хп)> обращающая в минимум среднюю квадратическую ошибку аппроксимации, равна условному математическому ожиданию значения экстраполируемой ординаты X (t -f- т) при значениях ординат, используемых
188 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ |ГЛ. IV для экстраполирования. С другой стороны, для нормальной системы случайных величин условное математическое ожидание одной из них выражается линейно через другие величины, значения которых предполагаются заданными. Таким образом, в случае нормального процесса результат, который получается при оптимальном линейном экстраполировании, не может быть улучшен путем перехода к нелинейным операторам. Этот вывод, полученный выше для простейшего случая, остается в силе и в более сложных задачах и является одной из причин, делающих рассмотрение только линейных операторов достаточно интересным для практики, поскольку нормальные случайные процессы, или процессы, мало отличающиеся от нормальных, весьма часто встречаются в приложениях. Наконец, третье соображение, которое делает практически важным рассмотрение в первую очередь линейных динамических систем, связано с тем, что во многих задачах случайные функции появляются в виде сравнительно малых добавок к различным неслучайным выражениям и процесс линеаризации становится возможным именно вследствие малости этих добавок. Итак, сделанные выше ограничения при постановке задачи нахождения оптимальной динамической системы сравнительно мало снижают практическую ценность получаемых таким образом результатов. Вид оператора оптимальной динамической системы существенно зависит от вида спектральных плотностей Su(u>)> Sv(u>) и Suv(<*>)- Действительно, например, в задаче фильтрации «отфильтровать» помеху от полезного сигнала в принципе невозможно, если их спектральные плотности не отличаются между собой, и процесс фильтрации будет тем более эффективен, чем сильнее спектральная плотность «Sa(<*>) отличается от спектральной плотности Sv (<*>). Как будет видно из формул последующих параграфов, даже небольшое на первый взгляд изменение вида спектральных плотностей сигнала и помехи существенным образом меняет математический вид оператора оптимальной системы. В большинстве прикладных задач спектральные плотности входных величин определяются экспериментально и имеют сравнительно небольшую точность. Почти всегда экспериментально найденные выражения для корреляционных функций (и соответствующие им спектральные плотности) могут быть аппроксимированы примерно с одинаковой точностью различными аналитическими выражениями, которые, естественно, дадут и различные аналитические выражения для оператора оптимальной динамической системы. Пусть, например, экспериментально найденная корреляционная функция с приблизительно одинаковой точностью может быть аппроксимирована одним из следующих трех выражений: A9.24)
§ i», ПОСТАНОВКА ЗАДАЧИ 189 которые соответствуют случайным процессам, обладающим различной физической природой: первый процесс является недифференцируемым, второй процесс имеет только первую производную, третий же процесс дифференцируем любое число раз. Поэтому возникает естественный вопрос: насколько можно доверять результатам, получаемым в теории оптимальных динамических систем, если исходные данные для такого расчета неточны? К сожалению, ответа на этот вопрос в общем виде не удается получить, однако практика применения этих методов показывает, что положение не столь безнадежно, как это может показаться сначала. Дело в том, что хотя вид оптимального оператора динамической системы существенно зависит от вида спектральных плотностей сигнала и помехи, ошибка в получаемой на выходе оптимальной системы функции зависит от точности исходных данных в значительно меньшей степени. Иными словами, небольшое отклонение от оптимальной системы, возникающее вследствие неточного знания характеристик случайных функций, поступающих на вход системы, мало сказывается на качестве системы. К сожалению, этот вывод является только качественным, так как нельзя в общем случае указать, какие искажения в функциях Su (<*>)> Sv(v) и SuV(<») следует считать «малыми». Наоборот, имеются примеры, когда даже весьма небольшие на первый взгляд отклонения в спектральной плотности могут существенным образом повлиять на точность получаемого результата. Рассмотрим для примера задачу чистого прогнозирования, т.е. определение значения ординаты случайного процесса U (t) в момент времени t -j-1 0е ^> 0) на основании значений ординат этого процесса в предшествующие моменты времени, т.е. случай, когда помехи отсутствуют. В общей теории стационарных процессов (см., например, [44]) доказывается, что точность прогнозирования существенно зависит от сходимости интеграла 00 " '" ° '§¦ d*. A9.25) Если этот интеграл сходится, то прогнозирование возможно лишь с ошибкой, причем величина ошибки зависит как от времени прогнозирования т, так и от вида спектральной плотности Su(&). Если же этот интеграл расходится (т. е. равен — оо), то ошибка прогнозирования обращается в нуль при любом т, т.е. прогнозирование может быть выполнено абсолютно точно (функции, для которых интеграл B5) расходится, называются сингулярными случайными функциями).
190 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV Поэтому, если в качестве аппроксимирующего выражения для спектральной плотности процесса, не обладающего свойством сингулярности, мы возьмем выражение, соответствующее сингулярному процессу, то, несмотря на то, что ошибка аппроксимации представляется «незначительной», оценка точности прогнозирования будет отличаться даже качественно: вместо конечной ошибки мы получим ошибку, равную нулю. Например, третье выражение в формуле B4) соответствует сингулярному процессу, так как при подстановке в этом случае <?а(и>) = -L jV'-o»*-*41'2* =-?| е-'2 A9.26) —оо * П в формулу B5) мы получим расходящийся интеграл, в то время как для первых двух выражений интеграл будет сходиться и, следовательно, процесс не будет сингулярным. Все вышеизложенные соображения показывают, что при выборе аппроксимирующих выражений для спектральных плотностей (корреляционных функций) исследуемых случайных процессов необходимо по возможности учитывать и общие соображения, связанные с анализом механизма возникновения этих процессов. В подавляющем большинстве случаев, встречающихся в приложениях, можно считать, что случайный процесс является результатом прохождения белого шума через линейную систему. В этом случае естеавенным видом аппроксимирующего выражения для спектральной плотности является дробно-рациональная спектральная плотность. С плотностями такого вида мы и будем в основном иметь дело в дальнейшем. После определения оптимальной динамической системы в том смысле, как это понимается в данном параграфе, т. е. определения оптимального математического оператора, переводящего одну случайную функцию в другую, в технических приложениях обычно возникает задача «синтеза» динамической системы из реальных элементов, оператор которой был бы наиболее близок к оптимальному. Очевидно, что точность аппроксимации, достигаемая в случае оптимальной динамической системы, всегда будет не ниже точности любой реальной системы. Поэтому результат, получаемый для оптимальной системы, представляет существенный интерес как оценка предельной точности, которая может быть достигнута любой реальной системой. Рассмотрение задачи синтеза динамических систем выходит за пределы содержания данной книги. В заключение отметим, что во многих прикладных задачах вид линейного оператора L, наилучшим образом аппроксимирующего функцию Z(t) = N Щг-\-1), бывает задан, и речь идет только о наилучшем выборе числовых параметров, от которых зависит оператор L.
% 19] ПОСТАНОВКА ЗАДАЧ'1 191 Если при этом под наилучшей аппроксимацией по-прежнему понимать обращение в минимум среднего квадратического отклонения, то задача определения оператора L сводится к определению экстремума функции нескольких переменных и не связана с какими-либо принципиальными трудностями. Пусть, например, требуется определить линейную комбинацию ординат случайной функции X(t)= U(t)-\- V(t), поступающей на вход динамической системы, и ее производной X(t)=O(t)-\-V(t) таким образом, чтобы получаемая на выходе случайная функция m A9.27) наилучшим образом (в смысле среднего квадратического отклонения) аппроксимировала значение ординаты полезной части U(t) функции X(t) в момент времени t-{-x (считаем a = v = 0). В соответствии с условиями задачи необходимо определить постоянные ki и ?2 таким образом, чтобы выполнялось условие D [в (*)] = М { [ktX(t) + *а ^Р -U(t + т)]2 } = min. A9.28) Раскрывая в последнем равенстве квадратные скобки и применяя теорему о математическом ожидании суммы, получим D [в @J = Afa* + k\o*x + °l-2 ?,/^ц(т) + 2 hRxuW- 0 9-29) Для нахождения оптимальных значений параметров kt и /г2 необходимо приравнять нулю частные производные дР [е (*)] и ^D [e (t)] dk, и ~Sk2 . Выполнив дифференцирование, получим ^l 4 A9.30) где, учитывая, что X(t)=U(t)-\-V(t), A9.31) i = - ^«@) - Kv@) - 2 RuV@)y A9.32) Подставляя оптимальные значения коэффициентов kx и k$ из C0) в B9), получим наименьшее значение дисперсии ошибки аппроксимации для оператора L, вид которого задан формулой B8), <r A9.34)
192 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV Аналогично решаются и более сложные задачи подобного типа. В дальнейшем при отыскании оптимальных динамических систем мы не будем предполагать заданным вид оператора L. Рассмотрим примеры. Пример 19.1. В качестве упрежденного значения случайной функции ?/(?4~<г) взята линейная комбинация где X(t)=U(t)+V(t), й = v = О, ВД = aftrTJ (cos px + j- sin p |т|), Kv(z) = oieryi (I + т |т|> Rva(x) = 0, время т > 0 задано. Определить значение постоянных kx и ?2, обращающих в минимум дисперсию ошибки: s (о=кгХ @ + АоД (о - и найти соответствующую этим значениям D [е В соответствии с формулами C0), C1), C2), C3) находим Для минимальной дисперсии в соответствии с C4) получим D [e (Olmin = °1 - ^щ ^Sa4cos ?k + -J- sin рт)« - Пусть для примера он = ав=1, а. = 0,1 I/сек, ф = 0,7 I/сек, 1 = 0,51/сек, х = 5 сек. Тогда
§ 191 ПОСТАНОВКА ЗАДАЧИ 193 т. е. дисперсия ошибки на 21% меньше дисперсии ординаты случайной функции U(t)t а среднее квадратическое отклонение ошибки e(t) будет равно 1/0,79 = 0,89, т. е. только на 11% меньше ои. Пример 19.2. Управляющий сигнал необходимо подать в момент, упреждающий момент обращения в нуль производной О (t) от случайной функции U(t). В действительности сигнал подается в момент обращения в нуль линейной комбинации К(<) = а?/(*)+ *#(*) +с Определить оптимальные значения постоянных a, b и с и величину дисперсии Q(t-\-x^, если а = 0,042 l/сек, р = 0,7 l/сек, х0 = 0,2 сек. Пример отличается от предыдущего тем, что в данном случае помеха V(?) = 0, а аппроксимируется не сама функция U(t), а ее производная. Тем не менее метод решения задачи остается прежним: находим дисперсию ошибки дифференцируем полученное выражение по a, b и с и из найденных таким образом алгебраических уравнений определяем искомые постоянные. Выполнив эти вычисления, будем иметь а = — (g2 + p2) g-«To sin pxo = —0,0972 Х/сек, Ь = е~ах° (cos рх0 — j sin (k0) = 0,9736. Условие отсутствия систематической ошибки М [s (t) ] = 0 дает с = 0. Подставля-я найденные значения a, b и с в выражение для дисперсии s(t), получим D [e (t) ] = о* (а« + р2) {l - Г*'. [^±?- sin + (cos (k0 - | sin fkoj2] } = 0« (a3 -f- p«) • 0,04, т. e. 4% от 7 А. А. Свешников
194 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ 1ГЛ. IV § 20. Общее решение задачи определения оптимальной динамической системы, осуществляющей операцию сглаживания, экстраполирования и дифференцирования Итак, предположим, что на вход линейной динамической системы, характеризуемой оператором L, поступает случайная функция X(t) = U(t)+V(t), B0.1) где полезный сигнал U(t) и «помеха» V(f) являются стационарными и стационарно связанными случайными функциями, корреляционные функции, корреляционные функции связи, а следовательно, и спектральные плотности которых предполагаются известными. Предположим, что математические ожидания п и v известны; в этом случае на вход системы вместо случайной функции X(t) можно подать разность i>], B0.2) и, следовательно, без ограничения общности математические ожидания сигнала и помехи могут быть приняты равными нулю. В этом случае условия A9.3) и A9.5) совпадают. Следовательно, требуется определить оператор L таким образом, чтобы выполнялось условие М {[LX(f) — NU(t + *z)f} = min, B0.3) где N — заданный оператор. Будем считать в данном и следующем параграфах, что для выработки аппроксимирующего выражения Y(t) = LX(t) B0.4) используются ординаты случайной функции X(tt) для всех моментов времени tb предшествующих настоящему моменту времени t, т. е. — оо <<!<*. B0.5) Практически это допущение означает предположение, что интересующая нас динамическая система включена достаточно давно до рассматриваемого времени t. Очевидно, это допущение может быть при) нято только в том случае, если динамическая система обладает устой) чивостью *). В этом случае, обозначая весовую функцию системы через l(t) и учитывая, что в общей формуле G.23) для решения неоднородного *) Впервые решение задачи в подобной постановке было получено Винером [51]. Задача интерполирования и экстраполирования стационарных последовательностей была рассмотрена А. Н. Колмогоровым в 1941 г. [19].
§ 2& ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ 195* дифференциального уравнения верхний предел интегрирования можно положить равным бесконечности, для функции Y(t) получим 00 Y(t)=\l (to X(t — to dtb B0.6) o- где знак минус (—) в нижнем пределе интегрирования означает, что точка t1 = 0 включена в область интегрирования. Явное указание на это обстоятельство в данном случае является необходимым вследствие того, что в дальнейших выкладках будет использована дельта-функция, при интегрировании которой невключение нуля в область интегрирования приводит к ошибке, так как при любом ^ J b(t)dt =0, a J O-f а 0—е Обозначая, как и в предыдущем параграфе, Z(t) = W(t + x), B0.7) в качестве ошибки аппроксимирования функции Z(t) искомой линейной системой получим I B0.8) 0- Таким образом, условия оптимальности динамической системы можно переписать в виде — tOdtx — Z(t) l = min. B0 9) Находя квадрат выражения, стоящего под знаком интеграла, пользуясь теоремой о математическом ожидании суммы и переставляя местами операцию интегрирования и операцию нахождения математического ожидания, вместо (9) будем иметь D [е(t)] = ]i(tO11l(tOKx(Г,- tOdtx - 2RXZ(U) \ dt4 + Kz@). o- [o- J B0.10) Для обращения полученного выражения в минимум необходимо определить оптимальным образом функцию l(t), стоящую под знаком интеграла. Подобные задачи решают в вариационном исчислении следующим методом. Пусть l(t) — искомая оптимальная функция веса. Заменим ее другой функцией 1Х(?), положив 4 (*)=/(<)+ «4@. B0.il) где а—постоянная, a i\(t) — произвольная функция времени. 7*
196 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ |ГЛ. IV Если подставить A1) в A0), то мы получим полином второй степени относительно параметра а B0.12) где D [е(О1о означает дисперсию ошибки e(t) при а = 0, а через ?i и Еа обозначено ?t = S ч (Ц \ l(h) Kx (U - h) dti - Rxz Ц tf» B0.13) tddtidb B0-14) 0- 0- На основании общих свойств корреляционной функции (см. § 5, свойство 3) выражение A4) не может быть отрицательным и может обращаться в нуль только для специально подобранных функций ~f\(t), поэтому выражение A2), рассматриваемое как функция а, является параболой, ветви которой при возрастании а уходят в -|-оо. Следовательно, экстремум этого выражения, соответствующий обращению в нуль первой производной по а, является минимумом. С другой стороны, так как l(t)y по предположению, является оптимальной ве- сосой функцией системы, то дисперсия D[s@] должна обращаться в минимум при а = 0. Сравнивая эти два условия, заключаем, что для того чтобы l(t) действительно была оптимальной весовой функцией системы, необходимо, чтобы первая производная от A2) обращалась в нуль при а = 0, - т. е. должно соблюдаться условие ^-O. B0.15) Условие A5) эквивалентно требованию ^ = 0, B0.16) т. е. ] Пl (ft)К* ««- *i)dt* ~ R** Щ dk = 0. B0.17) о- J Выполнить это требование для любой функции t\{t) возможно только в том случае, когда фигурная скобка, стоящая под знаком последнего интеграла, тождественно обратится в нуль, т. е. если \ I (h) Кх (t - U) dtx - Rxz (t) = 0, t ^ 0, B0.18) где индекс у аргумента t$ опущен, а условие t^0 соответствует области интегрирования в A7).
§ 20] ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ 197 Входящие в полученное уравнение корреляционная функция Кх(ъ) и корреляционная функция связи Rxz (т) должны рассматриваться как известные, поскольку они могут быть выражены через корреляционные функции и корреляционную функцию связи случайных функций U{t) и V(t), заданные по условию задачи. Действительно, на основании A) имеем , Ruvrt + RvuW, B0.19) а умножая обе части равенства G) на X(t1)=U(t1)+V(ti) B0.20) и находя математические ожидания обеих частей полученного равенства, будем иметь Rxe С - tO = UtKa (t + x — tO + Nfivu С + * — *i> B0.21) где индекс t у оператора N показывает, что выражение, к которому этот оператор применяется, рассматривается как функция t Таким образом, равенство A8) является интегральным уравнением для определения оптимальной весовой функции I(t). Прежде чем решать A8), перепишем его так: Rxm СО = $ ШО Кх ft - to dtlt B0.22) и подставим это выражение в A0) для дисперсии ошибки s(?), которая для оптимальной динамической системы, таким образом, примет вид D [. (t)] = Кв(Р) - ] ]/ft) /CO Kx ft - U) dh dt%. B0.23) о—о— Двойной интеграл, стоящий справа, дает дисперсию функции Y(t), получаемой на выходе оптимальной динамической системы. Таким образом, дисперсия ошибки воспроизведения требуемой случайной функции Z(t) оптимальной динамической системой окончательно определяется равенством D [«(Q] = D[Z(Q]-D[/(*)] = = \ Sz (со) tfco - J 1L (/(о) |« Sx (ю) rf<o, B0.24) —СЮ где L (/(о) — передаточная функция оптимальной динамической системы. Вернемся к рассмотрению A8). Существенная особенность этого уравнения состоит в том, что оно справедливо только для неотрица-
198 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV тельных значений t(t^O). Поэтому для нахождения его решения приходится прибегать к специальным приемам. Перейдем для этой цели от корреляционной функции Кх(у) к спектральной плотности ?*(<*>) и от корреляционной функции связи Rxz(x) к взаимной спектральной плотности SX2(со), которые в соответствии с A9) и B1) могут быть выражены через известные спектральные плотности Su(u>)y Sv(<*>) и Suvi®) по формулам Sx («О = Su (со) -f Sv (со) + Sva (со) + Suv W, B0.25) Sxz («О = Af (/со) eivn [Su (со) + Sw (со)], B0.26) где N (/со) — передаточная функция, соответствующая оператору N. Для выполнения этого перехода подставим в A8) вместо корреляционной функции Кх(*) и корреляционной функции связи Rxz(t) их выражения через Sx (со) и SXg(®y. Кх (т) = \ eiunSx (со) dco, B0.27) Я„(т)= ^ *"«(»)rf». B0-28) —00 выразив одновременно весовую функцию /(?) через передаточную функцию системы, положив, как обычно, оэ /(*) = JL С ^1 (/со) rfco. B0.29) —00 Подстановка B7), B8) и B9) в A8) после объединения интегралов дает уравнение для нахождения оптимальной передаточной функции системы L(/co) \ \ 'V+'-e»-»!)'* L (fte) Sx («>,) dtt rf(о, - —оо О— ш} B0.30) Двойной интеграл, стоящий в фигурных скобках, может быть вычислен, если воспользоваться интегральным представлением дельта-функции A0.21), согласно которому 00 еЧ»-»1>*1 dtx = 8 (со — coj). B0.31) о- Выполнив таким образом интегрирование по tt и использовав свойства дельта-функции, получим возможность выполнить интегриро-
$ 201 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ 199 вание и по «>i, после чего уравнение для определения L (/оо) примет вид оо \ #* {L (Й) Sx E) — Sxz ($)} <Й = a t 2э= 0, B0.32) —ОО где переменная интегрирования ш заменена на ?. Для решения полученного уравнения используем теорему, справедливую для всякой функции F(S), интеграл от квадрата модуля которой в бесконечных пределах ограничен, т. е. для которой выполняется условие J \F (?)|аЛ<оо. B0.33) -00 Согласно этой теореме, доказываемой в теории интеграла Фурье, если при t^O выполняется равенство le**F(i)dl = 0, B0.34) —00 то F(l) является предельным значением на вещественной оси такой функции комплексного переменного С = ?-|-П]> которая обращается в нуль при |С|—*оо и не имеет полюсов в верхней полуплоскости, т. е. limF(C). B0.35) Г|—-О Т>0 Будем обозначать функцию, удовлетворяющую вышеуказанным условиям, через F*(%). Тогда данная теорема может быть сформулирована следующим образом: при выполнении условий C3) и C4) FE) = F*(fy B0.36) Аналогично, если C4) справедливо при t ^ 0, то F (I) будет пределом на вещественной оси функции комплексного переменного, не имеющей полюсов в нижней полуплоскости, для чего примем обозначения F E) =i/?-(?). B0.37) Положим F (?) = Sxz (?) - L (Й) Sx (?). B0.38) Тогда функция F(?) в соответствии с C2) будет удовлетворять условию C4). Условие C3) для введенной таким образом функции F($) обычно выполняется. Поэтому вместо C8) можно написать ?> B0.39)
200 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV С другой стороны, вследствие предполагаемой устойчивости искомой динамической системы, корни знаменателя передаточной функции L (/;) относительно переменной X = Й могут иметь только отрицательные вещественные части, что соответствует положительным мнимым частям корней переменной ?. Следовательно, функция L(fi) (в конечной области) будет иметь полюсы, расположенные только в верхней полуплоскости, и можно написать B0.40) Используя это соотношение, равенство C9) можно переписать в виде F+® + L-{t\)Sx® = SxgQi). B0.41) В большинстве прикладных задач спектральная плотность ?*(<*>) является дробно-рациональной функцией своего аргумента, так как получается в результате деления двух полиномов частоты о>. В этом случае функцию Sx(<®) можно легко представить в виде произведения функции С+(?), являющейся предельным значением на вещественной оси функции, не имеющей полюсов в верхней полуплоскости, и С~0), являющейся пределом функции, не имеющей полюсов в нижней полуплоскости, т. е. можно написать $,($) = С"® С" F). B0.42) Действительно, для такого разбиения достаточно разложить числитель и знаменатель Sx(%) на линейные множители и, воспользовавшись тем, что Sx E) является четной функцией с вещественными коэффициентами, в качестве С4"^) взять отношение произведения всех множителей числителя к произведению всех множителей знаменателя, обращающихся в нуль в нижней полуплоскости, а в С~(Е) включись все оставшееся выражение, которое будет содержать множители, комплексно сопряженные с множителями, вошедшими в С+(?), и, следовательно, иметь полюсы, лежащие только в верхней полуплоскости. Если Sx(%) не является дробно-рациональной функцией своего аргумента, то подобное разбиение на С+(%) и С~(?) может быть осуществлено в ряде случаев с помощью формул, которые будут приведены в конце данного параграфа. Итак, предположим, что представление D2) возможно. В этом случав, деля обе части равенства D1) на С+E), будем иметь B0.43) Так как выбор функций С"($) и С~(%) сделан таким образом, что функция С*(?) не имеет нулей в верхней полуплоскости, то отношение /*"(?)/С+(?) не будет иметь полюсов в верхней полуплоскости и полученное равенство означает, что функция Sxz (?) / С4"(S) разбита на
§ 201 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ 201 два слагаемых, первое из которых является предельным значением функции, не имеющей полюсов в верхней полуплоскости, а второе — в нижней. Такое разбиение может быть сделано, и притом единственным образом, для всякой функции Fj(S), удовлетворяющей условию I \Fi&\t^<oo B0.44) —00 и, следовательно, допускающей преобразование Фурье. Действительно, переписав формулу Фурье 00 00 j ^-iXtFl{4>)eiatd^dt B0.45) —00—00 в гиде О— оо оо оо F,($)=^ J |е-*'Р,(ю)Лш<Й + ±С ^-«^(«У*»dt, B0.46) —ОО—00 0-f 00 можно доказать, что полученная таким образом сумма и является требуемым разбиением функции Ft(l) на F7(S) и F+(?), т. е. что О— оо iUii B0.47) Ft(%) = ^- С [ e-***Fi(<u)eMd<udt B0.48) Для того чтобы в этом убедиться, в соответствии с C3) — C7), достаточно показать, что выполняются равенства 00 V elitiF- ($) d\ = 0, если tx ^ 0, B0.49) —оо 00 С e'yiF+(?) Л = 0, если *!^0. B0.50) —00 В справедливости этих равенств проще всего убедиться, подставив в них D7) и D8) для функций F~ (S) и F+(?). Действительно, подставляя для примера D7) в E0) и меняя порядок интегрирования, получим оо а ( оо оо | it. B0.51) С
202 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ |ГЛ. IV Однако в соответствии с интегральным представлением дельта-функ- иии A0.21) 00 _L С gHU-t* л _ g (ti _ t) B0.52) —oo и, следовательно, E1) можно переписать в виде оо 0— (oo \ = \ Ь & — t) \\ eiatFx (<о) do> > Л, U =2= 0. B0.53) Последний интеграл может быть отличен от нуля только в том случае, если в области интегрирования по переменной t аргумент у дельта-функции будет обращаться в нуль, так как в противном случае множитель 8 (ti — t) будет тождественно равен нулю. Последнее условие при ti^O выполнено быть не может, чем и доказывается правильность E0). Аналогично доказывается и D9). Таким образом, D6) действительно дает разложение функции Ft (?) на сумму функций Fj($) и F+ (?). Для применения этой формулы к D3) достаточно убедиться, что функция, стоящая в правой части этого уравнения, удовлетворяет условию -2 <Й<оо. B0.54) Условие E4) в практически интересных задачах обычно выполняется, поэтому для интересующего нас слагаемого левой части уравнения L~(il)C~(l) получим на основании D8) явное выражение 00 ( СО \ ^Й> e""d"\dt B0-55> J 5 0+ Деля обе части равенства E5) на С~(%), получим окончательное выражение для искомой передаточной функции L(il) I { \W)\ B0-56) 0+ I J Остается выяснить, как можно определить функции С+(?) и в том случае, когда спектральная плотность Sx(y>) не является дробно рациональной функцией (не является отношением двух полиномов). Рассмотрим для этой цели In ?*((;) и предположим, что выполняется условие \ ||2. B0.57)
§ 20] ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ 203 Тогда, в соответствии с уже использованной выше теоремой из теории интегралов Фурье, 1п5^(Е) можно представить в виде суммы In $,(*) = Г4"© +Г"Ф B0.58) где Г+ (S) и Г" (I) получаются из функций комплексного переменного С не имеющих полюсов в верхней и соответственно нижней полуплоскости, путем соответствующих предельных переходов и на основании D7) и D8) определяются равенствами (?) = 1 С 0 ОО 00 -llt In Sx (со) emt da dt, B0.59) 0>-"oo 0— oo Г+($) = 1 { \е-1и\ъ8х(®)еш<1и>сИ. B0.60) —00 —00 Потенцируя E8), получим с (цЛ РГ+ (&) РГ" (&) /90 fi 1 ^ Ojp у*1) с С • y?\J,\J IJ Так как показательная функция комплексного переменного не может иметь полюсов в области, где отсутствуют полюсы показателя степени, то, положив С+#) = ег*&, B0.62) С~ #) = ег~$\ B0.63) мы тем самым получим искомое представление SX(Z) в виде произведения D2). В том случае, когда ?*(<*>) удовлетворяет неравенству Йл<оо, B0.64) () и С~(Е) могут быть определены также и по следующим формулам, которые приведем без вывода *): = exp { B0.66) —00 00 *) См., например, статью: М. П. Г а н и н, Определение оптимальной передаточной функции динамической системы с конечной памятью, Автоматическое управление и вычислительная техника, вып. 5, Машгиз. 1962.
204 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV Все выведенные в данном параграфе формулы относятся к случаю, когда математические ожидания полезного сигнала и помехи известны, и следовательно, можно было принять п = ъ == 0. Рассмотрим пример, поясняющий применение полученных в этом параграфе формул. Пример 20.1. Найти дисперсию оптимального устройства, предназначенного для определения текущего значения производной -j?, если текущие значения функции Y(t) определяются с ошибкой V(t)y а время работы системы можно считать неограниченно большим. Дано: J7 = 0, Ъ = 0, Ку (т) = о*у гг*111 (cos ?х + ~ sin p |ч В обозначениях предыдущих параграфов V(t), U(t)=Y(t)} Поэтому, применяя B4), для искомой дисперсии получим D[e(*)]= f ша Sy (со) d«> — где L(l&) — передаточная функция оптимальной динамической системы. Находя для ее определения спектральную плотность случайной функции X(t), получим (см. A1.17) и A1.4)) 2ava«x + Sx (ш) - Sy (со) + Sv (со) , п [(д> + a2 _ g2) e я (со + /oo) (ш — 3 + «a) (a) H- Э + J«) (ю — ««о) (ю — 3 — *a) (© + 3 — /a) Следовательно, в соответствии с D2) F — gi — ^l) F — ^2 — ^ где через ax-\-ibx и о« + /&9 обозначены корни числителя Sx(<&\ лежащие в верхней полуплоскости. Определение взаимной спектральной плотности Sxz(w) по B6) дает Sx, (») = /«
1211 РАСЧЕТНЫЕ ФОРМУЛЫ 205 Подставляя полученные выражения в E6), для искомой передаточной функции L(ll) будем иметь F —/«о)F —Р — faH6 + P —fa) 0 Полученные формулы для D[e(f)] и /,(/?) полностью решают поставленную в данном примере задачу. Все интегралы, входящие в эти формулы, могут быть вычислены, однако получение окончательных расчетных формул связано с утомительными выкладками, которые можно обойти. Практически интересный способ, позволяющий упростить вычисления для дробно-рациональных спектральных плотностей, рассмотрен в следующем параграфе. § 21. Расчетные формулы для определения оптимальной передаточной функции динамической системы в случае дробно-рациональных спектральных плотностей сигнала и помехи Выведенные в предыдущем параграфе общие формулы существенно упрощаются в наиболее важном для приложений случае, когда спектральные плотности сигнала и помехи, а также их взаимная спектральная плотность являются дробно-рациональными функциями, т. е. являются отношениями полиномов различной степени. Упрощение основано на том, что передаточная функция системы при фильтрации, упреждении и дифференцировании также является дробно-рациональной функцией, числовые коэффициенты которой могут быть вычислены по сравнительно простым формулам. В случае фильтрации с запаздыванием, т. е. когда «время упреждения» т<0, вид оптимальной передаточной функции несколько усложняется. Этот случай будет рассмотрен в следующем параграфе. Итак, положим, что Sx(l) является отношением двух полиномов. По-прежнему ограничимся рассмотрением вещественных случайных функций U(t) и 1/@ с нулевыми математическими ожиданиями и предположим дополнительно, что Sx(%) в конечной части плоскости комплексного переменного ? не имеет вещественных корней. В этом случае корни числителя, так же как и корни знаменателя в выражении для Sx(m), будут попарно сопряженными и спектральная плотность входного сигнала может быть представлена в виде B1Л)
206 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ |ГЛ. IV где полиномы РтA) и Qa(l) имеют корни, расположенные в верхней полуплоскости комплексного переменного, т. е. могут быть' представлены в виде Мт'' Q«(?) = riE-v,L B1.2) где комплексные числа р,у и v^ имеют положительные мнимые части, mj и nk — кратности соответствующих корней, а Р y !>/ = "*, %пк = п. B1.3) Взаимная спектральная плотность Sxz(w) связана со спектральными плотностями Sa(®) и Svui®) формулой Sxg H = NW еш [Stt (со) + Svu (ш)|, B1.4) где передаточная функция N (/со) желаемого оператора N в данном случае является полиномом, поскольку задачей рассматриваемой динамической системы является фильтрация, упреждение и дифференцирование. Формула D) показывает, что при замене вещественной переменной о) комплексной переменной С мы получим функцию SXZ(Q, аналитическую в верхней полуплоскости и не имеющую особенностей в указанной области, исключая конечное число точек, где эта функция может иметь полюсы. Обозначим значения С соответствующие этим полюсам, буквой Х^ а кратность г-го полюса через 1Г (г = = 1, 2, ... , а). Из вида функции Sx(%) следует, что можно положить где звездочкой по-прежнему отмечается полином, у которого коэффициенты заменены комплексно сопряженными выражениями. Поэтому общее уравнение B0.43), определяющее оптимальную передаточную функцию динамической системы, в данном случае можно переписать и виде ||® [Sxe в) - /* E)] = а* ^| Г (Й> B1.6) Левая часть написанного равенства является предельным значением на вещественной оси некоторой функции комплексного переменного С аналитической в верхней полуплоскости, за исключением конечного числа точек Х^ в которых эта функция имеет полюсы кратности 1Г, а правая часть равенства является предельным значе-
§ Я] РАСЧЕТНЫЕ ФОРМУЛЫ 207 нием на вещественной оси функции, аналитической в нижней полуплоскости, причем обе эти функции на бесконечности обращаются в нуль. Из теории функций комплексного переменного (теорема об аналитическом продолжении) известно, что в этом случае значение функции на вещественной оси можно рассматривать как предельное значение одной функции i(Q комплексного переменного С аналитической во всей плоскости, за исключением указанных выше полюсов, расположенных в верхней полуплоскости. Поэтому вместо F) получим два уравнения 3i\ B1.7) первое из которых будет использовано для определения функции а второе определяет искомую передаточную функцию оптимальной динамической системы. Для определения функции ^(С) будем исходить из полученных выше общих свойств этой функции, согласно которым ^(С) имеет полюсы заданной кратности в точках Хг плоскости комплексного переменного. Такие функции, в соответствии с обобщенной теоремой Лиувилля, могут быть представлены в виде конечной суммы отрицательных степеней разностей (?— Хг), т. е. можно написать i^F- BL9> Таким образом, определение функции ^(С), а следов ательно> на основании (8) и функции L~{i\) = L(&) сводится к вычислению конечного числа постоянных ckr Для их нахождения подставим сумму (9) в G), что дает X X Z Z(С-K) Г21 Для получения любого из коэффициентов cktr умножим обе части последнего равенства на (С — hr)lr. В результате в левой части равенства получим сумму положительных степеней бинома (С — V)- Поэтому для определения нужного коэффициента ckr достаточно продифференцировать по С обе части полученного таким образом равенства (lr — k) раз, т. е. столько раз, какова степень у бинома (С — Хл), стоящего множителем у искомого коэффициента, и положить в результате С = ХГ, так как при первой
208 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV операции слева исчезнут все слагаемые со степенями, меньшими (lr — k), а после второй операции исчезнут все слагаемые со степенями, большими (/г — k). Выполнив эти операции, получим I г . B1.11) Функция J PU @ при C=V не имеет особенностей. Следовательно, функция имеет -«в этой точке нуль порядка 1Г Поэтому второе слагаемое в правой части A1) обратится в нуль и для искомого коэффициента ckr получим окончательно ч1 I Г91 1 Формулы D), (8), (9) и A2) полностью решают задачу определения оптимальной динамической системы, обеспечивающей фильтрацию, упреждение и сглаживание. Эти формулы в общем виде довольно громоздки, однако в различных частных случаях существенно упрощаются в основном вследствие того, что кратности корней 1Г обычно бывают невелики, а поэтому порядок производных в A2) будет невысоким, и число слагаемых в (9) сравнительно малым. В заключение отметим, что подстановка (8) в B0.24) для дисперсии ошибки аппроксимации дает D[«(*)]= \ S,(»)d»--}p J IxH1** B1ЛЗ) —00 —СО Поясним применение полученных формул примерами. Пример 21.1. В условиях примера 20.1 определить передаточную функцию и дисперсию ошибки определения текущего значения производной }. \ если =10-* рад\ а = 0,1 \fcetc, C = 0,75 1/сегс, о| = 4 10"А рад\ а0 = 0,5 l/cetc. s
§ 211 РАСЧЕТНЫЕ ФОРМУЛЫ 209 Так как в рассматриваемом случае «I *о F - *i + 1Ьг) F - <*2 + /*») F - *i - йд) F - д, - ib2) а** (У — те(?_р + /а)F+р + ,в)E_р._,в)F+р_/в) » то, согласно обозначению A), 71 Следовательно, функция ^(Q> определяемая G) и входящая в выражение для искомой передаточной функции (8), на основании (9) определится формулой поскольку SXg(?) в верхней полуплоскости имеет только два простых полюса. В соответствии с A2) для определения постоянных с1Л и с1Л имеем *•* % ф — av -f- ibx -\- ict) (p — яа + f'^2 Ч~ *а) 2C ^2 = ^*! (так как в данном случае а1 = а,2 = 0). Подставляя выражение для ^(С) в A3), получим искомую дисперсию = .} («• + PI - ^- [4 I <•„ Г - j|p I«:,., Г] = Подстановка исходных числовых данных дает aj = a3 = 0, ft, = 1,17, ft, = 1,84, D [«(Qi g g^v (.«+ ft /i - . ^ * (*8 + ^> ^2 + С + а»)8 - I ^«o[P2 + (&1 + «)8l(PS + (^ + = «f, («3 + Pa) A - 0,717) = e* (a8 -f p3) 0,283, T.e. /311370 Пример 21.2. Определить дисперсию ошибки экстраполирования случайной функции U{t) на время xw если на вход оптимальной
2 I 0 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV динамической системы поступает сумма X{f) полезного сигнала U(t) и помехи V(t\ u = v = 0, Ku(x) = ole-« И (cos Kv (x) ±= a%e^ I'l A -f- T | x | ), Ruv (x) = 0, а экстраполирование осуществляется по всему прошлому процесса. При oa = ov=\, а = 0,1 1/сек, р = 0,7 1/сек, 7 = 0,5 1 /cere, x0 = 5 сек сравнить полученный результат с результатом решения примера 19.1. В рассматриваемом случае (см. A1Л7)) о /шч _ л [(с Следовательно, 5Л D) = Sa 0,35 ^ = E —/я — т = 0,363, п = 0,253. Полином Q4(?) имеет четыре корня: Следовательно, применяя формулу (9), получим Определяя коэффициенты chr методом, указанным в тексте, получим «Р (р + fa — W + *Л) № + «a + ГП + in) ' 2а i« (а8 + Р8) г-г"'[^ + («2 + 78I Подставляя указанные в условиях примера числовые величины
« 221 РАСЧЕТНЫЕ ФОРМУЛЫ 21 1 получим D D[e(O| = aJ{l — 0,977} = 0,023а*, а8 = т. е. <з8 в 5,9 раза меньше, чем при экстраполировании линейным выражением k^X (f)-\-k%X (t)f рассмотренным в примере 19.1, которое не является оптимальным. §22. Расчетные формулы для оптимальной передаточной функции динамической системы с запаздыванием Отличие данного случая от случая, разобранного в предыдущем параграфе, состоит в том, что взаимная спектральная плотность Sxz (C)> определяемая B1.4), Sxg (С) = N Щ e^[Sa (С) + Sw (С) ], B2.1) при отрицательном х, вследствие наличия множителя е*х = е~1^х\ обращается в бесконечность при обращении мнимой части переменной С в -|-оо, т. е. имеет в верхней полуплоскости существенно особую точку. Поэтому выражение B1.6) нельзя рассматривать как функцию, аналитическую во всей плоскости, исключая конечное число полюсов, и все дальнейшие выкладки становятся неприемлемыми. Для того чтобы обойти данную трудность, перепишем B1.6) в виде B2.2) Правая часть этого равенства является предельным значением на вещественной оси функции, аналитической в верхней полуплоскости. Второй член в левой части является предельным значением на вещественной оси функции, аналитической в нижней полуплоскости. Следовательно, для того чтобы воспользоваться теоремой об аналитическом продолжении, примененной в предыдущем параграфе, нужно только убедиться, что первое слагаемое левой части равенства B) <||«) B2.3) может рассматриваться также как предельное значение функции комплексной переменной С, аналитической в нижней полуплоскости, исключая конечное число полюсов. Это условие действительно выполняется, так как показательный множитель el^y стоящий в A), в нижней полуплоскости на бесконечности обращается в нуль и, следовательно, существенно особая точка отсутствует. Поэтому обе части B) могут быть получены путем соответствующих предельных переходов из одной функции №(?), аналитической во всей плоскости комплексного переменного С исключая а точек нижней полуплоскости С = *г, B2.4)
212 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV где хг соответствуют полюсам C), поскольку второе слагаемое в B) не имеет полюсов в нижней полуплоскости, а правая часть B) не имеет полюсов в верхней полуплоскости- Таким образом, можно положить ^^^ B2.5) что дает для искомой передаточной функции L{i%) B2-6) где на основании B1.1) выражение т р Д|2 заменено на ~-7г,. Поскольку функция lF(Q всюду аналитическая, исключая конечное число точек, в которых она имеет полюсы, ее, так же как в предыдущем параграфе функцию % (С), можно представить в виде конечного ряда, положив А B2-7) где у.г — полюсы C), 1Г — их кратность, а а — общее число полюсов (как было отмечено выше, все полюсы расположены в нижней полуплоскости). "" Для определения постоянных gktr примем гот же способ, который был использован в предыдущем параграфе: подставляя G) в E), умножая обе части равенства на (С— х,.)'/-, дифференцируя lr—k раз, полагая в результате ; = хг и учитывая, что слагаемое —а*ггл4 ?~W) не имеет полюсов в нижней полуплоскости и, следовательно, после выполнения указанных выше операций дает нуль, получим _ k) j dXl dlr~*h B2.8) Выражение (8) отличается от B1.12) только тем, что вместо полюсов Хг функции SX2(Q, лежащих в верхней полуплоскости, в эту формулу входят полюсы хг функции C), лежащие в нижней полуплоскости, которые, разумеется, имеют совершенно другие числовые значения и кратности 1Г Итак, формулы (б), G) и (8) решают задачу определения оптимальной передаточной функции для динамической системы с запаздыванием, если спектральная плотность Sx(<*>) не обращается в нуль или в бесконечность ни при каких конечных (вещественных) со и является дробно-рациональной функцией своего аргумента.
I 22] РАСЧЕТНЫЕ ФОРМУЛЫ 213 При V(f) = 0 подстановка найденного выражения для оптимальной передаточной функции в общую формулу B0.24) для дисперсии ошибки аппроксимации e(t)=Y(t)— Z(t) дает Ш Рт оэ $ |ЧГ(ш;Рrf«. B2.9) Применим полученные формулы к решению примеров. Пример 22.1. Определить передаточную функцию оптимальной динамической системы, предназначаемой для получения производной случайной функции U{t) в момент времени, предшествующий моменту последнего наблюдения ординаты случайной функции U(t) на -^ секунд, если помехи отсутствуют, й = 0, а 5(ш) Найти дисперсию ошибки определения производной. Так как в данном случае помеха отсутствует, то X(t) = U(t) к по условию Рт (ш) = Р, (о>) = 1, Qn (ш) = Q, (со) = (ш — i%)\ a Sxg (») = = /ад-'")Т<5а(и)), где xj^O. Следовательно, после подстановки в C) получим т. е. это выражение не имеет полюсов в нижней полуплоскости. Поэтому в соответствии cG)W(Q = 0, L (Й) = %В- = /Ь"к% 5, (ю) = /I (/«>) р 5Л (ш) = «о» 5Л (ш) = S, (ш> Следовательно, Пример 22.2. Решить предыдущий пример при условии, что ординаты дифференцируемой функции U(t) искажены помехой V(t), не зависящей от U(t) и имеющей спектральную плотность и нулевое математическое ожидание.
ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV Отличие от предыдущего примера состоит в том, что в данном «случае Следовательно, /(|,ч о /тч . о /(|>ч _ (д2 + Ь2) (со — со,) (со — (о2) (о> — со,) (со — со4) _ ((О) — <Stt (со) + 6„ (со) — (аJ + ау (со^ + Р2J где Wj и со2 — корни уравнения (я2 -f- б2) со4 -|- 2 (a2j32 -f- &2a2) а>2+ 4-|-#2а4) = 0, лежащие в нижней полуплоскости, со3 = а)^, Sxz (<о) = /ад-1<тт1 5Й («л) = ^/^^ ^вЧ В соответствии с G) г=\ «где <?г< око Произведя вычисление коэффициентов gu и g%1 и подставляя найденные значения в формулу F), для передаточной функции оптимальной системы получим ia* [(« - ^ С + m + te) + где m
§ 23] ОПТИМАЛЬНОЕ СГЛАЖИВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ 215" § 23. Оптимальное сглаживание, упреждение и дифференцирование при конечном времени наблюдения В предыдущих параграфах было рассмотрено определение оптимальной динамической системы, осуществляющей сглаживание, упреждение и дифференцирование стационарной случайной функции при наличии стационарных помех в том случае, когда ординаты случайной функции, поступающей на вход системы, известны за столь большой промежуток времени, предшествующий данному моменту времени, что при математическом решении задачи этот промежуток времени можно считать бесконечно большим. Во многих случаях подобная схематизация задачи является вполне приемлемой. Однако в приложениях также часто встречаются случаи, когда конечность времени наблюдения является характерной особенностью работы системы, а функция, поступающая на вход системы, кроме стационарной составляющей, имеет еще переменную составляющую, являющуюся заданной функцией времени. Типичным примером подобных задач являются те из них, которые связаны с построением оптимальных счетно-решающих приборов для определения параметров движения подвижных объектов. Неслучайными составляющими в данном случае являются текущие координаты объекта, к которым прибавляются ошибки измерения, являющиеся обычно стационарными случайными функциями. Решение этой задачи в общей постановке представляет большие математические трудности. Однако если и в этом случае пойти на некоторые упрощения, то можно получить решение, пригодное для практического использования*). Первое упрощающее предположение относится к виду неслучайной составляющей входного сигнала и заключается в том, что эта неслучайная функция времени может быть с достаточной точностью аппроксимирована полиномом от t заданной степени. Это предположение не сильно ограничивает применимость теории, поскольку всякую непрерывную функцию можно с достаточной точностью заменить полиномом, подобрав его коэффициенты соответствующим образом. Второе предположение относится к виду спектральной плотности случайного процесса, поступающего на вход динамической системы, и не отличается от предположения, сделанного в предыдущем параграфе. Наконец, в качестве третьего допущения в данном параграфе **) будем считать, что время наблюдения Т остается постоянным, т. е. что система учитывает ординаты входного случайного процесса только *) Такое решение впервые было получено Заде и Рагаццини [52]. **) В § 25 будут даны формулы для переменного времени наблюдения.
216 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ (ГЛ. IV за интервал времени (t—Т, t)y конец которого непрерывно перемещается, а ширина остается постоянной. Итак, сформулируем задачу математически. Положим, что случайная функция X(t), поступающая на вход динамической системы, -является суммой X (t) = Rk @ + U it) + V @, B3.1) где Rk (t) — полином степени k, т. е. Rk @ = <tf* + attk-* + ...+<*» B3.2) <д0, ab...,ak — неизвестные неслучайные постоянные, а (/@ и V(t) — ¦стационарные и стационарно связанные случайные функции, характеристики которых известны. * Задачей динамической системы является получение функции Z(t), определяемой равенством Z(t) = N[Rk(f) + Um B3.3) где вид оператора N задан. Обозначим, так же как и ранее, оператор искомой динамической системы через L, однако в отличие от предыдущего потребуем, чтобы при нахождении значения функции Y (t) = L [Rk (t) + (j(f) + V (t)l B3.4) получаемой на выходе системы, могли быть использованы ординаты функции X(t) только для интервала времени (t—Ту f). Сформулированную таким образом задачу мы будем называть задачей нахождения оптимальной динамической системы при конечном времени наблюдения. Операторы N и L будем считать не зависящими от времени. По-прежнему будем исходить из требования минимума средней квадратической ошибки, которое дает условие для определения оператора L, т. е. из условия = min. B3.6) Однако в данном случае условие E) нужно еще дополнить требованием равенства математических ожиданий случайных функций Y (t) и Z(f), так как в противном случае может возникнуть систематическая ошибка, искажающая результат, получаемый на выходе системы. Это дополнительное условие даст М {L [Rk (t) + U{t) + V (t)] - N [Rk (t) + U{t)]} = 0. B3.6) Математические ожидания стационарных функций U(f) и V (t) -можно считать равными нулю. Поэтому, применяя операцию математического ожидания к сумме F), получим LRk(t) = NRk(t). B3.7)
§ 231 ОПТИМАЛЬНОЕ СГЛАЖИВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ 217 Обозначим весовую функцию, соответствующую оператору L, через /(т), а весовую функцию, соответствующую оператору N, через л(т). Тогда G) можно будет переписать в виде $ / WRk(t — z)dz= \п (т) /?* (* — т) <*с, B3.8) О -оо где пределы интегрирования в левом интеграле — О, Г, поскольку по условию реальная динамическая система использует только конечное прошлое процесса, а в правом интеграле взяты бесконечные пределы интегрирования, так как на желаемый оператор N никакие ограничения не наложены. Разложим функцию Rk{t — т), стоящую под знаком интеграла, в ряд Тейлора около точки t Поскольку Rk(f) есть полином степени k, то этот ряд будет конечным, и мы получим B3.9) Подставляя это выражение в (8), получим т т 0 =Rk(t) J я(х)Л —/?ft(9 J«(* —оо —оо ... +(-0*-jj-fl'J'W I nD)xkdv. B3.10) Интегралы, стоящие в правой части A0), являются известными величинами, поскольку вид оператора N задан. Поэтому, обозначив через р./ моменты функции #(т), т. е. положив 00 N= J n(x)x>dx, B3.11) —ОО и учитывая, что A0) может выполняться тождественно только в том случае, когда коэффициенты у производных одного порядка от полинома Rk(t) одинаковы в обеих частях равенства, получим добавочные k -\- 1 условия, которым должна удовлетворять весовая функция /(т) искомой динамической системы т = р.у, / = 0, 1, 2, ..., к. B3.12)
'218 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV Итак, оператор оптимальной динамической системы L (или соответствующая ему весовая функция /(х)) определяется из требования .обращения в минимум выражения E) при условии соблюдения добавочных соотношений {12). Полученную изопериметрическую задачу вариационного исчисления можно свести к обычной задаче вариационного исчисления (задаче определения функции, обращающей в экстремум заданное интегральное выражение без учета каких-либо добавочных условий), если вместо условия E) потребовать, чтобы —00 к ГТ -| — 2 2 х/ М 1 СО т</^ ~ V-j = min> /=о L о J 2 / j B3.13) /=о L J -а затем постоянные Ху (неопределенные множители Лагранжа) определить таким образом, чтобы A2) выполнялись тождественно. В этом случае A3) не будет отличаться от E), а добавочные соотношения 02) также будут выполнены. Итак, для определения функции /(т) будем исходить из A3). Преобразуем левую часть этого равенства, представив квадрат выражения, стоящего под знаком математического ожидания, в виде J J-o 00 со Г — I \ /COя(x,) {[Rk(t — *)+U(t — x)+V(t — x)] [Rk {t — xO + —со О + U {t - xt)] + [Rk (t - x) + U it - x) + V(t - x)} [Rk (t - г,) + . B3.14)
§ 23] ОПТИМАЛЬНОЕ СГЛАЖИВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ 21 & Тогда после перестановки порядка интегрирования и нахождения? математического ожидания вместо A3) получим т <т D (в) = J /(т) U /(то [/Сй (т - Ч) + к„ о *<> 00 4- Я„ (х — х,)] Л, — ^ и (то \ки (х — ¦ —00 + ft* (t! - х)] ^ — 2 2 Хут4 dx + SS л (т) я (тО /Св (т - /=0 i -co + 22Xyp,y = min, B3.15> так как выражения вида Т оо S/(x)R*(< —^)Л— J /iW«*(* —x)dx, О —оо появляющиеся в процессе преобразований, обращаются в нуль на основании (8). Последний интеграл в A5) не зависит от /(т) и, следовательно, при отыскании минимума может быть отброшен, после чего получим $ /(т) { S 1{Ч) [Ка Сс - хО + Kv (т - тО + Ruv (т - о о оо + Яои (X - X,)] dzx - 2 ^ Я Ы [/С« (X - ХО + /?от (X! - X)] (fat - k — 22 Vе7}йх = min' B3.16> Заменяя в A6) искомую функцию /(т) суммой /(т)-|-ау](т), где т](т) — произвольная функция, и рассуждая так же, как в § 20 при выводе B0.18), для определения функции /(т) получим следующее интегральное уравнение: о = S ХУ ^ + ? « W 1^0 (< — ') + ««(< - т)] ^ B3.1 /=0 —оо справедливое при O^t^T.
220 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ 1ГЛ. IV Так как Ки (т) + К, (t) + Ruv (x) + /?„ (х) = Кх (х), B3.18) = М {[?/(*, -1) + 1/& -1)) f п (х) ?/(*, - т) rfx} = —00 = М {[A'0, -f)-x(tt-1)] [Zft)-2(Щ = Я*,@, B3.19) то A7) можно переписать в более компактном виде *) г+ k $ / (т) *, (< - т) йт — Rxz (t) = %kj tK O^t^T. B3.20) о- y=o Полученное уравнение отличается от B0.18), выведенного для случая, когда используется все прошлое случайной функции X(t), прежде всего тем, что это равенство справедливо на конечном интервале t. Это делает невозможным применение метода, который был использован в § 20, и в общем случае значительно усложняет решение этого уравнения. Однако в частном случае, когда спектральная плотность Sx(m) является дробно-рациональной функцией о>, решение B0) может быть сведено к решению обыкновенного дифференциального уравнения. Действительно, пусть s*im)==vH$' B3<21) где Лш (о>) и В2п («)) — полиномы степени 2т и соответственно 2л, содержащие только четные степени ш, т. е., например, Ачт И = То + Ti ^ + Та  +.. • + Тт <*>*". B3.22) Представим B1) в виде 3х()~Ж(^У?У B8'23) где полиномы Рт (С) и Qn (Q не имеют нулей в верхней полуплоскости комплексной переменной С Для решения B0) применим искусственный прием, состоящий в том, что вместо искомого оператора L будем искать оператор Llf который связан с оператором L соотношением L = UQn(P). B3.24) *) Г+ и 0 — в пределах интегрирования, как обычно, обозначают, нто точки т= Т и т = 0 включены в область интегрирования.
§231 ОПТИМАЛЬНОЕ СГЛАЖИВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ 221 где р — оператор дифференцирования, a Qn — полином, стоящий в знаменателе B3). Переход от оператора L к оператору Lj означает, что вместо оператора L, который переводит случайную функцию X(t\ поступающую на вход динамической системы, в требуемую нам функцию Z(t) оптимальным образом, мы определяем оптимальный оператор Lx для перевода функции Qn(p)X(t) в функцию Z(t). Очевидно, что вследствие наличия соотношения B4), связывающего операторы L и Lj, эти две задачи эквивалентны, однако вторая задача, как будет показано ниже, при сделанных предположениях о виде спектральной плотности Sx(<*>) решается значительно проще. Обозначим весовые функции операторов Lj и Qn(p) через /j(t) и q(z) соответственно. Так как оператор L является результатом последовательного применения операторов Lt и Qn(p), весовая функция /(т) является сверткой весовых функций 1х(ъ) и q{%), т. е. связана с ними соотношением т+ l(x) = J 4 (т — xt) q (xt) dxv B3.25) o- С другой стороны, для получения весовой функции оператора дифференцирования Qn{p) достаточно в полиноме Qn (p) каждую степень оператора дифференцирования р заменить соответствующей производной от дельта-функции &(т) (см. § 10). Следовательно, интегрирование в B5) может быть выполнено, и мы получим /W = Q»(Pt)'i(^ B3.26) где оператор /?t обозначает дифференцирование по т. Прежде чем переходить к решению интегрального уравнения B0), установим некоторые общие свойства искомой весовой функции 1Х (т). Выписав для этой цели явное выражение случайной функции Y(t), получаемой с выхода искомой динамической системы, через случайную функцию X(t), поступающую на вход системы, с учетом B6) получим г+ =lX(t — x) Qn (px) k W Л. B3.27) В выражении, стоящем под знаком интеграла, слагаемое с наивысшим порядком производной имеет вид
222 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV Повторно интегрируя это выражение но частям, в качестве вне- интегральных членов получим выражения вида / = 0, 1, 2, ..„ /2—1, B3.29) коэффициентами которых являются ординаты стационарных случайных функций, получаемых путем дифференцирования случайной функции X (t)y поступающей на вход системы. В соответствии с допущением B3) функция X (t) имеет спектральную плотность, изменяющуюся на бесконечности как 1 / <o'2/I~2m. Следовательно, производная этой функции порядка (п—/—1) будет иметь спектральную плотность, изменяющуюся при больших о как m 2n-2m , т. е. как (р**1"^. Для того чтобы случайная функция имела конечную дисперсию, необходимо, чтобы ее спектральная плотность убывала на бесконечности быстрее чем 1/о). Следовательно, чтобы рассматриваемая производная от X (t) имела конечную дисперсию, необходимо выполнение условия /я—/<0, B3.30) т. е. при /О B3.31) коэффициент в B9) у производной *У будет иметь бесконечную дисперсию. Так как, с другой стороны, B7), а следовательно, и все внеинтегральные члены вида B9) должны иметь конечную дисперсию, для }<^т производные ?у должны обращаться в нуль при т = 0 и т==Г, т. е. весовая функция 1х{х) должна удовлетворять следующим 2т дополнительным условиям: (х) dzf = 0, x (x) dxf = 0, /=0, 1, ..., т — \. B3.32) Полученные соотношения показывают, что производная в точках т = 0 и z=T терпит разрыв и, следовательно, производные более высокого порядка в этих точках будут содержать дельта- функции Ь (т) и 8 (т — Т) и их производные. Вернемся к B0). Подставляя в это уравнение вместо /(т) B6), получим (к Wdx - Rxz{t) = S X/. B3.33) о- /=o Для решения этого уравнения применим к обеим частям равенства оператор Qn(—pt), где pt — оператор дифференцирования по L Me-
§ 23] ОПТИМАЛЬНОЕ СГЛАЖИВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ 223 няя в левой части равенства оператор интегрирования по т и оператор Qn(—pt) местами и учитывая, что применение второго опера- k тора к сумме ^ \jt} дает многочлен степени k> т. е. сумму того же вида, вместо C3) получим Т+ k \Qni-Pt) KJf ~ *) Qnfa) AW dz - Qn (-ft) Rxz(t) = %ty, B3.34) o- /=e где X)—новые постоянные. Применяя к интегралу, входящему в C4), операцию интегрирования по частям, замечаем, что внеинтегральные члены будут иметь множители вида 7-' которые при j<^tn обращаются в нуль на основании соотношения C2), а при j^m также будут равны нулю вследствие того, что область интегрирования, по предположению, включает точки т = 0 и т=Г, и, следовательно, дельта-функции, которые возникают при дифференцировании, после подстановки пределов интегрирования также обратятся в нуль. Поэтому после интегрирования по частям все внеин- тегральные члены обратятся в нуль, и вместо C4) получим o- QniPt) Qni - Pt) Kxit - т)Л - Qn{ - Pt)Rxzii) = 2 ty. B3.35) Выразим в полученном равенстве корреляционную функцию Kx(t — t) через ее спектральную плотность, положив 00 Kx(t — т)= I e^V-^SxWd'» B3.36) —00 и введем операторы Qn(pt) и Qn(—pt) под знак интеграла по о>. Выполнив после этого дифференцирование по U преобразуем C4) к виду \ \ i О oo y=0 B3.37) Покажем, что при сделанном предположении B3) о виде спектральной плотности Sx(<*>) полученное интегральное уравнение сводится к обыкновенному дифференциальному уравнению. Действительно,
224 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ 1ГЛ. IV рассмотрим двойной интеграл в C7). Заменяя в нем Sx(<*>) по B3), сокращая на \Qn(^)\2 и учитывая B1) и B2), получим П I Qn (/») I3 Sx (ю) eiw <'"'> l[ (х) d* dx = 0 во = $ I (To + Т.№' + !• »4 + • • • + Tm »"") */-(/-T) /i W йш rft. B3.38) 0 oo Однако, согласно A0.22), при любом целом \х 00 ^ С аРе*ф1'-х)A(й = ЪМу — т), B3.39) — 00 где 8^^ (^ — т) обозначает производную порядка \х от дельта-функции по ее аргументу. Поэтому в C8) интегрирование по <*> может быть выполнено, и мы получим J f |Qw(/«)|i5,(co)^-(^>/1(x)tfcDrfx = О оо = $ [То-Т^B)(^^) + ... + (-1ГТт8(ш)(^-^)]/1(х)Л B3.40) о- или, учитывая свойства производных от дельта-функции, получим окончательно о— 1Г Tm |S- + • • • - Т» ? + То] А @- B3.41) Подставляя полученное выражение в C5) и одновременно заменяя корреляционную функцию связи Rxz(t) по формуле «*Д0= Г «'-'S,, («)*»= f «**ЛК/ю)[5.(ю) + 5,в(т)]Л»1 B3.42) — 00 —00 получим дифференциальное уравнение для определения искомой весовой функции lx{t) [И2ГП (-1ГТт|ш- + (-1)т Е/ $ * (»)]<*«> B3.43)
§ 23] ОПТИМАЛЬНОЕ СГЛАЖИВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ 225 где N(i<&)—передаточная функция заданного оператора N. Линейное неоднородное дифференциальное уравнение D3) имеет постоянные коэффициенты и, следовательно, его общий интеграл может быть представлен в виде (при 0 ^ t ^ Т) k 2m 4@= E?v*;+Sc'eV+ XIB3.44) — оо где аг — корни характеристического уравнения = 0, B3.45) а XJ и С'г (/ = 0, 1, ..., k\ г = 1, 2, , 2т) — пока неизвестные постоянные (считаем корни ar различными). Для нахождения весовой функции l(t), которая является искомой в данной задаче, подставим D4) в B6). Учитывая, что применение k 2m оператора Qn(pt) к суммам ^ ljtJ и ^ Ств*'1 дает суммы такого же вида, а оператор дифференцирования pt можно ввести под знак интеграла и заменить умножением на М указанная выше подстановка дает k 2m /=0 —1 — 7> 0 < ^ ^ Г, B3.46) где производные от дельта-функции появляются при дифференцировании функции /^"^@» которая в соответствии с C2) терпит разрыв на концах интервала @, 7), а Djy Cr, Аг и Вг (у = 0, 1, ..., k; г=1, 2, ..., 2/тг; /=1, 2, ..., я—/?г) — постоянные, подлежащие определению. Общее число постоянных, входящих в найденное решение для /(?), равно 2#-|-?-["# Для их нахождения имеется ^-)-^ соотношений, определяемых равенствами A2), дающими значения первых k-{-\ моментов функции l(t). 8 А. А, Свешников - 1385
226 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. TV Для получения недостающих 2п уравнений выражение D6) нужно подставить в исходное интегральное уравнение B0). Однако в B0) содержится еще k -f-1 неопределенных множителей Лагранжа. Поэтому в результате подстановки необходимо получить не 2я, а 2я -f- k -f-1 уравнений. Покажем, что необходимые уравнения могут быть получены. Действительно, эта подстановка дает линейную комбинацию различных показательных функций переменной ty коэффициентами которых являются искомые постоянные, входящие в D6). Так как B0) должно удовлетворяться тождественно, то, приравнивая эти коэффициенты нулю, получим систему линейных уравнений, определяющую искомые постоянные. Число получаемых таким образом уравнений в точности равно 2л, так как при сделанном в начале данного параграфа предположении о виде спектральной плотности Sx(u>) корреляционная функция Кх(ч) будет линейной комбинацией п показательных функций вида ?~~VT| (y=l, 2, ..., п), где постоянные vy могут быть как вещественными, так и комплексными *). Следовательно, при вы- 74- числении [ l(x)Kx(t— т)^х за счет дельта-функций, содержащихся oi в D6), появится {п—т) показательных функций вида g-'V""'1 и {п — т) показательных функций вида е~УК Кроме того, за счет 2т слагаемых вида еаг\ имеющихся в правой части D6), после интегрирования возникает 2т показательных функций вида е"Л Следовательно, всего мы получим 2 (п — т) -f- 2т = 2я различных показательных функций, приравнивая нулю коэффициенты у которых, будем иметь 2я линейных уравнений. Кроме того, после подстановки 1(%) в B0) возникает еще полином от t степени k> приравнивая нулю коэффициенты которого мы получим недостающие А-j-l уравнений. Вместе с соотношениями A2) всего мы будем иметь 2(n--\-k-\~l) линейных уравнений, позволяющих определить 2n-\-k-\-\ постоянных, входящих в D6), и k -j- I множителей Лагранжа. Полученные выше уравнения дают решение поставленной в данном параграфе задачи нахождения весовой функции оптимальной динамической системы при конечном времени наблюдения Т и сделанных предположениях о виде случайной функции X(t), поступающей на вход системы. В том случае, когда искомую динамическую систему удобнее характеризовать не весовой функцией /(т), а передаточной функцией ЦДо), *) В этом легко убедиться, обращая спектральную плотность Sx (со) по С A9tn M . Фурье и вычисляя \ # / е"шх <*<* с помощью вычетов. — со
§ 24] ПРИМЕРЫ НАХОЖДЕНИЯ ОПТИМАЛЬНЫХ СИСТЕМ 227 последняя может быть найдена путем применения преобразования Фурье, т. е. по формуле L{w)= V <?*•*/(т) Л, B3.47) интегрирование в которой после подстановки вместо /(т) выражения D6) легко выполняется. ' Прежде чем перейти к иллюстрации применения расчетных формул данного параграфа на конкретных примерах, определим величину средней квадратической ошибки получения заданной функции Z(i) с помощью оптимальной динамической системы. Возвращаясь для этой цели к A6) и учитывая, что /(т) для оптимальной системы удовлетворяет B0) и A2), получим 74- А D [e @]min= D [Z@] - J /СО К„ W^ + 2 ^ B3.48) о- /=о где Ху — исходные множители Лагранжа. § 24 Примеры нахождения оптимальных динамических систем при конечном времени наблюдения Пример 24.1. Пусть случайная функция, поступающая на вход системы, является суммой полинома первой степени и случайной функции, играющей роль помехи, т. е. пусть B4.1) где корреляционная функция помехи имеет вид К*(т) = 0*г-в1Ч B4.2) а математическое ожидание я = 0. Предположим, что время наблюдения ограничено и равно Т> а искомой является функция' Z(t)9 определяемая равенством Z@ = N/?1@- B4.3) Вид оператора N пока не будем конкретизировать, поскольку большую часть выкладок можно выполнить безотносительно к виду оператора N. Находя преобразование Фурье от корреляционной функции B), получим SA">)= / 1*1 п> B4.4) •*v ' тс (coJ -j- afc) v 7
228 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV Поставленная в данном примере задача совпадает с общей задачей, решенной в предыдущем параграфе, и соответствует случаю, когда k=l, я=1, tn — Q. Применяя общее решение B3.46) к нашему случаю, для весовой функции оптимальной динамической системы получим lit) = Do + Dtt + Atb (t) -\-Bxb(t—T), O^t^T. B4.5) Подстановка этого выражения в B3.20), которое в нашем случае примет вид т+ 5 1{*)КЪ{$ — z)dx = \ + l1t, Q^t^T, B4.6) о— дает -D^Xo + V, B4J) где при интегрировании учтено, что 7 t 1 \ 1(х)е-а^-хЫт: = [ /(т)е~а ^~т) dfz^\-\l(x)e~a^r~^ dx. B4.8) о о / Приравнивая нулю коэффициенты у показательных функций e~at и е0*, получим два уравнения aD0 — Dx-~ aMi = 0, B4.9) аОв + A+аГ)А —a3S1 = 0. B4.10) Уравнивание коэффициентов у нулевой и первой степени переменной t дает еще два уравнения о* X0 = 2~D0, B4.11) X, = 2^Z?,. B4.12) Подставляя E) в B3.12), получим еще два уравнения Do 7* + Dx у Г2 + Ах + Вх = p.» B4.13) Do 1 72 + А у Т* + fiiГ = 1*1» B4.14) которые совместно с предыдущими четырьмя уравнениями полностью определяют шесть постоянных Dq9 D\t A\i B\t Aq и Л|.
§24| ПРИМЕРЫ НАХОЖДЕНИЯ ОПТИМАЛЬНЫХ СИСТЕМ 229 Первые четыре постоянные могут быть определены независимо от уравнений A1) и A2). Решая эти уравнения, получим 12) ° а8 Г» + 6сеГ+ 12 Т (а* 6«* )[Xl' B4.18) Подстановка A7) и A8) в A1) и A2) дает значения последних двух постоянных (Хо и Xj), чем и заканчивается определение всех постоянных, входящих в выражение для оптимальной весовой функции E). Соответствующая этой весовой функции передаточная функция определяется с помощью преобразования Фурье: оо Z,(/(o)= С *-to*/(T)tfx, B4.19) что после выполнения интегрирования дает ЦШ)= At -f Bie-t»7 + 2kDqo (ш) -f 2«D^l> (ш). B4.20) Дальнейшее решение задачи невозможно без знания моментов ji0 и |а1? что требует конкретизации вида оператора N. Пусть функция Z(t), для приближенного определения которой используется данная динамическая система, является производной от неслучайной части входной функции X(t), т. е. Z(*) = J/?iW. B4.21) и задачей системы является определение этой производной с наименьшей средней квадратической ошибкой. В этом случае я(т) = 8П)(Х)> B4.22) ОО N= J /i(T)rfx = a B4.23) B4.24)
230 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ (ГЛ.IV а для ^ и Xj получим и A5), A6), A7) и A8) значительно упрощаются: ¦= 6(°Г+2) B4.25) B4.26) B4.27) B4.28) B4.29) B4.30) В заключение рассмотрим числовой пример. Пусть X(f) — текущее значение координаты точки, движущейся с постоянной скоростью; V(t) — ошибка определения текущих координат точки, характеризуемая корреляционной функцией вида B), где а = 0,25 1/сек, 0^ = 25 м. Найти среднюю квадратическую ошибку ав определения составляющей скорости точки при наблюдательном времени 7=20, 40, 240 сек. Применяя общую формулу B3.48), в данном случае будем иметь B4.31) Г(аТ6~1 6а2 аГ+ТI2)> -6аГ+12)> <Г+12' 12а2 24в«а Подставляя сюда числовые значения, получим Т (сек) ae (м/сек) 20 1,67 40 0,738 240 0,0627 Пример 24.2. Рассмотрим случай, который отличается от пре- дыдущего только тем, что случайная функция, обладающая корреляционной функцией вида B), является не помехой, а полезной частью сигнала. В наших обозначениях это означает, что B4.32) B4.33) B4.34) ш* 4-а2)' = 0.
fi 241 ПРИМЕРЫ НАХОЖДЕНИЯ ОПТИМАЛЬНЫХ СИСТЕМ 231 В соответствии с B3.46) в выражении весовой функции оптимальной системы появится добавочное слагаемое 00 00 С ' Q.n (<"\|Ж N (ш) Su (a)) etM dm = [ elatN{m) dw = 2ш (t), B4.35) — 00 т. e. /(t) = Atb (x) + Bt8 (т - T) + Z)o + Dt% + 2тгЛ (х). B4.36) Уравнение B3.20) в данном случае примет вид \ 2 о- /—о Подстановка C6) в C7) с учетом G) дает 7 \п (т) /Си (< — т) ^т — N/Ce @ = \> + V- B4.38) Дальнейшее решение задачи требует явного задания оператора N. При м,е р 24.3. Рассмотрим случай, который является типичным при определении мгновенных значений координат быстро перемещающейся точки (например, при определении скорости зенитной цели в приборах управления стрельбой). Отличие этого случая от случая, разобранного в примере 1, состоит в том, что координаты точки нельзя считать линейными функциями времени, хотя они и могут быть представлены полиномами более высокой степени, а спектральная плотность «помехи» (ошибки измерения координаты точки) обычно выражается более сложной формулой, чем это было рассмотрено выше. Сформулируем задачу математически. Пусть функция, поступающая на вход системы, *(О = Кв(О+ V{t), B4.39) где /?з@ — полином третьей степени, а помеха V(t) имеет корреляционную функцию /С„(Х) = <,;*-• 1*1 B4.40) и нулевое математическое ожидание.
232 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ dRb(i Задачей системы является определение скорости dt [ГЛ. IV в момент времени t при наблюдательном времени 7\ Так как спектральная плотность Sv (со) в данном случае определяется формулой где для краткости обозначено B4.41) B4.42) a Sx (u>) = Sv (<*)), то в соответствии с общей формулой B3.46) для весовой функции оптимальной динамической системы получим /(т) = АХЬ (т) -f- Btb (т — Т) + Do + ^iT + D&* + А^3- B4.43) Для определения постоянных после подстановки /(т) в уравнение 74- 3 \ I CO Kx (t — т) dx == 2 ^ B4.44) о- /=о и уравнивания коэффициентов у одинаковых показательных функций получим — aAt -f- Do Di -f- -у D2 f D3 = 0, B4,45) = 0. B4.46) Дополняя эти уравнения равенствами, получающимися при уравнивании моментов /(х) и л (х) = 8A) (х), получим Щ, +1 1 74D3 = О, У 7*0» + "В" Г4^з = 0, -f 1 VDi + -J- 7D2 + 4 7*D, = 0 B4.47) Система уравнений D5), D6) и D7) полностью определяет постоянные, входящие в весовую функцию D3). Аналогично решаются и более сложные задачи подобного типа.
§ 25 ПРОСТЕЙШИЕ НЕСТАЦИОНАРНЫЕ ЗАДАЧИ 233 § 25. Простейшие нестационарные задачи Рассмотренные в предыдущих параграфах задачи относились только к тем случаям, когда как поступающая на вход динамической системы функция, так и функция, подлежащая определению в системе, являются стационарными *), а искомая оптимальная система описывается дифференциальным уравнением с постоянными коэффициентами. Между тем задачи, в которых полезный сигнал или помеха (или оба вместе) являются нестационарными функциями, представляют существенный интерес для практики. Поэтому в последние годы рассмотрено большое количество задач, в которых первоначальные предположения о стационарности случайных процессов и отыскиваемой оптимальной системы заменяются более общими предположениями. Не ставя задачей изложить все достигнутые в этом вопросе результаты, рассмотрим особенности определения оптимальных линейных систем при отказе от предположения о стационарности. Сохраним прежние обозначения, т. е. будем обозначать полезный сигнал U{t)y помеху V(t), функцию, получение которой нужно обеспечить с наименьшей ошибкой на выходе системы, Z(O = NC/(O. B5.1) а функцию, получаемую на выходе системы, 7 = ]*(*> h)X(tx)dtv B5.2) но функции ?/@» V(t) и X(t)= U(t)-\- V(t) не будем считать стационарными, и следовательно, будем характеризовать их математическими ожиданиями u{t), v(t) и корреляционными функциями Kn{t\y t%), Kv(t\9 h)t которые теперь являются функциями двух аргументов. Поскольку мы отказались от требования стационарности динамических систем, искомая весовая функция l{tb t^) и весовая функция nfay t<i)9 соответствующая заданному оператору N, являются функциями двух переменных. В остальном порядок решения задачи не отличается от решения задачи для стационарных систем. Предположим для простоты, что математические ожидания как полезного сигнала, так и помехи известны. В этом случае можно считать, что функции (J(f) и 1/@ имеют нулевые математические ожи- *) Исключение представляет голыш случай Заде — Рагаццини, 1де математическое ожидание полезного сигнала не предполагается постоянным.
234 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ ГГЛ. IV дания. Будем по-прежнему под оптимальной системой понимать такую систему, для которой дисперсия ошибки в (9= Y(t)—Z(t) B5.3) обращается в минимум, т. е. в качестве условия оптимальности системы примем D [г (*)] = М {[ У (?) - Z@]'} = min B5.4) для заданного диапазона изменения времени t. Будем считать, что система использует конечное время наблюдения Т. В этом случае, подставляя явное выражение B) функции Y(t) через U(i) и V(t)> условие D) можно представить в виде М {[ $ / (*, U) X (?г) dtx — Z (t)f \ = min. B5.5) о Раскрывая квадратные скобки, заменяя произведение интегралов двойным интегралом и меняя порядок нахождения математического ожидания и интегрирования, получим d [«со]=$/(*, *о [J at, t,) кх (*„ h) du - 2RX2 (tlt t)] dtt+ о о -f D[Z@1 = nHn. B5.6) Так же как и при решении стационарной задачи, определение весовой функции l{t>tx) свелось к задаче вариационного исчисления: необходимо так определить функцию /, чтобы выражение F), являющееся функционалом этой функции (т. е. зависящее от вида этой функции), обратилось в минимум. Несмотря на то, что в данном случае речь идет об определении функции двух переменных, решение этой задачи может быть получено общим методом вариационного исчисления, рассмотренным в § 21 для стационарной задачи, когда необходимо было определить функцию одного переменного /(т). Так же как и в том случае, заменим искомую функцию l{t> tx) суммой !> B5.7) где y] (t, ft) — произвольная (из класса допустимых) функция, а а — постоянная, и определим, при каких условиях наименьшее значение F) будет достигаться при а = 0. Очевидно, что если эти условия будут выполнены, то никакое изменение функции l(t9t%) путем добавления произвольной функции ат] (t> tt) не может уменьшить значение дисперсии ошибки e(t) и, следовательно, l{t,t^ и будет решением поставленной экстремальной задачи.
§35] ПРОСТЕЙШИЕ НЕСТАЦИОНАРНЫЕ ЗАДАЧИ 235 Итак, подставляя G) в F) и выполняя простые преобразования, получим D [е (*)] = D [е (*)] + 2а?х + а2Е9, B5.8) а=0 где обозначено г г *i = Ь ('• '») И 1 & ^ ^ &• '«) Л« - Л« &' ') } Л» B5.9) оо г т ?,= J J4(f, f^fr *0 **(*!> t$dtxdt* B5.10) о о При любом значении ^ функции -ц (t, t{) и т) (^, ^) можно рассматривать как функции своих вторых аргументов, и в этом случае, в соответствии с общим свойством корреляционных функций E.14), можно утверждать, что ?а ^ 0 при любом виде функции r\ (t, tj). Выражение (8) не отличается от выражения B0.12). Поэтому, повторяя рассуждения § 20, заключаем, что l(tv t%) будет весовой функцией оптимального оператора L в том случае, когда дисперсия (8) обращается в минимум при а = 0, что имеет место, если ?1 = 0, B5.11) т. е. когда т г $ Ч (Л '0 И / V, t,) Kx (tv t,) dt% - RX2 (tt, t) \ dtt = 0. B5.12) о * о ' В интеграле A2) под знаком интеграла стоит множителем произвольная фуНКЦИЯ 7] (t, tt). Поэтому из равенства A2) следует равенство нулю фигурной скобки, стоящей под знаком интеграла: т 0. B5.13) Полученное равенство является интегральным уравнением для определения весовой функции l(t, tt). Уравнение A3) по виду похоже на уравнение B0.18), полученное для весовой функции /(х) при решении стационарной задачи, однакд является значительно более сложным, так как в данном случае необходимо определить функцию двух переменных /(?, ^). Прежде чем переходить к краткому изложению результатов, полученных при исследовании уравнения A3) для одного частного случая, определим величину дисперсии ошибки е (t) для оптимальной системы.
236 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ (ГЛ. TV 7 Подставив для этой цели в F) вместо \/ (t, ?2) Кх (tv t%) dt^ в соот- о ветствии с A3), Rxz(tvt)} получим т D |е (t)}min = D [Z@] - $ /(*, <,) Яхг (tt, t) dtx = D [Z(Q] - Ryz (t, t), 0 B5.14) где Y(t), естественно, предполагается вычисленной для оптимальной весовой функции системы. Если, наоборот, исключить, пользуясь A3), из (б) Rxz(tvt), то получим 7 Т D le (Olmin = D [Z @] — ЦЦЬ tx) I (*, U) Кх (tv h) dU dt4 = о о = D[Z(t)] — D[Y(t)), B5.15) что аналогично формуле B0.23) для стационарного случая. Вернемся к рассмотрению уравнения A3) Отметим прежде всего, что при выводе этого уравнения мы не делали никаких предположений об «объеме памяти» Т. Поэтому, положив в этом уравнении Т= оо, мы получим интегральное уравнение для определения оптимальной весовой функции системы, учитывающей при своей работе ординаты входного процесса для «всего прошлого», т. е. для всех моментов времени со 11 (f, f 0 Кх (*i, h) dt, — Rxz (it, 0 = 0, t S3 0, t! s= 0. B5.16) U Аналогичным образом, положив в A3) T=t> получим уравнение для определения оптимальной передаточной функции системы для весьма важного в практическом отношении случая, когда наблюдение за реализацией входного процесса начинается одновременно с включением системы: t \l(tito)Kx(tvt,)dt, — RX2(tvt) = 0, t^Q, 0 <*,<*. B6.17) о Наиболее простые результаты при решении уравнения A3) удается получить в том случае, когда полезный сигнал U{t) и помеха V(t) связаны линейными дифференциальными уравнениями с белым шумом *) *) Ссылки на соответствующие оригинальные работы можно найти, например, в [15].
* 25) ПРОСТЕЙШИЕ НЕСТАЦИОНАРНЫЕ ЗАДАЧИ 237 Весьма общий результат был получен Шинбротом, использовавшим предположение о специальном виде корреляционной функции Кх (tv t.{) и корреляционной функции связи Rxg (tv t^ [50]. В решении Шинброта предполагается, что эти функции двух аргументов tt и t2 можно представить в виде конечных сумм произведений функций каждой из переменных tx и ?2, т. е. предполагаются справедливыми равенства Кх (*„ U) = 2 Т/ ft) Ь ft)> h ^ k> B5.18) / = 1 т Rxm &> '0 = 2 Ху (*i) Ь ('Л ' k ^ ** B5.19) где сру(^), фу(^) и ху(О — некоторые числовые (не случайные) функции. Из равенства A8) вследствие симметрии корреляционной функции Kx(tpto) следуег, что при tx^t^ должно выполняться равенство Кх (tlf U) = 2 <ру (U) Фу (tx). B5.20) Допущение о справедливости равенств A8) и A9) накладывает на вид корреляционных функций Kx(tvt%) и Rxz(tvtv) значительно менее существенные ограничения, чем это может показаться сначала, так как к таким суммам всегда можно свести корреляционные функции и корреляционные функции связи нестационарных процессов, возникающих в результате применения весьма широкого класса операторов к стационарным случайным процессам, имеющим дробно- рациональную спектральную плотность. Действительно, если, например, X(t) — стационарный случайный процесс с дробно-рациональной спектральной плотностью, то, как это было показано в § 13 (см. формулу A3.24)), корреляционная функция Кх {ti —1%) может быть представлена в виде суммы экспонент ауе~х/"8~~^ 1, т. е. при условии tx^t^ в виде A8). Если функция Y(t) получена из X (t) путем умножения на любую числовую функцию ? или путем дифференцирования X(t)> то по-прежнему корреляционная функция может быть представлена в виде A8). Таким образом, условия A8) и A9) во многих встречающихся на практике случаях выполняются точно. В других случаях эти условия можно рассматривать как приближенные разложения корреляционных функций в ряды по соответственно подобранным функциям <$р фу и %р точность которых всегда можно сделать достаточно высокой, удерживая в бесконечном ряде достаточно большое число т первых слагаемых.
238 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV Итак, исходные предположения о виде корреляционных функций Kx(tv t%) и Rxg(tv t%) не являются существенными с точки зрения приложений и могут быть приняты. Не останавливаясь на изложении общего метода решения уравнения A6), развитого Шинбротом, которое можно найти в [31], остановимся на применении этого метода к частному случаю, когда, кроме A8) и A9), выполняется еще добавочное условие т S [?j 00 Фу 00 - 9J 00 Ь 00] = w Pi - *0> B6.21) 7 = 1 т. е. функции <fj(t) и фу0) таковы, что разность, стоящая в левой части равенства B1), является функцией разности (tx —14). Допущение B1) является более существенным, чем допущения A8) и A9), однако имеется ряд задач, где это допущение выполняется. Мы примем это допущение для того, чтобы избежать более сложных выкладок. Для упрощения написания формул воспользуемся символикой векторного исчисления и будем совокупность функций сру0), фу0) и х/@ ПРИ /=1> 2,..., т обозначать как векторы ф0)> Ф0) и %0) соответственно. т В этом случае суммы вида 2 ?/Ф/ можно рассматривать как У-1 скалярные произведения и обозначать <p0)ip0). Применяя эти обозначения, условия A8), A9) и B1) можно записать в виде Kx (tv t^ = ф 00 ф 00» к ^ к* B5.22) Rx. 0» '0 = ¦ 00 X 0а), к S* *i, B5.23) ф 00 М5 00 - Ф 00 * 00 = <* 01 - к). B5.24) Покажем, что искомое решение /0, к) интегрального уравнения A7) может быть представлено в виде / 0, fо — [/ 0) • Y (к)] • / 0 — *0> B5.25) где /0) и Y0) — векторы с компонентами /t0), /30),...» /т0) и Ti 0)» Та 0)» • • •» Т/л0) соответственно, а /0) — функция единичного скачка, т. е. функция, определяемая равенством 0, и обеспечивающая обращение в нуль весовой функции /0, ^) при Покажем, что можно так определить векторы /0) и у@> чт0 выражение B5) будет удовлетворять интегральному уравнению A7).
ft 25] ПРОСТЕЙШИЕ НЕСТАЦИОНАРНЫЕ ЗАДАЧИ 239 Действительно, переписав с учетом B2), B3) и B0) интегральное уравнение в векторной форме, получим Ч> 001 0) = $ ЦЬ к) [Ф ft) Ч> ft)] Л, + J /(*, U) [Ф ft) г|) ft)] Л* B5.27) о *, Последний интеграл справа представим как разность интегралов, взятых в пределах от 0 до t и от 0 до tl9 т. е. представим B7) в виде Ч> 00 X 0) = 110. '0 [ф 00 * 00] ** + о + \ /0, '0 [Ф 00^ 00] Л, - \ l(U U) [ф 00 я|> 00] Л» B5.28) о о Перенося второй интеграл справа в левую часть равенства, объединяя оставшиеся интегралы и вынося за скобки общие множит^пи, получим о h h = $ /0, h) [ф ft) i|) ft) - ф ft) ф ft)] dt* B5.29) о Подставив в полученное уравнение B4) и B5), преобразуем его к виду = / 0) S Y 00 *> 0i - h) dU B5.30) о В обеих частях равенства полученного уравнения стоят произведения (скалярные произведения векторов) функций tx на функции t. Следовательно, уравнению можно удовлетворить, если приравнять эти функции попарно, т. е. положить -ф ft) = IY 00 & 0i — к) dt* B5.31) о ' О + $ I' С) Y СО] Ф СО Л. = X О B5.32)
240 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ ГГЛ. IV Первое из полученных уравнений является формулой свертки (композиции) функций \(t) и w(t). Поэтому, обозначая через ч? (s), V(s) /и W(s) преобразования Лапласа (или Фурье, если для этих функций преобразование Фурье существует) функций, обозначенных соответствующими малыми буквами, получим (считаем 1*7^0) 5^§ B5.33) где написанное векторное равенство следует понимать в обычном для векторного исчисления смысле, т. е. как равенство каждой из т компонент векторов, стоящих в левой и правой частях равенств. Найдя таким образом преобразования Лапласа для всех т компонент 7/@ вектора \(t) и применяя обратное преобразование Лапласа, можно определить все искомые функции Х/@> где / = 1, 2,..., т. После этого определение компонент вектора l(f) сводится к решению системы линейных алгебраических уравнений. Действительно, обозначив \ V (*я) Ь ('*) dU = ал it\ B5.34) о векторное равенство C2) можно переписать как систему т скалярных уравнений т SК(*) + Ыh@ = Ь@- i = h %..., т, B5.35) / = 1 где, как обычно, 8уу=1, 8у? == 0, если ]ф1 Подстановка найденных из этой системы уравнений функций lj(t) в формулу B5) (считаем, что определитель системы не равен 0) дает весовую функцию оптимальной динамической системы, определяемой интегральным уравнением A7). На этом мы закончим рассмотрение идеи решения нестационарной задачи, данного Шинбротом. Более подробное рассмотрение этого метода в предположении, что выполняется условие B4), можно найти в [31]. Кроме случая Шинброта, ряд нестационарных задач поддается сравнительно простому решению тогда, когда входной сигнал системы связан линейными уравнениями с функциями белого шума. Решение нестационарной задачи в весьма общем случае удается получить с помощью метода канонических разложений [33], однако именно вследствие общности решаемой задачи получаемые при этом расчетные формулы, как правило, довольно громоздки. Пример 25.1. Определить весовую функцию оптимальной динамической системы, предназначенной для нахождения производной от
§25| ПРОСТЕЙШИЕ НЕСТАЦИОНАРНЫЕ ЗАДАЧИ 241 случайной функции ,Х (t) в момент времени t -\- т, если система включена при ? = 0, т^>0, а X (t)— стационарная случайная функция, spx + ^ sin р|т|). B5.36) В данном случае нестационарность задачи связана с перемениостыЪ времени* наблюдения t. Следовательно, искомая весовая функция определяется уравнением A7), где Rxz (tv '0 = Kx(t* + *- *i) = ~Л" aTe~a {t2 ~h) sin P 0, + t - *,). ^r>^. B5.37) Написав выражение для Kx(tq — tt) при ti^>t в виде (?i cos ^3 cos + sin p^ sin pfj — ~ sin p^ cos %tx + j cos p*9 sin p^j, B5.38) обнаруживаем, что если положить ф! (^) = о^ cos pf, ф2 @ = о^ sin pf, B5.39) ?1 @ == се- «' (cos pt + j sin p^, ?1 @ = oe-^ ( sin P* — j cos pf) , B5.40) Xl (t) = — ое- ™e~ «* sin p (т — ^), Z2 (^) = — ое- ^е~«г cos p (t — 0» B5.41) то C8) и C7) не отличаются от A8) и A9) при т = 2. Кроме того, образуя разность _ tj + ^. sin p (^ _ ^)j _ - ¦ tfi-' > [cos p (^ — tO + 4 sin p (U — to] = w(tt — tO, B5.42) замечаем, что условие B4) также выполняется. Следовательно, положив в соответствии с B5) /(t, tO = [lt (t) f! (tO + 4 (t) 7з fa)] / 0 — ^)» B5.43) для определения функций ^(t) и 720) на основании C1) имеем два уравнения t cos р^х = ^ fi 00 w 0i — ^0 ^з» о Sin Р^j = ^ T2 00 ^ 01 ^0 ^4- I)
242 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV Применяя к функциям tyi(t)> ф2(?) и w(t) преобразование Лапласа (см. [14]), получим Следовательно, преобразования Лапласа для ^i@ и y*@ будут Находя оригиналы полученных изображений, будем иметь Подставляя полученные выражения для yi@ и ^з@ в C2), после интегрирования получим систему двух линейных алгебраических уравнений, решая которую определим функции lx{t) и 4(?). Подставляя их в D3), получим окончательное выражение для оптимальной весовой функции l\t> t%). § 26. Оптимальные многоканальные динамические системы Рассмотренные в предыдущих параграфах данной главы задачи определения оптимальных систем относились исключительно к одно- канальным системам, т. е. к таким динамическим системам, в которых по одной случайной функции, поступающей на вход системы, должна быть получена одна функция на выходе, удовлетворяющая определенным условиям. В различных технических приложениях не менее часто возникают задачи, при которых по нескольким входным функциям нужно получить «оптимальным образом» одну или несколько функций на выходе. Такие системы носят название многоканальных. Примерами подобных систем могут служить различные навигационные системы, когда по измеряемым координатам движущегося объекта вырабатываются параметры его движения. Весьма распространенными являются многоканальные системы и другого типа, когда различные входные величины используются для получения с наибольшей точностью одной величины. Примерами таких динамических систем могут служить различные навигационные комплексы, использующие для определения текущей
26] ОПТИМАЛЬНЫЕ МНОГОКАНАЛЬНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ 243 координаты объекта измерения различных физических величин (скорости, ускорения и т. п.). Подробное изучение многоканальных систем выходит за рамки настоящей книги, поэтому мы только коротко рассмотрим особенности возникающих при этом задач. Итак, будем называть многоканальной систему, работающую по схеме, изображенной на рис. 17, где Xi(t),...tXn(t)— случайные функции, поступающие на вход системы, a Y\ (f),..,, Ym (t) — функции, которые получаются на выходе системы. Случайные функции Xj (t) можно рассматривать как суммы полезных сигналов Uj(t) и по- • мех Vj(t): Xn(t)- Рис' 17# /=1,2,...,л. B6.1) Задачей системы, так же как и в случае одноканальных систем, является получение на выходе с наименьшей ошибкой некоторых функций Z((t) (/=1,2,..., т), являющихся результатом применения заданных операторов к совокупности функций Uj(f). Ограничиваясь по-прежнему рассмотрением только линейных систем, функции Yi @ можно выразить через функции Xj{t) в виде соотношений У—Ю B6.2) где верхний предел интегрирования t0 нужно взять равным -f-°°» если система может использовать реализации случайных функций «за все прошлое»; взять равным Т, если используются реализации только в течение интервала времени (t — Т, t), и, наконец, положить tQ = t, если поступление реализаций случайных функций Xj(t) начинается одновременно с включением системы. Формула B) показывает, что для каждого выхода системы необходимо определить п весовых функций 1ц (t> tt)t которые в случае нестационарных систем являются функциями двух переменных, а в случае стационарных систем lij(t,tl) = lij(t — tt). Таким образом, для многоканальных систем искомой является не одна весовая функция, а совокупность ппг весовых функций, что существенно усложняет задачу. Понимая и в данном случае под оптимальной такую систему, которая обращает в минимум дисперсии отклонений выходных функций Yi(f) от заданных функций Zi(f)y и считая для простоты Xj = 0t
244 ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ [ГЛ. IV для определения совокупности весовых функций /;)(?, ^i) получим т условий D[Yt@ — Z,(*)] = min, / = 1, 2,..., да. B6.3) Учитывая равенства B), нахождение весовых функций системы, удовлетворяющих C), является задачей вариационного исчисления, для решения которой нужно повторить выкладки, которые были подробно рассмотрены для одноканальной системы, т. е. нужно каждую из искомых функций 1ц (t, ?>) заменить на сумму где У]ц — произвольные функции, и показать, при каких условиях выражение C), которое теперь станет функцией коэффициентов ац, обращается в минимум приа^ = 0. Выполнив эти преобразования, для определения оптимальных весовых функций получим т независимых систем по п интегральных уравнений 2 \ hr (t, U) RXJ Xr (tP h) dt% - RXjZi (tv t) = 0, B6.4) Г=1 0 t<tv 0^^</0; j==U 2,...>n; /=1,2,...,/», где корреляционные функции связи RXjxr (^i> ^2) и Rxjzt (tv t*) предполагаются известными, поскольку корреляционные свойства полезных сигналов и помех должны быть заданы для того, чтобы можно было ставить задачу о нахождении оптимальной системы. Решение системы D) в общем случае представляет сложную задачу. В стационарном случае при бесконечном времени наблюдения 7 эти системы упрощаются и принимают вид S f hr Vi) RXjXr{t - *i) dtx - RXjH(t) = 0. B6.5) r=i 0 Для этого случая и дробно-рациональных спектральных плотностей удается получить довольно общие простые результаты (см., например, [31]).
ГЛАВА V ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ § 27. Определение и общие свойства марковских процессов Рассмотренные в предыдущих параграфах методы исследования случайных функций основывались на изучении первых двух моментов ординат случайных функций, т. е. не выходили за рамки корреляционной теории. Во многих прикладных задачах такой подход к изучению с.чуча?»1«ь:х процессов оказывается вполне приемлемым, что, собственно говоря, и обеспечило широкое применение теории случайных функций в технике. Однако имеется целый ряд задач, представляющих большой практический интерес, для решения которых аппарат корреляционной теории оказывается недостаточным. К таким задачам в первую очередь относятся: определение вероятности выхода ординаты случайной функции за данные пределы, определение закона распределения времени выброса за данный уровень и ряд аналогичных задач. Решение таких задач для случайных процессов любого вида представляет большие трудности. Однако и в этом случае удается получить сравнительно простые методы расчета, если отказаться от рассмотрения случайных процессов самого общего вида и ограничить себя только процессами, обладающими некоторыми специальными свойствами, но тем не менее имеющими непосредственный практический интерес. Такими процессами и являются марковские процессы, обладающие тем свойством, что в отличие от случайных процессов общего вида для их полной характеристики достаточно знать только двумерные законы распределения. Для удобства изложения материала примем в данной главе обозначения, несколько отличающиеся от обозначений, которыми мы пользовались раньше. Будем обозначать случайный процесс по возможности буквой U(t). В том случае, когда возникнет необходимость в рассмотрении двух
246 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V моментов времени, предшествующий момент времени будем обозначать буквой U а будущий момент времени — буквой т, т. е. всегда будем считать, что t ^ т. Ординату процесса в момент времени t будем обозначать X, а ординату процесса в момент времени т У, т. е. положим Х=?/@> Y=U{i)y t^x. B7.1) Если ордината процесса имеет заданное значение (например, лг), то мы сокращенно будем говорить, что рассматриваемая система находится в состоянии х. Наконец, в том случае, когда рассматривается несколько моменте в времени tv-t%, ..., tk, условимся нумеровать их в порядке возрастания, а соответствующие ординаты процесса будем обозначать буквой X с тем же индексом, т. е. положим Хх = U(tx), X* = ?/&), ..., Хк = U(tk) (h < U ^ ¦ • • < tk). B7.2) Прежде чем переходить к определению марковского процесса, рассмотрим процесс, любые ординаты которого являются независимыми случайными величинами. Такой процесс полностью определяется одномерным законом распределения своих ординат, а для ординат, являющихся непрерывными случайными величинами, — плотностью вероятности /(лг) ординаты этого процесса, взятой в момент времени t Действительно, так как любые ординаты являются независимыми, то многомерная плотность вероятности f(xlf х& ..., х^^ хп) на основании теоремы умножения вероятностей может быть выражена формулой f B7.3) Очевидно, что вследствие отсутствия вероятностной связи между ординатами такого процесса его корреляционная функция K(ti> t%) отлична от нуля только при t1 = t%. Строго говоря, процессов с независимыми ординатами в природе не существует, так как все процессы, соответствующие реальным явлениям, обладают известной плавностью и, следовательно, соседние ординаты таких процессов не могут быть независимыми. Поэтому рассмотрение реальных процессов как процессов с независимыми ординатами обычно является непригодным, так как при этом теряется возможность исследовать явления, возникающие вследствие наличия зависимости между ординатами процесса. Естественным является переход от рассмотрения процессов с независимыми ординатами к более сложной модели реального процесса, для которой полной характеристикой является уже не одномерный, а двумерный закон распределения ординат случайной функции. Такой
I 27] ОПРЕДЕЛЕНИЕ И ОБЩИЕ СВОЙСТВА МАРКОВСКИХ ПРОЦЕССОВ 247 моделью и является марковский процесс, для которого закон распределения ординаты процесса в любой будущий момент времени зависит только от значения ординаты в данный момент времени и не зависит от того, какие ординаты случайная функция имела в прошлом. Впервые такие процессы для дискретных значений моментов времени t (и дискретных значений ординат случайной функции) были рассмотрены А. А. Марковым A856—1922). Процессы, рассмотренные в свое время Марковым, в настоящее время обычно называют цепями Маркова. В данной книге рассматриваются только непрерывные процессы Маркова, ординаты которых являются непрерывными случайными величинами (достаточно подробные сведения о цепях Маркова можно найти в книгах [34], [35]). Для математической формулировки основного свойства марковского процесса рассмотрим плотность вероятности f(xk\xly ..., xk_i) случайной величины Xk при условии, что значения ординат случайного процесса в предшествующие моменты времени tv tb ..., tk_x известны. В общем случае эта плотность вероятности зависит от значений Х\У •..» xk_t ординат случайного процесса в моменты времени tv ... ..., tk_v Однако для марковских процессов существенным является только значение ординаты процесса в момент времени, ближайший к рассматриваемому моменту времени tk. Поэтому в качестве определения марковского процесса можно записать следующее условие: если для любых моментов времени ^CCC - *h-x) = / С** I **-i)> B7.4) то такой процесс называется марковским. Таким образом, закон распределения ординат марковского процесса в «будущий момент времени» tk зависит только от значения ординаты этого процесса в «настоящий момент времени» tk_x и совершенно не зависит от того, как изменялась ордината процесса «в прошлом». Покажем, что для марковских процессов любые многомерные законы распределения могут быть выражены через двумерные законы распределения. Рассмотрим для примера трехмерную плотность вероятности f(xv x%> х^)у т. е. плотность вероятности трех ординат случайного процесса U(t)y взятых в три последовательных момента времени. В соответствии с общей формулой для условных законов распределения B.4) имеем х2, х3)=/ (*з I *i> х$ f (xv х& B7.5)
?48 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V Однако, согласно основному свойству марковских процессов, г. е. / (хР х» *8) = / (х, | х%) f (x, | xt) f (xt). B7.7) Аналогично для я-мерной плотности вероятности получим / (Х\, Х%у ..., Xn_i, Хп) = / (Хп \Х%, ..., Хп_{) f (Xi, Xq, ..., ^n-l) = = f(xn\ xn_t) f (xn_, \x^ ... f (x, I xt) f (Xi). B7.8) Таким образом, плотность вероятности ординат марковского случайного процесса U(t) любого порядка может быть выражена через условные двумерные плотности вероятности типа / (xk \ xk_t) и плотность вероятности f(xx) первой ординаты. Однако и условные двумерные законы распределения и одномерный закон распределения однозначно выражаются через двумерные законы распределения (см. B.4), B.5)). Следовательно, все законы распределения марковского случайного процесса однозначно могут быть выражены через двумерные законы распределения, т. е. двумерный закон распределения / (лг, у), заданный для любых значений моментов времени t и т, является полной характеристикой процесса. Имея в, виду, что в дальнейшем условная плотность вероятности f(y\x) будет рассматриваться как явная функция четырех переменных х, t; у, т, примем для нее обозначение f (U х; т, у)> где всегда будем считать ?^т. В некоторых случаях, когда существенной является зависимость f(tf x; т, у) от значения ординаты функции в момент времени х или в момент времени t, вместо^четырех аргументов у функции / мы будем явно отмечать только два, т.е. писать /(т, у) или f(ty x) соответственно. Для одномерных плотностей вероятности случайных величин X и Y мы будем употреблять обозначения f(x) и f(y) соответственно. Наконец, для двумерной плотности вероятности величин X и У мы сохраним обозначение f(x, у). Установим несколько общих соотношений, которым удовлетворяет функция f (t, x; т, у). Так как эта функция дает условную плотность вероятности величины у у то должны выполняться соотношения, справедливые для любой плотности вероятности, т. е. при любых значениях х} у} t и % (t ^ т) должно быть f{t,x;x,y)^:O B7.9) f(t, х; х, y)dy = l. B7.10)
§ 271 ОПРЕДЕЛЕНИЕ И ОБЩИЕ СВОЙСТВА МАРКОВСКИХ ПРОЦЕССОВ 249' При z = t исчезает разница между случайной величиной Л" и У, и следовательно, условная плотность вероятности / (t, х; т, у) должна- обращаться в нуль для любых значений у ф х. С другой стороны, соотношение A0) остается справедливым и при t = zf а это может быть только в том случае, если f(t, x; т, у) обращается в дельта- функцию, т. е. должно выполняться условие / У, х; z, у) U = 8 (х -у). B7.11) Наконец, между двумерной плотностью вероятности f(x, у)У условной плотностью f(t, x\ т, у) и плотностями распределения f \х) и f (у) ординат случайной функции X и У справедливы очевидные соотношения /(л, у)=/ (U х; <с, у) f{x), B7.12) оо / (у) = $ / (*> х-<ъУ)/ С*) &х- B7-13> — ОО Как было указано выше, соотношения (9), A0), A1), A2) и A3) справедливы для любого случайного процесса. Выведем еще одно соотношение, справедливое только для марковского случайного процесса. Рассмотрим произвольный момент времени f, лежащий между t и т (?<Х<СТ)> и обозначим ординату случайного процесса в этот момент времени через Z. Определим вероятность того, что ордината случайного процесса,, имевшая значение х в момент времени t, в момент времени т будет иметь значение, лежащее в интервале (у, у -f- dy), если в момент времени f ордината имеет значение, лежащее в интервале (z, z -j- dz). Рассматриваемое событие является произведением (совместной реализацией) двух событий: получение случайной величиной Z указанного значения в момент времени f при условии, что в момент времени t ордината процесса равнялась х, и получение случайной величиной У значения, лежащего в интервале {у, y-\-dy), при условии, что в момент времени f ордината процесса находилась в интервале (z, z -|- dz). Первая вероятность равна f(t,x;f,z)dz, B7.14) вторая вероятность равна f(t',z;z>y)dy, B7.15) так как вследствие предполагающейся непрерывности ординат процесса эта вероятность для любого значения Z в интервале (z, z -(- dz) с точностью до бесконечно малых величин одинакова. Так как рассмотренные выше события для марковских процессов являются независимыми, то вероятность перехода процесса из состоя-
250 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ (ГЛ. V ния х в момент времени t в состояние у в момент времени т при условии, что в момент времени f ордината процесса находилась в интервале (z, z-\-dz\ равна произведению вероятностей A4) и A5), т. е. равна f {t, х; f, z) / (t9 z; т, у) dz dy. B7.1 б) Интегрируя последнее равенство по всем возможным значениям z, получим вероятности перехода процесса из состояния х в момент времени t в состояние у в момент времени % безотносительно к значению ординаты процесса в момент времени f, т.е. f(t, x; т, y)dy. Приравнивая эти два выражения и сокращая на dy, получим окончательно оо /(*, х; ъу)=* $ f(t, х; f, z)f(t\ z; %, y)dz. B7.17) — ОО Полученное соотношение в соответствии с [7] мы будем называть обобщенным уравнением Маркова, который вывел аналогичную формулу для дискретных марковских процессов (цепей Маркова). Иногда это соотношение называют формулой Смолуховского по имени физика Смолуховского, использовавшего его в теории броуновского движения, формулой Чепмена или формулой Колмогорова, давшего общую аналитическую теорию марковских процессов [21 [. § 28. Уравнения Колмогорова Основное упрощение, которое имеет место при исследовании марковских случайных процессов, состоит в том, что условная плотность вероятности f(t, x; т, у) удовлетворяет системе дифференциальных уравнений, наличие которых облегчает не только определение этой плотности, но и позволяет получить решение ряда других задач, имеющих непосредственный интерес в приложениях. Плотность вероятности f(t, x; т, у), рассматриваемая как функция параметров начального состояния t, x, удовлетворяет уравнению m+a(f' х)й+т^> х^=°9 <28Л> где a (ty х) и Ь (t, x) — числовые (не случайные) функции времени, определяющие особенности рассматриваемого марковского процесса, физический смысл которых будет выяснен ниже при выводе этого уравнения. Если рассматривать f(t, x; т, у) как функцию параметров конечного состояния т, у} то получим уравнение ! | [ЬЬ У)/] 0, B8.2)
I 2S| УРАВНЕНИЯ КОЛМОГОРОВА 251 где а(т, у) и ?(т, у)— те же функции, что и в уравнении A), но, естественно, взятые при других аргументах. Уравнения A) и B) носят название первого и второго уравнений Колмогорова [7] (второе уравнение еще до его строгого вывода в работе Колмогорова [21] встречалось в работах физиков, и поэтому его также иногда называют уравнением Фоккера—Планка или Фоккера — Планка—Колмогорова). Как будет показано в следующих параграфах, при соответствующих начальных и граничных условиях уравнения Колмогорова определяют условную плотность вероятности /(/, х; х, у) как функцию четырех аргументов. Дл! вывода уравнений Колмогорова необходимо сделать ряд предположений, относящихся к существованию соответствующих частных производных от функции / и требованию достаточно быстрого убывания моментов разности (К—X) при t—ух. Не останавливаясь на строгой математической формулировке этих предположений, которые можно найти, например, в [7], заметим, что в последующем изложении эти условия всегда будут выполняться. Кроме того, мы с самого па- чала предположили, что существует плотность вероятности / (ty х; х, у). Это предположение не вызвано существом дела и принято нами только для удобства — можно показать, что при определенных допущениях могут быть написаны уравнения Колмогорова не для условной плотности вероятности f(t, x; х, у), а для условной функции распределения F (t, x; х, у). Не ставя перед собой задачу изложить строгий вывод уравнений Колмогорова, рассмотрим тем не менее схему этого вывода, позволяющую уяснить физический смысл функций а и Ь9 входящих в коэффициенты уравнений. Для вывода первого уравнения Колмогорова в обобщенном уравнении Маркова B7.17) положим f = t-\-A (А^О), т.е. перепишем это уравнение в виде х; х, у) = $ / (t, x; t + Д, г) / (t + Д, z; t, у) dz. B8.3). Разложим в подынтегральном выражении функцию / (t-{- Д, z; т, у) в ряд Тейлора по переменной z около точки z = x, ограничившись при этом первыми тремя членами ряда и написав в явном виде остаточный член ряда, т. е. положим , z; х, y) = f(t + A, x; x, B8.4)
252 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ Г ГЛ. V Подставив D) в C) и вынося за знак интеграла множители, не зависящие от г, получим оо /(*, х\ т, ;/) = /(?-f Д, х\ % у) $ f(t, x\ t-\-k, z)dz-\- — 00 _ — СО * - ^1 (z-Xff(t, X; <+A, B8.5) Перенося первое слагаемое в правой части равенства в левую часть оо и учитывая, что в соответствии с B7.10) \ / (ty x; tf-f-A» z)dz — \, — со после деления обеих частей нового равенства на А получим И, х; т, .у) _ , z)dz] </' X' У> — 00 оо — -«г "т* \ з—я \& *"~~ Xj / [Ту Х\ t —г*- /Л, о\ & j OX — оо B8.6) Переходя к пределу Д-*0, обозначая 00 a(t> x) = iim -r- \ (z — х) / (t, x; ^ + ^> z)dz, B8.7) — оо 00 Ь (t, X) - ШП ^ J (z _ ^ / ft J5- f + д, г) ^ B8.8) А-».О _ — 00
§ 28] УРАВНЕНИЯ КОЛМОГОРОВА 253 и предполагая *), что оо ,. 1 С d3f\t-4- А, л* + 0 (г — х); т, у] , чЧ г,, , , А ч , п hm -д- \ —iJ—!—-—j-~ ¦** (z — xfj (t, x; t-f-h, z) dz=0, — 00 B8.9) получим т. е. первое уравнение Колмогорова. Остается выяснить физический смысл функций a(t, х) и bit, x). Обращаясь для этой цели к равенствам G) и (8), замечаем, что интегралы в этих формулах дают условные математические ожидания первой и соответственно второй степени приращения ординаты функции за время А. Поэтому, положив в этих формулах t -f- A = т и заменив букву Z буквой К, будем иметь a(U x)=:\im-±-7M[Y— X\X = x], B8.11) bit, x)=Um~^—M[(V — Xf\X = x]. B8.12) tT l Таким образом, функция a(t> x) характеризует предел отношения математического ожидания разности ординат случайного процесса U(t) к интервалу времени, для которого эти ординаты взяты, при стремлении интервала времени к нулю, a b(ty x) дает предел отношения математического ожидания квадрата разности ординат к интервалу времени при стремлении интервала времени к нулю. Следовательно, a(t, х) в определенном смысле слова характеризует скорость изменения ординаты функции, a b{t, x) — скорость изменения условной дисперсии ординаты функции. Второе уравнение Колмогорова доказывается несколько более искусственным способом. Введем в рассмотрение некоторую функцию R (у), которая во всей области изменения ординаты случайной функции U(f) является непрерывной, дифференцируемой до второго порядка и обращается вместе с первыми двумя производными в нуль на границах интервала изменения j/, а в остальном является совершенно произвольной. ¦) Сущность сделанного предположения состоит в требовании, чтобы вероятность больших отклонений \г — х\ убывала с уменьшением А настолько быстро, чтобы все моменты этой разности, начиная с третьего, стремились к нулю быстрее, чем А.
254 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ (ГЛ. V Обозначим границы интервала изменения у через а и В и образуем Р \ d%fV' Х) т' У) R ^ ^ Заменяя производную -j~ пределом отноше- а ния приращения функции к приращению аргумента, получим > 1 f = Нш 4- \ [/(*. *! * + Д. У)—fit, x; -с, j;)]/?(j)rf> B8.13) а Заменив под знаком интеграла / (t, x; т -f- A, >/), пользуясь обобщенным уравнением Маркова , ^==5/ft х; т, получим х; т, г)/(т, ^; т + A, y)R(y)dz dy — р - J/ft x; *,y)R(y)dy). B8.16) а Если в двойном интеграле изменить обозначения переменных интегрирования, заменив z на уУ г у на г, то интегралы, стоящие в фигурных скобках, можно объединить и вместо A5) будем иметь ^$/ j){$ /(-с, у; т + А, z)R(г)^ — R(у)}rfy. B8.16) Так как функция R(z) no условию непрерывна вместе с первыми двумя своими производными, то ее можно разложить в ряд около точки z=y по степеням (z—у), т. е^ можно написать B8.17)
$281 УРАВНЕНИЯ КОЛМОГОРОВА 255 Подставляя A7) в A6) и учитывая, что (при сделанных предположениях о быстроте убывания старших моментов (z —у) с уменьшением А) 1 Р 1 lim т-\\/(ъ У, т-4-Д, z)[R{y)~\-Rr(y){z—y)-\--~-R"{y){z—у)*-\- + о((z —у)")] dz — R(y)} = R'(y)a(x, y) + \R"(у)Ъ (т, у), B8.18) вместо A6) получим B8.19) Правую часть равенства A9) интегрированием по частям можно преобразовать к такому виду, чтобы под интегралом в качестве множителя стояла сама функция R{y)y а не ее производные. Внеинте- гральные члены при этом обратятся в нуль вследствие обращения в нуль R(y) и R'(у) на пределах интегрирования, и после объединения всех интегралов в один мы получим - \ gp [Ь (*, у) f(t, х; 1, у)]} R (у) dy = 0. B8.20) Так как функция R(y) по условию любая, то интеграл B0) может обращаться в нуль только в том случае, когда множитель у R(y) обращается в нуль тождественно при любом значении у} лежащем в интервале (a, J3), т. е. когда |+ ^Ы^У)П-\^[Ь^ У)/1 = 0, B8.21) что совпадает со вторым уравнением Колмогорова, в котором коэффициенты а (т, у) и b (т, у) имеют тот же физический смысл, что и й первом уравнении. Итак, оба уравнения Колмогорова можно считать составленными, если найдены функции a(ty x) и b(t> x)> определяемые формулами G) и (8) (или A1) и A2)). Уравнения Колмогорова по существующей классификации дифференциальных уравнений в частных производных принадлежат к типу параболических уравнений. Для того чтобы уравнение этого типа од- нб&начно определяло его решение, необходимо располагать начальными и граничными условиями для искомой функции. Начальные условия должны давать зависимость искомой функции / от «простран-
256 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V ствеыной» координаты (переменной х в первом уравнении или переменной у — во втором уравнении) при значении «временной» координаты (t или т), принимаемой за начальное. Граничные условия должны устанавливать значения функции / для любого момента времени на границе допустимой области изменения пространственной координаты. Начальные условия для уравнений Колмогорова легко устанавливаются из простых физических соображений. Рассмотрим для примера второе уравнение. Естественно считать начальным значением х «настоящий момент времени» t Если начальное значение х ординаты случайного процесса предполагается заданным, то функция f(tt x; х, у) в соответствии с B7.11) должна обращаться в дельта-функцию, т. е. начальным условием будет fit x; x,y)\x_t = b(x-y). B8.22) Очевидно, это же равенство является начальным условием и для первого уравнения. В некоторых задачах начальная ордината процесса не является заданной, а должна рассматриваться как случайная величина, плотность вероятности /0 (х) которой, естественно, должна предполагаться известной. В этом случае начальным условием вместо B2) будет fit x; z,y)\^=fo(y). B8.23) Граничные условия так же просто определяются требованием обращения в нуль плотности вероятности / на границах области изменения случайного процесса. Например, если интервал изменения у (— оо, со), то f{tу х; т, у) для любого х должна обращаться в нуль при \у\-+оо. В том случае, когда область (а, C) возможных значений ординат случайного процесса ограничена, как это показывают более подробные рассуждения [37], на границах области должны выполняться условия {а (у, у)f{t, х; х, у)- ||И*. У)fit, x; х, у)]\\у.а = = Ит, у)fit, х, х, y)-^^[b(x, у)f(t, x; х, y)}}\y_z = O. B8.24) Кроме граничных и начальных условий функция f(t, x; х, у) должна удовлетворять требованиям, справедливым для любой плотности вероятности, т. е. должно быть /3*0, B8.25) 00 \f{t, x; т, y)dy—\. B8.26)
128) УРАВНЕНИЯ КОЛМОГОРОВА 257 Прежде чем переходить к изложению методов решения уравнений Колмогорова, рассмотрим примеры на составление этих уравнений. Пример 28.1. Рассмотрим дифференциальное уравнение dJ? m\{t), B8.27) где т и а — постоянные, a l(t) — «белый шум», т. е. случайная функция, обладающая корреляционной функцией /^(т)=&(т) B8.28) (будем считать 1 = 0). Как было уже отмечено выше (см. пример 13.1), уравнение B7) служит хорошей моделью многих физических процессов, например, процессов типа броуновского движения. Для определения спектральной плотности решения этого уравнения (при <х^>0) достаточно было сделать предположение B8) о виде корреляционной функции /Q (т). Для того чтобы решение C7(t) уравнения B7) являлось марковским процессом, этого предположения уже недостаточно, так как требуется еще предположение о достаточно быстром убывании вероятностной (а не корреляционной) зависимости между ординатами процесса $(t) с ростом интервала времени между ординатами. Предположим пока, что ординаты процесса b(t) являются независимыми случайными величинами. В этом случае U(t) будет марковским процессом, так как является решением уравнения первого порядка, однозначно определяемым ее начальным значением, а вследствие независимости ординат функции \(t) значения этой функции «в прошлом» никак не влияют на ее значения «в будущем». Если функция ? (t), кроме условия B8), является еще и нормальной, то требование независимости ее ординат тем самым будет выполнено, и можно будет утверждать, что U{t) — марковский случайный процесс. Однако требование нормальности процесса i(t) является слишком сильным и не вызывается во многих задачах физической сущностью рассматриваемого процесса. Например, имеется весьма важный класс задач, для которых t(t) можно рассматривать как результат воздействия дискретных импульсов, число которых в течение заданного интервала времени подчиняется закону Пуассона (например, дробовой шум в электронных лампах и сходные задачи). Для того чтобы решение уравнения B7) было марковским процессом, достаточно потребовать, чтобы, помимо условия B8), вероятностная зависимость между ординатами функции %(t) убывала настолько быстро, чтобы интеграл от этой функции подчинялся нормальному закону распределения. Удовлетворяющий этому условию «белый шум» иногда называют «белым шумом в узком смысле» в отличие от «белого шума в широком смысле», определяемого условием B8). Под белым шумом в данной главе мы будем понимать белый шум в узком смысле. 9 А. А. Свешников —Щ8
258 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V Итак, если t(t) является белым шумом в узком смысле, то функция U{f)> определяемая уравнением B7), является марковским процессом. Следовательно, для условной плотности вероятности^^, х; т,у) справедливы уравнения Колмогорова. Для нахождения коэффициентов этих уравнений проинтегрируем уравнение B7) в пределах (t, tf-j-Д). В результате получим ;+д /+д Y — X = m \ Ktjdti — a \ U(h)dtx. B8.29) t t Находя математическое ожидание обеих частей B9) и применяя теорему о среднем для второго интеграла в правой части, получим М [(У — X) | X = х] = — ои;Д, B8.30) т. a(t, х)= — ах. B8.31) Возведя B9) в квадрат и находя математическое ожидание полученного выражения с точностью до малых первого порядка относительно А, будем иметь $ 6(*0 t Н-Д t+A zm* ) ) Ktfo — tddtidt* B8.32) t t Подставляя C2) в A2) и учитывая B8), получим , н-д н-д 1 b(t, x) = \im±rm* \ \ b(t(i — t1)dt1dt<i = \im-jrm*k=*m*. B8.33) д _* Пример 28.2. В качестве второго примера рассмотрим более сложное уравнение, содержащее белый шум. Положим § B8.34) где по-прежнему \= 0, Kt {U — ti) = b fo — tx)9 B8.35) а ty(tf и) и g(t, и) — заданные (числовые) непрерывные функции своих аргументов. Интегрируя D1) от t до * + Д, получим Y — X= \ <H^69<#i+ J g(tv и)\Ц$<их. B8.36) t t
§ 28] УРАВНЕНИЯ КОЛМОГОРОВА 259 Вычисляя математическое ожидание последнего равенства и считая А малой величиной, с точностью до малых второго порядка будем иметь М|(У — X)\X=x] = ty(U х)Д, B8.37) т. е. a(t, *) = lim-jU(fc x)b = ty(t, х). B8.38) д — оа Возводя C6) в квадрат и находя математическое ожидание полученного результата, с точностью до бесконечно малых второго порядка, будем иметь х)Ь B8.39) что после подстановки в A2) дает ) = g\tt x). B8.40) Полученный результат позволяет установить и обратную Связь между уравнениями Колмогорова и дифференциальным уравнением для самого процесса. Пусть, например, второе уравнение Колмогорова имеет вид з- — з~ (y*f) —> 5~i (s*n ХУ f) == О* B8.41) В соответствии с B1) отсюда Следует a(t, дг)= — xb b{t, лг) = 2 sin tx. B8.42) Сравнивая D2) с C8) и D6), находим ф (t, х)= — х\ g* (U х) = 2 sin tx9 B8.43) т. ё. если случайный процесс U(f) удовлетворяет уравнению dU л , 1/—: — = — Сг -{- у 2 sin tUl (t), B8.44) to условная плотность вероятности f(i x\ % у) будет удовлетворять уравнению Колмогорова D1). Однако если переход от.дифференциального уравнения C4) для процесса к уравнению Колмогорова является однозначным, обратный переход не является однозначным. Так, например, если U(t) определяется дифференциальным уравнением dU Tt = —Ц* -f 1/2 sin Ш — с9 tt @ + cU V), B8.45) где с — произвольная постоянная, a S, (f) я ^ (t) — некоррелированные случайные функции, обладающие свойствами белого шума, го вид уравнения D1) остается прежним.
260 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V § 29. Решение уравнений Колмогорова для простейших случаев В общем случае (при любом виде функций a(tt х) и b(t, х) й любой области изменения ординаты случайной функции U{f)) решение уравнений Колмогорова может представлять сравнительно сложную задачу, и хотя это решение может быть получено общими методами, применяющимися в математической физике (см., например, [22], [40]), однако обычно его удается получить только в виде бесконечного ряда. Оставляя исследование таких более сложных случаев для дальнейшего, рассмотрим в данном параграфе только простейшие случаи, для которых уравнения Колмогорова могут быть легко решены в конечном виде. Случай 1. Стационарное решение. В том случае, когда коэффициенты ait, x) и b(U x) не зависят от времени, имеет смысл нахождение стационарных решений уравнений Колмогорова, т. е. решений, соответствующих настолько большому промежутку времени, прошедшему с момента задания начальных условий, что условную плотность вероятности / можно считать не зависящей от разности (т — f). Рассмотрим для примера второе уравнение Колмогорова и примем для простоты момент t за начало отсчета времени. Для стационарного решения ~ = 0, функция / зависит только от у, и вместо уравнения в частных производных B) мы получим обыкновенное линейное уравнение второго порядка Ъ[а(У)П-Ъф[Ь(У)Л = 0 B9.1) ИЛИ |?{«О')/-у|[6О')/]} = 0. B9.2) Интегрируя последнее равенство по всему интервалу возможных значений ординаты процесса у и учитывая при этом условие B8.24), получим линейное уравнение первого порядка ]-а B9.3, Последнее уравнение интегрируется сразу, так как переменные разделяются. Интегрирование дает B9<4) где нижний предел интегрирования у0 в показателя степени может быть взят любой, поскольку изменение у9 соответствует изменению
§ 29| РЕШЕНИЕ УРАВНЕНИЙ КОЛМОГОРОВА 261 множителя, а постоянная с определяется из условия нормировки \f(y)dy=l. B9.5) —00 Пример 29.1. Найти стационарное решение второго уравнения Колмогорова для случайного процесса, рассмотренного в примере B8.1), т. е. для процесса, определяемого уравнением тЦ1). B9.6) Как было показано в примере B8.1), в этом случае а — — our, Ь — т\ Подставляя эти значения в D) (считаем j/0 = 0), получим т. е. нормальный закон распределения, имеющий дисперсию, равную т2 а? = у-. Записав плотность нормального закона в обычной форме f(y) = -±=e **>', B9.8) аУ2п тем самым определяем постоянную с: 4^ B9.9) Случай 2. Коэффициенты а(х, у) и ? (т, у) не зависят от времени и являются линейными функциями у. Рассмотрим, как интегрируется второе уравнение Колмогорова, когда коэффициенты а(т, у) и ?(т, у) являются линейными функциями ординаты j/, т. е. а (?, у) = а0 + ЧУ> Ь (х, у) = % -f р^, B9.10) где а0, а1? C0, ^ — постоянные. В этом случае легко получить окончательный результат, если от плотности вероятности / перейти к характеристической функции Е{ъ> г)> связанной с / соотношением B.16) оо Е (т, z) = I е1*У f(x, у) dy. B9.11) —00 Для этой цели подста-вим 00) вр второе уравнение Колмогорова B8.2), умножим обе части уравнения на е**У и проинтегрируем по у
262 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ 1ГЛ. V в бесконечных пределах. В результате получим - у \ el*y Ц* [(Ре + РиО /] dy = 0. B9.12) —00 Интегрируя по частям и учитывая, что внеинтегральные члены обращаются в нуль вследствие исчезновения / на бесконечности, будем иметь % + (у %** - b*) \ «"*/(*> у) dy + &*' -iaiZ) § eUyyf(x> У) аУ = °- (?9-!3) В полученном выражении первый интеграл равен ?(т, z), а второй может быть выражен через характеристическую функцию, так как = __/(??(т, г)^ B9.14) Таким образом, уравнение A3) сводится к уравнению в частных производных первого порядка А^ = 0. B9Л5) Это уравнение может быть решено общими методами теории дифференциальных уравнений в частных производных первого порядка [10]. В частном случае, когда b(z, у) = const (^ = 0), непосредственной проверкой легко убедиться, что уравнению A5) удовлетворяет характеристическая функция нормального процесса. Действительно, если переписать это уравнение в виде |-(In Е) + (~ № — 1Щ?\ — «1* I- (InE) = 0> B9Л6) то становится очевидным, что ему можно удовлетворить, положив In E= — ^ г* Н" ®г* B9.17)
§ 291 РЕШЕНИЕ УРАВНЕНИЙ КОЛМОГОРОВА 263 где ау и J7 — функции т, удовлетворяющие уравнениям °У1% = *1<Ъ+тЬ B9Л8) g B9.19) начальные условия для которых будут оу = 0, у = Ху т = 0. B9.20) Оба эти уравнения легко интегрируются, так как переменные у них разделяются, и мы получим j7(x) = ^(eai* — \)-\-xe«i\ B9.21) 4(т) = А (г**!' — 1). B9.22) Так как из теории дифференциальных уравнений в частных производных известно, что удовлетворить уравнению и выполнить одновременно начальные и граничные условия можно единственным образом, то выражение A7) является решением уравнения Колмогорова в данном случае. Однако характеристическая функция, определенная формулой A7), является характеристической функцией нормального закона распределения с дисперсией Оу и математическим ожиданием J7, Поэтому можно сделать следующий общий вывод: если коэффициент а (т, у) является линейной функцией у, а коэффициент Ъ (т, у) — постоянная, то ордината марковского случайного процесса подчиняется нормальному закону распределения. Ввиду важности этого вывода для дальнейшего изложения рассмотрим пример, имеющий и самостоятельный интерес. Пример 29.2. Определить закон распределения ординаты случайного процесса U(f) в момент времени т, если при ? = 0 U(t) = x, а процесс определяется уравнением (t)t B9.23) где \ (t) — «белый шум», имеющий нулевое математическое ожидание и корреляционную функцию /Се(т) = 8(т). B9.24) Для этой задачи коэффициенты уравнений Колмогорова были определены в примере 28.1: а (т, у) = — ay, Ъ (т, у) = т* = const. B9.25) Следовательно, учитывая обозначение A1), имеем ao = O, dx = — a, % = т\ & = (). B9.26)
264 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ.V Подставляя эти значения коэффициентов в общие формулы B1) и B2), получим, что ордината случайного процесса подчиняется нормальному закону распределения с математическим ожиданием xe-«x B9.27) и дисперсией °И0 = -^О— *"*")• B9.28) При исследовании уравнения типа B3) в корреляционной теории (см. формулы A3.1), A3.6) и A3.8)) было показано, что корреляционная функция стационарного решения этого уравнения имеет вид Ку(%) = ?е—\*\9 B9.29) т. е. после затухания переходного процесса дисперсия ординаты случайной функции U(t) становится равной w2/2a. Этот результат полностью согласуется с формулой B8), так как после окончания переходного процесса можно считать е-*лх = 0> и формула B8) дает о* = /иа/2а. Однако исследование решения уравнения B3) с помощью теории марковских процессов дает более глубокие результаты, чем это было получено в корреляционной теории, так как здесь удалось установить следующее положение: если стационарный марковский случайный процесс имеет корреляционную функцию в виде затухающей экспоненты B9), то этот процесс является одновременно нормальным. Справедливо и обратное положение: если стационарный процесс имеет корреляционную функцию вида B9) и процесс нормальный, то он является одновременно и марковским. Указанные выше положения были доказаны впервые Дубом и носят название первой теоремы Дуба (см., например, [29]). Так как корреляционная функция вида B9) соответствует недиф- ференцируемому случайному процессу, то можно сделать второй, весьма важный для приложений вывод, что нормальный марковский процесс является недифференцируемым. В заключение данного параграфа рассмотрим весьма эффективный метод решения уравнений Колмогорова, который во многих случаях сразу ведет к цели. Этот способ, указанный в [21], состоит в том, что прежде чем решать уравнения Колмогорова, иногда удается так заменить независимые переменные t и х (или т и у), чтобы эти уравнения по своему виду совпали с обычным уравнением теплопроводности giSR решение которого для неограниченной области изменения переменной у может быть написано в общем виде. Действительно, предположим,
f 291 РЕШЕНИЕ УРАВНЕНИЙ КОЛМОГОРОВА 265 что уравнение справедливо при любом t'^f и у, лежащем в интервале — оо <:j/ <; оо. Требуется найти решение при условиях Г(т>,/)\х>^,= Ь(/-х'), U'V>/)dy'=U Г^О. B9.31) —00 Непосредственной проверкой можно убедиться, что всем этим условиям удовлетворяет решение fit', х\ х\ /)=, } е «(^0. B9.32) У 2п (т — t) Из общей теории уравнений теплопроводности известно, что это решение является единственным. Кроме того, легко убедиться, что функция C2) удовлетворяет не только уравнению C0), но и так называемому сопряженному ему уравнению %?°- B9-33> Таким образом, если удается преобразовать уравнения Колмогорова к виду C0) и C3), то новая независимая переменная у подчиняется нормальному закону распределения C2). Наличие нормального закона распределения для У, разумеется^ не означает, что справедлив нормальный закон распределения для ординат У исследуемого случайного процесса, поскольку соотношение между У и У\ вообще говоря, не будет линейным, и следовательно, если У подчиняется нормальному закону распределения, то У уже не будет нормальной случайной величиной. Итак, уравнения Колмогорова можно считать решенными, если их удастся преобразовать к виду C0) и C3). Для такого преобразования положим f = cp (t)y J = <f (т), х' = ф {U х), У = ф (т, у), B9.34) где ср и ф — произвольные функции (помимо очевидного требования взаимно однозначного перехода от одной системы переменных к другой), которыми можно будет потом распорядиться для упрощения вида уравнения. Выполнив переход к новым переменным, для условной плотности вероятности /' (f9 x'; т', У) величины у' получим уравнения, по виду не отличающиеся от исходных уравнений Колмогорова: % + а' (Г, У) J? +1V (Г, х') *? = 0, B9.35) Р(Г /)Л 0' B9-36)
266 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V в которых коэффициенты a'(f, х') и b'(f9 х') определяются равенствами B9.37) B9.38) где в правых частях равенства tux предполагаются выраженными через f и х\ Воспользовавшись произволом выбора функций ф и ср, в ряде случаев можно добиться, чтобы коэффициент d обратился в нуль, а коэффициент Ъ' стал постоянным. Например, если a ft х) = а @ х + р (О, Ъ ft х) = ? (О, B9.39) то, положив ф ft х) = х ехр {— J а (^) dt\ — $ р (/2) ехр {— \ а (^) ЛЛ Л„ '-о •'о ^о ' B9.40) после подстановки в C7) получим а' = 0. Так как при этом вид функции cp(tf) по-прежнему остается произвольным, то можно положить ср @ = \ т (t,) ехр {- 2 j'a ft) *J ^ B9.41) о ^ о ' что дает Ь' = 1. Применяя этот метод, в частности, к условиям примера B9.2) и полагая a(tf) = — a, p(?) = 0, *[(t) = m*> получим и на основании C2) . B9.42)
§ 30] ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ДОСТИЖЕНИЯ ГРАНИЦ 267 Учитывая формулу B.36) для плотности вероятности функции случайной величины, получим B9.43) т. е. результат, полученный в примере 1 другим способом. Другим примером, когда рассмотренный выше способ интегрирования уравнений Колмогорова сразу ведет к цели, является случай а (*, х) = а (t) (х - т); Ъ (*, х) = 2р (t) (x - т)«, B9.44) где 7 = const. Положив в этом случае t ф (*, *) = 1п (лг — т) + J [p (*i) - * ifO] dk, B9.45) о t B9.46) о также получим а' = 0, У=1, т. е. для переменной у мы получим нормальный закон распределения. § 30. Определение вероятности достижения границ и закона распределения времени пребывания случайной функции вне заданной области Рассмотрим несколько задач, решение которых не может быть получено в рамках корреляционной теории. Первой задачей такого типа является определение вероятности того, что случайная функция U(t), имеющая в момент времени t значение х, будет иметь в некоторый будущий момент времени т значение у, ни разу не заходя в течение интервала времени (t, т) в некоторую «запретную» область (естественно, предполагается, что начальное значение х не принадлежит этой области). Простейшей задачей такого типа является определение вероятности того, что в течение интервала времени (t> t-\-T) выполняется неравенство (ЗОЛ) Необходимость определения таких вероятностей возникает при решении многих прикладных задач. В первую очередь к этим задачам относятся задачи, которые можно рассматривать как задачи теории надежности, при которых для нормальной (безаварийной) работы
268 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ 1ГЛ. V рассматриваемой системы необходимо, чтобы параметр, характеризующий данную систему, во время работы системы не выходил за некоторые допустимые пределы. Примером подобной задачи может служить определение вероятности безаварийного полета самолета на малой высоте над поверхностью земли, когда при данной точности высотомера, характере аэродинамических возмущений и заданных свойствах автопилота необходимо определить вероятность того, что самолет «ни разу» не коснется поверхности земли. В качестве второго примера можно указать определение вероятности посадки на стопор стабилизированной площадки на качающемся объекте (судне, самолете), если пределы стабилизации ограничены. Наконец, к этой же задаче сводится определение вероятности срабатывания различных реле, например фиксирование сигнала радиоприемником, имеющим определенный порог чувствительности. Рассмотрим, как такие задачи могут быть решены для марковских процессов. Для этого введем в рассмотрение плотность вероятности зд>(т, у) того, что в момент времени т ордината случайной функции U(t) будет находиться в интервале (y>y-\-dy) при условии, что в интервале времени (t, т) значение ординаты ни разу не вышло за границы дозволенной области A). Очевидно, искомая вероятность И7(т) недостижения границ к моменту времени x = t-\- T определится равенством \ C0.2) С другой стороны, до достижения границ функция U(f) должна обладать теми же свойствами, что и в случае, если никаких границ не существует вовсе. Следовательно, до момента достижения границ условные плотности вероятности /(^, jc; т, у) и w(x, у) должны удовлетворять одному и тому же дифференциальному уравнению — второму уравнению Колмогорова ^^^(x,y)w] = 0. C0.3) Отличие возникает только с того момента, когда ордината случайной функции дойдет до одной из границ запретной зоны («коснется» границы). В этом случае попадание ординаты функции в интервал (у, у -{- dy) без достижения границы, естественно, становится невозможным и, следовательно, плотность вероятности w^y) обратится в нуль для любого момента времени т. Таким образом, при решении уравнения C) граничными условиями будут w (т, их) = w (х, и*) = 0, т > U C0.4)
% 30| ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ДОСТИЖЕНИЯ ГРАНИЦ 269 Начальные условия для w(z, у) не отличаются от начальных условий для /'. Если в начальный момент ордината случайной функции равна х, то w(>z,y)\Xssst = b(x — y). C0.5) Если в начальный момент точное значение ординаты случайной функции не известно, а дан только закон распределения этой ординаты, то начальными условиями будут w{^y)\x = t = fb(y)> C0.6) где /оОО — плотность вероятности начальной ординаты случайной функции U(t), вычисленная при условии, что удовлетворяются неравенства щ <^ х <[ щ. Итак, плотность вероятности w(t, у) определяется уравнением C) при граничных и начальных условиях D) и E) или D) и F). Таким образом, для получения искомой вероятности необходимо проинтегрировать уравнение C) при соответствующих начальных и граничных условиях, а затем найденное решение подставить в формулу B). Решение уравнения C) может быть получено обычными методами математической физики. Пригодную для вычисления форму решения в большинстве случаев удается получить методом расщепления переменных (методом Фурье), однако сложность решения существенно зависит от вида функций а (т, у) и b (т, у). В конце параграфа будет рассмотрено несколько примеров решения уравнения C). Перейдем к рассмотрению второй задачи — к определению закона распределения времени пребывания случайной функции в заданной области. Эта задача, весьма важная для ряда приложений, также не может быть решена в рамках корреляционной теории и оказывается весьма тесно связанной с только что рассмотренной задачей определения вероятности невыхода случайной функции за определенную область в течение заданного времени. Обозначим /е@) плотность вероятности времени пребывания функции в заданной области. Очевидно, что если к моменту времени х ордината функции еще ни разу не достигла запретных границ, то это значит, что время 6 пребывания в допустимой области будет не менее (т — t). Вероятность этого события равна t—t
270 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ ГГЛ. V С другой стороны, эта же вероятность определяется формулой B). Следовательно, 00 Щ \ /е @) db = \w (т, у) dy. C0.7) Дифференцируя последнее равенство по т, получим где знак частной производной сохранен, чтобы подчеркнуть имеющуюся зависимость W (%) от х и t Когда за начальный момент времени взят момент пересечения границы области [х = щ или х = и2), формула (8) дает закон распределения времени между двумя последовательными пересечениями границ области, т. е. времени пребывания случайной функции в дозволенной области от момента входа в эту область до момента выхода. В частном случае, если положить и2 = оо, то формула (8) даст закон распределения времени выброса случайной функции за уровень щ (снизу вверх). Располагая плотностью вероятности Д(9), можно вычислить математическое ожидание времени пребывания случайной функции в данной области. Подставляя для этой цели (8) в общую формулу для математического ожидания 00 0 = М(8) = $е/е@)</9, C0.9) о интегрируя по частям и учитывая при этом, что И7(оо) = 0, W(t)=L получим 00 W(*)d*. C0.10) В том случае, когда коэффициенты a (U х) и Ъ (t, x) уравнений Колмогорова не зависят от времени, математическое ожидание б для стационарного марковского процесса можно определить, минуя решение уравнения в частных производных. Действительно, в этом случае плотность вероятности w (т, у) будет зависеть не от t и «с в отдельности, а только от разности (т — t), и следовательно, dw _ dw /Qnii\ w—-"зг- C0Л1>
ft 30] ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ДОСТИЖЕНИЯ ГРАНИЦ 271 С другой стороны, до момента достижения границы дозволенной области функция w должна удовлетворять первому уравнению Колмогорова B8.1) Подставляя в последнее равенство A1) и интегрируя по у от щ до учитывая B), получим ^{^a C0-13) Интегрируя последнее равенство по т от t до оо и учитывая при этом A0) и сделанное условие о независимости а и b от времени, получим Учитывая, что №(оо) = 0, W(t) = l, вместо A4) можно написать где обозначено р (х) = 2a/b, q(x) = — 2/b. Общим интегралом полученного уравнения будет \{\ * q(Xt)dXb + cte *' } х' xf где xf — любое значение х, взятое за начальное, а постоянные сг и Сч определяются из граничных условий в («,) = 8A10 = 0, C0.17) выражающих тот факт, что если вначале ордината случайного процесса была равна одному из ее предельно допустимых значений, то время пребывания случайной функции внутри допустимой области равно нулю. Полагая в A6) хг = и1 и учитывая A7), получим C0.18) «2 J ] 2 J ]е «' dx% Уравнение A3) позволяет получить дифференциальные уравнения для определения более высоких моментов длительности пребывания
272 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ ГГЛ. V случайной функции в заданной области, образующих систему связанных друг с другом уравнений. Для получения этой системы продифференцируем A3) по т, положив после дифференцирования т = 0-{-^ Тогда, учитывая (8), получим ^^^°- C0Л9) Умножив обе части последнего равенства на ехр(?г0) и интегрируя результат по б от 0 до оо, после простых преобразований получим уравнение, которому должна удовлетворять характеристическая функция E$(z) случайной величины 0: L^l = O. C0.20) Разлагая функцию Eq(z) в ряд по степеням z (см. B.21)) и приравнивая нулю коэффициенты у различных степеней z, получим систему уравнений для начальных моментов /ю/(8) случайной величины 0. Так, например, для второго момента, с учетом A4), имеем 0, C0.21) где //Zj @) ^= ё определяется уравнением A5), а #г2@) связан с дисперсией 0 соотношением С8=/Гс2@) — 02. В качестве последней задачи, решение которой также может быть получено с помощью теории марковских процессов, рассмотрим определение среднего числа выбросов va за данный уровень (или за границы заданной области). В § 9 данная задача была решена методами корреляционной теории, однако полученные там результаты оказываются непригодными для марковских процессов, так как последние являются недифференцируемыми, в то время как при выводе формулы (9.29) предполагалось, что случайный процесс имеет производную и может быть разложен в ряд Тейлора вблизи момента времени, для которого имеет место выброс. Прежде чем переходить к решению этой задачи, постараемся представить себе качественную картину, которая должна иметь место при пересечении недифференцируемой функцией заданного уровня. Рассмотрим, например, марковский процесс U(t), определяемый уравнением B8.27), которое можно переписать в виде l (t), C0.22) ~ = — где l(t) — «белый шум», а а и т — постоянные. Как показывает последнее равенство, производная рассматриваемого процесса состоит из деух слагаемых: плавно меняющейся функ-
§30] ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ДОСТИЖЕНИЯ ГРАНИЦ 27а- ции —aU(t) и функции n&(f) с независимыми ординатами. Следовательно, реализация случайного процесса U(f) должна иметь вид, плавной функции, на которую наложена весьма быстро осциллирующая кривая, т. е. вид, схематически изображенный на рис. 18. Очевидно, что для такой функции однократное пересечение заданного уровня (уровня щ на рис. 18) практически невозможно, так как за Родним пересечением всегда следует бесчисленное множество бесконечно близких пересечений. Поэтому на первый взгляд может показаться, что сама постановка задачи о среднем числе выбросов в единицу времени для марковских (недифференцируемых) процессов- Рис. 18. теряет смысл, так как в результате подсчета мы должны получить* бесконечность (этот же результат получается и в том случае, если^ формально применить формулу (9.34), так как входящее в эту формулу среднее квадратическое отклонение а'х для недифференцируемых процессов обращается в бесконечность). Однако если отказаться от подсчета всех выбросов за данный уровень и ограничиться только учетом таких выбросов, для которых время пребывания вне данной области будет больше некоторого конечного значения б0> то задача сразу приобретает физический смысл и результаты ее решения представляют практический интерес, так как при этом бесконечно большое число бесконечно близких выбросов мы будем учитывать как один выброс и будем принимать во внимание только выбросы, достаточно удаленные друг от друга по времени, наличие которых может быть обнаружено с помощью физически реализуемого измерительного прибора, всегда обладающего определенной инертностью («выбросы» в точках tt и f2 на рис. 18). После этих общих рассуждений перейдем к вычислению среднего числа выбросов для марковского процесса. Определение среднего числа выбросов в единицу времени с временем пребывания выше заданного значения сводится к решению вто-
274 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V рого уравнения Колмогорова путем примерно таких же рассуждений, как это было сделано выше для определения плотности вероятности w (т, у). Рассмотрим для этой цели интервал времени (U t -f- А), в течение которого случайная функция пересекла уровень у = щ, и определим при этих условиях плотность вероятности того, что к моменту времени т случайная функция будет иметь ординату в интервале (у>у -\-dy), ни разу за промежуток времени (t, т) не опускаясь ниже уровня и2. Так как интервал времени А мал, то искомую плотность вероятности можно считать пропорциональной А и обозначить v (т, у) А. Плотность вероятности zj(t,j/)A удовлетворяет второму уравнению Колмогорова, а так как интервал А не зависит ни от т, ни от у, то этому уравнению должна удовлетворять и функция v (т, у): д г~'- ->)v(x,y)]—Y-^[b{*,y)v(x,y)] = O. C0.23) Начальные и граничные условия для решения последнего уравнения должны отражать два обстоятельства: во-первых, факт нахождения функции ниже уровня щ для моментов времени, предшествующих t, и, во-вторых, факт пересечения этого уровня в момент времени, лежащий между t и ?-|-Д. Из первого условия следует t>(t,j/) = 0, t<*, C0.24) так как для моментов времени, предшествующих t, ордината не может принять значение у^>иь ни разу не опускаясь ниже уровня щ, поскольку предполагается, что вблизи момента времени t имеется выброс. Так как время выброса точно не фиксировано, а известно только, что выброс был в интервале времени (t, t -(- А), то второе условие •означает, что интеграл от v(z,y)A по т в пределах (t,t-\-k) при у = щ должен давать плотность вероятности попадания ординаты функции в окрестность н2. Это условие будет выполнено, если v (т, щ) А = 8 (х — 0 /(*, и2) А, C0.25) т. е. v (т, щ) = 8 (т — t)f(ty н2), C0.26) где f(t, x) — плотность распределения ординаты случайной функции •в момент t. Условия B4) и B6) полностью определяют решение уравнения B3). Очевидно, число выбросов п (м2, т0) А, происходящее в среднем в течение интервала времени А, равно вероятности того, что выброс, начавшийся в интервале (t,t-\-A), не кончится к моменту т = ?-|--тв. Условная вероятность этого события, в соответствии с принятыми оо обозначениями, равна А \ v (т0, у) dy.
§ 30| ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ДОСТИЖЕНИЯ ГРАНИЦ 275 Приравнивая последнее выражение п (и2, то) А и сокращая на Л, получим 00 n(tt9tx0) = ]v(^y)dy. C0.27) При решении уравнения B3) удобно исключить плотность вероятности f(t, х) из граничных условий B5). Этого легко можно достигнуть, если обозначить v (т, у) = f{t9 щ) vx (т, у\ C0.28> Вследствие линейности уравнения B3) для vx (т, у) получим уравнение такого же вида 091 ?У) +-&[о(t,у)vt(т. y)]-YW {Ь(Х'У)Щ(Х' У)] = °' C0'29)' которое, однако, теперь нужно решать при других добавочных условиях: Vi(x,y) = Ot т<^; t>j(t, я,) = 8(т —0, t^t C0.30) Очевидно, для среднего числа выбросов п (иа, т0) будем иметь 00 п (и* т0) = f(U Щ) \ vx (т0, у) dy. C0.31) Для стационарного процесса, когда я(т, y)z=a(y), b(x,y) = y) для решения уравнения B9) иногда с успехом могут быть применены методы операционного исчисления. Умножая для этого B9) и C0) на е~рх> интегрируя по т и обозначая изображение Карсона — Лапласа функции vx (т, у) через V\ (/?, у), т. е. полагая Vt(p>y) = p I e-P"-t)vi(z,y)dz> C0.32) о получим для Vi (p, у) уравнение Uf*(y) ^)-2|[в(у) Vt] = 2pVl9 C0.33> которое нужно интегрировать при условиях Vx (р, »0 = Р> V\ (Р> оо) = 0 (Rep > 0). C0.34) Изображение N\ (n%, р%) функции п (м.2, т) может быть выражено через производную по у от изображения V\ (/?, у). Действительно, умножая C1) на ре~Рх° и интегрируя по т0, получим оо М (»» Р) = /(?, Щ) \ Vt (p, у) dy. C0.35) «2
276 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V С другой стороны, интегрируя C3) по у от «9 до оо, имеем \ Vy (P> y)dy = a (//,) - \b{y)V1 (p, у)] \ ysa=ft2, C0.36) т. e. N\ (»* rt = fiU Щ) {а (и,) - ~ I; [* (y) У, (p, y)l U-e,}. C0.37) В том случае, когда решение уравнения C3) имеет достаточно -простой вид, пользуясь таблицами формул операционного исчисления [14], обычно удается найти оригинал п(иь т), соответствующий изображению C7). Поясним применение рассмотренных выше методов на примерах. Пример 30.1. Дана нормальная стационарная функция U(t)f й = 0, /Сц(т) = ае~а|т|. Определить вероятность того, что в течение времени Т ордината функции не выйдет за пределы ±h> если при ^ = 0 ?/@ = 0- Как было показано в примерах § 29 (формулы B9.23) и B9.28)), данному процессу соответствует дифференциальное уравнение ^ + <хг/=оуГ2оГ*(9. C0.38) где 5@ — белый шум с математическим ожиданием 5 = 0 и корреляционной функцией К^ (т) = 8 (т), а коэффициент m в B9.23) в обозначениях данного примера заменен на о Уа. Так как случайный процесс U(t) является марковским, то задача сводится к определению функций U7(t) и w(i, у) по формулам B) и C). В соответствии с результатами решения примера 28.1 коэффициенты уравнений Колмогорова в рассматриваемом случае имеют значения а = — ау, Ь = 2а<Л C0.39) Следовательно, уравнение C) примет вид -«°3S = 0. C0.40) которое нужно решать при граничных и начальных условиях Применим для решения метод расщепления переменных (метод •Фурье), т. е. будем искать решение в виде произведения двух функ- дий, каждая из которых зависит от одного переменного XW^(y> C0.42)
§ 30] ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ДОСТИЖЕНИЯ ГРАНИЦ 277 Подставляя D2) в D0), деля обе части равенства на ахСс)ЧГ(у) и оставляя в левой части равенства только слагаемые, зависящие от т, получим Так как левая часть равенства зависит только от т, а правая — только от j/, то каждая из этих частей равенства должна быть постоянной. Обозначив эту постоянную —X2, получим два обыкновенных дифференциальных уравнения 4r=a C0-44) где для краткости введены безразмерные переменные 1Х = аъ У1 = ±у. C0.45) Первое из полученных уравнений имеет очевидное решение х (т) = *-*¦*• = е~»*\ C0.46) Решение второго уравнения может быть выражено через специальные функции — функции параболического цилиндра D? iyx) (функции Вебера) [53], [43], т. е. функции, удовлетворяющие уравнению > = 0, р = — (Х* + 0,5), C0.47) по формуле ЧГ (у,) = ехр {— I;/-;} Dp CO- C0.48) По смыслу рассматриваемой задачи в данном случае следует выбрать только четное решение уравнения D7), которое получится, если в качестве начальных условий взять Dp@)=l, Dp@) = 0. В формулы D7) и D8) входит пока произвольный параметр р, которым можно распорядиться таким образом, чтобы функция W (у%) обращалась в нуль при yx = ±hje, т. е. определив значение р как корень уравнения = 0. C0.49) Из теории специальных функций известно, что уравнение D9) имеет бесчисленное число вещественных корней, которые обозначим ру (/=1, 2, ...).
278 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V Итак, произведение функций D6) и D8) при \] = — р/ — 0,5 удовлетворяет как дифференциальному уравнению D0), так и граничным условиям D1). Для получения окончательного выражения для w(*>y) остается удовлетворить начальным условиям D1). Для этого будем искать решение в виде суммы произведений х(т)^Чу) для различных значений р, т. е. положим 00 т) • Cа50> где постоянные cj должны быть выбраны так, чтобы при т = 0 сумма E0) обратилась в Ъ(у). Положив для этой цели в E0) т = 0, умножив обе части полученного равенства на exp {j/f/4} Dp.CvO и проинтегрировав по д/| от — h до /г, получим явное выражение для коэффициентов с/. ц№) C051) где Nj= S'DJ.(yi)<*.b C052> -Л/а 7 так как при указанной выше операции все интегралы типа Л/а \ Dp (yi) Dp (yO dyx при / ФI вследствие ортогональности функ- — Л/а * ций D$\y\) обратятся в нуль. Подставляя найденное решение E0) в формулу B) и интегрируя сумму почленно, получим выражение для вероятности W{x): ах = 2 Cje~Л>ат» C0.53) где Су = 2су J e-^4Z)P|(yi)rfyi. C0.54) Окончательная формула E3) для искомой вероятности W{z) проста для вычислений, так как обычно результат расчета представляет интерес при достаточно больших ат, а в этом случае в бесконечной сумме необходимо удержать только несколько первых слагаемых, однако для получения коэффициентов Cj и р^ необходимо выполнить ряд сравнительно трудоемких вычислений: найти корни уравнения D9),
i 30] ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ДОСТИЖЕНИЯ ГРАНИЦ 279 вычислить интеграл E2) и вычислить интеграл E4). Эти вычисления пока усложняются тем, что нет таблиц функций параболического цилиндра, рассчитанных в нужном диапазоне изменения аргумента и индекса р. Поэтому ниже приводится таблица значений корней pj и коэффициентов Ср рассчитанных для различных значений полуширины дозволенной области р = /г/а. Таблица *) р ч ч с2 Р ч ч с, с, 0,2 61,2 558 1,270 —0,423 2,0 0,254 5,51 1,101 —0,148 0,4 15,0 138 1,265 —0,412 3,0 2,40 • Ю-2 2,67 1,018 —0,033 0,6 6,37 61,4 1,261 —0,385 4,0 9,93-10-* 2,08 1,001 —0,270.10-2 0,8 3,38 34,3 1,237 —0,367 5,0 1,44-Ю-5 2,00 1,000 —0,642. 10-» 1,0 2,00 21,8 1,226 —0,336 6,0 9,5-10"8 2,00 1,000 —0,334-10~8 *) Данные для таблицы взяты из работы: В. С. 3 а р и ц к и й, Определение вероятности надежной работы системы в течение заданного промежутка времени, Изв. АН СССР, Техническая кибернетика № 1, 1966. Пример 30.2. В условиях предыдущей задачи определить: а) вероятность того, что за время т ордината процесса U(t) ни разу не превзойдет уровень щ = 0, если при * = 0 U(t) = — C, где Р]>0; б) среднее время 0 достижения нулевого уровня; в) среднее число выбросов п @, т0) за нулевой уровень, длительность которых превосходит т0. а) Первая часть задачи по своему содержанию не отличается от задачи, рассмотренной в примере 1, однако изменение области допустимых значений ординаты функции U(t) и отличие от нуля начальной ординаты приводит к тому, что ряд для функции w^y) приобретает другой вид. Действительно, решая и в этом случае уравнение D0) методом расщепления переменных, получим по-прежнему два уравнения D4), первое из которых и в этом случае имеет решение D6), однако в качестве решения второго из этих уравнений
280 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V необходимо будет выбрать функции, отличные от D8). Действительно, положив для удобства Л = ^. C0-55) перепишем это уравнение в виде м+2^ w,+2(Х*+l) w=а C0>56) В качестве решения этого уравнения нужно выбрать такие функции, чтобы при y% = ut =— оо W (у2) обращалось в нуль. Как доказывается в теории специальных функций [43], этому условию можно удовлетворить тогда, когда X2 есть целое число Х2 = 0, 1, 2, ... C0.57) В этом случае функция W (у%) выражается через полиномы Чебы- шева — Эрмита Нп(уъ) по формуле ЧГ (у*) = е~У1 Ип Оч)> C0.58) где Ип (у) = (- 1)п еУ §~ (е~У>). C0.59) Однако, кроме условия *Р (—оо) = 0 должно удовлетворяться еще второе граничное условие 1*@) = 0. Это условие можно выполнить, если брать полиномы Чебышева — Эрмита только с нечетными индексами, так как в эгом случае полиномы содержат только нечетные степени своего аргумента и, следовательно, обращаются в нуль при j/.2 = 0. Заменяя поэтому в D6) ^ на 2^1 и выбрав в качестве решения D0) линейную комбинацию функций ^(т) и W (у^ при различных значениях к, получим w(x,y)= У. cfte-<2*+»<"е-ЧЯ«+1(у0- C0-60) Как и в предыдущем примере коэффициенты ck нужно выбрать таким образом, чтобы удовлетворить начальным условиям, которые в данном случае имеют вид Полагая для этой цели в F0) т = 0, получим 2 ^^|^+1ы=8о+Р)=7р^ § (л 2
§ 301 ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ДОСТИЖЕНИЯ ГРАНИЦ 281 Умножая последнее равенство на Hu+i(yd> интегрируя по у* в пределах от 0 до оо и учитывая при этом свойство ортогональности полиномов Ип(у\ со = 4- \ о , получим т. е. окончательно вместо F0) будем иметь C0.62) Значения входящих в последнюю формулу полиномов Нп (х) можно или вычислить, пользуясь формулой E9), или воспользоваться таблицами полиномов Чебышева — Эрмита. Можно также использовать связь между производными от плотности нормального закона распределения у(х) и полиномами Нп(х): н (JL\ — ( n\VV~ где Значения" производных от функции cp(jc) можно найти в [45]. Подставляя F2) в формулу B) для 1F(t) и учитывая, что г х г 7 о о -, C0.63) — 00 получим окончательно оо
282 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V Полученный ряд удобен для вычислений, так как быстро сходится. Вероятности №(т), рассчитанные по формуле F4) для различных значений C/а, даны на рис. 19. W сев 2,0 5 ос7 О 1 2 Рис. 20. б) Для решения второй части задачи (определения б), подставив F4) в A0), получим 1 Ш 5 '(заб5) Значения а0, рассчитанные для различных р/а, приведены на рис. 20. в) Для определения среднего числа выбросов п @, т0) в единицу времени воспользуемся формулой C1), которая в данном случае при- • мет вид 00 п @, т0) = f(t, 0) 5 vx (т0, у) dy. C0.66) о Закон распределения U(t) по условию нормальный, следовательно, ^ «-*/*• C0.67) C0.68) fit, х)=Пх)= у 6%
§ 30] ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ ДОСТИЖЕНИЯ ГРАНИЦ 283 Остается определить функцию vx (т0, у). Для ее нахождения воспользуемся операционным исчислением, определив сначала изображение !/(/?, _у), являющееся решением уравнения C3), которое с учетом C9) примет вид |г Bа*2Vi) + 2а|{yVx) = 2/7V, C0.69) или, произведя замену переменных -К = 7-, C0.70) Последнее уравнение по виду не отличается от уравнения D4) и, следовательно, имеет решение e~yVA D-p/a(y\)- (Это уравнение имеет и второе решение, однако это решение в данном случае должно быть отброшено, так как оно не обращается в нуль на бесконечности, что противоречит физическому смыслу задачи.) Учитывая граничные условия C4), получим C0.72) Подставляя найденное значение V\(p,y) в C7) и учитывая при этом, что производная от функции параболического цилиндра может быть выражена через такую же функцию с индексом, уменьшенным на единицу (см. [9], стр. 289), находим изображение Ni{p,u^ функции п (t, щ) () М (я» Р)=ро ^ , fx Ы- C0.73) В том случае, когда рассматриваются выбросы за нулевой уровень (и2 = 0), полученному изображению, несмотря на его сложный вид, соответствует простая формула для оригинала п{х, 0) (см. [37]) C0-74)
284 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ (ГЛ. V Как и следовало из общих соображений, при т0 —* 0, п (т0, 0) —¦> оо, однако при то]>О полученная формула дает результат, пригодный для практического использования. В общем случае щ ф 0 оригинал п (т, и.2)> соответствующий изображению G4), имеет более сложный вид. Пример 30.3. Определить среднее число выбросов п (т0, щ) стационарного случайного процесса U(t) за уровень и^^>0, превосходящих по длительности т0, если уравнение процесса имеет вид Ш + *{и-аи) = °У«НЪ C0.75) где 1=0, /^(т) = &(т), Уравнение G5) при указанных начальных условиях определяет случайный процесс, ординаты которого не могут принимать отрицательных значений, так как при стремлении U к 0 со стороны положительных значений в скобке (U—<з*/Ц) второе слагаемое стремится к —оо. Следовательно, --г- стремится к -|-оо, и функция U(t) начинает резко удаляться от оси абсцисс. Итак, для дальнейшего заметим, что t/@сопроцесс U(t) является марковским, так как он определяется уравнением первого порядка, содержащим в правой части функцию l(t) с независимыми ординатами. Для применения формулы C1) необходимо найти функцию f(tyx) и функцию vx (x, у), т. е. решить второе уравнение Колмогорова B8.2) и уравнение B5), отличающееся от него только начальными и граничными условиями. Так как нас интересует только стационарное решение уравнения Колмогорова, то применима формула B9.4) ЯёН' (за76) где а (у) и b (у) — коэффициенты уравнений Колмогорова. Для их нахождения, интегрируя G5) от t до t-\- А и поступая так же, как в примерах B8.1) и (*28.2), получим C0.77) Подставив G7) в G6) и определяя постоянную с из условия нор- 00 мировки J f(y) dy=\> имеем о 2Z C0.78)
§ 31] МНОГОМЕРНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 285 т. е. стационарное решение уравнения G5) подчиняется закону распределения Рэлея. Подстановка G7) в C3) для изображения V\ дает !* (А V.) + 2«! [[у - ?) Vt] = 2p Vt. C0.79) Последнее уравнение подстановкой У = у^°Уг> V1=y1Z{y1) C0.80) сводится к уравнению il^0' <3(Ш> совпадающему с G1) и, следовательно, его решение может быть выражено через функции Вебера (функции параболического цилиндра)* § 31. Многомерные марковские процессы Понятие марковского процесса может быть обобщено на совокупность случайных процессов, или, как говорят, на многомерные, процессы. Возьмем совокупность п случайных функций времени U\{t\ Оч @> • • • > Un (t), которые мы будем рассматривать как п компонент случайного вектора R(f). Обозначим значения ординат этих функций в момент времени t через Xv Х2, ..., Хп, а их значения в момент времени % (t^>t) через \ ъ п Многомерный случайный процесс является марковским, если закон распределения системы случайных величин Yv Уъ ..., Уп, вычисленный при условии, что значения хъ х2, ..., хп случайных величин Xv ..., Хп известны, не зависит от того, какие значения случайные функции U\y ..., Un принимали в моменты времени, предшествующие моменту времени t. В этом случае, подобно тому как это имеет место для одномерных марковских процессов, исчерпывающей характеристикой процесса будет двумерная условная функция распределения или плотность вероятности f(U хь хь ..., хп; т, уь у* ..., уп) C1.1) (если ограничиться рассмотрением только непрерывных случайных процессов). Плотность вероятности A.) удовле.тво.ряет в.сем требованиям, справедливым для плотности вёр®ят.но?ги cijciaeystei случайных величин: функция / не может иметь отря^теяьншк ордин-ат; при обращении^
286 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V в со модуля хотя бы одного из ее аргументов у^ функция / обращается в нуль; интеграл от плотности / по части переменных ур взятый по всей области возможных значений этих переменных, дает условную плотность вероятности для оставшейся подсистемы случайных величин Yv Уъ ..., Yn\ наконец, интеграл от / по всем переменным ylf у.2> ... , уп, взятый по всей области возможных значений этих величин, равен единице. Кроме этих общих соотношений, для марковских процессов функция f(t, хь ..., хп; т, yv ..., уп) удовлетворяет обобщенному урав- яению Маркова, которое в данном случае имеет вид f (t, xv ..., Хп, т, уь ..., уп) — со = j... j f(t% xv .. • > хп; tit Zp . •., zn) X zv...,z,i*,yb ...,yn)dzl ... dzn. C1.2) Используя последнее равенство и повторяя рассуждения, которые приводят к уравнениям Колмогорова в одномерном случае, для многомерного процесса можно получить уравнения, которые являются обобщением уравнений Колмогорова на случай многомерных марковских процессов. Эти уравнения имеют вид еде в первом уравнении коэффициенты at и btj являются функциями iy хь ..., хп, а во втором уравнении — функциями т, уь ..., уп. Коэффициенты at и bti имеют тот же физический смысл, что -и коэффициенты а и Ь в случае одномерных марковских процессов, т. е. определяются формулами *,(*, xv ..., хп)= lim -J—Miyi— JfilJCi, •••, *„], C1.6) bu{Uxv ..,, xn)= lim ^ C1.6) Так же, как и для одномерного процесса, определение этих коэффициентов обычно не представляет большой трудности. В частном случае, когда компоненты многомерного случайного •процесса Up ..,, Ua удовлетворяют системе дифференциальных урав-
f 81] МНОГОМЕРНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 287 нений, в которые линейным образом входят случайные функции, обладающие свойствами белого шума, определение этих коэффициентов осуществляется так же, как это было показано в § 28 для1 одномерных марковских процессов. Предположим, что функции U\ (t), ..., Un (t) удовлетворяют системе дифференциальных уравнений п /=1, 2, ..., л, C1.7) где lm(t) — взаимно независимые случайные функции, обладающие свойствами белого шума: /г (т) = 8(т), C1.8) а неслучайные функции 4?z и glm предполагаются известными. Будем считать их непрерывными функциями своих аргументов. Интегрируя каждое из уравнений G) по t от t до t -f- Д> считая А малой величиной и пользуясь теоремами о среднем, будем иметь У,-*, = *,(*,*!, ..., Х„)Д+ j^glm(t,Xt Хп) \%m{h)dh. т = \ t C1.9) Вычисляя математическое ожидание обеих частей полученного равенства и пользуясь формулой E), получим at(U xv ..., xw) = 47/(/L, xv ..., xn)> 1=1, 2, ..., л. C1.10) Написав равенство (9) для двух значений индекса / (/ и у), перемножая левые и правые части этих двух равенств, находя математическое ожидание результата и пользуясь формулой F), получим выражение для коэффициентов btj п ЬцУ, XV ..., Хя)= 2 glm(t> xl> •••' *n)gjm(t> Xv ..., Хп) (/,/=1, 2, ..., п). C1.11) Таким образом, для многомерного марковского процесса, определяемого системой уравнений G), коэффициенты уравнений Колмогорова могут быть найдены по формулам A0) и A1). Докажем обратное утверждение: покажем, что если даны коэффициенты av btj уравнений Колмогорова для я-мерного марковского процесса, можно составить систему линейных уравнений типа G),
"'288 основы теории марковских процессов [гл. v «которой удовлетворяют компоненты процесса. Иными словами, нужно убедиться, что если заданы коэффициенты а1 и Ьц как функции t, xv ..., хпУ то из системы уравнений A0) и A1) можно определить ^функции 4?z и glm. Так как уравнения A0) определяют ч7, однозначно, то остается убедиться, что система A1) имеет решение. Система A1) вследствие симметрии коэффициентов blm имеет только я(л-|-1)/2 уравнений, в то время как искомых функций glm в общем случае л3. Поэтому функции glm не могут быть определены однозначно. Однако если подчинить эти функции добавочному условию симметрии относительно индексов / и т glm=gmv C1Л2) то задача решается однозначно, так как систему A1), пользуясь матричными обозначениями, в этом случае можно записать в виде т. е. матрица || glm || является квадратным корнем из матрицы || Ъш ||. Для симметричной положительно определенной матрицы, как это доказывается в матричном исчислении, квадратный корень из матрицы имеет смысл и определяется однозначно. Таким образом, можно утверждать, что всякой системе «-мерных уравнений Колмогорова соответствует система уравнений типа G) с симметричными функциями glm. Требование симметрии функций glm нуждается в разъяснении, так как при написании общей формы системы G) нет никаких оснований ограничивать вид функций glm требованием их симметричности. Поэтому, решая систему A3) при добавочных условиях A2), мы, вообще говоря, не получим тех же уравнений G), из которых мы исходили при получении уравнений Колмогорова. Однако отличие, которое при этом возникает, носит часто формальный характер, так как наличие в правых частях G) независимых случайных функций Ьт (t) дает возможность так преобразовать эти уравнения, чтобы функции glm стали симметричными. Уже этот пример показывает, что так же, как это имеет место для одномерных марковских процессов (см. § 28), переход от уравнений Колмогорова к системе дифференциальных уравнений для компонент процесса не является однозначным. Тем не менее такой переход в ряде случаев представляет интерес, так как мы получаем многомерный марковский процесс, эквивалентный по своим свойствам случайному процессу, для которого задана система уравнений Колмогорова. Решение многомерных уравнений Колмогорова представляет, как правило, более сложную задачу, чем решение аналогичных уравнений для одномерного марковского процесса, так как метод расщепления переменных (метод Фурье) в общем случае оказывается неприменимым
§ 31| МНОГОМЕРНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 289 и приходится искать методы решения, специфические для конкретного вида функций аь и blm. Однако во многих практических задачах функции аг и blm имеют сравнительно простой вид, что упрощает получение решения. Так, например, весьма часто коэффициенты Ь1т являются постоянными, з коэффициенты аг — линейными функциями координат xv В этом случае решение уравнений Колмогорова может быть найдено в общем виде. Действительно, положим п a-i (ъ У\> • - • > Уп) = 2 а'ЛУу + Ч Ьи = const C1.14) и рассмотрим уравнение D). Это уравнение в соответствии с предположением о том, что начальные значения ординат случайных функций U\(t)9 Ui(t), ... • •> Un(t) заданы, нужно интегрировать при условии х — и f(t, xv ..., хп; т, yv ._.., уп) = *0--. ЫУп — Хп)> C1.15) отражающем тот факт, что при x — t ординаты yj совпадают со значениями ординат X] (у = 1, 2, ..., п). Кроме начальных условий, при интегрировании уравнения D) необходимо еще учитывать граничные условия, которые в данном случае сводятся к требованию обращения в нуль плотности вероятности / при стремлении к бесконечности модуля хотя бы одной из переменных У у Для решения уравнения D) при условиях A4) проще всего от плотности вероятности / перейти к характеристической функции E(zv ..., zn)y определяемой формулой оо = 5... 5 ехр { 21 l*iyi}f(t> xv..«Xn, ^yv...yyn)dyl ...dyn. C1.16) -00 /=1 n Умножая для этого D) на ехр|2 ^ziVi\ и интегрируя по всем переменным уг в бесконечных пределах, получим А. А. Свешников — 1388
290 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V Каждый из интегралов в A7) интегрированием по частям может быть сведен к характеристической функции Е или ее производным по zv Действительно, заменяя аг по формуле A4), интегрируя по частям и учитывая, что внеинтегральные члены обращаются в нуль вследствие граничных условий для /, получим со п •" \ Wi [(a/+ 2 *иу})*\ехр 2 /=1 2 а1/л)/ехР{' 2 /el /=1 Аналогичным образом It, 2 — оо У— 1 Подставляя A8) и A9) в A7), будем иметь п п п Ъ- 2 аЛ^ = ('2^-Т 2 /,/ = 1 7=1 /./«1 Для определения начальных условий, которым удовлетворяет функ- п ция Е, умножим обе части равенства A5) на ехр {/ ^ *&А и /1 интегрируем полученные выражения по всей области изменения переменных yj. Учитывая определение характеристической функции и свойства дельта-функций, получим п ?|х=, = ехр{*2 zjxj]. C1.21) Уравнение B0) является линейным дифференциальным уравнением первого порядка в частных производных и может быть решено общими методами, разработанными в математике для этого случая [10], однако специальный вид уравнения B0) позволяет получить необходимое решение, не прибегая к этим методам, так как простая подстановка показывает, что уравнению B0) можно удовлетворить, положив п п Е (*„ ..., zn) = ехр [i ^ Siz, - т 2 *"*'*'}' C! '22)
§311 МНОГОМЕРНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 29! где yt и ktj — функции только х. Действительно, подставляя B2) в B0), сокращая показательную функцию и приравнивая нулю коэффициенты у различных степеней zt, получим систему обыкновенных дифференциальных уравнений а1тут=а1 (/=1, 2, ..., п), C1.23) п = blm (/, /я=1, 2, ..., п). C1.24) Система уравнений для определения pt не зависит от klm и в соответствии с B1) должна быть решена при начальных условиях x = U уг = хь (/=1, 2, ..., п). C1.25) Система уравнений для klm не зависит от $1 и должна быть решена при начальных условиях x = t klm = 0. C1.26) Так как и B3) и B4) являются системами линейных дифференциальных уравнений с постоянными коэффициентами, то их решениями являются линейные комбинации экспоненциальных функций видз ек{>х~*\ где X — корни соответствующего характеристического уравнения (при наличии кратных корней некоторыми коэффициентами у экспонент будут полиномы от х — t). Таким образом, решение уравнений B3) и B4) не связано с принципиальными трудностями и может быть получено обычными способами. (Методами матричного исчисления решение этих уравнений может быть записано в общем виде, однако при практическом использовании получаемых таким образом общих формул все равно необходимо находить корни характеристических уравнений и выполнять практически те же выкладки, которые необходимы при обычном методе решения системы линейных уравнений с постоянными коэффициентами.) Итак, решением /(*, *lf ..., лг„; х, yv ..., уп) второго уравнения Колмогорова в том случае, когда коэффициенты blm являются постоянными, а коэффициенты at — линейные функции от переменных у(, является плотность вероятности, которой соответствует характеристическая функция вида B2). Однако формула B2) является общей формулой для характеристической функции системы нормальных случайных величин. Поэтому можно сделать следующий, весьма важный для дальней- ше* о вывод: если коэффициенты уравнений Колмогорова blm — постоянные, а коэффициенты at — линейные функции пространственных
292 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ |ГЛ. V координат, то многомерный марковский процесс, определяемый этим уравнением, является одновременно нормальным процессом. Для того чтобы интерпретировать полученный результат с несколько иной точки зрения, перейдем от уравнения Колмогорова к системе дифференциальных уравнений, определяющих закон изменения компонент процесса Ut(t). Используя для этого формулы G), A0) и A1), получим, что плотность вероятности будет удовлетворять уравнениям Колмогорова с коэффициентами (i4), если , 2, ..., л), C1.27) где glm — в данном случае постоянные коэффициенты, a Sw@ — независимые случайные функции, имеющие свойства белого шума. Исключая из системы B7) все компоненты случайного процесса UL (t), кроме, например, U\ (t)y для этой компоненты получим линейное дифференциальное уравнение л-го порядка вида nit), C1.28) где Qn\di) и Prm {dtl^fn^^) — полиномы степени п и соответственно гт от дифференциальных операторов -гг. Как известно из корреляционной теории случайных функций, при наличии стационарного решения уравнения B8) (т. е. в том случае, когда рассматриваемая динамическая система является устойчивой) функция U\ (t) имеет дробно-рациональную спектральную плотность SUl (со), так как CL29> где rm<«. i/>r(to)|«= v \p (to)|«. Таким образом, полученный выше при решении уравнения Колмогорова с коэффициентами A4) результат может быть сформулирован и следующим образом: если коэффициенты blm = const, а коэффициенты at — линейные функции пространственных координат (хь или yt) то многомерный марковский процесс является нормальным, а любая его компонента после окончания переходного процесса обладает дробно-рациональной спектральной плотностью. Справедливо и обратное положение (см. § 32). Именно, можно утверждать, что если нормальный стационарный процесс имеет дробно-рациональную спектральную плотность, то его можно рассматривать как компоненту многомерного марковского процесса.
§ 31! МНОГОМЕРНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 293 Это положение, которое имеет большое значение при использовании методов теории марковских процессов в приложениях, иногда называют второй теоремой Дуба [29]. Рассмотрим применение многомерных марковских процессов для определения вероятности достижения случайной функцией границ заданной области. Эту задачу для многомерных процессов можно формулировать двумя различными способами. Во-первых, можно поставить перед собой цель определить вероятность того, что ни одна из компонент случайного процесса не выйдет за дозволенные пределы, короче говоря, что совокупность переменных уь у^ ..., уп за время Т= т — t ни разу не покинет некоторую область D- Во-вторых, можно выделить из п компонент процесса одну компоненту (например, ?Д) и интересоваться вероятностью того, что эта компонента за время Т ни разу не выйдет за интервал (и1У щ), безотносительно к тому, какие значения будут принимать другие компоненты. Для решения первой задачи обозначим через w(z, yv ...> уп) плотность вероятности того, что к моменту времени х ординаты Уг будут находиться в интервалах (yv yl-\-dyl)(l=\,2> ..., л), ни разу не заходя в течение интервала времени (t, т) за границы области D, а искомую вероятность — через W(i). Рассуждая так же, как для одномерного марковского процесса, можно показать, что функция w удовлетворяет многомерному уравнению Колмогорова при следующих начальных и граничных условиях: при т = ? гв> = &(л—*1)8(Л —*«) •-. Ъ(Уп — *п\ C1.31) при т^>? в> = 0, C1.32) если точка с координатами yv y2, ..., уп находится на границе области D. Очевидно, искомая вероятность W(x) может быть определена по плотности вероятности t^(x, yv j/3, ..., уп) путем интегрирования по переменным yv y,v ..., уп по всей «дозволенной» области D, т. е. Н7(т)=$...$да(т, yv ..., yn)dyx ... dya) i = t+T. C1.33) (D) При второй постановке вопроса, когда обусловлена только область допустимых значений одной компоненты марковского процесса (для
294 основы теории марковских процессов [гл. v определенности будем считать компоненты U\)> вероятность W(%) также может быть получена из плотности w (т, yv ..., уп) путем интегрирования, однако вместо формулы C3) теперь мы будем иметь 00 U-2 — 00 И| Последняя формула может рассматриваться как частный случай C3), когда область D ограничена только интервалом изменения одной переменной уу Вероятность W(i) связана с плотностью вероятности /(б) времени пребывания многомерного случайного процесса в дозволенной области и с математическим ожиданием этого времени пребывания б формулами, идентичными формулам C0.8) и C0.10), полученным в § 30 для одномерного марковского процесса, т. е. формулами C1.35) оо 6 = $ W(x)dz, C1.36) где под временем пребывания в данной области следует понимать или время, в течение которого все компоненты процесса ни разу не выйдут за границы некоторой области D (если при вычислении W{%) пользоваться формулой C3)), или время, в течение которого одна из компонент процесоа ни разу не выйдет за интервал (uv w2) (если при вычислении W(x) пользоваться формулой C4)). Аналогичные обобщения на многомерные марковские процессы допускают и формулы C0.27), C0.28) и C0.29) для среднего числа выбросов за границы заданного интервала изменения одномерного марковского процесса. Рассмотрим применение формул данного параграфа на примерах. Пример 31.1. Случайные перемещения земной оси хорошо описываются уравнениями (см. [20]) *"i — mU 4-W =<& (О dt 1 ' 2 2 ^ '* где U\ (t) и С/ч @ — угловые отклонения оси, X, <о, с — постоянные, a 5j@ и ?2@ — независимые случайные функции, обладающие свойствами белого шума (;2 = ?2 — О, К^ (?) — К^ (t) = 8 (х)).
§ 31] МНОГОМЕРНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 295 Определить двумерную плотность вероятности ординат случайных функций U\ (t), U$ (t) в момент времени х, если при t = 0 U\ = xX} ?/2 = *2- Совокупность случайных функций U\ (t), U^ it) является двумерным марковским процессом, так как определяется системой уравнений типа B7). Следовательно, задача сводится к решению второго уравнения Колмогорова при соответствующих начальных условиях. В соответствии с формулами A0) и A1) для коэффициентов уравнений Колмогорова получим ах = — Ху, — огуз, я* = — \уа -|- a>yv bx 2 = 0, *it i = с\ b% 2 = с\ Искомая плотность вероятности f(t, xlt х2; т, уь у%) является решением уравнения д/ д д са d2f с2 d*f при начальных условиях Коэффициенты af полученного уравнения линейно зависят от yv Уь и следовательно, на основании формул A4), A5) и B2) для характеристической функции системы случайных величин Yx = Ui(fz) и К3 = Ц^ (т) получим = exp |/ ($z + р&) kz\ где J?i, J?2, kx i, /?2t .2 и kXf 2 в соответствии с B3) и B4) удовлетворяют системе дифференциальных уравнений при начальных условиях
296 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V Решение полученной системы дает Ух = е~Хт (xt cos (от — х2 sin tux); j73 = е"кх (xt sin о>т -j- лг2 cos шх); 2(ХЧ-«») {т ^ + ш*> ~ »'«-*Ч О ~ ^ cos 2шт) - — ?~'2Хх со sin 2а>т} ~ e~*M C0S > + -j_ ^ [X'2 _|_ шз (i _ <r^)] sin 2u>t}, Пример 31.2. Вывести уравнения Колмогорова для нормального стационарного процесса U(t)y если cos рх —|—g- sin p(' В § 11 было показано (формула A1.17)), что случайный процесс с данной корреляционной функцией обладает спектральной плотностью и, следовательно, U(t) является стационарным решением дифферен- .циальиого уравнения где $(^) — «белый шум»» т. е. функция, обладающая корреляционной функцией 8(т) и спектральной плотностью 1/2тс. Уравнение для процесса ?/@ имеет второй порядок и, следовательно, U(t) не является марковским процессом («будущее» процесса определяется не только значением U(t) в начальный момент, но и значением О (t) в этот момент времени). Однако двумерный случайный процесс Ui(t)f U*(t),rjie Ui(t)^U(t)y U%(t)=O(t), уже будет марковским, так как начальное значение вектора Ui(t), U^{t) полностью определяет вероятностные свойства процесса при t^zt. Подставляя в уравнение для U{t) для определения компонент марковского процесса получим систему уравнений 4 2. С/, + («' + fl<) U, = 2о
f 31| МНОГОМЕРНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 297 Используя формулы A0) и A1) и учитывая обозначения G), получим коэффициенты уравнений Колмогорова: ах (t, хь х2) = хь а% (t, xv x2) = — (а* -J- $2) xt — Ь1Л = Ьхл = 0, Ь%ъ = 4а% (а* Следовательно, уравнения Колмогорова будут иметь вид g=о. Пример 31.3. В условиях предыдущего примера определить двумерную плотность вероятности ординаты случайного процесса U(f) и его производной U(t)y если при t = 0 U{t) — xv (J(t) = x%. В соответствии с обозначениями, принятыми в предыдущем примере, необходимо определить /40, xv x2; т, yv j/2), т. е. решить второе уравнение Колмогорова при указанных выше начальных условиях. Так как дифференциальное уравнение для искомой плотности вероятности имеет коэффициенты, линейно зависящие от ух и у& то в соответствии с теоремой Дуба можно утверждать, что система случайных величин Yv K2 подчиняется нормальному закону распределения, и следовательно, для искомой функции f можно написать /@, xv x2; т, у1У уа) = ¦}. где элементы корреляционной матрицы &у^ и математические ожидания j/j и уъ могут зависеть только от переменной т. Для получения явного вида этой зависимости подставляем общее выражение для / во второе уравнение Колмогорова; используя общие формулы B3) и B4) и учитывая, что в данном случае ai,i = 0, ам = 1, а.2>1 = — (а2 + ?*). а2 2 = — 2а, 7.j = а2 = 0,
298 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ ГГЛ. V получим систему обыкновенных дифференциальных уравнений для определения yv yqt klv klu и &2 3: * + (a3 + f>*) A,., + 2a*,., - *,., = 0; ^ - 2*,., = 0; ^й + 2 (a« Решая полученную систему дифференциальных уравнений при начальных условиях t = 0, р, = д:„ р? = л;2, А,, = А1р8 = Лг>2 = 0, получим: pt + | (x, + ол?,) sin px], cos pt — (^^ at, + -J- *,) sin pt], ^— ? cos 2pt+ J sin 2 Пример 31.4. Угловые отклонения ?/i, 6/3 оси гироскопического маятника от вертикали в первом приближении определяются системой уравнений 0х — 0 где i47] (?) и Л (^) — горизонтальные ускорения точки подвеса маятника, а g и х — постоянные. Считая приближенно, что A^(f) и Л^^) — взаимно независимые случайные функции, обладающие свойствами белого шума аР = ач = 0, Кар (т) = Кау) (т) = rt (т), определить вероятность IF (Г) того, чю в течение интервала времени 7" ось маятника ни разу не выйдет за пределы конуса образующая которого составляет угол 7 с вертикалью, если в начальный момент времени (t = 0) ось маятника вертикальна.
§311 МНОГОМЕРНЫЕ МАРКОВСКИЕ ПРОЦЕССЫ 299 Двумерный случайный процесс Ut(t), U%(t) определяется системой дифференциальных уравнений второго порядка, содержащих в правых частях равенства белый шум. Следовательно, {Jl9 ?/2 можно рассматривать как компоненты двумерного марковского процесса. Плотность вероятности га>(т, yv _y.2) нахождения процесса в момент времени т в интервале (yv yx -f- dy{9 Ун Л + Ф'а) ПРИ условии, что за весь промежуток времени процесс ни разу не выйдет за дозволенные пределы, определится как решение второго уравнения Колмогорова при соответствующих начальных и граничных условиях, а искомая вероятность W(T) можег быть найдена путем интегрирования w(T, у1У у%) W(T)= \ \ w(T, yv y*)dytdy* Вычисляя коэффициенты уравнения Колмогорова обычным образом (см. § 28), получим т. е. второе уравнение Колмогорова примет вид dw , dw dw 1 л о / d2w , d2w\ d-z b^ldyx ь-^ dy2 2 \dy'j ' d[y|/ Решение этого уравнения нужно искать при условиях: т^>0, w(i, Уь Уъ) = 0> если у\ -\-у1==ч'К Так как граничные условия обладают круговой симметрией, то удобнее перейти от прямоугольных координат к полярным. Переходя одновременно к безразмерным переменным, т. е. полагая — Ъ> Уъ= у — Ъ> Ъ = — Ъ> Уъ= у — Ъ> Ъ = г cos <р, щ = г sin 9, tj = получим dw I dw I d2ty 1 dw 11 где хе; рассматривается как функция т^ г, ср. Переходя в выражении для W(T) к полярным координатам, получим где xi = xgr, а ^(х^ r) = ^w{xv r,
300 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V Для определения v проинтегрируем дифференциальное уравнение для w(tv г, ср) по ср от 0 до 2тс. Учитывая при этом, что w должна быть периодической (непрерывной) функцией угла ср, получим дт, 2rdr 2dF~v' Начальным и граничным условиями для последнего уравнения будут Решая уравнение для v методом расщепления переменных, получим v (т„ г) = ? е~ *K;J0 (Xy V2 г), где Уо (^) — функция Бесселя первого рода нулевого индекса, Ху = —^ (лу, |Ху — корни уравнения 70 (^) = 0, а коэффициенты Cj определяются из начальных условий Окончательно для искомой вероятности W(T) получим си v ! где ^sssx^I. § 32. Замена реальных процессов марковскими Краткий обзор теории непрерывных марковских процессов, приведенный выше, показывает, что если непрерывный случайный процесс является марковским, то ряд задач решается сравнительно просто Однако для того, чтобы эта теория могла быть применена на практике, необходимо, во-первых, убедиться, что реальные процессы действительно можно считать марковскими, и, во-вторых, показать способ, с помощью которого могут быть определены коэффициенты уравнений Колмогорова, являющихся основными в этой теории. Как уже отмечалось в § 29, реальные процессы не являются одномерными марковскими процессами, так как марковские процессы не- дифференцируемы, а существенной особенностью реально возникающих процессов как раз является их дифференцируемость, связанная с неиз-
§321 ЗАМЕНА РЕАЛЬНЫХ ПРОЦЕССОВ МАРКОВСКИМИ 301 бежной инерционностью всех реальных динамических систем. Правда, как это было показано в § 30 при определении среднего числа выбросов одномерного марковского процесса, недифференцируемость процесса даже в этом случае не приводит к абсурдным результатам, если исключить из рассмотрения выбросы бесконечно малой длительности. Однако для окончательной проверки пригодности замены реальных процессов одномерными марковскими процессами необходимо иметь возможность уточнения получаемых результатов путем перехода к более точной аппроксимации. Для большинства процессов, с которыми приходится иметь дело в технике, подобное уточнение может быть сделано, если перейти к многомерным марковским процессам. Действительно, в подавляющем большинстве случаев в технике приходится иметь дело со стационарными случайными процессами, закон распределения ординат которых может считаться нормальным, а спектральная плотность достаточно хорошо аппроксимируется дробно- рациональной функцией. Однако в предыдущем параграфе было отмечено (вторая теорема Дуба), что если эти условия выполняются, то случайный процесс является компонентой многомерного марковского процесса. Следовательно, не делая никаках добавочных допущений, кроме допущений, принимаемых обычно в приложениях, для исследования этих процессов можно применить весьма эффективный метод теории марковских процессов. Для практического применения этого метода необходимо для нормального процесса с дробно-рациональной плотностью указать способ составления уравнений Колмогорова. Дадим математическую формулировку поставленной задачи. Имеется нормальный, стационарный случайный процесс U(t)y спектральная плотность которого Su(m) является дробно-рациональной функцией частоты s°(w)=mw> т<п- C2Л) где коэффициенты полиномов Qn(x) и Рт(х) обозначим соответственно через <Х] и ру, т. е. положим Qn (х) = хп + ^х"-1 + ...+<*„ C2.2) C2.3) Требуется показать, что U(t) можно рассматривать как компоненту многомерного марковского процесса, установить число измерений этого процесса и определить для него коэффициенты аг и Ъ1т уравнений Колмогорова. Для решения этой задачи заметим прежде всего, что, согласно спектральной теории стационарных случайных ф>нкций (см § 12)
302 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ !ГЛ. V процесс, имеющий спектральную плотность вида A), является стационарным решением дифференциального уравнения C2.4) где I (t) — случайная функция с некоррелированными ординатами (белый шум), и следовательно, ее корреляционная функция имеет вид дельта-функции Ке(т) = 8(т) C2.5) (без ограничения общности можно считать, что й = 0. В этом случае ? = 0). Перейдем от уравнения D) к системе дифференциальных уравнений первого порядка. Для этого обозначим U(t)= (Ji(t) и введем (п—1) функций U% (t), ..., Un (t), связанных с U\ (t) и ее производными следующими соотношениями: Ox (t) = U% (*), (Jn-rn @ = Un- m+1 @ + Cn-rrfi @> Un-m-i @ = Un-m(t\ 0п_г (t) = Un (t) + cn_? (9, C2.6) где произвольные постоянные сп_тУ сп_т+1, ..., сп_х выберем таким образом, чтобы после исключения из уравнения D) старших производных функции U(f) путем замены их функциями Ui(t) по формулам F) получилось уравнение первого порядка, не содержащее производных от 5@- Подставляя F) в D), получим т-1) @ + • • • + К-? if) + U т- C2.7) Приравнивая коэффициенты у одинаковых производных от %(t) в левых и правых частях равенства, получим рекуррентную формулу для определения коэффициентов ck: к -f m- n 2 {k = n — m,n — m + l,...,n). C2.8)
ЗАМЕНА РЕАЛЬНЫХ ПРОЦЕССОВ МАРКОВСКИМИ 303 При такрм выборе коэффициентов ck уравнение G) принимает вид чл_/^- + ^@- C2.9) Система уравнений F) и (9) состоит из п уравнений первого порядка с п неизвестными функциями Uv ..., Un и содержит в правых частях равенств функцию \(f). Так как поведение совокупности функций Ui> ..., Un в будущем однозначно определяется начальными значениями ординат этих функций, то, следовательно, эти функции являются компонентами л-мерного марковского процесса. Так же компонентой марковского процесса является и исходная функция U(t)> так как U(t)=Ui(t). Остается написать формулы для коэффициентов аь и Ъ1т. Так как полученная сисгема уравнений по своему типу аналогична системе C1.7), рассмотренной в предыдущем параграфе, отличаясь от нее только тем, что в данном случае в правых частях равенства имеется только одна функция l(t), то, применяя формулы C1.10) и C1.11), получим 2+1 ПрИ 1^/^Я— 1, «*Н v» „ ппи / „ C2Л0) - Ул°-щ.1-]У] При 1=П, ГО при ls^/^л — т — 1, Ъ1т = \ V (l^m) C2.11) \ сгст при n — m^l^n, где последняя формула определяет blm при любых значениях индексов вследствие симметрии этих коэффициентов. Итак, мы показали, что нормальный стационарный процесс, обладающий дробно-рациональной спектральной плотностью, является компонентой я-мерного марковского процесса, где 2п — степень полинома, стоящего в знаменателе спектральной плотности. Помимо рассмотренного выше нормального стационарного процесса с дробно-рациональной спектральной плотностью, переход к марковским процессам возможен и в том случае, когда рассматриваются динамические системы, содержащие звенья (линейные или нелинейные), входом в которые являются нормальные процессы с дробно- рациональными спектральными плотностями. Пусть, например, динамическая система характеризуется уравнением + b%+ +-iZF[U(t)\ C2.12) где у — постоянные или заданные функции времени, F (и) — характеристика некоторого безынерционного нелинейного звена, a U(t) —
304 ОСНОВЫ ТЕОРИИ МАРКОВСКИХ ПРОЦЕССОВ [ГЛ. V с тационарная нормальная случайная функция, обладающая дробно-рациональной спектральной плотностью вида A). Переходя от случайного процесса U{t) к «-мерному марковскому процессу по формулам (б) и обозначая Ош (t) = Z (*), U^ (t) = On*.» ... > Uw (<) = Unv-i @> C2.13) вместо A2) получим уравнение d% t)]- C2.14) Уравнения F), (9), A3) и A4) составляют систему п-\-г уравне ний первого порядка, в правые части которых, помимо функций Uf> входит только случайная функция ? (t)y имеющая свойства белого шума (в узком смысле). Такая система уравнений, как мы в этом убедились в предыдущем параграфе, определяет (п -\- г)-мерный марковский процесс. Таким образом, случайная функция Z(t), определяемая уравнением A2), также может рассматриваться как компонента марковского процесса соответствующего числа измерений. В заключение отметим, что замена реальных процессов марковскими допустима и в том случае, когда интересующий нас процесс определяется дифференциальным уравнением, содержащим функцию ?(?), обладающую свойствами белого шума, хотя и нелинейным образом, но так, что соответствующие нелинейные выражения могут быть разложены по степеням малого параметра, стоящего множителем у ?@ (см., например, [37]). Рассмотрим несколько примеров, иллюстрирующих применение многомерных марковских процессов для описания реальных процессов. Пример 32.1. Стационарный нормальный процесс U\lf) имеет нулевое математическое ожидание и корреляционную функцию- /СйДт) = о*<?-а^ cosjk. Показать, что Ui(t) можно рассматривать как компоненту двумерного марковского процесса. Для решения задачи замечаем прежде всего, что (см. пример 11.2) спектральная плотность для Ui(t) имеет вид | — со2 следовательно, их (t) является стационарным решением дифференциального уравнения где Е (t) — белый шум, корреляционная функция которого /С (х) = Ь
§ 32! ЗАМЕНА РЕАЛЬНЫХ ПРОЦЕССОВ МАРКОВСКИМИ 305 Функция U\ (t) не является марковской, так как определяется уравнением Btoporo порядка, и следовательно, знания начального значения этой функции недостаточно для определения свойств функции в будущие моменты времени. Однако, положив в соответствии с F) Ох (t) ===== ?/а (t) + с ? (t), после подстановки в уравнение для U\(f) получим Если положить с1 = а у2си, то в последнем уравнении производ- ная -77 исчезнет и мы получим систему двух уравнений с двумя неизвестными, содержащих в правых частях равенства белый шум и, следовательно, определяющие двумерный марковский процесс с компонентами Ui(t)t ?/«(*): Ш + (а + р) Ux @ + 2а?/2 @ = а /2~а (V^+f1 - 2а) 6 {t\ Пример 32.2. Случайная функция Z(t) определяется уравнением *1Ж + aZ (t) = к V1 {t\ Z @) = 0, где V(t) — нормальная стационарная функция, Показать, что Z(t) является компонентой двумерного марковского процесса. Так как V(f) — нормальный процесс, имеющий спектральную плотность 5г,(ю) = с?д/7;(и>3-}-а3), то V{t) — марковский процесс, определяемый уравнением ^ + al/=awK2iS@, где ^(т) = 8(т> Таким образом, функции Z(f), V(t) определяются системой двух уравнений первого порядка, в правую часть одного из которых входит белый шум. Следовательно, Z(t) и V{t) являются компонентами двумерного марковского процесса.
ГЛАВА VI НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ § 33. Особенности исследования нелинейных динамических систем Исследование нелинейных динамических систем является значительно более сложной задачей, чем исследование линейных систем. Усложнение связано в основном с двумя обстоятельствами: во-первых, для нелинейной системы в общем случае не удается выразить моменты ординат случайной функции на выходе через моменты ординат случайной функции на входе и, во-вторых, закон распределения выходной случайной функции уже не является нормальным даже в том случае, когда входные величины и функции подчиняются нормальному закону. Следовательно, для нелинейных систем, вообще говоря, недостаточно знать только первые два момента выходной случайной функции (математическое ожидание и корреляционную функцию), а необходимо вычислять более высокие моменты распределения, нахождение которых может быть сопряжено с большими вычислительными трудностями. Поэтому при анализе нелинейных систем не удается указать общий метод получения вероятностных характеристик выходной функции системы, а приходится довольствоваться различными приближенными формулами, позволяющими получить требуемый результат с необходимой точностью. Так как выбор различных приближенных способов расчета и их эффективность зависят от свойств исследуемых систем, то рассмотрим типичные нелинейные системы, некоторые из которых будут более подробно рассмотрены в следующих параграфах. Будем считать для простоты, что нелинейная система характеризуется одним входом X (f) и одним выходом Y(t)> т. е. может быть представлена схемой, изображенной на рис. 21. Общее уравнение подобной системы может быть записано в виде ), t\ C3.1)
I 83| ИССЛЕДОВАНИЕ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ 307 Нелинейная система Y(t) где F — некоторая нелинейная функция (или функционал) своих аргументов. Во многих нелинейных системах удается выделить линейную часть и часть нелинейную. При этом входом в нелинейную часть системы может быть или только внешнее возмущение X (t), или функ- __ ция, зависящая как от функции ~"~ X(t)> так и от функции, поступающей на выход всей системы (или Рис. 21. ее части). В первом случае структурная схема системы мо/кет быть представлена в виде, изображенном на рис. 22. X(t) Нелинейный элемент системы Линейная часть системы Y(t) Рис. 22. Во втором случае одной из возможных структурных схем системы может быть схема, представленная на рис. 23. хт хш-т Нелинейная часть системы Z(t) Y(t) Линейная часть системы V(t) Рис. 23. Уравнение системы первого типа может быть представлено в виде \ )> *], C3.2) где L — оператор линейной части системы, г F — нелинейная функция (функционал) своих аргументов. Очевидно, положив Z it) = F [X (*), X @, ... , *(m) @> t]9 C3.3) уравнение B) можно будет переписать в виде C3.4) и тем самым формально свести анализ исходной нелинейной системы к решению двух задач: определению вероятностных характеристик функции Z(t), связанной с заданной функцией X (t) нелинейным соотношением C), и анализу линейной системы D). Системы подобного типа называют «приводимыми нелинейными системами».
308 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИИ 'ГЛ. VI Системы второго типа, как это ясно из рис. 23, не допускают подобного сведения к линейной системе. Их называют «неприводимыми линейными системами». При анализе нелинейных систем существенно, является ли характеристика F нелинейной части системы непрерывной функцией своих аргументов или нет. В первом случае мы будем говорить просто о нелинейных элементах системы. Во втором случае нелинейный элемент будем называть существенно нелинейным. Примерами нелинейных элементов первого типа могут быть любые элементы, для которых функции F являются дифференцируемыми функциями своих аргументов, например F \Х @1 = аХ* (*), F [X (*)] — sin X (t) C3.5) и т. д. Существенно нелинейные звенья возникают, например, в различных законах управления, при наличии люфтов в кинематических цепях и т. д. Если, например, X if) — значение регулируемого параметра, a F [X (t)] — команда, подаваемая на органы управления, то в том случае, когда меняется только знак команды (управление по принципу «да — нет»), существенно нелинейная функция F[X(t)\ будет определяться равенством 1 при X > 0, 0 при Х = 0, C3.6) F\X] = при X < 0, а график функции F(X) будет иметь вид ступенчатой кривой, изображенной на рис. 24, а. При управлении по принципу «да — нет» в том случае, когда имеется зона нечувствительности, график функции F(X) будет иметь вид Fi (х)> изображенный на рис. 24, б. Линейному закону управления с зоной насыщения соответствует график рис. 24, в. Линейному закону управления с зоной насыщения и зоной нечувствительности соответствует график рис. 24, г. Особыми свойствами обладает нелинейное звено, характеристика которого изображена на рис. 24, д. В этом случае выходная функция звена F[X{t)] в интервале —b<^X<^b равна 1 или —1 в зависимости от того, попадает в этот интервал функция X (t) из области Л' (() ^> Ь или соответственно из области X @ <С — *• Следовательно, в данном случае F[X(t)] уже не будет функцией аргумента Х> а является функционалом X(f), поскольку зависит не только от значения функции X(t) в данный момент времени, но и от характера ее изменения в прошлом.
§33| ИССЛЕДОВАНИЕ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ 309 Вторым весьма существенным признаком, который может быть положен в основу классификации нелинейных элементов (помимо непрерывности функции F), является наличие или отсутствие однозначной зависимости выхода нелинейного элемента от ординаты входной функции. В том случае, когда значение X(f) в момент времени t однозначно определяет значение функции = F\X(t),t] C3.7) в тот же момент времени, нелинейное звено называют «безынерционным» (или звеном «б^з памяти»), в противном случае звено называю? F(x) -Ъ х -1 а) F2(x) /Г х ; б) -Ъ -с -Ъ х -7 JL_. ~7L Ъ с х в) -ъ г) х Ф Рис. 24. инерционным (звеном «с памятью»). Например, из пяти характеристик, изображенных на рис. 24, первые четыре (а, б, в и г) соответствуют безынерционным звеньям, а последнее — инерционному. Очевидно, что для инерционного звена характеристика F\X(f)} уже не будет функцией, а будет являться функционалом, зависящим от вида функции А' (() в предшествующие моменты времени, а не только от значения ординаты X(t).
310 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [171 VI Таким образом, подводя итог беглому рассмотрению различных типов нелинейных систем, можно сделать вывод, что во многих случаях нелинейную систему можно рассматривать как совокупность линейных и нелинейных звеньев, соединенных различным образом. При этом нелинейные звенья по характеру их зависимости от входных величин могут быть существенно нелинейными или просто нелинейными, а в зависимости от того, однозначно или нет определяется выход с звена значениями поступающей на его вход функции (величины), — безынерционными или инерционными. § 34. Определение закона распределения случайной функции на выходе линейной части системы При исследовании линейных систем вопрос о законе распределения ординат случайного процесса, получаемого на выходе системы, в большинстве технических задач не представляет большого интереса, так как поступающие на вход случайные процессы обычно бывают- близки к нормальным, а прохождение через линейную систему не искажает нормального закона распределения. При исследовании нелинейных систем на вход линейной части системы поступает случайный процесс, являющийся выходом нелинейной часги системы. Заксн распределения такого процесса может существенно отличаться от нормального, и поэтому даже грубая оценка вида закона распределения ординаты случайного процесса, получаемого на выходе линейной части системы, приобретает существенный практический интерес. Если этот закон близок к нормальному, то можно ограничиться определением только первых двух его моментов, если же закон распределения резко отличен от нормального, то необходимо располагать более подробными его характеристиками. Исследуем несколько подробнее изменение закона распределения ординаты процесса при прохождении процесса через линейную часть системы. Получение ординат выходного процесса из ординат процесса, поступающего на вход линейной системы, в конечном счете всегда сводится к суммированию этих ординат, взятых для различных моментов времени и умноженных на различные коэффициенты. Ограничимся рассмотрением стационарных динамических систем, т. е. систем, поведение которых определяется дифференциальными уравнениями с постоянными коэффициентами, а начальные условия будем считать пока нулевыми. Пусть на вход линейной динамической системы, характеризуемой передаточной функцией L(iw) и весовой функцией /(т), поступает случайная функция X(t) (которая может и не быть стационарной).
С 34} ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ФУНКЦИИ 31 1 Если обозначить случайный процесс, получаемый на выходе системы при нулевых начальных условиях, через Y} (t), то t Yx(f) = \l{t — x)X(x)dt. C4.1) Разобьем интервал интегрирования @, t) на п равновеликих интервалов длиной Д и обозначим 6,= $ l(t — x)X(x)dx (/=1, 2, ... , я). C4.2> Если взять п достаточно большим, то А = tjn будет достаточно малой величиной, и X (t) в B) можно приближенно вынести за знак интеграла, положив равным ординате этой функции в конце интервала интегрирования, т> е. написать /А а,= J /(t — x)dx. C4.3> Подставляя C) в A), получим, что выходная случайная функция К, @ может быть представлена в виде суммы большого числа случайных величин МО = 2 6/. C4.4) закон распределения каждой из которых может быть выражен через закон распределения ординаты случайной функции X (f), поскольку Еу и X(jb) связаны линейным соотношением C). Если бы слагаемые в D) были независимы, то на основании центральной предельной теоремы (теоремы Ляпунова) можно было бы утверждать, что при росте п закон распределения ординаты функции К, (к) будет стремиться к нормальному. Однако в данном случае величины ij являются зависимыми, поскольку выражаются через ординаты одной и той же случайной функции X (t). Правда, и для сумм зависимых слагаемых справедлива теорема, согласно которой при определенных условиях закон распределения суммы1 стремится к нормальному при увеличении числа слагаемых до бесконечности, однако применение этой теоремы к сумме D) не позволяет сделать вывод о нормальном законе распределения Yx (t). Дело в том, что хотя мы и можем формально в этой формуле сделать п сколь угодно большим, однако, увеличивая таким образом число слагаемых, мы тем самым увеличиваем связь между соседними слагаемыми, что не должно иметь места согласно условиям теоремы.
312 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI Однако, несмотря на то, что предельная теорема для сумм случайных слагаемых в данном случае и неприменима, некоторые общие качественные выводы о свойствах закона распределения Yx (t) можно сделать. Во-первых, очевидно, что чем быстрее убывают корреляционные моменты между случайными величинами 5у, тем больше слагаемых п можно взять в сумме D), сохраняя слабую зависимость между слагаемыми, и тем ближе подойти к условиям центральной предельной теоремы. Следовательно, чем быстрее убывает корреляционная функция Кх (т), тем ближе будет закон распределения Y] (t) к нормальному закону. Во-вторых, при одинаковом числе слагаемых сумма тем меньше будет отличаться от нормальной величины, чем однороднее слагаемые. Наиболее благоприятной в этом отношении будет сумма слагаемых, имеющих одинаковый закон распределения. В нашем случае это будет тогда, когда коэффициенты aj в C) будут постоянными величинами, не зависящими от индекса /, т. е. когда /(т) = <: = const, C4.5) а передаточная функция системы Z,(/o>) в соответствии с B0.28) и A0.21) определяется равенством i (/ш)= ^ etwxl(z)dz = 2'Kcb(io). C4.6) —00 Так как последнее условие означает, что рассматриваемая система имеет бесконечно узкую полосу проп)'скания в районе нулевой частоты, то мы получаем вывод, что чем уже полоса пропускания, тем ближе к нормальному будет закон распределения ординат функции, получающейся на выходе динамической системы *). Выбрав для такой системы промежуток времени t достаточно большим, можно получить на выходе случайную функцию, закон распределения которой будет сколь угодно близок к нормальному. При конечной полосе пропускания /(т) ф const и, следовательно, коэффициенты aj не будут постоянными. Если, например, система устойчива, то, как известно (см. § 7), lim /(т) = 0, и следовательно, даже при т -+00 неограниченном увеличении времени t мы не получим нормального закона распределения,' так как, начиная с некоторого значения индекса у\ коэффициенты ау- будут практически обращаться в нуль, и, сохраняя в сумме D) неизменной величину интервала Л, мы не получим бесконечного числа слагаемых, что необходимо для установления нормального закона распределения. *) Считаем, что lim К (т) = 0.
§34| ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ФУНКЦИИ 313 Для простоты мы считали, что начальные условия нулевые. Если это условие не выполняется, то случайный процесс Y(t) на выходе линейной системы будет связан с Y{ (ty определяемым A), соотношением jl(t)y C4.7) где yj (t) — независимые интегралы однородного дифференциального уравнения, соответствующего уравнению рассматриваемой динамической системы, п — порядок этого уравнения, a cj — постоянные величины, линейно связанные с начальными значениями Y(t) и первых (п—1) ее производных. Если начальные значения по смыслу решаемой задачи являются случайными величинами с заданным законом распределения, то коэффициенты Cj будут также случайными величинами Формула G) показывает, что закон распределения случайной величины Y(t) является композицией закона распределения случайной п величины Yx(t) и закона распределения 2 cjyj(t)- Если слагаемые этой суммы — нормальные величины или величины, хотя и не обладающие нормальным законом распределения, но такие, что дисперсия ни одной из этих величин не превалирует над дисперсией Yx (t)> та плотность вероятности f(y), как правило, будет ближе к нормальной- чем плотность вероятности /(j/{). В том случае, когда рассматриваемая динамическая система устойчива, все интегралы yj(f) стремятся к нулю при росте U и следовательно, после окончания переходного процесса первый член в правой части G) может быть отброшен и между Y{t) и Yl(t) исчезает разница. п До затухания переходного процесса ^j cjyj(f) можег играть су- щественную роль и ее нужно учитывать при нахождении закона распределения Y(t). Итак, подводя итог этим качественным рассуждениям, можно сделать вывод, что, проходя через линейную часть системы, случайный процесс приобретает свойства, сближающие его с нормальным законом распределения, или, как говорят сокращенно, линейная система «нормализует» случайный процесс. Эффективность этой «нормализации» будет тем больше, чем Уже полоса пропускания системы, чем больше время работы системы и чем быстрее затухает связь между ординатами входного процесса. Очевидно, что все приведенные выше рассуждения носят чисто качественный характер и только поясняют существо дела. Для того
314 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. VI чтобы с уверенностью можно было считать случайный процесс, получаемый на выходе линейной части системы, нормальным, необходимо «ли произвести строгое определение этого закона распределения и сравнить его с нормальным законом, или приближенно оценить поправки» которые нужно добавить к нормальному закону распределения, для того чтобы с достаточной точностью получить интересующий нас закон распределения. Точное определение закона распределения на выходе линейной системы связано, как правило, со сложными вычислениями (исключение, естественно, представляет случай, когда входной процесс нормальный и, следовательно, нормальным будет и процесс, получаемый на выходе). Некоторые результаты могут быть получены с помощью теории марковских процессов, однако окончательный результат удается получить в простой аналитической форме только для отдельных частных случаев. Наоборот, вычисление поправок к нормальному закону распределения может быть выполнено сравнительно простыми средствами, а в том случае, когда интересующий нас закон распределения действительно мало отличается от нормального, окончательные формулы имеют простой вид. Для получения этих формул удобно представить плотность вероятности fy(y) в виде разложения в ряд по ортогональным полиномам Чебышева — Эрмита Нг{х)у определяемым равенством ^х2) • C4.8) Имея в виду получить наиболее простое выражение для коэффициентов ряда через центральные моменты закона распределения fy(y) и производные нормированной плотности нормального закона распределения 1 —x2i2 ^ , C4.9) положим У— Э C4.10) ЬУ2 и будем искать ряд в виде /• (у) = е-*я 5 bjHjix). C4.11) /=о Этот ряд сходится в любой точке непрерывности функции fv(y), если [23] ^J'4°^ C4-12)
§ 341 ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ФУНКЦИИ 31 5 а функция fy(y) имеет конечное число разрывов. Следовательно, ряд A1) пригоден в том случае, когда плотность вероятности fy(y} убывает достаточно быстро с ростом своего аргумента. Для определения коэффициентов bj достаточно умножить обе части A1) на Hj(x) и проинтегрировать обе части равенства по л: в бесконечных пределах. При интегрировании правой части равенства исчезнут все слагаемые (вследствие ортогональности полиномов Чебышева — Эрмита Hj(x) с весом е~~х2)> кроме слагаемого с индексом у, в левой же части равенства все интегралы могут быть выражены через центральные моменты закона распределения К Выполнив необходимые преобразования, можно обнаружить, что при выбранном значении х ^1 = й2 = 0> и ряд A1) может быть представлен в виде ;(tI) C4.13) где производные предполагаются взятыми по аргументу дифференцируемой функции, а коэффициенты аь определяются равенствами ЧШ C4,4) где [1/2] — целая часть //2. В ряде случаев (например, если закон распределения Y(t) мало отличается от нормального), в A3) можно удержать только три первых члена. В этом случае приближенное выражение для /у(у) примет вид где «асимметрия» Sk(F) и «эксцесс» Ех(У) закона распределения Y(t) определяются формулами Sk(Y) = -^P- Ex(Y) = ±iiP-— 3. C4.16) у ' av Чем ^ меньше Sk, Ex и сумма отброшенных членов ряда A3), тем ближе закон распределения Y{t) к нормальному. Для получения бесконечного ряда, аналогичного A3), сходящегося и в том случае, когда условие A2) не выполняется, нужно вместо A1) искать разложение в виде оо *00fy О)=е~х! 2
316 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ |ГЛ. VI где функция g(y) должна быть выбрана так, чтобы удовлетворялось условие I fy(y)e{y~yJJ4G*g(y)dy<:cx>. C4.18) — 00 Коэффициенты bj в этом случае могут быть просто выражены через центральные моменты, вычисленные с весом g(y), т. е. через «ел и чины со Vi= \ g{y)fyiy)iy-S)'dy. C4.19)" — оо Оставляя этот случай в стороне, вернемся к рассмотрению разложений A3) и A5). Центральные моменты цДУ) ординаты случайной функции Y(t) простыми алгебраическими соотношениями B.12) связаны с начальными моментами ml(Y)> Поэтому для получения этих разложений достаточно найти связь начальных моментов Y{t) с начальными моментами mj(X) ординаты входного процесса X (/). Так как между X (t) и Y}(t) имеется линейное соотношение A), то общие формулы, устанавливающие требуемую связь, легко могут быть получены. Действительно, находя математическое ожидание обеих частей равенства A) и меняя в правой части равенства порядок интегрирования и нахождения математического ожидания, получим /и, (Y{) =ух (/) = $/(/ — *)* Ос) dx. C4.20) о Возводя обе части A) в квадрат, куб и т. д. и представляя каждый t раз степень интеграла J/(/ — 1)Х(т)йъ в виде кратного интеграла, о после нахождения математических ожиданий обеих частей равенств получим = И '(' - Ti) W - т*) М \Х ^ Х ('«)] <Мг,= 00 I Г = \\ l(t — xj lit — -Ч) Kx Ы, тО dxjdx, +f (t), C4.21) GO t t t =5 И/(/ -Ti) /(/ - ts>l{f -ts) M [x (Xi) x (Xa) X(-^dZi d^dz* ooo C4.22) и т. д.
§ 34' ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ФУНКЦИИ 317 Полученные формулы показывают, что для вычисления моментов ординаты случайной функции на выходе линейного элемента уже недостаточно знагь моменты ординаты входной случайной функции для определенного момента времени, а необходимо располагать совокупностью функций, определяющих зависимость математических ожиданий произведений ординат функции X (t), взятых для различных моментов времени, от значений этих моментов времени. Так, для нахождения пц(У{) необходимо знать не момент т^{Х)У а корреляционную функцию Кх(tj, т2), для нахождения пгг(У{) нужно располагать математическим ожиданием М [X (хх) X (т2) X (т3)], которое в случае нестационарной случайной функции X (t) является функцией трех переменных и т. д. Указанные выше математические ожидания могут быть найдены (предполагаем, что они не обращаются в бесконечность), если известны все многомерные законы распределения случайной функции X(t). Таким образом, для нахождения закона распределения ординаты случайной функции, получаемой на выходе линейной системы, необходимо располагать полной характеристикой случайной функции, поступающей на ее вход. Этим задача определения закона распределения на выходе линейной системы принципиально отличается от задачи определения корреляционной функции выходного сигнала, для решения которой достаточно знать только корреляционную функцию входного сигнала, независимо от вида его закона распределения. Рассмотрим несколько примеров, иллюстрирующих «нормализацию» закона распределения линейной частью системы. Пример 34.1. Функция Y(t) связана с нормальной стационарной случайной функцией Z(t) соотношением ^~p- = Z4t). C4.23) Определить плотность вероятности fy(y), если 2 = 0, /С2(т) = о!*-ат, <»* и а даны, а К(/)|/-0 = 0. В данной задаче входом в систему является случайная функция X(t) = Z4t), C4.24) а рассматриваемый линейный оператор есть оператор интегрирования = $* 00 Л. C4.25) о Пользуясь общей формулой B.37) для плотности вероятности функции случайной величины, получим h {x)=*hе' xl2°l ~w • х^°- C4>26)
318 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI Плотность вероятности fx(x) имеет вид, изображенный на рис. 25, т. е. резко отличается от нормальной. При вычислении fy(y) ограничимся приближенным разложением A6), для нахождения которого достаточно определить только моменты Y(t) до четвертого включительно. Учитывая, что в нашем случае х = а\> из B5) получим у (t) = alt C4.27) Для нахождения моментов Y(t) более высокого порядка необходимо определить н = М [X (тО X (т,)] = М [Z* (тО Z* (т9)], Н=М[Х (тО X (т,) X (т8I = М [Z4(тО Z2(хО Z1(x3)], ^ = М [X (хО X (т,) X (т8) *(т4)] = М [Z2 (xO Z1 (x2) Z2 (т8) Z3 (тА)]. Найдем сначала последнее математическое ожидание, как наиболее сложное. Рассмотрим для этой цели систему 8 нормальных величин St, Sa>... ..., Е8, положив К[ ¦= Z (xO, Eg = Z (хО> Е3 == Z (тО> ?4 ^ Z (х2), Е5 = Z (х3), ^6 = Z(x3), ;7==Z(x4), S8 = Z(x4), и обозначим элементы корреляционной матрицы этой системы через kjt. Очевидно, эти элементы просто выражаются через /G(x). Например, kn = Кг (^2 — Ti) и т- Д» Пусть Б (и1? м2» • • •» us) — характеристическая функция системы случайных величин ?i> ?*> •..»?8* ^ак как эти в^ли* чины нормальные и имеют нулевые математические ожидания, то О ш =ехр{-т 2*//й/и'Ь C4.28) Пользуясь общим свойством характеристических функций B.22), имеем *) ~5 3 dui ди2 ... Е («1, Н9, . . о Ы8) . C4.29) *) Необходимые моменты могут быть получены, минуя дифференцирование, если воспользо&аться окончательными формулами, полученными Леоновым и Ширяевым (см. сноску на стр. 119).
134] ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ФУНКЦИИ 319 Для выполнения указанного дифференцирования обозначим показатель степени в B8) через б и разложим Е (иь..., и8) в ряд по степеням б: оо E(uv ..., us)=^j. C4.30) /«о Показатель степени б является однородным многочленом второй степени переменных uv ..., щ. Следовательно, при дифференцировании B9) 2/2 раз и обращении переменных щ, ..., щ в нуль отличные от нуля слагаемые могут возникнуть только от (п-\- 1)-го слагаемого ряда (дифференцирование нечетное число раз всегда дает нуль). Поэтому вместо B9) можно написать ± 4! C4.31) Выполнив это дифференцирование, получим (см. [5]) н = Af! + 2Af i (kh + kh + kh + kh + k\b + kh) + 4 (khkh + A|8*b+ *M1 1^35^37^ i. C4.32) Аналогичным образом вычисляя р-3 и [х2, получим ^ = k\\ + 2AU (Af5 + Af3 + ^зб) + 8^33^13*13» ^2 = Afi + 2А!з- C4.33) Подставляя найденные математические ожидания в формулы B1), B2) и аналогичную формулу для четвертого начального момента, после интегрирования и перехода к центральным моментам по формулам B.12), для асимметрии и эксцесса получим окончательные выражения v_ 12 [(*-!) + («*+1)*-2*! [Bа*-1 C4.34) C4.35) Как и следует из общих рассуждений, при /->оо и асимметрия, и эксцесс обращаются в нуль и, следовательно, функция fy(y) приближается к нормальной. Однако если / сравнительно невелико, то отклонение от нормального закона может быть заметным. Для того чтобы в этом убедиться, справа приведены значения Sk(K) и Ех(У) 1 2 4 при t = —, — и —. Вычисленные' по формуле A5) для этих значений t плотности вероятностей t Sk(y) Ex (У) 1 а 7,36 12,0 2 а 3,22 8,70 4 а 1,94 7,35
Я20 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ ¦ ГЛ. V! построены на рис. 26. Рисунок показывает, что отличие от нормального закона распределения (пунктир) довольно значительно. Пример 34.2. В качестве второго примера рассмотрим линейное звено первого порядка, на вход которого поступает та же функция у-у Рис. 26. X(t), что и в предыдущем примере, т. е. рассмотрим динамическую систему, поведение которой определяется уравнением C4.36) где по-прежнему Y(f)\t 0 = 0, k —известная положительная постоянная, X{t) = Z*{t)) Kz{*) = °le-^> * = 0. Определим закон распределения К(/), причем для простоты расчетов будем считать, что время t достаточно велико. Отличие этого примера от предыдущего заключается только в том, что при использовании формул B0), B1) и B2) весовую функцию /(т) >же нельзя считать равной единице, а нужно положить C4.37)
§34| ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ФУНКЦИИ 321 Сделав эту замену, выполнив соответствующие интегрирования ы и отбрасывая слагаемые, содержащие множители вида е р ~ы получим C4.38) Полученные выражения показывают что даже при большом промежутке времени работы системы закон распределения выходного сигнала не «нормализуется». Рис. 27. Действительно, взяв для примера несколько значений отношения /oiy получим значения асимметрии и эксцесса, приведенные в таблице Л/а Sk(K) Ех(У) 0,1 0,83 2,51 0,5 1,49 7,43 1 1,73 9,60 5 1,97 11,76 10 1,99 11,93 Построенные для этих значений А/а плотности вероятности fy(y)> вычисленные по приближенной формуле A5), даны на рис. 27. Как 11 А. А. Свешников
322 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI показывает рисунок, fy (у) заметно отличается от плотности нормального закона распределения, построенного на том же рисунке (при тех же значениях математического ожидания и дисперсии) пунктирной линией. § 35. Приводимые нелинейные системы Как было условлено в § 33, под приводимыми нелинейными системами мы будем понимать динамические системы, поведение которых описывается уравнением вида LY{t) = F[X{t)\ C6.1) где X(t)— входной сигнал, Y(t) — выходной сигнал системы, L — линейный оператор, г F[X (t)] — нелинейная функция (функционал) своего аргумента. Обозначив в предыдущей формуле C5.2) мы формально можем свести рассмотрение нелинейной системы к рассмотрению линейной системы, определяемой уравнением LK@ = Z@, C5.3) что и объясняет наименование этих систем «приводимые». Однако исследование этих систем даже в рамках корреляционной теории наталкивается на существенные трудности. Действительно, используя свойство линейности оператора L, обозначая функцию веса этого оператора l(tv /4) и считая для простоты начальные условия нулевыми, уравнение C) можно переписать в виде t \ d*z. C5.4) Следовательно, для нахождения математического ожидания и корреляционной функции Y(t) можно воспользоваться формулами G.44) и G.43), т. е. написать t j@ =?/(*, т)*(т)Л, C5.5) о Ky(tv U) = \\l(tv xt)l(tb х$КЛ*» ^dxxdx* C5.6) В последние формулы входят математическое ожидание и корреляционная функция случайной функции Z{f), которая связана с известной функцией X(t) нелинейным соотношением B). Для того чтобы это вычисление можно было выполнить точно, как мы увидим далее, необходимо располагать двумерной плотностью
§ 35| ПРИВОДИМЫЕ НЕЛИНЕЙНЫЕ СИСТЕМЫ 323 распределения случайной функции X(t), а для приближенного вычисления этих характеристик необходимо знать достаточное число моментов функции X{t). В обоих случаях вычисления, как правило, значительно усложняются сравнительно с линейными системами. Рассмотрим методы вычисления z(t) и Kz(tv т2). Предположим сначала, что нелинейное соотношение B) является безынерционным, т.е. значение функции Z (t) однозначно определяется значением функции X(t) в тот же момент времени. Обозначим одномерную и двумерную плотности вероятности случайной функции X (t) через fx(x) и fx(xv x2) соответственно, причем под Xi будем понимать значение ординаты X(t) в момент времени х1У а под х$— в момент времени т2. Так как формула B) дает функциональное соотношение между случайной величиной X(t) и случайной величиной Z(t), то для нахождения z(t) и /C*(Ti> тз) применимы общие формулы вычисления математических ожиданий функций случайных величин, т. е. можно написать = M{F\X(t)}\ = \ F(x)fx(x)dx, C5.7) — оо Кг Ы, х2) = М {F [X Ы] F [X Ы]\ — S Ы) 2 (тО = ОО [[ *) fx (xv л?0 dxt dXi — 2 (t,) 2 (x,). C5.8) Формулы G) и (8) решают в принципе задачу определения вероятностных характеристик случайной функции Z(t), необходимых для применения формул E) и F), однако они часто оказываются неудобными, особенно если нелинейная функция F[X(t)] соответствует существенно нелинейному звену. В этом случае область интегрирования в (8), как правило, приобретает довольно сложный вид и вычисление двойного интеграла усложняется. Поэтому часто бывает удобнее преобразовать G) и (8) так, чтобы в эти формулы входили не плотности вероятности ординат А"^), а соответствующие характеристические функции. Для выполнения этого преобразования предположим сначала, что функция F(x) допускает преобразование Фурье, т. е. предположим, что существует функция <р(н)> связанная с F(x) соотношениями 00 F(x)= \ y(it)eiaxdu> C5.9) = & \ P & \ ^dx. C5.10) 1Г
324 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI Заменяя в (9) х на X(t) и подставляя в G) F[X{t)}> получим со {\ ). C5.11) — оо Меняя в последнем равенстве местами интегрирование и нахождение математического ожидания и учитывая при этом, что М {*'«*<'>} = ? (я) C5.12) есть характеристическая функция ординаты X(t), получим оо z(t)= $ о (г?) Е {и) dii, C5.13) — оо где время t входит в выражение функции Е(и) как параметр. Аналогичным образом, если в (8) подставить вместо F (хх) и F(x2) (9) (обозначая переменную интегрирования первый раз через щ, а второй раз через и2), получим со Kz СЧ, т2) = ЭД <р (пг) 9 ( Е («1» lh) dih dih — * (tJ z (to), C5.14) - оо где C5.15) — характеристическая функция системы случайных величин ^(xj) и Л'(тэ), а переменные xt и т2 входят как параметры в выражение функции ?(Mi, щ). Формулы A3) и A4) часто бывают более удобными для вычислений, чем G) и (8), так как даже для существенно нелинейной функции F(X) ее преобразование Фурье ср(и) может быть непрерывной функцией, и при вычислении интегралов A3) и A4) не возникает добавочных трудностей, связанных с видом области интегрирования. При выводе формул A2) и A3) предполагалось, что справедливы соотношения (9) и A0), т. е. считалось, что преобразование Фурье функции F(X) существует. Это предположение на первый взгляд сильно ограничивает применимость полученных формул, так как для существования преобразования Фурье необходимо, чтобы интеграл от модуля функции в бесконечных пределах был конечен, а большинство нелинейных преобразований, имеющих интерес в технике, этому условию не удовлетворяет. Так, например, этому условию не удовлетворяют функции F(x) = ax\ F(x) = signx и т. д. Для того чтобы выразить 2(t) и Kz(t\, t$ через характеристические функции Е(и) и Е (щ, щ), в этом случае иногда заменяют преобразование (9) более сложным преобразованием, в котором интегрирование выполняется в плоскости комплексного переменного
§ 35| ПРИВОДИМЫЕ НЕЛИНЕЙНЫЕ СИСТЕМЫ 6 JJ (см., например, [11]) по контуру, выбранному так, чтобы интеграл имел смысл. Произведя и в этом случае обращение интеграла (9) и подставив результат в G) и (8), мы получим формулы, отличающиеся ог A3)~и A4) тем, что интегрирование выполняется по соответствующему контуру. Однако этого искусственного приема часто можно избежать, если интеграл A0) рассматривать как главное значение этого интеграла. Получающаяся при этом функция ср (w) в этом случае будет являться так называемой обобщенной [6] функцией (подобно тому как обобщенной функцией является введенная в § 10 дельта-функция), однако формулы (9), A3) и A4) останутся без изменения. Этот прием, которой для одного частного случая был в свое время использован еще А. А. Марковым, оказывается особенно удобным при анализе существенно нелинейных звеньев. Пусть, например, F[X(t)] = sign X(t), C5.16) Т. v II при х>0, 0 при х = 0, C5.17) —1 при Рассматривая дельта-функцию Ь(х) как производную от функции F (х) и повторяя рассуждения, которые были приведены в § 10 при выводе формулы A0.32), получим 00 \ «**«$. C5.18) Последний интеграл, известный в анализе как интеграл Дирихле, был получен задолго до построения теории обобщенных функций. Этот интеграл будет взят за основу при исследовании существенно нелинейных звеньев. Возвращаясь к формулам A3) и A4), в данном случае получим - 00 = ± j E(u) f, C5.19) Км ('1. Ч) = - i \ J Е (и„ )—^- - 2 (т,) z Ы. C5.20) Аналогичный подход применим и при рассмотрении существенно нелинейных звеньев более сложной структуры.
Л26 нелинейные методы теории случайных функций (ГЛ. VI Рассмотрим, например, нелинейное звено, характеристика которого изображена на рис. 24, б, которое соответствует управлению по принципу «да — нет» с зоной нечувствительности. Обозначая характеристику этого звена через Ft(X) и сохраняя обозначение F(X) для характеристики звена, определяемого формулой A7), легко убедиться, что F(x-b) N -ъ о 1 C5.21) Действительно, прибавление b к аргументу функции F (х) сдвигает график функции F (X) влево на отрезок bt а вычитание из аргумента b приводит к сдвигу графика вправо на эту же величину (рис. 28). Суммирование ординат этих графиков, как ясно из рисунка, дает характеристику, отличающуюся от Fi(jc) только множителем 2. Подставляя в B1) интегральное представление A8), после объединения интегралов получим Рис. 28. JL Рассуждая примерно таким же образом, можно выразить через F(X) и характеристику F*(X), изображенную на рис. 24, в. Действительно, беря в формуле B1) вместо суммы разность, получим функцию 1 т/1, . ,v г^л, щ^ C5.23) равную единице, если \Х\<^Ь, и равную нулю во всех остальных случаях. Следовательно, умножив B3) на Х> получим среднюю часть характеристики F%(X). Прибавив к полученному таким образом результату Fi(X)f получим всю характеристику Fv(X), т. е. ^ b)}> C5.24) что с учетом B1) и A8) дает сю = Л [ eittX (cos ub + iX sin ub) —. C5.25)
§ 351 ПРИВОДИМЫЕ НЕЛИНЕЙНЫЕ СИСТЕМЫ 327 Интегральное представление B5) также позволяет выразить моменты функции Z(t) = Fi[X(f)] через характеристические функции ординат случайной функции X (t)y однако в отличие от A9) и B0) под знаком интеграла будут не только характеристические функции Е(и) и ?(«!, и9)> н0 и их производные. Действительно, подставив, например, в G) вместо F(x) B5), получим z(t) = ~ { {М (eittX) cos ub -f М AХешх) sin nb\d~. C5.26) — оо Учитывая A2), имеем = \ eiuxfx(x)dx = E(u\ C5.27) — 00 оо М [IX@ «<«*«] = A J ei«xfx{x)dx== дЁ^1, C5.28) — 00 Следовательно, вместо B6) можно написать оо 2 @ = 1 jj [? (и) cos к» + -^ sin и*] ^. C5.29) — ОО Выполняя аналогичные выкладки, корреляционную функцию zi^v ч)> определяемую равенством (8), можно представить в виде g (xt, т2) = — ^з \ \ [Я (mj, м2) cos uxb cos м2^ + — 00 -|—^) cos wi^ sin и«* Н а« Sln Wl cos M<2 "^ ^-'-^fer1 sin и*sln Ч^-'ws(^ C5-30) Комбинируя соответствующим образом функции F (X) при различных значениях аргументов, для характеристики Fz (X) (рис. 24, г) получим C5.31) Подставляя и в этом случае вместо F(X) A8), получим для характеристики нелинейного звена F%(X) интегральное представление, используя которое можно выразить моменты функции z(t) = F[X (t)J
328 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. VI через характеристические функции ординат случайной функции X (t) и их производные. Аналогичным образом могут быть вычислены моменты выходного сигнала и других существенно нелинейных безынерционных звеньев. Если безынерционное звено имеет характеристику F [X (?)]> являющуюся непрерывной функцией своего аргумента X(t), моменты функции Z(t) = F[X(t)] часто могут быть выражены через моменты ординат функции X (t). Действительно, предположим, что функция X{f) разлагается в ряд Тейлора около точки X(t) = X(t), сходящийся во всей области изменения ординаты случайной функции X(f). В этом случае получим где -г-, -pg и т. п. сокращенно обозначают производные от функции F[X(t)] по Ху в которых после дифференцирования положено Находя математическое ожидание обеих частей равенства C2), получим 2(t) = F[X«)) + ^H[X(t)) + ^H[X(t)} + ..n C5.33) где [ху [X (t)] обозначает центральный момент ординаты функции X (t) порядка /. Для получения корреляционной функции Kz(*v тз) нужно написать формулу C2) дважды — сначала для аргумента t = т1э а потом для аргумента ^ = т2. Перемножив затем левые и правые части написанных выражений и находя математическое ожидание полученного равенства, получим со 2 %1Ш^1[Х{ч)> Х{ч)] Ж> C5'34) где Таким же образом могут быть найдены моменты Z(t) и более высокого порядка. В том случае, когда входной процесс является нормальным, для моментов ординат выходного процесса может быть получен ряд, содержащий только моменты первого порядка выходного сигнала, но вычисленные с весами, роль которых играют полиномы Чебышева — Эрмита.
§ 35| ПРИВОДИМЫЕ НЕЛИНЕЙНЫЕ СИСТЕМЫ 329 Рассмотрим этот метод на примере вычисления корреляционной функции выходного сигнала безынерционного нелинейного элемента Согласно общей формуле имеем ЭД x* — z(*zx)z (т2), C5.36) — оо где f{X\i jc2) — двумерная плотность вероятности ординат A'(tj) и X (т.2) входного случайного процесса. По условию этот закон нормальный» и следовательно, его характеристическая функция может быть записана в виде ?(Й1э ,/j = tf-41«^-4,eS/2+tei*i+lBii.e-eJf,e*,ViIliJ C5.37) где через kx обозначена нормированная корреляционная функция ординат входного сигнала для моментов времени i\ и т^, т. е. ** = 0-^-**(*!» **)• C5.38) Разлагая последний множитель в C7) в ряд (этот ряд всегда абсолютно и равномерно сходится), получим Для перехода от характеристической функции к двумерной плотности вероятности f(xly х%) C9) необходимо умножить на A/4тг2)ехр(—1щх\ — ШъХъ) и проинтегрировать по их и щ в бесконечных пределах. При выполнении этого интегрирования каждое слагаемое суммы распадается на произведение интегралов одного и того же типа (/=1, 2): 2тс — 00 -7&ls S •"'"¦"'"""•'-' 1 - оо Выражение, заключенное в последнем равенстве в фигурные скобки, является одномерной плотностью нормального закона распределения с дисперсией aj и математическим ожиданием xv т. е. может быть записано в виде
330 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИИ [ГЛ. VI а его /-я производная может быть выражена в виде -=^V C5.41) где Hj(x) — полиномы Чебышева—Эрмита A8.30). Подставляя D1) в D0) и возвращаясь к формуле C9), получим искомое разложение для корреляционной функции <°x^x2)J -f nij (Zj) ntj (Z2) — 2 (t2) z (t2), C5.42) где обозначено C5.43) Перейдем к рассмотрению нелинейных инерционных звеньев, т. е. таких зависимостей между входной функцией X(t) и выходной Z(t)y при которых значение Z(t) определяется не только значением ординаты функции X (f) в тот же момент времени, но и ходом этой функции в предыдущие значения времени. В этом случае характеристика звена F[X(t)] в формуле A) уже будет не функцией, а функционалом, и вычисление моментов ординат выходной функции Z(t), как правило, усложняется. Тем не менее во многих технических задачах эти вычисления могут быть выполнены сравнительно просто вследствие особой структуры инерционных нелинейных систем. Так, например, многие нелинейные системы, встречающиеся в технике, можно рассматривать (точно или приближенно) как последовательно соединенное нелинейное безынерционное звено и линейное звено. В этом случае задача вычисления моментов выходной функции системы распадается на две задачи: вычисление моментов выходной функции нелинейного безынерционного звена и вычисление моментов выходной функции линейного звена по моментам входной функции этого звена. Обе эти задачи были рассмотрены выше. В других случаях, когда подобное представление нелинейного инерционного звена является невозможным, иногда удается подобрать для характеристики этого звена достаточно удобное интегральное представление и свести в конечном итоге задачу вычисления моментов ординат выходной функции нелинейного звена к задаче интегрирования характеристических функций ординат входной случайной функции.
§ 35} ПРИВОДИМЫЕ НЕЛИНЕЙНЫЕ СИСТЕМЫ 331 В этом отношении интересным является гистерезисное звено, характеристика которого представлена на рис. 24, д. Рассмотрим гистерезисное звено подробнее. Для получения интегрального представления характеристики ги- стерезисного звена Fg[X(t)] заметим прежде всего, что Z{f) = Fk[X(t)\ изменяет свое значение только в двух точках: при X = — Ь и X = Ь, оставаясь неизменным при любых других значениях X (t). В точке X = -\- Ь функция Z(t) имеет скачок, равный 2 при прохождении функцией X (t) этой точки слева направо, и остается без изменения, если X(t) это значение проходит справа налево; аналогичным образом в точке Х = — Ь функция Z(t) скачком уменьшается на 2 при прохождении этой точки функцией справа налево и остается неизменной в противоположном случае. Так как в точке скачка функции первого рода (изменение ординаты функции на конечную величину) ее производная равна дельта- функции, то окончательно можно записать C5.44) Функция F(x), определяемая A8), в точке х = 0 имеет скачок, равный 2, а производная этой функции равна 25 (х). Следовательно, продифференцировав обе части A8), получим оо 8(*) = 1 \ eiaxdu C5.45) — ОО (эта формула была получена в § 10 другим способом). Подставляя D5) в D4) и учитывая при этом, что согласно A8) C5.46) — оэ получим оо —~^- = —. \ eiuX [t) sin ub du -f- dt m J ' ~ 00 CO + ^ [\ eiuX «t + '•* <ft cos и& ^^. C5.47) — 00 Для получения окончательной формулы для Z(t) последнее выражение нужно проинтегрировать но L При этом необходимо учесть
332 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI начальные условия для Z(t), которые связаны с начальными условиями для X(t) следующим образом: если при ? = 0 X(t)^ — b, то Z@ = —1; если при ? = 0 X(t)^b, то Z(t)=l; если при t = 0 —b<^X(f)<^b> то Z(t) может быть равно—1 или -)-1 в зависимости от того, вошла функция X (t) в интервал (—b, b) слева или справа. Примем для определенности, что при ? = 0 X(t) = Ob а функция X{t) может попасть с одинаковой вероятностью в интервал (—b, b) как слева, так и справа. В этом случае Z(t) =A C5.48) / = о где случайная величина А с вероятностью 1/2 может равняться — 1 и с вероятностью 1/2 равняться -j- L Интегрируя D7), получим окончательное интегральное представление характеристики гистерезисиого звена dudv|Л + А C5.49) ubdu-\- 0 ' - оо Пользуясь D9), можно выразить все моменты функции Z(t) через характеристические функции ординат случайной функции X(t) и ее производной X(t). Например, находя математическое ожидание обеих частей D9), получим z (t) = 1 И \ Е (и) sin ub du + i- С J ? (и, t») ^-* им rfu | dt, C5.50) 0 0 где Е(и) обозначает характеристическую функцию случайной величины X{i), г E(iu v) — характеристическую функцию системы случайных величин X (i)vlX (x). Сравнивая формулу E0) с формулами A9) или B9), дающими значение математического ожидания выхода с существенно нелиней- * ного безынерционного звена, можно отметить, что для гистерезисного звена мы имеем усложнение формулы в двух направлениях: во-первых, вместо однократного интеграла по аргументу характеристической функции теперь имеется двойной интеграл и, во-вторых, появилось добавочное интегрирование по времени. Соответственно усложняются и формулы для моментов Z(t) более высокого порядка, однако формула D9) может быть использована при анализе нелинейных звеньев гистерезисного типа.
S 361 ПРИМЕРЫ ПРИВОДИМЫХ НЕЛИНЕЙНЫХ СИСТЕМ 333 § 36. Примеры приводимых нелинейных систем Для иллюстрации применения методов, разобранных в предыдущем параграфе, рассмотрим несколько приводимых нелинейных систем, представляющих интерес при исследовании различных механических систем, работающих под воздействием случайных возмущений. Будем считать для простоты, что входная случайная функция X(t) является стационарной и нормальной. Это последнее допущение, которое может быть принято во многих прикладных задачах, позволит просто вычислить ряд интегралов от характеристических функций и получить для первых моментов выходного сигнала простые аналитические выражения. Примеры, рассмотренные ниже, в основном относятся к механическим системам, однако эти примеры представляют более общий интерес, так как большое число чисто радиотехнических или электромеханических нелинейных систем описывается аналогичными уравнениями. Пример 36.1. В качестве первого примера рассмотрим влияние сухого трения в оси подвеса свободного гироскопа при наличии случайных колебаний платформы, на которой установлен гироскоп. Предположим для определенности, что речь идет о свободном гироскопе, установленном на корабле (или самолете) таким образом, что первоначальное направление оси ротора гироскопа горизонтально и перпендикулярно плоскости симметрии корабля (самолета). При отсутствии трения в подшипниках такой гироскоп будет сохранять направление оси ротора неизменным в пространстве и, следовательно, может быть использован как указатель направления («гироскоп направления»). Ошибка а(?) удержания направления таким гироскопом, вызванная наличием сухого трения в горизонтальной оси, в соответствии с прецессионной теорией определяется уравнением H% = MT + kslgn[X(t) + Ht)l C6.1) где И—кинетический момент гироскопа, М1 — знакопостоянная составляющая момента трения, X(t) = Q(t) — угловая скорость бортовой качки корабля, $(t) — угол, составленный осью ротора гироскопа с горизонтом, а величины И, Мт и k — постоянные. Угол крена корабля в (t), как мы неоднократно принимали в данной книге, с достаточной точностью может считаться стационарной нормальной случайной функцией, имеющей корреляционную функцию -(i sin Х|т| V C6.2)
334 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. V! Следовательно, случайная функция X (t) = в (*), также нормальная, будет иметь корреляционную функцию jJ = a9V2 + XV-M*i (cosXt — ?sin A|t|) C6.3) и нулевое математическое ожидание. Угловая скорость |3 (t) <^ Й (t). Поэтому в правой части A) $(t) может быть отброшена, и после деления обеих частей равенства на Н уравнение A) может быть переписано в виде g=tfz + /zsign[X(O], M=jf> п = ^. C6.4) Последнее уравнение характеризует приводимую существенно нелинейную систему и, следовательно, может быть исследовано методами, изложенными в предыдущем параграфе. Так как 'основной интерес в данном случае представляет влияние сухого трения, то положим т — 0 (при тф§ будет наблюдаться дополнительный постоянный уход гироскопа). Интегрируя в этом случае D), получим \ C6.5) о где Z(Q = sign [X(f)]t C6.6) а начальное значение а(^) принято равным нулю, так как нас интересует уход, накопившийся за время t Находя математическое ожидание а(?) и дисперсию D [а(?)] обычным образом, ^получим формулы, являющиеся частным случаем формул C5.5) и C5.6) ' \ C6.7) D [a @] = К* (*, 0 = п*\\ Кг (хь т2) dxx dxb C6.8) 00 где Z(f) и Kz(?\> ъ) определяются формулами C5.19) и C5.20). В рассматриваемом случае нормального стационарного процесса X(t) Е(ц) = е~ °%а2/\ Е (ц19 и,) = ехр { — °f (и? + «D — Кх (ч - tJ щщ [, C6.9)
§ 36] ПРИМЕРЫ ПРИВОДИМЫХ НЕЛИНЕЙНЫХ СИСТЕМ 335 следовательно, 2 = 0, C6.10) Кж(х% - т,) = - ? (\ е~ '>? + «Р /а " **(т* "т*> ЯЛ f^i-. C6.11) Последний интеграл легко вычисляется, если равенство A1) продифференцировать по Kxfa— *ч) как nt) параметру. Продифференцировав, получим U ^ + 2^«*»Л tfMw2 = l_*L=. C6.12) Интегрируя последнее равенство по Кх и учитывая при этом, что Kz(t) =0, получим Kz (т) = ~ arc sin kx (т), C6.13) где kx(t)— нормированная корреляционная функция случайного процесса X(t): А^(т)==4-К,(т). C6.14) Л V / Q.JJ •* \ / \ / Подставляя A3) в (8) и пользуясь тем, что корреляционная функция Kz Сч> ^) = Kz (т2 — тД выполняя одно интегрирование так же, как это было сделано при получении формулы F.35), получим окончательное выражение t D fa (*)] = ^! С у — т) arc sin А, (т) ^х = о = \ arc sin Avmat \ таге sin А^(т)ат. C6.15) Как показывает полученная формула, дисперсия ухода гироскопа направления не зависит от интенсивности качки, характеризуемой се, а определяется, помимо параметров гироскопа, степенью нерегулярности качки (параметр |х корреляционной функции /С* СО) и пРе~ обладающей частотой качки (параметр X). При достаточно большом t (т. е. при таком t} что можно считать kx(t) = O) верхние пределы в интегралах A5) можно положить равными бесконечности и для дисперсии углового ухода гироскопа направления получим П Га (fi\ ^^ n t h Dfi 1 в\
336 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. VI где о° со «о = 4^2 § arc sin kx (х) di, ft0 = ^-* С т arc sin А, (т) dx. C6.17) о' п о Рассмотрим числовой пример. Пусть бортовая качка корабля характеризуется следующими величинами, соответствующими довольно сильной качке крупного судна: оо==6°, (л = 0.042 I/сек, Х = 0,42 1/сек, а гироскоп направления характеризуется следующими параметрами: кинетический момент гироскопа //=2000 гсм сек, модуль знакопеременной составляющей момента трения & = 0,5 гсм, а интересующее нас время работы прибора ?=10 мин. Подставив эти численные данные в A7) и выполняя интегрирование численно, получим ао = О,19 (угл. минL/сек, Ь0 = 6,0 (угл. мин)\ что после подстановки в A6) для среднеквадратического отклонения ухода гироскопа направления за 10 минут дает аа\ = 11 мин. \/ = 10 мин Пример 36.2. В качестве второго примера рассмотрим влияние сухого трения в осях карданова подвеса на ошибку гировертикали, установленной на качающейся платформе (корабле, самолете). Считая, что одна из осей карданова подвеса лежит в диаметральной плоскости корабля, для углов а(?) и $(t), определяющих отклонения оси гировертикали из-за сухого трения в осях подвеса, имеем систему уравнений •АР — /#= — *! sign (W -f h C6.18) C6.19) где углы 0 (t) и ч7 (t), определяющие отклонения платформы от горизонтальной плоскости (например, угол крена и угол дифферента корабля), можно считать нормальными стационарными случайными функциями, имеющими корреляционные функции вида B) и ьезависи- мыми между собой. Угловые скорости a(t) и $(t) и в данном случае можно считать малыми сравнительно с угловыми скоростями 6 (t) и Ф (t) и переписать последние уравнения в виде 4Р _ /Я = —A, sign [чТ @], C6.20) J& + f$ = k2 sign [в @]. C6.21) Полученная система отличается от уравнений, рассматривавшихся в предыдущем параграфе, в двух отношениях: во-первых, здесь мы
§ 36| ПРИМЕРЫ ПРИВОДИМЫХ [.ЕЛИПЕЙ ibIX СИСТЕМ 337 имеем дело не с одним уравнением, а с системой и, во-вторых, в данном случае имеется не один случайный вход, а два: 0 (t) и ч7 (t). Тем не менее исследование подобных динамических систем может быть выполнено примерно теми же методами, что и в предыдущем примере. В данном случае решение задачи упрощается еще и тем, что путем введения в рассмотрение линейной комбинации искомых функций а (О и [3@ систему уравнений B0) и B1) формально можно свести к одному уравнению первого порядка. Действительно, введем обозначения *а @ = 6@* b b тогда система уравнений примет вид W + ift^*¦ VVsign №@1 • C6.24) Умножив B3) на //]//>> а B4)— на l/Vq, после суммирования полученных результатов будем иметь ^Ж- -iX^Jr=-Ui slZn Iх* @1 + ** sign [X% (t)l C6.25) где C@=-5-a@ + /r^P@. C6.26) Уя УР Решением уравнения B5) при нулевых начальных условиях будет С (Q = jM [еа «-'«'- 1 ]{ х, sign [X, (t,)} - ht sign [Xt (t,)} } dtv 0 C6.27) Интеграл B7) распадается на сумму двух интегралов, каждый из которых зависит только от одной случайной функции. Поэтому нахождение моментов ординат случайной функции С@ может быть выполнено таким же образом, как и в предыдущем примере, и не влечет за собой добавочных трудностей. Нахождение математического ожидания обеих частей B7) вследствие того, что ху = х.1 = 0, дает С @ = 0. C6.28)
338 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИИ | ГЛ. VI Так как по определению B6) С @ имеет вещественную и мнимую части, то равенство B8) означает, что обращается в нуль как математическое ожидание вещественной, так и математическое ожидание мнимой части, т. е. О. C6.29) Для нахождения дисперсий углов а(?)и C(f) удобно сначала найти математические ожидания |С@|2 и [С@]2> а затем воспользоваться соотношениями, являющимися следствием B6): j D [а @] + j D [р @] = М {| С @ П. C6.30) } D la (t)} - у D [р @1 = | М {[С (t)f + [С* (*)]• }• C6.31) Математические ожидания, стоящие справа в C0) и C1), для нормальных случайных процессов Х\(t) и X^(t) могут быть вычислены тем же методом, который был подробно рассмотрен в примере 1. В результате вычислений получим _|_JL[sin Хт— sin l(t — z)— sin X { *2 arc sin h (x) + xf arc sin kx (т)} d% C6.32) X X { A arc sin &2 (x) — xf arc sin kx (x)} diy C6.33) где через ^i(x) и &2(х) обозначены нормированные корреляционные функции случайных функций Как показывают формулы C2) и C3), и в данном случае при большом времени t работы системы дисперсии угловых ошибок гировертикали становятся линейными функциями времени и, следовательно, среднеквадратические ошибки углов а(?) и §(f) при большом t примерно пропорциональны ]/"t. Пример 36.3. В качестве последнего примера рассмотрим вычисление первых двух моментов случайного процесса на выходе детектора при условии, что на его вход поступает нормальный стацио-
§ 361 ПРИМЕРЫ ПРИВОДИМЫХ НЕЛИНЕЙНЫХ СИСТЕМ 339 нарный процесс, характеристики которого х и Кх(х) известны Будем считать, что детектор пропускает без искажения ординаты случайного процесса X(t), превосходящие заданную величину а (уменьшенные на а), и не пропускает сигнала, если X(f)<^ay т. е. будем считать, что детектор пропускает часть реализации случайного процесса выше уровня а. В этом случае уравнение нелинейного звена может быть записано в виде Y a]} C6.34) или, с учетом формулы C5.18), -а]+ 5 ^p{[()]}[f)] C6.35) Так как начало отсчета ординат случайного процесса X (t) можно выбрать произвольно, то будем считать х = 0, т. е. выберем центр закона распределения X (t) за начало отсчета. Находя математическое ожидание обеих частей равенства C4) и учитывая при этом, что в рассматриваемом случае нормального случайного процесса М [е*«х <')] = Е (и) = е-4«2/2, C6.36) М [X @ eiaX{/)} = \ ^р- = шо%е- 4«2/2, C6.37) получим оо 9 со 2 @ = — -j п—^ f е- 4«3/2- iau d± ^_ g f e- 4«2/2 - iau du_ C6.З8) — 00 Последний интеграл вычисляется сразу и равен -^— ё~ a2/2<J*t для вычисления первого интеграла достаточно заметить, что ОО 00 да J — ОО C6.39) Следовательно, интегрируя C9) в пределах от 0 до а и учитывая при этом, что при а = 0 интересующий нас интеграл обращается в нуль вследствие нечетности подынтегрального выражения, получим оо f ld± (±\ т C6.40)
340 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. VT Подставляя D0) в C8), получим окончательное выражение для математического ожидания случайного процесса, поступающего с выхода детектора: ±[{±)]^—\ C6.4.) т. е. математическое ожидание выходного процесса является постоянной, однако отличается от математического ожидания входного процесса Для определения корреляционной функции /С^Сч, т2) применим обычный прием, т. е. перемножим ординаты Z(tj) и Z(t2), определяемые C5), и найдем математическое ожидание полученного произведения. В результате будем иметь оо + L |j М К*, _ а) (*, - а) е- ш (в**, + е*"*)) Ц - — С» ОО М K*i — «)№ — а)г(«1»|+«'^1^+'»А]^, C6.42) — ОО где для краткости обозначено Хх = X (tj), Х% = X (т3), Кх = К^ (т3 — Учитывая, что М K-Yi — а)(Х* — 5 -f- ia) (о%щ -f- Kxii\ -f- ia)] X X* xK l *' x l 2 ^ ! 2;' C6.43) M l№ — a) (X.2 — a) e/M ^2 - a)] — = [К, — (oi« + ia) (Kxii + /a)J б " °2^ «^ - ™»> ^36'44) получим 1 — oo oo — oo - 2/a (aj 4- /f J и, j ^^- -1\ C6.45)
S 37| НЕЛИНЕЙНЫЕ СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ 34 Г Однократный интеграл в D5) распадается на два^ элементарных интеграла и на интеграл, тождественный с D0). Двойной интеграл распадается на четыре интеграла, из которых два вычисляются сразу, а в двух других интегралах просто выполняется интегрирование по и,. При а = 0 формула D5) упрощается, и мы получим Формула D5) показывает, что Z(t) имеет не только постоянное математическое ожидание, но и корреляционную функцию, зависящую только or разности т = т9— tj. Следовательно, Z(t) стационарна в> широком смысле. § 37. Нелинейные системы с обратной связью Исследование динамических систем, содержащих нелинейные звенья, охваченные обратной связью, представляет значительно более сложную задачу, чем исследование нелинейных систем, рассмотренных в §§ 35 и 36. Существенное усложнение, которое возникает в этом случае, связано с тем» что для таких систем, как правило, не удается записать явную аналитическую зависимость выходного сигнала от поступающего на вход системы случайного возмущения. Поэтому даже вычисление первых моментов выходного сигнала представляет существенные трудности, для преодоления которых применяют различные приближенные методы. Приближенные методы, используемые для исследования подобных, систем, могут быть разбиты на три группы: а) методы, основанные на разложении по степеням малого параметра или нелинейных выражений, входящих в уравнения системы, или выходной функции системы; б) различные методы последовательных приближений; в) методы, основанные на применении теории марковских процессов. Рассмотрим первые две группы методов, оставляя рассмотрение применения марковских процессов при исследовании нелинейных систем до § 39. Разложение по степеням малого параметра применимо в том случае, когда случайные возмущения можно считать в определённом смысле слова «малыми». Расчетные формулы, которые удается получить этим методом, оказываются тем более простыми, чем меньше параметр, по которому ведется разложение. В смысле реализации этого метода следует различать случай, когда по степеням параметров разлагаются нелинейные выражения, входящие
?Л2 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. VI « уравнения системы, и случай, когда используется разложение самого решения уравнения. Рассмотрим оба эти случая отдельно. Пусть уравнение системы будет C7.1) где L — линейный оператор, F[Z(t)] — нелинейный безынерционный элемент, а X (t) — случайная функция, характеристики которой предполагаются известными. Структурная схема системы имеет вид, представленный на рис. 29. Рис. 29. Предположим, что нелинейный элемент имеет характеристику F[Z{t)\ являющуюся непрерывной функцией своего аргумента. Будем считать отклонение случайной функции X(t) от ее математического ожидания малой величиной, понимая под «малостью» возможность разложения F[X(t)~\- Y(t)] в ряд Тейлора по степеням [X(t) — X(t)] и [Y(t)—y{t)\ Для получения необходимого разложения представим X(t) в виде X @ = х it) + v [X (t) - X (t)l C7.2) где искусственно введенный коэффициент v в окончательных формулах нужно будет положить равным единице, а при разложении всех функций по степеням v этот коэффициент следует считать малой величиной. Смысл подобного искусственного введения параметра v состоит в том, что показатель степени v в получаемых далее разложениях будет указывать на порядок малости соответствующего слагаемого сравнительно с разностью [X(t) — X(t)]> которую мы будем считать малой первого порядка. Если предположение о «малости» этой разности справедливо, то в сумме, содержащей слагаемые с различными степенями v, слагаемые с более высокими степенями могут рассматриваться как малые более высокого порядка и могут быть отброшены. {Предположение о малости [X (t) — х (Щ как раз и означает, что подобный образ действия является допустимым.) При подстановке B) в A) мы получим уравнение, содержащее «малый» параметр. Поэтому естественно искать решение Y (t) этого уравнения в виде разложения по степеням этого параметра, т. е. положить У @ = Л @ + v К, @ + v* Y, @ +... C7.3)
$ 371 НЕЛИНЕЙНЫЕ СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ 343 Подставляя B) и C) в A) и разлагая F [X (t)-\-Y (t)] по степеням v, получим = F [X (О +Д @1 + vF' [X (t) + у0 (t)} [X (t) - + v5 {/* [X (t) + j0 @1 K, @ + у F' [JC @ +^o @1 X X [X (Q -X(t)+ K, (f)]4} + v3 {Г [Л (t) +У» (t)} V3 (t) + + F" [X (t) -\-y0 (t)) [X (t) - * (Q + Yy (t)} K3 @ + 4 ^o @] [A" @ - X (t) + K, (<)]3} +..., C7.4> где под F(;) [JP(O +Л@1 понимается производная от функции /=|Х @+ Y(t)] по ее аргументу, взятая в точке Приравнивая между собой члены в левой и правой частях равенства, содержащие параметр v в одинаковой степени, получим серию- последовательно связанных между собой уравнений t)l C7.5> [L -F(X + у»)] Yx (t) = F [x (t) + y« (t)] [X @ - x (*)], C7.6} IL — F (x + л)] ^ @ = у p" I* it) +-Vo @] [X it) — x (t) -f rt @]2, C7.7). Уравнение E) является нелинейным, однако его решение не сопряжено с принципиальными трудностями, так как это уравнение не содержит случайной функции X (t). Функция у0 (t) является «числовой» (не случайной) функцией времени и может быть найдена числовыми методами анализа. Остальные уравнения полученной бесконечной системы содержат случайные функции, однако являются линейными относительно искомых функций, причем в каждое следующее уравнение входит только одна новая неизвестная случайная функция. Начальные условия при решении этих уравнений можно считать нулевыми, удовлетворив начальные условия для yQ при решении уравнения E). Поэтому последовательное определение любых моментов ординат этих функций может быть выполнено общим методом, изложенным в § 34 для линейных систем. Рассмотрим для примера, как получить первые и вторые (корреляционные функции и корреляционные функции связи) моменты ординат функций Y\it) и Yq(t).
344 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ |ГЛ. VI Для этого перепишем уравнения F) и G) в виде t У, @ = \ h (t, О F [X (х) + у0 (х)] [X (х) - X (х)] dx, C7.8) О t Y% (t) = 1 jj /, (t, т) F" \X (x) + y0 (x)] [AT (x) - X (x) + K, (x)]* rfx, C7.9) 6 где /j(t, т) — функция веса линейных уравнений F), G) и т. д., т. е. функция веса, соответствующая линейному оператору U = L-F'lX(t)+yo(t)]. Применяя к (8) операцию нахождения математического ожидания, шлучим г Pi V) = $ h it, x) F' [X (x) + y0 (x)] [X (x) - X (t)] dx = 0. C7.10) 0 Умножая (8) на X1(xi) — ^(tj) и снова находя математическое ожидание обеих частей равенства, получим t Ryix (*, х,) = 5 /j (t, x) F' [X (x) + .>/, (x)l /^ (x, Tj dx. C7.11) 0 Находя математическое ожидание (9), получим П @ = \ h V, т) Г [X (х) + yQ (т)] [Ryv х (т, т) +1 /^ (х, х) Продолжая этот процесс далее, можно вычислить любое число моментов функций К/ @, причем каждый раз в равенство, определяющее следующий момент, будут входить только моменты, определенные предыдущими равенствами. Возвращаясь к равенству C) и полагая v=l, получим возможность выразить выходную функцию рассматриваемой системы через сумму случайных функций, необходимое число моментов которых может быть определено: к(9=л(9+Г1(')+М0 + --- C7.13) Формула A3) позволяет определить необходимое число моментов У (t)*)y и, следовательно, с любой степенью точности определить закон распределения Y(t). *) Считаем, что эти моменты существуют.
§ 371 НЕЛИНЕЙНЫЕ СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ 345 Действительно, применяя к A3) операцию нахождения математического ожидания, получим Я0=л(')+Л@+Л@ + .-- C7Л4> Применяя к G) операцию нахождения дисперсии, будем иметь ..и C7.16) где через kjt(t) обозначены корреляционные моменты случайных величин Yj(t) и К,@ (/, /=1, 2, ...). Таким образом, задачу определения вероятностных характеристик случайной функция, получаемой на выходе нелинейной системы с обратной связью, формально можно считать решенной. Однако, для того чтобы ряд A3) действительно являлся решением поставленной задачи, необходимо, чтобы он сходился при всех значениях t, которые нас интересуют, т. е. необходимо, чтобы функции Yj (t) достаточно быстро убывали с ростом индекса у. Теоретическое доказательство сходимости этого ряда обычно бывает сопряжено с большими трудностями, однако при практическом использовании изложенного выше метода, как правило, можно довольствоваться установлением факта достаточно быстрого убывания моментов случайных функций Yj(t) с ростом номера у. В том случае, когда в ряде C) или A3) оказывается достаточным удержать только первые два слагаемых, метод разложения но степеням малого параметра сводится к обычному методу линеаризации. Применение этого метода будет рассмотрено в конце данного параграфа на конкретных примерах (примеры 1 и 2). Рассмотренный выше метод разложения по степеням малого параметра применим только в том случае, когда нелинейные функции, входящие в уравнение системы, допускают разложение в ряд Тейлора, т. е. когда в системе нет существенно нелинейных звеньев. Когда такие звенья имеются, иногда с успехом может быть использован метод, основанный на разложении по степеням малого параметра решения нелинейного уравнения. В отличие от рассмотренного выше метода, в этом случае в уравнении A) уже не предполагается, что характеристика нелинейного звена F[Z(t)] является дифференцируемой функцией своего аргумента. Рассмотрим применение этого метода сначала s частном случае, когда входом в рассматриваемую систему является не случайная функция, а случайная величина V, т. е. уравнение A) имеет вид LY(t) = F[V,t, Y(t)\ C7.16) Решение этого уравнения зависит от значения случайной величины V как от параметра, т е. » C7.17)
346 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. V! где срA/, t), как правило, уже является непрерывной функцией своих аргументов, так как наличие линейного оператора L сообщает системе известную инерционность, сглаживающую скачкообразные изменения функции F[V,t, Y{t)\ Приняв допущение непрерывности <рA/, t) относительно V и считая отклонение V от ее математического ожидания v величиной «малой» в том смысле, что в разложении функции ср в ряд Тейлора около точки V=v можно ограничиваться небольшим числом первых членов, лолучим a^I |^i|^(K-^ + ...> C7.18) где символом -р сокращенно обозначено ^ t)=yo(t), _ по смыслу обозначения A7), является решением уравнения A6) при замене V= ю. Формула A8) может явиться исходной при получении различных расчетных формул для вычисления моментов ординат функции Y(t). Так, в методе, предложенном Б. Г. Доступовым [17], для определения производных, входящих в A8) в качестве коэффициентов у случайных величин, используется следующий искусственный прием. Предположим, что мы хотим ограничиться в разложении A8) только первыми тремя членами ряда. Тогда для определения двух неизвестных производных -р и ~ достаточно решить уравнение A6) трижды: один раз заменяя V на v, второй раз заменяя V на (?>-{-&i) и> на" -конец, заменяя V на (tj-j-a2), где аг и а2 — произвольные, но достаточно малые параметры. Действительно, обозначив последние два решения >'i@ и j/2@> B соответствии с A7) получим Ух @ = ?(*> + *i> % У'в @ = ?(*> + *» Ъ Уо @ = <Р № 0- C7.19) Разлагая правые части равенств A9) в ряд Тейлора и ограничиваясь только первыми тремя членами, после простых преобразований лолучим %Wk C7-20) з!+т"»0=i ^ (*>-*<*>]• C721) Решая систему уравнений B0), B1) относительно ^| и ^, получим значения искомых производных как функций времени И2? „ - а, Ь>, @ —J>» @1 + «1 \У% (t) -Уо @1 П7 94^ ^=2 ( }
^ 37) НЕЛИНЕЙНЫЕ СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ C47 Формулы B2) и B3) содержат произвольные параметры at и а> от которых -р и -р|, по смыслу задачи, не должны зависеть. Эта зависимость в действительности и является кажущейся, так как если выбрать aj и оц достаточно малыми, то результат не будет чувствителен к их изменению. Таким образом, получим следующий практический прием выбора постоянных ах и а2: значения этих постоянных должны быть выбраны так, чтобы, например, при уменьшении их вдвое выражения B2) и B3) не менялись. Очевидно, что для того, чтобы можно было пользоваться первыми тремя членами в ряде Тейлора, необходимо выбирать ах и а2 достаточно малыми, а в этом случае в формулах B2) и B3) в числителях возникает разность близких между собой чисел. Поэтому для получения приемлемого по точности результата все расчеты, в том числе и нахождение Уо(()г V\it) и y%(t)j необходимо вести с большой относительной точностью, что при использовании цифровых электронных вычислительных машин обычно не вызывает затруднений, но при ручном счете может существенно осложнить расчет. Возвращаясь к равенству A8), коэффициенты которого теперь следует считать известными величинами, можно получить все необходимые моменты ординат функции Y(f). Так, например, для математического ожидания Y(t) получим |S C7<24) Для корреляционной функции Ky(tv t%) будем иметь l\y(h> h) — —gg gg—°v~^[~~dd W Г . C7-25) Метод Доступова, идея которого изложена выше, применим не только в том случае, когда входным случайным возмущением является случайная величина, но и тогда, когда на вход динамической системы поступает случайная функция времени. Расчетные формулы для этого случая приобретают более сложный вид (см. [17]), однако их применение является вполне возможным, если для производства расчетов использовать цифровые электронные вычислительные машины. При выборе окончательных расчетных формул в методе Доступова за исходное принята формула A8), являющаяся разложением функции ср (V, 0 в ряд Тейлора по аргументу V. Такое разложение в случае, когда разность (V—г;) можно считать «малой» величиной, обычно дает достаточно хороший результат при небольшом числе удерживаемых в ряде Тейлора членов.
y.Ah НЬЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИИ (Л. VI Однако ряд Тейлора при аппроксимации функции, аргумент ко- юрой меняется в заданном интервале, не является наилучшим. Поэтому точность окончательных формул можно повысить, если вместо формулы A8) за исходное выражение для получения расчетных формул взять ряд, дающий наименьшую ошибку (в определенном смысле этого слова) в области возможных значений разности (V—v). Полученные таким образом формулы при одинаковом числе удерживаемых членов ряда будут давать ббльшую точность и оказываются пригодными и в том случае, когда ряд Тейлора при V=v расходится (например, когда -г? = оо). Перейдем к рассмотрению приближенных методов, основанных ла метоле последовательных приближений. По-прежнему рассмотрим систему, описываемую уравнением LY(t) = F[X(t)+ Y(t), t\ C7.26) где L — линейный оператор, a F [X (/) -\- Y{t), t) — характеристика нелинейного безынерционного элемента, который может быть и су- .щесгвенно нелинейным. Предположим, что законы распределения любого числа ординат входной случайной функции X (t) известны, и поставим себе цель определить необходимое.число моментов ординат выходного процесса Y(t). Для решения этой задачи пренебрежем сначала в правой части {26) Y(t), обозначив Z0(t) = F[X(f), t] и соответствующее этому приближению значение функции Y(t) через Y\(t), т. е. положим L К, (t) = Zo 0), Zo @ = F[X (t), t). C7.27) В этом приближении система теряет все особенности системы с обратной связью, и для определения моментов Y\ (l) достаточно вычислить моменты соответствующего порядка функции Z0(t) и воспользоваться формулами § 34 для линейных систем. Так как все законы распределения случайной функции X(t) предполагаются известными, то вычисление моментов Z0@ не связано с принципиальными трудностями. Например, j*o(Q= \F[x, t]fx(x)dx; KZQ(b> Ч> = —00 00 = l]F(xt, ъ)Р(х* xjfAxv x^dxidxt — г,(^J,(т,) C7.28) —00 И Т. Д. Подставив найденные таким образом моменты правой части B7) & C4.21), C4.22), получим необходимое число моментов функции Y\(t),
§ 37! НЕЛИНЕЙНЫЕ СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ 349 т. е. выходной функции Y(t)y найденных в первом приближении Обозначим Z1(t) = F[X(t)+Y1(t), t]. C7.29) Любой момент ординат функции Zi(t) может быть найден с необходимой точностью, так как моменты X (t) известны (известен закон распределения ординат функции X (t))> а моменты ординат Y\ (t) могут быть найдены, как это было показано выше. Следовательно, закон распределения [X(t)-\- Y\{t)} можег быть найден с необходимой точностью, а поэтому могут быть определены и моменты Z\ (t) по формулам, аналогичным B7). Найденные таким образом моменты Z\(f) могут быть подставлены в формулы C4.21) и C4.22) для нахождения моментов Y{t) во втором приближении и т. д. Если процесс последовательных приближений сходится, то, начиная с некоторого шага, моменты выходной случайной функции в двух последовательных приближениях практически перестанут отличаться друг от друга и на этом решение -задачи можно будет считать законченным. Получение общих признаков, доказывающих сходимость метода последовательных приближений, представляет большие трудности. Однако практически о сходимости этого метода судят по изменению числовых значений моментов, получаемых в следующем приближении. Очевидно, что чем меньше ожидаемая дисперсия Y(t) сравнительно с дисперсией X(t), тем больше оснований предполагать, что метод последовательных приближений дает сходящиеся результаты и тем меньше шагов потребуется для получения достаточной точности. Очевидно, что каждое следующее приближение требует более громоздких вычислений. Поэтому данный метод практически удобен только в том случае, когда удается ограничиться одним-двумя приближениями. Рассмотрим примеры применения методов разложения по малому параметру. Пример 37.1. В качестве первого примера рассмотрим учет нелинейности закона сопротивления воды в теории бортовой качки корабля. Обозначим угол крена корабля в (t) и примем, что момент сопротивления бортовой качке может быть выражен двухчленной зависимостью (см. Павленко Г. Е., Качка судов, Трансиздат, 1935) Тогда уравнение бортовой качки прямостенного судна примет вид *§ + 2* f + *е + v (gy = #х @. C7.30)
350 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИИ (ГЛ. VI где /г, k и v — постоянные, X (t) — стационарная случайная функция, определяющая значение угла волнового склона, которую будем считать нормальной, а корреляционную функцию известной (х = 0). Коэффициент v в уравнении можно считать «малой величиной», поскольку линейная теория качки корабля в основном правильно описывает поведение корабля на волнении. Поэтому применим метод разложения искомого решения 9 (t) по степеням v, положив в (t) = в0 @ + v Qt (t) + v*e, @ + v393 (t) +... C7.31) Подставляя C1) в C0) и поступая так же, как при выводе уравнений E), F), G), получим 2* ^>+ *'в, = *•*(<), C7.32) C7.зз) Ф. C7-34) Уравнение C2) линейно и содержит в правой части равенства нормальную случайную функцию X(t). Следовательно, во(?) также нормальна и полностью определяется ее спектральной плотностью \ + + \ В правой части уравнения C3) стоит функция Y{t)—~\-w) • которая уже не является нормальной, однако моменты любого порядка этой функции могут быть найдены, поскольку ёо(?)—нормальная функция, спектральная плотность которой (оа5в0 (<*>) определяет полностью все законы распределения ординат этой функции (см. § 13). Для спектральной плотности ®i(t) из C3) получим Для нахождения взаимной спектральной плотности «Уе^ («)) умножим обе части C3) на 90(?.2) и, учитывая стационарность функций 90(?) и 9j(?), после простых преобразований получим *^°1е0 W с^З _|_ ^2 _[_ 2lh(x) * Если ограничиться корреляционной теорией, то определением спектральных плотностей &0 («>). 59х(со) и 5e,80 (w) заканчивается решение
§ 37] НЕЛИНЕЙНЫЕ СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ 351 задачи в первом приближении, так как, сохраняя в C1) первые дна слагаемых, для спектральной плотности в (t) получим Sb М = Ао (о)) + vSMo (со) + vSMl (о)) + v*S8l (о)). Если точность первого приближения недостаточна, то необходимо определить достаточное количество моментрв ординат случайной функции 9j (t) для нахождения приближенного выражения плотностей вероятности ординат этой функции, необходимых для вычисления моментов правой части уравнения C4). Записав для этой цели решение уравнения C3) в виде (см. 7.22) =1С *-*«-> [_ f^-W sin co0 (t — x) dx, <«0 = V Aa — h\ дальнейшие вычисления нужно вести по формулам, аналогичным A0) и A1), в которых весовая функция /(х) в данном случае равна — е~кх sin <vc. Пример 37.2. Определить дисперсию случайной функции a (t), если g = /isign[X@ + a@], C7.35) где X(t) — нормальная стационарная функция с нулевым математическим ожиданием и известной корреляционной функцией, а а(^) можно считать «малой» сравнительно с X (t). Уравнение C5) содержит существенно нелинейное выражение sign [X (/)-}-a (?)], и следовательно, непосредственное разложение этой функции по степеням малого параметра является невозможным. Поэтому применим метод последовательных приближений. В примере 36.1 было рассмотрено уравнение C6.4), отличающееся от C5) отсутствием в правой части равенства a(f). Поэтому использованное там выражение для a (t): t 00 0 —oo можно рассматривать как первое приближение при решении рассматриваемого примера. Определим приближенное выражение для плотности вероятности ординаты случайной функции (f), C7.37) используя для этого выражение C6).
352 НЕЛИНЕЙНЫЕ МЕТОДЫ 1ЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI Находя математическое ожидание C7), получим j/ = 0. Для корреляционной функции /Су ft, t^) получим Ку ft, U) = Кх (U - U) + Кл ft, *,) + /?л ft, Ь) + Я ах ft, ^)- C7.38) Выражения для Ka(tv tt) и /?*aft, f8) могут быть получены из C6) таким же способом, как в примере 36.1 была получена Dfa(/)]. Если вследствие малости a(t) можно считать, что закон распределения Y(t) мало отличается от нормального, то для получения D[a(?)] во втором приближении достаточно Ky(t\> х9) из C8) подставить в C6.11) н C6.8) вместо /С*(т2 — Ti)« Если а@ настолько велико, что Y(t) уже нельзя считать нормальной, то необходимо, исходя из первого приближения для а(/), даваемого формулой C6), определить моменты более высокого порядка для Y(t) и в формулу (9) вместо характеристической функции нормального закона распределения подставить приближенное значение характеристической функции ординат Kft), Y(L), вычисленной с учетом необходимого числа моментов этих ординаь Очевидно, весь расчет при этом существенно усложняется. § 38. Метод статистической линеаризации К методу последовательных приближений, рассмотренному в предыдущем параграфе, непосредственно примыкает метод статистической линеаризации [17], [38], отличающийся, однако, от него тем, что метод статистической линеаризации не дает последовательного уточнения характеристик исследуемой системы, а дает искомые характеристики системы только в первом приближении. Идея метода статистической линеаризации состоит в том, что вместо нелинейного выражения F[X(f)]> входящего в уравнение системы, подбирается такое линейное выражение [a (t) X (t) -\- b (t)], которое является в каком-то смысле слова эквивалентным исходному нелинейному выражению. Так как воздействие выхода нелинейного элемента F[X(t)] на выход рассматриваемой нелинейной системы в основном определяется первыми моментами ординат функции F[X(f)], то следует ожидать, что ошибка, возникающая при линеаризации, будет тем меньше, чем лучше будут совпадать первые моменты нелинейного выражения F [X (t)] и линейной функции aX(t)-\-b. Так как при уравнивании этих моментов мы располагаем только двумя функциями a(t) и b(t), то добиться полного совпадения этих моментов даже в рамках корреляционной теории не удается и приходится довольствоваться различными приближениями, выбор которых в известном смысле произволен.
38] МЕТОД СТАТИСТИЧЕСКОЙ ЛИНЕАРИЗАЦИИ 353 Итак, рассмотрим два выражения C8.1) Zx it) = a (t) [X @ - Jc (t)] -f b (t) C8.2) и постараемся так определить числовые (не случайные) функции a(t) и b{t), чтобы Zt(t) «наилучшим образом» аппроксимировала Z(t) Как мы видели выше, под «наилучшим» в данном случае следует понимать, например, такое приближение, при котором наибольшее число моментов функций Z(t) и Zt(t) совпадает. Для совпадения первых моментов (математических ожиданий) необходимо выполнение равенства * (О =M{F [*(*)]}• C8.3) Оставшуюся неопределенной функцию a(t) можно выбрать, исходя из различных соображений. В первом случае (обозначим соответствующее значение функции ax(f)) исходным является требование равенства дисперсий Z{t) и Zi(t) (очевидно, уравнять корреляционные функции Kz(tv t%) и KSl(tly ?2), пользуясь функцией a(t) одного переменного, невозможно). Приравнивая дисперсии A) и B), получим ol@ej@=o5@, C8.4) т. е. ±^|, C8.5) где знак в правой части равенства должен быть выбран так, чтобы характер изменения функций Z(f)u Zx{f) был одинаковым. (Например, если Z(i) = X*(f)> то должен быть взят знак плюс, если Z(t) = = — sign X (t), должен быть взят знак минус.) Во втором случае при выборе вида функции a(t) требуют, чтобы дисперсия разности [Z(t) — Zi(t)] имела минимальное значение, т. е. определяют эту функцию (обозначим ее #а@) из условия D {F [X (*)] — а* (О [X @ — х @] — * @} = min, C8.6) которое дает "xz (*» *) Rxz \Ч /о о т\ где kxz{f) — корреляционный момент X(t) и Z(t). Функции at(t) и a2(t)) естественно, не совпадают между собой и не могут быть указаны общие соображения. в пользу того или иного метода определения a(t). Однако опыт производства расчетов позволяет делать 12 А. А. Свешников
354 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI некоторые практические рекомендации. В частности, в качестве функции а@ иногда целесообразно взять полусумму ax{f) и a^(t) ([17]) а @ = у [а3 @ + а* (*)]• C8.8) Выражения C), E) и G) могут быть вычислены, если известен закон распределения fx(x) ординаты случайной функции X(t) в момент времени L Действительно, в соответствии с общими формулами для математического ожидания имеем 2{t)= $ F(x)fx(x)dx, C8.9) —00 оо (t) = $ F*< (X) fx (x) dx - z°- (f), C8.10) —00 00 = $ xF(x)fAx)dx-Jc(tJ(t), C8.11) где плотность вероятности fx (лг) для нестационарных процессов X (t) зависит от t как от параметра. Последние три формулы показывают, что при вычислении коэффициентов a(t) и b(f)B методе статистической линеаризации нелинейных выражений используются только свойства случайной функции X(t), определяемые законом распределения ординат этой функции (законом распределения первого порядка), зависимость же между различными ординатами функции X (t) при этом не учитывается вовсе, а предполагается, что эта зависимость в какой-то мере будет учтена тем, что в аппроксимирующее выражение B) входит случайная функция X(t), Если плотность вероятности fx(x) известна, то вычисление математических ожиданий (9), A0) и A1) не представляет принципиальных трудностей как в том случае, когда характеристика нелинейного звена F(X) является непрерывной функцией своего аргумента, так и в том случае, когда эта характеристика соответствует существенно нелинейному звену. Для нормального закона распределения эти математические ожидания вычислены для типовых нелинейных звеньев и имеются в литературе [17], [33]. В том случае, когда рассматривается нелинейная система без обратной связи и аргументом X{t) функции F[X(t)] является входное возмущение, закон распределения предполагаем известным. Вычисление коэффициентов a(t) и b(t) в этом случае может быть выполнено, и если статистическая линеаризация в данном случае допустима» заменив в уравнении рассматриваемой динамической системы
§381 МЕТОД СТАТИСТИЧЕСКОЙ ЛИНЕАРИЗАЦИИ 355 нелинейное выражение A) линейной функцией B), мы тем самым сводим анализ нелинейной системы к анализу линейной системы без обратной связи. Несколько сложнее обстоит дело в том случае, когда рассматривается нелинейная система с обратной связью. В этом случае аргументом у характеристики нелинейного звена будет уже не входная функция X(t), а сумма X(f)-\- Y(t) входной и выходной функций и линеаризовать нужно уже не F[X(t)]} a F [X (f)-{-Y (f)]. Формально и здесь можно положить F [X @ + Y(t)\ = a {t) [X @ + Y(t)} + Ъ @, C8.12) однако для определения коэффициентов a (t) и b(t) теперь недостаточно знать закон распределения fx(x), а нужно располагать законом распределения суммы входной функции X(t) и выходной функции Y(f), параметры которой неизвестны и подлежат определению при анализе системы. Это затруднение обычно обходят, считая, что сумма X(t)-\- Y(t) достаточно хорошо следует нормальному закону, и используя коэффициенты статистической линеаризации, полученные для нормального закона. Выполнив необходимые преобразования, в результате получаем линейную динамическую систему с обратной связью, исследование которой производится общими методами анализа линейных систем. Подведем итоги беглому рассмотрению метода статистической линеаризации. Как ясно из предыдущего, этот метод дает простой способ исследования нелинейных динамических систем путем замены их «эквивалентными» линейными системами. Общего доказательства возможности подобной замены, так же как и оценки получаемой при этом ошибки, не существует, однако сравнение результатов, полученных методом статистической линеаризации, с результатами, получаемыми точными методами, показывает, что по многих практически интересных случаях точность метода статистической линеаризации оказывается приемлемой. Вследствие своей простоты метод статистической линеаризации в настоящее время находит широкое применение, и в подавляющем большинстве случаев себя оправдывает. Однако можно указать примеры, когда этот метод дает не только большие ошибки, но и качественно неверные результаты. Рассмотрим несколько примеров применения метода статистической /тнеаризации, показывающих как сильные, так и слабые стороны этого метода. Пример 38.1. Применить метод статистической линеаризации к определению дисперсии ошибки корабельного гироскопа направления, вследствие сил сухого трения, возникающих в осях подвеса гироскопа на качке корабля. Этот пример был рассмотрен в § 36 (пример 36.1), где для искомой дисперсии получена точная формула C6.15), которая
356 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI при большом времени работы гироскопа может бьш> заменена формулой C6.16), т. е формулой D[a@] = V — *o- C8.13) Получим выражение для D [a (t)], используя метод статистической линеаризации. Для этого в уравнении C6.4), определяющем закон изменения угла а ухода гироскопа со временем ^t = usign[X(t)] C8.14) (полагаем для простоты #г = 0), заменим нелинейное выражение Z= = sign [X (t)] линейной функцией C8.15) Подставляя A5) в A4) и интегрируя (при нулевых начальных условиях), получим а @ = па\Х (tt) dtt + nbt C8.16) о Так как в разбираемом примере случайная функция X(t) равна угловой скорости бортовой качки Х@ = в@> C8.17) то интеграл в A6) вычисляется, и мы получим а @ = па [в @ — в @)] + nbt C8.18) Применяя к последнему равенству теорему о дисперсии суммы, находим окончательное выражение для дисперсии ухода гироскопа D [а @] = 2 л3 а3 [с| — Кв (*)]. C8.19) При достаточно большом значении t можно положить /C6(f)=ae0, и последняя формула примет вид D[a@] = 2/iVa||. C8.20) Остается определить постоянную а (постоянная Ь не входит в окончательную формулу). Для определения коэффициента а применим оба указанных способа. В первом случае имеем ? -о = ±- C8.21)
> 38| МЕТОД СТАТИСТИЧЕСКОЙ ЛИНЕАРИЗАЦИИ 357 Во втором случае получим 00 • 2 f 1 2а' = -^=, C8.22) т. е. значение, примерно на 20% меньшее, чем av Формулы B1) и B2) показывают, что коэффициент а в данном случае является постоянной величиной (вследствие стационарности процесса X(f)\ Поэтому метод статистической линеаризации в соответствии с формулой B0) для большого промежутка времени t дает постоянную величину дисперсии угла а(^), в то время как точная формула показывает, что дисперсия растет со временем по линейному закону A2). Таким образом, данный пример показывает, что метод статистической линеаризации не является универсальным методом и в отдельных случаях может давать даже качественно неверный результат. Пример 38.2. Определить спектральную плотность случайного процесса Y(f), получаемого на выходе линейного звена второго порядка после окончания переходного процесса, на вход которого поступает квадрат нормального стационарного процесса X (t), если уравнение звена W + 2h Ш + **У = k*X*> C8*23) = &Г*»" (cos ^-x+ ± sin ^ili-), C8:24) где ш0 = Vk* — h\ h > О Решим сначала задачу методом статистической линеаризации. В этом случае нужно произвести замену X2 @ л* а [X @ — *] + *, C8.25) где коэффициенты а п b должны быть определены по формулам C) и D) или C) и G). Возьмем за основу последние две формулы. Тогда в нашем случае (см. [17], стр. 129) а = 2х, Ь = а*х-{-&. C8.26) Подставляя B5) в B3) и учитывая стационарность задачи, для спектральной плотности 5у(ш) получим — /г2J
358 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI или, учитывая B4), ^Н = -г7 f—Ti Z-Yj п у C8.27) Используя формулу A3.45), можно получить точное выражение для «Sy(w): _ Л4Ла8.*8 J oJ-|F +Л2©* U8 —Л*| + 4Л2а>2 ff ^(«-»iM,(«i)rf«i. C8.28) Cpa-внивая приближенное выражение для спектральной плотности B7) с ее точным значением B8), замечаем, что метод статистической линеаризации дает правильное значение только для первого слагаемого в формуле B8) и совершенно не учитывает второго слагаемого в этой формуле. Однако в зависимости от величины X второе слагаемое в формуле B8) может иметь основное значение. Кроме того, второе слагаемое отличается от первого и в «качественном» отношении: в то время как первое слагаемое имеет максимум вблизи a) = — kt второе слагаемое имеет максимум вблизи о> = &. Поэтому неучет в приближенной формуле B7) этого слагаемого может привести в ряде случаев к существенным ошибкам. Пример 38.3. В качестве последнего примера рассмотрим линейное звено первого порядка, на вход которого поступает стационарный нормальный случайный процесс X(t)y прошедший предварительно через безынерционное звено, имеющее линейную часть и ограничивающее входной сигнал по модулю. Дифференциальное уравнение такой сисгемы имеет вид ^ C8.29) где [X{t\ \X{t)\^b Определим дисперсию ошибки e@=K@ —ДГ(О , C8.31) методом статистической линеаризации для стационарного режима.
§ 381 МЕТОД СТАТИСТИЧЕСКОЙ ЛИНЕАРИЗАЦИИ 359 В соответствии с формулами B) и E) при статистической линеаризации имеем i C8.32) где оо Ь\ -*(¦?")]• <38-33> Подставляя C2) в B9) и заменяя Y(t) на t(t)-\-X(t)y получим C8.34) что для спектральной плотности ошибки дает -f C8.36) Интегрируя последнее равенство в бесконечных пределах, получим приближенное выражение для дисперсии ошибки е(?) °«= rfa [а (в« - **? + «Я- C8.36) В рассматриваемом примере возможно дать оценку метода статистической линеаризации. Выражая для этого Z{f) через X(f) по C5.25): 00 Z(f)=~ \ е1аХ «>[й cos bu + iX (t) sin *н] ^, C8.37) — 00 после подстановки в B9) и перехода к е(?) получим 00 Ц 4- ае @ = -?- § ег«* «[ft cos bu + /А" @ sin — 00 — aX(f) — У^Р-. C8.38) Вычитая C8) из C4), получим уравнение для погрешности
360 НЕЛИНЕЙНЫЕ МЕТОДЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VI вычисления ошибки e(t) методом статистической линеаризации ut 00 = a %l X (t) — —, [ е'«х it) [[, cos Ьп + IX (t) sin bit) —• C8.39) — oo Интегрируя последнее уравнение и выполнив простые преобразования, можно выразить D[A(O] через характеристическую функцию E(uv щ) системы случайных величин X(t) и X (t-\~x), определяемую равенством Е (irt, нО = ехр {— Ц- [и\ + «5 + 2k (т) и1Иj}, C8.40) 1 ^(т)=^-/Сд.(т). C8.41) Получаемое таким образом выражение содержит тройное интегрирование— по uv щ и х. Интегрирование по щ и щ может быть выполнено. Вычислив после этого интеграл по х численно, можно получить представление об ошибке метода статистической линеаризации в данном случае. § 39. Применение теории марковских процессов к исследованию нелинейных систем Получение вероятностных характеристик на выходе нелинейной динамической системы в общем случае требует применения различных приближенных методов; некоторые из них были рассмотрены в предыдущих параграфах. Однако положение существенно меняется, если входом в систему является функция, которую можно рассматривать как белый шум (в узком смысле) или марковский процесс. В этом случае плотность вероятности ординаты процесса на выходе системы определяется дифференциальным уравнением в частных производных (уравнением Колмогорова) и решение задачи может быть связано только с чисто математическими трудностями получения такого решения. Несмотря на то, что эти трудности сами по себе могут оказаться значительными и потребовать применения различных приближенных способов вычислений, применение марковских процессов к исследованию нелинейных систем представляется весьма перспективным, так как современные электронные вычислительные машины делают доступным численное решение довольно сложных дифференциальных уравнений в частных производных, а сведение реальных процессов к марковским обычно может быть сделано без добавочных допущений сравнительно с теми, какие обычно делаются в прикладной теории
§ 40! ОБЩИЕ ПРИНЦИПЫ НАХОЖДЕНИЯ ОЦЕНОК 377 Дисперсия полученной таким образом оценки определяется формулой D[x] = 1±-. D0.23) В частном случае, когда Т1=Т% — ...= Тп=Т, все дисперсии of будут одинаковы (положим их равными о\) и вместо B2) и B3) получим более простые выражения D0.24> D[x] = ±a2v D0.25) Как показывают формулы A2) и B1), для определения дисперсии оценок математического ожидания необходимо знать корреляционную функцию исследуемого процесса X(t). Хотя обычно эта функция не бывает известна, последними формулами можно пользоваться, подставив в них вместо неизвестной корреляционной функции ее оценку, методы определения которой будут разобраны в следующем параграфе. В некоторых случаях (например, при фотографировании шкал приборов) не удается получить непрерывную реализацию x(t) случайного процесса, а приходится иметь дело с набором значений ординат реализаций процесса, полученных в дискретные моменты времени. Аналогичная задача возникает и при определении оценок параметров случайного процесса на дискретных электронных вычислительных машинах. В обоих случаях возникает вопрос о том, какой интервал дискретности может быть принят без существенного уменьшения точности получаемой оценки. Применительно к нахождению оценки математического ожидания вопрос сводится к определению такого максимального значения А, при котором формула (8) будет давать практически такую же точность, как и формула (9). Находя для этой цели дисперсию х, определяемую (8), после несложных преобразований будем иметь D [Л] =тгк { 2 Сравнивая полученное выражение с дисперсией х, даваемой формулой A2) для случая использования непрерывной реализации, замечаем, что выражение B6) дает приближенное значение интеграла,
378 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII полученного из A2) путем замены Т на Г-f-A и вычисленного методом трапеций. Последнее обстоятельство позволяет применить формулы для остаточного члена при численном интегрировании для определения изменения дисперсии оценки математического ожидания SD [х], возникающего вследствие того, что вместо непрерывной реализации процесса используется дискретное число ее ординат. Как известно из анализа, ошибка, возникающая от применения формулы трапеций при интегрировании функции f(x) с шагом А при учете m -j- 1 ординаты, может быть представлена в виде Da27) где величины бу лежат в интервале @, 1). Применяя эту формулу к нашему случаю, получим \ (l- Г4-Д ¦4- 2 V /i 'Z-r-\ КМd* — ~V A — — \ К(>1\Н.1. D0.28) Предположим, что интервал А выбран достаточно малым. Тогда сумму в B8) можно рассматривать как приближенное значение интеграла от функции взятого методом прямоугольников, т. е. приближенно можно положить Разлагая правую часть полученного равенства по степеням А и сохраняя только линейные и квадратичные члены, получим 8D [х] ^ (ЛА« — 25А) ^2, D0.30)
40] ОБЩИЕ ПРИНЦИПЫ НАХОЖДЕНИЯ ОЦЕНОК 379 где для краткости обозначено к(х) = -т T> D0.31) D0.32) Так как выражение C0) является полиномом второй степени относительно А, то при A = Amin = J D0.33) 8D (х) имеет минимальное значение, равное 8D[*]min=-x'^- D0-34> При достаточно большом Т знак отношения C3) определяется знаком числителя. Поэтому при В^>0 возможно выбрать шаг дискретности А = Аопт, при котором 8D [х] в соответствии с C4) будет отрицательным и, следовательно, дисперсия оценки jc, полученной при использовании дискретного числа ординат по формуле (8), будет меньше, чем дисперсия оценки (9), полученной с учетом всего графика реализации x(f). Этот вывод, впервые полученный С. Я. Вилен- киным *) не является очевидным. Формула C4) показывает, что выигрыш в эффективности оценки, который может быть получен при выборе оптимального шага дискретности, убывает с ростом длины реализации Г. Поэтому при практических расчетах обычно предпочитают формулу (9), так как она удобнее для автоматизации и не требует предварительной оценки нормированной корреляционной функции k (т), необходимой для нахождения Аопт по формуле C3). Вернемся к рассмотрению реализаций нестационарного случайнога процесса. Пусть имеется п независимых реализаций Xj(t) случайного процесса X(t), длительности которые Т примем одинаковыми, а корреляционную функцию Kx(tv fa) бу.$ем считать известной. Посмотрим, как можно уточнить оценку C) математического ожидания x(t), если некоторые свойства x(t) известны. Предположим, например, известно, что x(t) является полиномом* от t степени не выше чем k: D0.35) ¦) С. Я. В и л е н к и н, Об оценке среднего в стационарных процессах. Теория вероятностей и ее применение, т. IV, вып. 4, 1959.
380 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII коэффициенты которого аг — неизвестные постоянные, подлежащие определению на основании полученных реализаций. Если бы мы располагали одной реализацией xj(t), а дисперсия ординат случайного процесса была бы постоянной, для определения коэффициентов аг естественно было бы исходить из требования т ь \ \xj (о—2 аА*dt=min> о /о т. е. использовать метод наименьших квадратов. Оценки аг коэффициентов av получаемые в результате решения системы C6), линейно связаны с ординатами реализации x(t). Поэтому определение дисперсий этих оценок, так же как и дисперсии оценки x(t)t определяемой формулой C5), не представляет сложности (в окончательные формулы и здесь, естественно, войдет Kx(tp t*)). Не останавливаясь подробнее на этих вычислениях, отметим только, что и в других случаях, когда о виде оцениваемого математического ожидания x(f) имеется добавочная информация вроде условия C5), для получения оценки можно использовать вместо формулы C) более сложные выражения, учитывающие характер изменения математического ожидания со временем и дающие, естественно, более точный результат. В том случае, когда никакой дополнительной информации о x(t) не имеется, формула C) дает наилучшую оценку. Рассмотрим несколько примеров. Пример 40.1. Определить дисперсию оценки математического ожидания стационарной случайной функции, найденной по трем независимым реализациям длительностью 7^ = 5 мин, 7^=10 мин, Тг = 15 мин, если /С(т) = <Лгй1Т1> а =10 м, а = 0,001 1/сек. В соответствии с B2) для оценки математического ожидания имеем * + * + * где Xj — оценка математического ожидания, полученная по /-й реализации, а с) — дисперсия этой оценки. Находя D [х\ после очевидных сокращений получим
40] ОБЩИЕ ПРИНЦИПЫ НАХОЖДЕНИЯ ОЦЕНОК 381 Так как в соответствии с формулой A2) Tj то ) = 2-f-3,4, Пример 40.2. Дана реализация стационарного процесса длиной 7 = 50 сек. Определить: а) интервал Аопт между ординатами реализации, при котором оценка (8) математического ожидания х была бы минимальней; б) на сколько процентов дисперсия оценки х, вычисленная с учетом всего графика реализации по формуле (9), будет больше дисперсии оценки, вычисленной по формуле (8) при шаге дискретности Аопт; в) наибольший шаг дискретности А^ при котором дисперсия оценки (8) будет не более чем на 5% превышать дисперсию оценки (9), если ^(t) = oVaiTl, a = 0,1 I/сек. Переходя к безразмерному времени т1 = ат, Т1 = аТ=5, в соответствии с C1) и C2) имеем { По формуле C3) находим Допт=~2р т- е- число ординат реализации, дающее оптимальную оценку математического ожидания m +1 = 5*121 = -у^т- + 1 ^ 11. Дисперсия оценки (9) в соответствии с A2) равна
382 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VT1 Для относительного увеличения дисперсии при переходе от оценки (8) к оценке (9) в соответствии с C4) имеем Р1Л]-Р[*1опт_ D [Jc] A • 0,61» \x] 1,21 • 25 • 0,321 _ооп/ Наконец, для получения шага дискретности А,, гарантирующего увеличение дисперсии не более чем на 5%, приравнивая выражение C0) 0,05Di(x), получим квадратное уравнение: 1,21 Af — — 1,22Aj = 0,05. 26 • 0,321, т. е. А? — At — 0,322 = 0. Решая это уравнение, получим А] = 1,26, т. е. можно ограничиться пятью ординатами ) Подсчет D (Jc) при дискретном числе ординат, выполненный по формуле B6), дает следующую зависимость D(x) от числа учтенных ординат (т-\-\), которая хорошо согласуется с результатами, полученными выше по приближенным формулам. D[x] D[x)-D[x]om Pi m /u 3 0,371 20,0 4 0,331 7,5 5 0,316 2,8 6 0,310 0,9 11 0,307 0 12 0,307 0 16 0,309 0,6 21 0,311 1,2 22 0,312 1,6 § 41. Оценка корреляционной функции Перейдем к нахождению оценки корреляционной функции X{f), которую пока не будем считать стационарной. Так как, по определению, D1.1) то для нахождения оценки K(tt> U) можно исходить из тех же соображений, которые были использованы при нахождении x(t). Примем по-прежнему, что имеется п реализаций случайной функции X(t) одинаковой длительности Т. Предположим сначала, что математическое ожидание Jc (t) известно. Выберем два произвольных момента времени tx и tb находящихся внутри интервала @, 7). Ординаты реализаций xj(t) (J=l9 2, ...,/z) в эти моменты времени можно рассматривать как значения случайных величин X(t{) и X(t$, а выражение \х, (*,) - X (*t)| [xj ft) - X 00] D1.2) как значение случайной величины, стоящей под знаком математического ожидания в формуле A), полученное при у-м опыте. Следовательно, для нахождения оценки корреляционной функции /C0i» ^0
$ 41] ОЦЕНКА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 383 нужно усреднить выражение B) по всем реализациям, т. е. для оценки K(tv *0 получим Если математическое ожидание x(t) неизвестно, то вместо математического ожидания случайной функции в C) нужно взять ее оценку по формуле D0.3) и положить п К (*(, U) = —Ц- У [xj (tt) — Jc (Щ [х,- (L) — x (/2I. D1.4) где, как обычно в подобных задачах, множитель \\п перед суммой заменен на 1/(я— 1) для того, чтобы оценка была несмещенной. Действительно, находя математические ожидания обеих частей равенств C) и D), после простых преобразований получим, что в обоих случаях # 'О- D1.5) Формулам C) и D) можно придать и несколько иной вид. Если раскрыть квадратные скобки и произвести простые преобразования, то получим: при известном математическом ожидании D1.6) при неизвестном математическом ожидании п Xj {h) - *{tl) * Детальный анализ точности оценки K(tv ?2) несколько усложняется, так как в формулы C) и D) входят суммы произведений зависимых случайных величин Xj (tt) и Xj (?2), однако вычисление дисперсии K(tv ti) может быть выполнено и в этом случае, причем окончательный результат будет содержать моменты ординат случайной функции X(t) до четвертого включительно. Если X(t) — нормальный случайный процесс, то моменты более высокого порядка могут быть выражены через корреляционную функцию K(tv ?2) и окончательные формулы, естественно, упрощаются. Знание математического ожидания и корреляционной функции в большинстве случаев позволяет решать задачи, встречающиеся в
384 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК (ГЛ. VII приложениях. Поэтому применением D0.2), C) или D) обычно заканчивается обработка реализаций нестационарных случайных функций. Перейдем к рассмотрению оценки корреляционной функции стационарного случайного процесса. Предположим сначала, что имеется одна реализация случайной функции х (t)> записанная в интервале @, Г), а математическое ожидание х известно. Так как М — *]}, D1.8) то для определения К(ъ) можно воспользоваться полученными в предыдущем параграфе результатами для оценки математического ожидания стационарной функции, которой в данном случае будет произведение [X (t) — х] [X (t +1) — х]. Применяя общую формулу D0.9) и учитывая, что интервал реализации рассматриваемой в данном случае функции равен @, Т—т), получим *) 7 — * *00 =7=7 \ I*® —X][x(t + x) — X]dt. DL9) По доказанному выше оценка (9) является несмещенной. Для того чтобы убедиться в ее состоятельности, необходимо установить, в каких случаях lim D[?(t)] = 0. D1.10) Г-оо Для вычисления последней дисперсии в общем случае недостаточно знать корреляционную функцию процесса X(f), необходимо располагать моментами ординат этой функции более высокого порядка. Для нормального процесса D[/C(x)] может быть выражена через /С(т), как это будет показано ниже при выводе дисперсии аналогичного выражения. В формулу (9) входит математическое ожидание процесса. Следовательно, этой оценкой можно пользоваться только в том случае, когда х известно. Однако обычно математическое ожидание исследуемого процесса не бывает известно и для его оценки приходится пользоваться формулой D0.9). В этом случае естественно в формуле A0) заменить.? на х, после чего получим 7-т ^ [ — Sc]dt. D1.11) *) Оценка К{т) по дискретному числу ординат будет рассмотрена дальше.
§ 411 ОЦЕНКА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 385- Возможно вести обработку опытного материала иначе: сначала получить оценку математического ожидания произведения X (t) - X (t -f- т),. а затем перейти к оценке корреляционной функции, воспользовавшись общим соотношением между центральным и начальным моментами второго порядка ] — (Х)\ D1.12) в котором математические ожидания, стоящие справа, нужно заменить их оценками. Расчетная формула в этом случае будет иметь вид Т-х \x<f)x<t + )<tt(*)*- D1ЛЗ> Формула A3) не совпадает с A1), однако при достаточно большом Г результаты, полученные по этим формулам, будут практически идентичны. Несмещенность оценки A1) или A3) уже не следует из предыдущих рассуждений и должна быть проверена. Вычислим для примера математические ожидания обеих частей равенства A3), что после перемены порядка интегрирования и нахождения математического ожидания дает М [K(*)] = K(*) — D[Jt]. D1.14> Для эргодических случайных процессов (для которых Jim /<(т) = 0) т-*оо дисперсия D [х], по доказанному выше, стремится к нулю при росте 71 Следовательно, в этом случае lim М[АГ(т)] = Л:(т). D1.15) Г-*-оо Отметим, что в отличие от х математическое ожидание оценки К(?) равно /С(т) только в пределе. Так же можно доказать, что и оценка A1) является асимптотически несмещенной, т. е. при росте Т (для эргодических случайных, процессов) математическое ожидание K(t) стремится к /((т). Вычисление дисперсии правой части A1) или A3) приводит к довольно громоздкому выражению. Чтобы получить несколько более простую окончательную формулу, примем, что при вычислении х используется не вся реализация, а только запись за время (Т—т), т. е^ что х вычисляется не по D0.9), а по формуле Т-х x = y~^- \ x(t)dt, D1.16) и будем исходить из A3). 13 А. А. Свешников
386 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII При сделанном допущении A3) можно представить в виде 7_т Т-х \ \ х M I V + т> - х VM dtx (U* D1.17) о Определяя дисперсию К(т) по общим правилам, будем иметь D [?(т)] = М {[/?(т)]2} - {М [КМ]}*. D1.18) Подставляя сюда значение /С(х) из A7), а М [#(*)] из 04), получим X [X & + х) - X (Щ dtt dt, dt, dh - Т-х <41Л9> Полученная формула показывает, что для нахождения дисперсии оценки корреляционной функции в общем случае знания корреляционной функции уже недостаточно, а необходимо располагать моментами до четвертого порядка. Однако для нормальных процессов моменты любых порядков могут быть выражены через математическое ожидание и корреляционную функцию. Действительно, на основании B.21) и B.27) для любых четырех нормальных величин Xv Х& Х& Х& справедливо соотношение М [ХхХгХгХЦ = knku + knku + kxikn + xtx2ku -f- х^хгки + + XtXzku + X^kn + XdXgkn + ^4^1*88 + *1-ЗДЛ> D1 -20) где ktj — корреляционный момент /-й и у-й случайных величин. Понимая в B0) под Xv X2, Хг и Х^ соответственно X (tx), [X (*, + т) — X (t$\ и [X (U -\-х) — Х (h)l вместо A9) получим J D [?(*)] = ^ J Gi -
§ 41| ОЦЕНКА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 387 В том случае, когда X известно точно и, следовательно, используется формула (8), аналогичные рассуждения дают { } D1.22) = (Г=Т* \ Из формул B1) и B2) следует, что при наличии эргодичности нормального процесса X(t) lim [ЛГ(т)] = а D1.23) т. е. A1) и A3) дают состоятельные асимптотически несмещенные оценки корреляционной функции. Так же состоятельной и асимптотически несмещенной оценкой является и выражение (9). В том случае, когда процесс не нормален, наличие эргодичности для функции X (t) может быть недостаточным для эргодичности произведения X(t)X(t -j-т). Поэтому для принятия A3) в качестве оценки корреляционной функции, вообще говоря, необходимо убедиться, что правая часть A9) стремится к нулю при росте 7. Однако в большинстве практически интересных случаев применимость A3) не вызывает сомнения. Формула A9) и соответствующая ей для нормального процесса формула B2) представляют интерес для численного определения точности найденной оценки корреляционной функции, которую можно получить, если в этой формуле заменить искомую корреляционную функцию /С(т) ее оценкой. Вид формулы B2) показывает, что по мере приближения интервала времени т к Т дисперсия оценки К(ч) увеличивается, т. е. точность оценки понижается. Следовательно, при построении графика оценки К (у) нужно учитывать, что точность найденных ординат этой функции убывает по мере удаления от начала координат. Происходит это потому, что с ростом х интервал времени (Т—т), на котором производится усреднение функции X (t) X (t -f-1)> уменьшается. При обработке реализаций стационарных случайных функций иногда возникает необходимость использовать несколько реализаций Если имеется уверенность в том, что все эти реализации получены при одинаковых условиях, то каждую из них обрабатывают указанным выше способом, а затем оценки корреляционных функций усредняют по всем реализациям. При этом, если длительность реализаций в отдельных опытах одна и та же, то в качестве окончательного значения оценки нужно взять 13»
388 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII среднее арифметическое результатов обработки отдельных реализаций, а если длительность реализаций различна, то результаты обработки отдельных опытов нужно взять с весом, который можно считать обратно пропорциональным дисперсии соответствующего значения, даваемой A9) и B2). Рассмотрим особенности оценки корреляционной функции по дискретному числу ординат реализации случайного процесса. В этом случае (9) и A1), естественно, не могут быть применены и приходится пользоваться формулами, в которых интегралы заменены соответствующими суммами. При этой замене возникает два основных вопроса, связанных с выбором шага дискретности Д: во-первых, существует ли и в этом случае оптимальный шаг дискретности и, во-вторых, насколько можно увеличивать шаг дискретности, не рискуя при этом существенно ухудшить оценку корреляционной функции? Первый вопрос может возникнуть в том случае, когда имеет смысл пойти на усложнение методов обработки опытного материала для повышения эффективности оценки. Второй вопрос возникает тогда, когда получение большого количества ординат случайного процесса сопряжено с добавочными трудностями (например, при фотографировании шкал приборов) или сокращение числа членов в суммах, дающих оценку /?(т), желательно для упрощения расчетов. Исследуем этот вопрос подробнее для простейшего случая, когда известно, что jc = 0, a X(t) — нормальная случайная функция. Вместо (9) в этом случае получим q 2 Находя дисперсию правой части равенства с помощью B0), будем иметь — К2 (/А) — К@)К(Щ. D1.25) Полученное выражение можно рассматривать как значение интеграла J A- -Ti)}«fc,, D1.26) вычисленного методом трапеций. Поэтому, используя формулу D0.27) для остаточного члена в формуле трапеций и повторяя выкладки,
§ 41] ОЦЕНКА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 389 выполненные в предыдущем параграфе при оценке 8D [х]У для изменения дисперсии /С(т) при переходе от формулы B2) к формуле B4), получим (Тх=Т — т) 8D [?(*)] = (Д,Да— 2Я, А) ^, D1.27) где введены обозначения 1 jj D1.28) -т)]^. D1,29) Обычно Вх^>0. В этом случае выражение B7) имеет минимум, соответствующий оптимальному значению шага дискретности А: Аопт =^, DЬ30) при котором D1.31) Если и Ах > 0 (что обычно имеет место), то (8D [К 00] )опт <С ®> т. е. существует шаг дискретности C0), при котором оценка дисперсии по дискретному числу ординат является более эффективной, чем оценка по непрерывному графику реализации .лг(?), даваемая формулой B2). Как и при оценке математического ожидания, получаемый при этом выигрыш быстро уменьшается с ростом Т. Кроме того, Аопт при оценке корреляционной функции оказывается функцией т (и отличается от Аопт при оценке х). Поэтому усложнение расчетов, связанное с использованием оптимального шага дискретности, обычно себя не оправдывает и оценку корреляционной функции вычисляют по формуле A3), а в том случае, когда вычисление по дискретному числу ординат является более удобным (например, при вычислении на цифровых ЭВМ или при получении ординат реализации в дискретные моменты времени), выбирают интервал А настолько малым, чтоб» оценка по формуле B4) практически не отличалась от оценки по
390 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК 1ГЛ. VII формуле A3), которая имеет еще и то преимущество, что вычисление интегралов, входящих в эту формулу, просто выполняется с помощью специальных приборов — корреляторов. После определения достаточного числа ординат функции /C(t) и построения ее графика обычно возникает необходимость аппроксимирования корреляционной функции простым аналитическим выражением, удобным при дальнейшем исследовании. Выражения, употребляемые при такой аппроксимации, должны удовлетворять общим свойствам корреляционных функций и отображать характерные свойства полученной кривой K(i). Аппроксимирующее выражение может быть найдено обычными методами приближения функций с любой точностью. Однако большая точность приближения к найденному значению К(ъ) обычно бывает не только не нужна для получения ответа на конкретный практический вопрос, решаемый в данной задаче, но бывает даже в ряде случаев нежелательна, так как воспроизведение различных особенностей графика функций /С(т), возникающих вследствие невысокой точности самой оценки корреляционной функции, может только исказить физическую сущность рассматриваемого явления и, во всяком случае, усложнить его исследование. Поэтому выбор типа аппроксимирующего выражения и необходимая точность аппроксимации К(?) определяется той задачей, для решения которой требуется знание корреляционной функции. Например, если случайная функция, характеристики которой определяются из опыта, входит в правую часть дифференциального уравнения, решение которого является объектом исследования, то обычно имеет значение только общий характер изменения функции К(ъ). В этом случае в качестве аппроксимирующего выражения одинаково годятся как выражения, соответствующие дифференцируемому, так и выражения, соответствующие недифференцируемому процессу. Наоборот, если по найденному значению корреляционной функции требуется определить корреляционную функцию производной исследуемой случайной функции, то к выбору аппроксимирующего выражения необходимо подходить с большей осторожностью. Так, например, в этом случае выражение К (т) ъ о*е~ * I * I cos px D1.32) явно не годится, и лучший результат можно ожидать от аппроксимации корреляционной функции формулой (s рт + j sin р|т |). D1.33) Кроме того, при выборе аппроксимирующего выражения полезно учитывать механизм возникновения исследуемого случайного процесса*
% 41] ОЦЕНКА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 391 Например, большинство случайных процессов, имеющих интерес для технических приложений, может рассматриваться как результат прохождения «белого шума» через динамическую систему с постоянными или почти постоянными параметрами. В этом случае спектральная плотность должна иметь вид Нй <41-34> где Р2т (ш) и Q%n (со) — полиномы степеней 2т и 2/г от о>, содержащие только четные степени своего аргумента. Такой спектральной плотности соответствует корреляционная функция /С(т)= 2 *"''М(а/Р'М +а]е-*№), D1.35) / = i где ay и Ру — абсолютные значения мнимых и вещественных частей корней полинома Qs/i (<*>). В данном случае корреляционная функция убывает с ростом т по экспоненциальному закону. Поэтому для процессов подобного типа аппроксимация выражениями вида АГ(т)^<Га2г3 D1.36) или вида oVa2T2 cos рт D1.37) менее желательна, так как эти корреляционные функции соответствуют случайным процессам, имеющим существенно отличные свойства. (Например, для процессов такого типа возможна точная экстраполяция процесса по конечному отрезку его реализации — см. условие A9.26) сингулярности процесса.) Во многих задачах достаточно хорошей является аппроксимация К(х) выражениями вида cospi, aV-aM (cos рт +4 sin p | ~V|T|), D1.38) из которых первые два соответствуют недифференцируемому процессу, а последние два — процессу, имеющему одну производную. При использовании выражений этого типа за значение о2 можно взять оценку дисперсии (т. е. К@))> а постоянные аир определить по нескольким наиболее характерным точкам кривой K(t)> Так как точность ординат К'(т), как правило, падает с ростом т, то в качестве этих характерных точек не следует брать те из них, которые расположены далеко от начала координат.
392 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК (ГЛ. VII Например, если из анализа общего вида кривой и условий поставленной задачи признано целесообразным использовать аппроксимирующее выражение для К(т) в виде \ Р то для определения аир можно потребовать, чтобы аппроксимирующая функция совпадала с К(х) в начале координат, имела бы первый нуль в той же точке, что и /?(т) (в точке tj), а в точке та, где расположен первый минимум функции /С(т2)> имела бы ту же ординату, что и К (?)• Выполнение этих условий дает уравнения cos ртх + ?- sin р | Tt | = 0, D1.39) D1.40) численное решение которых не представляет трудностей, так как из первого уравнения а выражается явно через р «=—PctgPhil D1-41) и задача сводится к решению одного уравнения с одним неизвестным, что может быть осуществлено, например, графически. Возможны и другие способы подбора значений а и р по найденному графику К (т). Например, если функция /С(т) определена с достаточной точностью вплоть до второй точки пересечения оси *с (при т = т3)> то, положив T = arctgj, D1.42) искомое аппроксимирующее выражение можно представить в виде /C(T)^oV~a|t| cos(P|t| — T). D1.43) Так как cos (P | т | — 7) обращается в нуль при аргументе, равном я 3 п -гй т-я) то для определения р и ^ имеем два уравнения Р*1-Т = т. px3-T = 4tr, D1.44) откуда непосредственно следует, что
$ 411 ОЦЕНКА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 393 Можно исходить и из требования равенства моментов функции /С(т) и oV-«и* if cos (fc +y sin P I T I) на некотором участке изменения т, например от т = 0 до второго нуля функции АГ(т). В том случае, когда определение корреляционной функции производится для выяснения механизма возникновения случайного процесса, к вопросу об аппроксимации К(т) нужно подходить с особой тщательностью. При этом выяснение тонкой структуры случайного процесса обычно удобнее производить не путем анализа оценки корреляционной функции, а путем изучения оценки спектральной плотности 5(ш) (см. § 42). В настоящее время широкое распространение получили специальные вычислительные приборы (корреляторы), приспособленные для автоматического или полуавтоматического вычисления оценки корреляционной функции по полученному ранее графику реализации случайной функции или в процессе самой записи текущих значений случайной функции. Большинство корреляторов вычисляет интегралы, дающие оценки математического ожидания и корреляционной функции стационарного процесса т D1.46) -Jc]dt D1.47) Некоторые корреляторы вычисляют значение интеграла Т-х dt, D1.48) который связан с АГ(х) формулой *(т) = Дт) —(Л)» D1.49) Независимо от того, производится вычисление D7) или D8), принципиальная схема прибора остается одной и той же и состоит в следующем (рис. 33). С подвижной ленты /, на которой тем или иным способом произведена запись реализации случайной функции, снимают значения ординат случайной функции, соответствующие двум моментам времени, сдвинутым друг относительно друга на интервал т, величину которого можно менять в нужных пределах. От снятых таким образом ординат x(t) и iff-ft) на дифференциалах 2 и 4 вычитается оценка
394 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII математического ожидания случайной функции, предварительно определяемая по D6). Получаемые после дифференциалов разности x(f)— 5д и х (?-{-%)— х поступают на множительный механизм 3, где перемножаются. Результат перемножения подается на интегрирующий механизм 5, с которого на счетчик 6 поступает текущее значение интеграла D7), поделив которое на длину пропущенной через прибор Г" Y ч \А/ x(t) К Г " }J!(t+Z) IjJ Г 3 5 T-z f[x(t)-x][x(t+t)-x]dt I / /. ddIdd Рис. 33. ленты / (с учетом приборного масштаба), получаем оценку корреляционной функции при установленном значении т. Повторив эту операцию несколько раз, можно получить нужное число ординат функции /С(т). Для определения оценки математического ожидания предварительно пропускают ленту с записью реализации случайной функции, снимая с нее только ординату х (f), а вместо ординаты xtf-j-z) в множительный механизм подают постоянное значение а (на дифференциалах при этом, разумеется, вычитание х не производится). При такой работе прибора на счетчике будет получено значение т a I x(t)dt, D1.50) которое отличается от оценки математического ожидания, определяемого D6), только постоянным множителем, который легко учесть. В тех приборах, в которых дифференциалы 2 и 4 отсутствуют, работа производится в таком же порядке, но только со счетчика снимается не величина, пропорциональная /C(t)> а величина, пропорциональная интегралу D8), по значениям которого вычисляется корреляционная функция по D9).
§ 41] ОЦЕНКА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 395 Очевидно, что если на подвижной ленте или на двух синхронно перемещающихся лентах нанесены два графика, соответствующие реализациям двух стационарных случайных функций X(t) и Y(t), то, снимая с этих графиков ординаты х (f) и у (t) и подавая их в счетно- решающую часть коррелятора, на выходе мы получим величину, пропорциональную Т-х \ -y]dt, D1.51) которая отличается от оценки корреляционной функции связи Т-х D1.52) только постоянным множителем, учитывающим множитель в E2) и масштабные коэффициенты прибора. Таким образом, коррелятор может быть использован не только для определения корреляционной функции, но и для определения корреляционной функции связи двух стационарных случайных процессов. Различные существующие образцы корреляторов, которые воспроизводят описанную выше схему работы, отличаются между собой только техническим воплощением этой схемы, т. е. тем, какая форма записи случайного процесса используется, какой метод считывания ординат случайной функции применяется и, наконец, какого типа счетно-решающие механизмы (множительный, интегрирующий) используются. При получении записи реализации функций на бумажной ленте съем ее ординат можно производить или вручную путем совмещения подвижных индексов с кривой, или с помощью специальных считывающих устройств. При записи на магнитную ленту считывание ординат случайной функции производится наиболее легко, прибор получается конструктивно более простым, а время, необходимое для обработки записей, будет значительно меньшим, чем при использовании записей на бумажной ленте. Независимо от технического осуществления коррелятора указанной выше схемы принцип его работы остается одним и тем же и, следовательно, приведенные в начале параграфа формулы, определяющие дисперсии оценок математического ожидания и корреляционной функции, остаются полностью приемлемыми и в данном случае. Однако при использовании этих формул не следует забывать, что они получены в предположении, что обрабатываемые реализации являются действительно реализациями стационарного процесса.
396 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII Кроме того, эти формулы, естественно, не учитывают ошибки коррелятора как счетно-решающего прибора. Рассмотрим несколько подробнее ошибки, которые могут возникнуть вследствие первой из указанных выше причин. Предположим, например, что нестационарность исследуемого процесса вызвана тем, что математическое ожидание процесса не постоянно, а является медленно меняющейся функцией времени, определяемой равенством D1.53) где а и Ъ — постоянные. Применяя в этом случае формулу D6), т. е. считая х постоянной, при вычислении оценки математического ожидания мы получим систематическую ошибку. Действительно, находя математическое ожидание обеих частей равенства D6), получим т ^x(t)dt a + bT D1.54) Так же возникает систематическая ошибка и при вычислении оценки корреляционной функции, так как, находя математическое ожидание обеих частей равенства D7), с учетом A6) и E3) получим D1.55) Второе слагаемое в полученной формуле (для эргодических процессов) стремится к нулю при росте 7, однако третье слагаемое не только не уменьшается, но растет по квадратическому закону с ростом Т. Поэтому если при обработке реализации случайного процесса на корреляторе мы предполагаем, что математическое ожидание процесса постоянно, а в действительности это математическое ожидание( медленно изменяется со временем, то будет возникать систематическая ошибка в определении корреляционной функции, которая будет рйсти с ростом Т и будет зависеть от т. Если математическое ожидание х не является линейной функцией времени, а меняется по более сложному закону (например, содержит низкочастотную гармоническую компоненту), то систематическая ошибка в /С(т) может расти с ростом т по более сложному закону. Этим иногда удается объяснить явление, замечающееся часто при обработке реализаций случайных процессов: значения /С(т) для больших т, не только не согласуются с аппроксимацией оценки К (т), полученной для
§ 41! ОЦЕНКА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 397 сравнительно малых значений т, но могут противоречить основным свойствам корреляционной функции, например, может быть Кроме описанной выше схемы коррелятора, пригодного для обработки любых стационарных случайных функций, существуют еще корреляторы, специально предназначенные для обработки реализаций стационарных нормальных процессов. Один из принципов построения таких корреляторов основан на томг что нормированная корреляционная функция k (-с) и вероятность q того, что знаки отклонений ординат случайной функции от ее математического ожидания для двух моментов времени / и f + т будут противоположными, связаны соотношением ^ D1.56) которое легко может быть выведено, если учесть, что ординаты X (t) и А'(/4-т) образуют систему нормальных случайных величин. Действительно, обозначив для краткости Xt = X (О — X, Xi = X(f + %) — X, К@) = о\ D1.57> для плотности вероятности f(xif *2) получим f(Xi,x,) = »=eSnr=W«» + *Jate-»'. D1.58). 2п<з2 у\—№ Величины К\ и х% будут иметь противоположные знаки тогда,, когда или хх положительно, а лг3 отрицательно, или наоборот. Поэтому вероятность q определится формулой О оо оо О 9— \ S f(x* x*)dx\ dx4-\- \ \ f(xlt x^dxidx* D1.59) - оо 0 0 —оо Подставляя сюда плотность вероятности E8), замечаем, что интегралы легко вычисляются, если от прямоугольных координат хх и х% перейти к полярным, положив хх = р cos <р. хч = р sin <p. D1.60) Выполнив эту замену, получим г, D1.61) что эквивалентно E6).
398 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII Вычисление оценки нормированной корреляционной функции k (т) по формуле E6) можно автоматизировать следующим образом. Пусть дана реализация случайной функции x(t), разность между которой и математическим ожиданием X записана на подвижной ленте (рис. 34). Предположим, что в точках Аи Ву отстоящих одна от другой на расстоянии т, имеется два устройства, автоматически фиксирующих знак ординаты функции [х (t) — Jc]. Если перемещать ленту с постоянной скоростью и замыкать цепь счетчика времени (секундомера) только тогда, когда знаки функции в точках А и В будут различны, Рис. 34. то отношение времени Tv отсчитанного секундомером, ко всему времени движения ленты Т даст оценку искомой вероятности q: д=^Ь. D1.62) Устройства, автоматически фиксирующие знак ординаты функции, представленной графиком, конструктивно значительно проще, чем устройства, определяющие величину ординаты. Например, в одной из существующих схем корреляторов в точках А и В располагается по две пары скользящих контактов, одна из которых находится выше линии математического ожидания (выше прямой Ot на рис. 34), а другая — ниже этой линии. В точках пересечения кривой с осью Ot проведены токопроводящим состааом вер» тикальные прямые. При пересечении вертикальной прямой верхней парой контактов замыкается соответствующая электрическая цепь и срабатывает двухпозиционное реле / или 2, фиксирующее положительный знак ординаты функции. При пересечении токопроводящей линии нижней парой контактов реле срабатывает снова, чем фиксируется отрицательный знак функции. Счетчик времени включается автоматически в том случае, когда реле фиксирует разные знаки. Очевидно, что коррелятор описанного выше типа может быть также использован и для определения нормированной корреляционной функции связи двух стационарно связанных нормальных процессов. Для
S 411 ОЦЕНКА КОРРЕЛЯЦИОННОЙ ФУНКЦИИ 399. этого нужно только, чтобы в приборе сравнивались знаки не ординат функций [х (t) — х] и [х (t -f- т) — л], а ординат функций [х (t) — х] и [у(^ + т)—У\ Получающееся в этом случае по F2) значение q будет давать оценку вероятности несовпадения знаков ординат этих функций, а нормированная корреляционная функция связи определится, формулой, аналогичной E6), *^L D1.63) Во многих задачах дисперсия случайной функции не представляет основного интереса. Например, при исследовании качки корабля на вблнении обычно задаются различной интенсивностью волнения (его балльностью); при исследовании помехозащищенности радиолиний задаются уровнем шумов и т. д. Поэтому изложенный выше способ определения нормированной корреляционной функции нормального случайного процесса, не требующий применения множительного и интегрирующего механизмов, в ряде случаев находит свое применение. Для обоснования возможности применения этого способа необходимо убедиться, что получаемые таким образом оценки будут несмещенными и состоятельными. Кроме того, существенно сравнить эффективность этого способа с эффективностью, получаемой при использовании формулы D7). Более подробное рассмотрение этого вопроса показывает, что эта оценка действительно является несмещенной и состоятельной (для эргодических процессов), однако ее эффективность ниже, чем эффективность оценки, даваемой формулой D7). Поэтому, используя формулу E6) для оценки нормированной корреляционной функции, мы не получим той точности, которую можно было бы получить при более рациональной обработке опытного материала. Мы как бы теряем часть полученных реализаций, т. е. изложенный выше способ не является оптимальным с теоретической точки зрения. Тем не менее простота автоматизации обработки опытного материала делает целесообразным применение этого способа в ряде случаев, особенно когда получение реализаций случайного процесса не связано с большими трудностями. Пример 41.1. Дисперсия о2 стационарной нормальной случайной функции X (t) известна, X = 0. Оценка нормированной корреляционной функции определяется или по формулам E6) и F2): kx (x) = cos nq, q = ¦ где 7\ — общая сумма отрезков времени, в течение которых sign [X (t)X (t -f- x)] = —1, a T—общая длина реализации, или по формуле Г — х
400 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII Определить lim —L1 ¦ , считая функцию kit) известной. ГDJ^cOl Г-оо J Так как Т -> оо, а о — состоятельная оценка qy то разность iq — q) можно считать малой и, следовательно, разлагая cos nq — = cos тс [^-|-(^— q)\ в ряд и ограничиваясь только линейными членами, получим ?j (т) = cos nq — n(q — q) sin яф kx (т) — k (t) = — тс (q — q) sin Ttq> С другой стороны, учитывая способ определения qy имеем Т-х О оо 0 со оо 0 0 со 0 оо оо О (О оо 0 со оо 0 0 со 0 оо оо О SJJS+5 5 П + И 5 5+ —оо 0 —оо 0 0 —оо —оо 0 —оо о 0 —оо оо 0 оо 0 ч —оо 0 —оо / a /"(Xi, дг2, хг, Хь) — плотность вероятности системы нормальных случайных величин Xx = ^X{tl\ АГ2=-~Х(^ + х), X%=\-X(t& Xk = Х(^ + ), %\ -= — X (^ -f- т), корреляционная матрица Ц&^Ц которых имеет вмд k(x) k(x) Используя формулу B2), имеем = ^Л^г J G - х - — x)j dx*
§ 42| ОЦЕНКА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ 401 Следовательно, Дщ °'*>)] - 7--coD[fts(x)] T-t = lim y Г~С° \ \т — х — х1ПкЧ Интеграл, стоящий в знаменателе, легко может быть вычислен. Интеграл, стоящий в числителе, может быть найден только численно. При этом следует учесть, что два из четырех интегрирований в формуле для J(zx) могут быть выполнены. § 42. Оценка спектральной плотности Для определения оценки спектральной плотности стационарного случайного процесса по его реализации можно или предварительно определить оценку корреляционной функции изложенным в предыдущем параграфе методом и найти ее преобразование Фурье, или с самого начала вести обработку реализаций случайной функции таким образом, чтобы сразу находить ординаты оценки S(o>) спектральной плотности. Рассмотрим подробнее каждый из этих способов для определения наиболее эффективного. Если оценка 5 (со) определяется по предварительно найденной оценке корреляционной функции АГ(т), то возможно или предварительно аппроксимировать К(ъ) соответствующим аналитическим выражением, или исходить непосредственно из графика ЛГ (т), полученного путем обработки реализации случайного процесса. Первый способ представляется наиболее практичным в том случае, когда из общих соображений вид корреляционной функции не вызывает сомнения и нет опасности при ее аппроксимации упустить какие- то существенные подробности спектральной плотности. Пусть, например, известно, что случайная функция X{f) может рассматриваться как выходная функция стационарной линейной системы первого порядка, на вход которой поступает «белый шум», а функция Л'(т) хорошо аппроксимируется выражением К(х) = а*е«\х[. D2.1)
402 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII В этом случае для оценки спектральной плотности получим сразу Однако часто возникают задачи, при которых оценка «S (со) должна быть найдена с большей тщательностью, так как самой задачей статистической обработки является выяснение тонких свойств спектральной плотности, связанных с выяснением природы возникновения исследуемого случайного процесса. В этом случае необходимо обратиться к оценке К(?) до ее аппроксимации или к самой реализации случайного процесса. Однако в первом случае возникает принципиальная трудность, связанная с тем, что оценка корреляционной функции К(х) известна нам только на ограниченном интервале изменения ее аргумента (— Г, Т), причем точность оценки уменьшается с приближением к границам интервала. Поэтому вычисление оценки спектральной плотности по формуле т S (со) == JL С e'iwx K(x) dx D2.3) не является наилучшим, а в ряде случаев и просто неприемлемым, так как неучет ординат корреляционной функции /С(х) при \ъ\^>Т может существенно исказить ординаты спектральной плотности при малых значениях со. Столь же неэффективным оказывается и непосредственное применение преобразования Фурье к реализации х (t) для получения оценки Рассмотрим этот вопрос подробнее. Пусть дана реализация x(t)f записанная в интервале времени (О, Т). Так как спектральная плотность является усредненным значением квадрата модуля амплитуды разложения случайной функции в ряд Фурье, то в качестве оценки спектральной плотности естественным представляется принять выражение, называемое обычно «периодограммой» (или «периодограммом»): т 111* 3 1 l i imf '^ ** D2.4) вычисление которого значительно проще поддается механизации, чем вычисление корреляционной функции, поскольку здесь отпадает необходимость в перемножении ординат реализации случайной функции, взятых в различные моменты времени. Для того чтобы D) можно было принять в качестве оценки, необходимо убедиться, что при росте Т математическое ожидание этого выражения стремится к 5 (со), а его дисперсия стремится к нулю. Выпол-
§ 421 ОЦЕНКА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ 403 нение первого условия легко доказать, так как, вычисляя математические ожидания обеих частей D) и рассматривая квадрат модуля интеграла как двойной интеграл, получим (считаем ? = 0) = -J- И т т Г1' М [л (tj) л (r2)J ati at<i = Г 7 D2.5) Следовательно, переходя к пределу, будем иметь 00 lim М [/(»)] = 4- ^ e'<otATWdT = S(a)), D2.6) —00 т. е. первое условие, которому должна удовлетворять оценка ? (<*>), действительно выполняется. Однако второе условие нарушается, так как, определяя дисперсию 5(ю), например, для нормального процесса, будем иметь [32] (считаем <о ф 0) lim D[/(a>)] = S2K D2.7) Г—оо т. е. точность определения спектральной плотности по D) не повышается с увеличением интервала записи Т. Поэтому D) не может быть принята в качестве оценки спектральной плотности. Несостоятельность оценки D) спектральной плотности &(w) связана с тем, что здесь оценивается не числовой параметр, характеризующий S(a>), а производится оценка всего хода этой функции, или, как говорят в математической статистике, производится непараметрическая оценка ?(<*>). Так как число оцениваемых ординат спектральной плотности бесконечно, то дисперсия оценки каждой ординаты не убывает с ростом Т. Действительно, предположим сначала, что мы представили случайную функцию не в виде интегрального спектрального разложения A0.45), а в виде отрезка ряда Фурье п X(t)^ ^ (Aj cos ujt + Bj sin со/), D2.8) /-i где Aj и Bj — случайные величины, обладающие одинаковой дисперсией о" (и нулевыми математическими ожиданиями). Для получения оценки дисперсии представим реализацию x(t) случайной функции
104 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК (ГЛ. VI! в виде ряда (8), коэффициенты которого можно рассматривать как реализации случайных величин Aj и Bf. Для оценки дисперсии этих величин имеем W + »5). D2.9) 2 S (со,) — 5 («О =Л I {L J ешх (t) dt 0 Предположим теперь, что в формуле (8) мы будем увеличивать число слагаемых п. Тогда при соответствующем предельном переходе сумма (8) превратится в интеграл, a aj можно будет заменить на S(u>)du> (см. § 10). Однако при этом предельном переходе оценка а/ по-прежнему будет вычисляться по формуле (9), содержащей только два слагаемых, и следовательно, дисперсия оценки не будет уменьшаться с ростом п, т. е. полученная таким образом оценка S(m) не будет состоятельной. Положение изменится, если вместо оценки дисперсии каждой амплитуды Aj или Bj мы будем оценивать дисперсию суммы амплитуд, приходящихся на заданный интервал частот (о)!, ах2). Применительно к непрерывному спектру частот это означает, что мы будем искать не оценку ординат спектральной плотности *S(a>), а оценку интеграла от этой спектральной плотности, взятого в пределах от ш, до щ или (что то же самое) разность спектральных функций S(co2) — S(o)i). Легко проверить (см. [8], [42]), что в этом случае Т *} dv D2.10) будет асимптотически несмещенной и состоятельной. Таким образом, вследствие несостоятельности оценки 5(<о) формула D) не позволяет даже при весьма больших длинах реализации Т получить надежное значение спектральной плотности в данной точке о>, т. е. надежно определить тонкую структуру функции 5 (ш). Наоборот, если мы будем интересоваться усредненными значениями этой функции, то с увеличением интервала усреднения (о^, ш2) при той же длине реализации мы будем получать все более эффективные оценки. Однако если мы будем использовать полученные усредненные оцетжи для характеристики спектральной плотности ?(о»), то мы неизбежно получим систематическую ошибку. Иными словами, получая состоятельную оценку путем указанного выше усреднения по частотам, мы тем самым нарушаем несмещенность оценки. Для преодоления возникающей таким образом трудности применяются различные способы, основанные на рациональном усреднении ординат спектральной плотности. Рассмотрим сначала простейший из таких способов, поясняющий существо решаемой задачи. Вернемся для этой цели к выражению D). Как было отмечено ранее, это выражение не может быть принято
\ 421 ОЦЕНКА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ 405 в качестве оценки спектральной плотности, так как не дает состоятельной оценки. Однако если разбить интервал времени @, Т) на п интервалов длиной То и применить D) для каждого из этих интервалов, то мы получим п оценок спектральной плотности JTq eia>tx(t)dt? (/=1, 2, ... , п), D2.11) G-1) То среднее арифметическое которых при достаточно больших То и п можно принять за оценку *S(w). Действительно, положив D2Л2> и находя математические ожидания обеих частей равенства, на основании F) получим * lim М[5(ю)] = Ит М [5/(а))] = 5(а)). D2.13> То~* со Т0-*со С другой стороны, считая 5/(о>) при достаточно большом То независимыми случайными величинами и применяя основные теоремы для дисперсии суммы независимых случайных величин, с учетом G) получим lim D [5 (<¦>)] = lim Г- 52 (<оI = 0. D2.14) То-+ оо Покажем, что оценку, практически эквивалентную A2), можно получить из C), введя в подынтегральное выражение в правой части* этой формулы соответствующую весовую функцию. Для того чтобы в этом убедиться, подставим A1) в A2), представляя одновременно квадрат модуля интеграла в виде двойного интеграла. Выполнив эти преобразования, получим п jT0 jTo S^ = W~ 2 S \ (г-*»Ъ-*йх{Ь)х(Ы<их<и* D2.15) ° /= Ч/-1O*о (/-1O-0 Если в каждом из интегралов, стоящих под знаком суммы, произвести замену переменных, положив *! = *! — (/— 1) То, *, = *,-(/— 1) Го, D2.16) то A5) примет вид 7^0 То п — 1 SH^-^T \ \ 2 е-^<-2--1)л;(xi-f-/Го)JC(х2 + /Го)flfTt^та.D2.17> 0 i a i=o
406 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII Введя вместо т2 новую переменную интегрирования т = та —Tt, D2.18) формуле A7) можно придать вид Го п— 1 л —1 + 5ГЙ7 2 \ 1 = 0 -То —т То Го - $ е'Ш [\ Х^ +1Т»)х ^ + iT* +1) ^i] dx\ D2.19) О То — х Первая сумма в полученном равенстве (с учетом множителя 1/пТ0) дает оценку корреляционной функции K(t), вычисленную по формуле D1.9) для реализации длины nT0-\-i= Г-f-x. Каждый из внутренних интегралов во второй сумме формулы A9) также дает оценку ^корреляционной функции, вычисленную по отрезку реализации длиной т, но умноженную на т. Обозначив эти оценки К\ (х) и Kl (t) для первого и второго интегралов суммы, вместо A9) можно будет записать . D2-20) Если в последней формуле не делать различия между оценками K(t), K'i(i) и Kl (x), написав всюду К"(х), то мы получим П Г 5(ш) = ^ ^ А(т)^Г(т)е-^^ = 1 ^ ftW^W^*. D2.21) -То -Т где «весовая функция» h (х) обращается в нуль при | х | ^>> 7- Таким образом, приведенные выше качественные рассуждения показывают, что введение в формулу преобразования Фурье оценки корреляционной функции добавочного множителя, отличного от нуля только в конечном (симметричном) интервале изменения аргумента, примерно эквивалентно переходу от несостоятельной оценки D) к состоятельной оценке A2). При этом общие соображения о выборе интервала Го остаются прежними: интервал То должен быть достаточно большим для того, чтобы оценка 5(ю) была несмещенной, и
§ 42J ОЦЕНКА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ 407 достаточно малым, чтобы n = jr было настолько большим числом, 'о чтобы оценка была эффективной. Общих теоретических рекомендаций по выбору значения Го, к сожалению, не удается получить, так как оптимальное значение Го зависит не только от вида искомой спектральной плотности 5(о>), но и от той конкретной задачи, которая при этом решается. Поэтому можно сделать только общие практические указания по выбору ширины интервала 70 (ширины «окна», как иногда называют этот интервал в английской и американской литературе): выбрав вид весовой функции /г(т) (о выборе вида этой функции будет сказано ниже), производят расчет ?(со) при различных Го, идя, например, от меньших значений к большим. Так как малое значение TQ соответствует большому числу п в формуле A2), то получаемая при этом оценка будет наиболее эффективной (дисперсия оценки 5 (со) будет наименьшей), однако вследствие малости То оценка будет обладать наибольшей смещенностью, что может сильно исказить график оцениваемой функции. По мере увеличения То эффективность оценки будет падать, однако будет уменьшаться систематическая ошибка оценки. На получаемых графиках ¦§(«>) это будет сказываться в том, что сначала (при малых То) график S (со) будет иметь вид плавной кривой, на которой все характерные для данной спектральной плотности пики будут сглажены; по мере роста То тонкая структура спектральной плотности будет постепенно проявляться, а при дальнейшем росте Го график начинает приобретать вид реализации случайной функции, поведение которой не отражает характера S(w), а является следствием несостоятельности оценки. Если общая длина Т реализации случайного процесса достаточно велика, то, если поступать указанным выше образом, обычно удается подобрать «оптимальное» значение То. Если Т мало, то, естественно, никаким выбором Го нельзя получить достаточно хорошую оценку спектральной плотности и необходимо стремиться к увеличению объема опытного материала. Вернемся к формуле B1). Покажем, что ее можно преобразовать таким образом, чтобы под знак интеграла входила не оценка корреляционной функции, а «периодограмма» /(со). Заменим для этой цели весовую функцию h (т) ее преобразованием Фурье w (со), т. е. положим D2.22) и подставим в B1) вместо /С(т) ее выражение через реализацию случайного процесса x(t) К (т) = 1 J х if) х (t + x) dt, D2.23)
408 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII отличающееся от D1.9) только тем, что интервал усреднения взят равным Т, а не (Т—т), и положено jt = O. (Так как весовая функция h (т) обращается в нуль при | т | ]> 70 ^ Г, то первая замена является допустимой; предположение же о нулевом математическом ожидании не является существенным и сделано только для простоты написания формул.) Выполнив указанные подстановки и сделав очевидные преобразования, получим Т D2.24) ^Второй интеграл в фигурных скобках можно преобразовать, введя новую переменную интегрирования t1 = t-\-x, после чего получим .S(a>) = со Т T+t = \w (a)i) Угг \ei 1<0"Ш1) tx ^ dt \ D2.25) Так как при достаточно большом Т (и малом t) Т J e_ i «о - О D2.26) то B5) приближенно можно представить в виде г wi) oVI [ ei(a)~Ш1)**@ dt *d&x D2.27) (r :или, учитывая D), в виде со со 5(оо) = V zi^ (^i) /(со — o)j) (/(Oj = \ zjy (со — o)j) /(coj) ^/o)j[. D2.28) — CO —CO Итак, для оценки спектральной плотности мы получили две практически эквивалентные формулы: формулу B1), выражающую 3? (со) через R(t), и формулу B8), дающую связь между ?(«>) и /(со). Для .применения этих формул необходимо выбрать вид весовой функции di(x) или преобразования Фурье зд>(и>) этой функции. В зависимости
§ 421 ОЦЕНКА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ 409 от того, какая выбрана весовая функция /г(т), рассматривают различные виды оценок. Рассмотрим несколько таких оценок, отсылая для более подробного рассмотрения этого вопроса к специальной литературе (см. [1], [42], [47], [56]). 1. «Усеченная оценка» 1 l " D2.29) О при |т|>7о, 4 sin2~^" D2.30> 2. Видоизмененная оценка Бартлетта -И'-ЯК1-1*1I" 14* г- {(г+ Го) (В ~ (т~ То) ш cos (й7°+2 sin О)Г°} • {42-32> 3. Оценка Хэмминга ft (т) = (l — Щ (о,54 + 0,46 cos ^), D2.33) D2.34) Независимо от вида весовой фз^нкции h (т), вычисление по формуле B8) можно реализовать путем построения соответствующей системы (фильтра), на вход которой подается реализация случайной функции x(t) (об этом подробнее см. [47]). Вычисления по формуле B1) могут быть выполнены с помощью обычного коррелятора, если на нем вычислять «корреляционную- функцию связи» произведения h(x)K(z) и набора кривых cos <от дли различных значений о>. Итак, суммируя вышеизложенное, можно сделать вывод, что при выяснении тонких свойств спектральной плотности, для того чтобы использовать всю информацию, содержащуюся в реализации случайного процесса, вообще говоря, приходится прибегать к довольно трудоемким расчетам. Поэтому не лишним будет отметить, что в тех
410 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VH случаях, когда длина реализации весьма велика (или практически не ограничена), а выяснение тонкой структуры спектральной плотности не является особенно важным, в целях упрощения расчетов иногда имеет смысл отказаться от теоретически оптимальных методов обработки, приняв более простую схему расчетов. В качестве одного из таких способов получения оценки спектральной плотности можно указать на пропускание реализации случайной функции через динамическую систему, обладающую узкой полосой пропускания, — метод фильтрации случайной функции. Рассмотрим этот способ подробнее. Пусть испытуемая случайная функция X(t) поступает на вход линейной динамической системы, с выхода которой снимается случайная функция Y(t)> свойства которой определяются свойствами случайной функции X(f) и рассматриваемой динамической системы. Если реакцию динамической системы на гармоническое колебание еш единичной амплитуды обозначить Ф (/<*>), то в соответствии с A2.28) для спектральной плотности Sy (со) получим «> D2-35) Предположим теперь, что рассматриваемая динамическая система обладает свойствами узкополосьгого фильтра, т. е. что квадрат ее передаточной функции | Ф (/со) |9 имеет настолько резкий максимум в узкой полосе частот, расположенной около частоты too, что можно положить | Ф (/со) |2 = 0, если |со — о>0|>Д, D2.36) где А — величина, малая сравнительно с областью, в которой спектральная плотность Sx(u>) меняется значительно. В этом случае дисперсия случайной функции Y(t) может быть выражена приближенно через значение ординаты спектральной плотности Sx(iti) при оо=:ю0. Действительно, в соответствии с общей формулой для дисперсии и выражением C5) имеем 00 D [ У (*)] = oj = 2 $ | Ф (/со) |« Sx («) Ж». ^42.37) о Учитывая соотношение C6), интегрирование в C7) можно производить только по узкой полосе (ш0 — А, о>0-|-Д), т. е. написать (считаем со0^>А) со0+Д 4 = 2 $ |Ф(*о)|*5*(<о)*о. D2.38) В полученном выражении Sx(®>) можно приближенно считать постоянной, равной ее ординате в средней точке области интегрирования,
§ 42| ОЦЕНКА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ и вынести за знак интеграла, после чего получим I |2^о), D2.39> а>0—А или, обозначив О>0+Д 2 $ |Ф(/со)|^(о==С(«>0), D2.40) со0—Д для определения оценки ординаты спектральной плотности в точке (о = оH будем иметь р D2-41> где постоянная С(«о) не зависит от свойств исследуемой случайной фЗ'нкции и определяется только передаточной функцией фильтра. Располагая набором фильтров с различным положением частоты пропускания (или имея возможность изменять значение о>0 у данного фильтра путем настройки), пользуясь D1) можно определить ординаты оценки спектральной плотности «?*(<*>) для различных значений ее аргумента. Ошибка определения ординат спектральной плотности Sx(u>) указанным выше способом, кроме приближенности C9), связана с тем, что вместо дисперсии случайной функции, получаемой на выходе динамической системы, мы вынуждены использовать оценку этой величины, которая не свободна от случайных ошибок. Если считать, что при использовании различных фильтров разброс случайных ошибок Оу остается постоянным, то абсолютная ошибка определения ординаты 5»(и>о) будет увеличиваться с уменьшением С(о>0). Поэтому для обеспечения одинаковой точности определения ординат спектральной плотности необходимо подбирать такие узкополосные фильтры, для которых ординаты функции С(<*>0) менялись бы по возможности незначительно в интересующей нас области изменения частот. Преимущество данного способа определения спектральной плотности состоит в том, что для его осуществления достаточно производить определение дисперсии случайной функции на выходе фильтра, что реализуется значительно проще, чем определение корреляционной функции 1((х) или нахождение преобразования Фурье реализации x(f) для вычисления 7(о>) по формуле D). Недостатком этого способа является ошибка, связанная с применением D1) к реальным динамическим системам, отличающимся от идеальных узкополосных фильтров. В заключение рассмотрим особенности получения оценки $(о>) спектральной плотности, имеющей резко выраженные максимумы в
412 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII различных диапазонах частот. В этом случае, как обычно говорят, случайная функция имеет высокочастотную и низкочастотную компоненты, а ее реализация имеет вид сравнительно медленно меняющейся кривой, на которую наложены случайные высокочастотные колебания (рис. 35). Подобные реализации возникают довольно часто (например. Рис. 35. в гидроакустике, при вибрациях механических систем и т. п.), и поэтому рассмотрение методов их обработки представляет непосредственный практический интерес. Непосредственное применение формулы B1) или B8) не позволяет в этом случае получить оценку «S (<*>), отражающую специфические особенности спектральной плотности. Лучший результат удается получить, если предварительно разделить «высокочастотную» и «низкочастотную» компоненты, найти оценки §п («>) и SB («>) спектральных ллотностей этих компонент, а затем положить ==& (со)+ §в(о>). D2.42) Для устранения низкочастотной составляющей нужно пропустить реализацию x(t) через «фильтр», пропускающий высокочастотную составляющую и задерживающую низкочастотную. Таким фильтром может служить или соответствующим образом подобранная динамическая (линейная) система или математическое усреднение ординат реализации случайной функции на интервале подходящей длины, расположенном симметрично относительно текущего значения аргумента реализации jc(t). В некоторых случаях хорошие результаты можно получить даже путем глазомерного «усреднения» высокочастотной составляющей. Пример применения указанного выше способа получения оценки ч§(со) (который иногда называют «выбеливанием») можно найти в [56]. Очевидно, что этот способ предполагает некоррелированность высокочастотной и низкочастотной составляющих случайного процесса. Подобная некоррелированность часто следует из анализа физической природы исследуемого процесса.
Ц31 ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯ 413 § 43. Оценка закона распределения ординаты стационарного процесса Предположим по-прежнему, что имеется реализация стационарного процесса длиной 7*, которую в этом параграфе удобнее будет обозначать X(t). Поставим задачу оценить функцию распределения F(x) ординаты процесса Предположим, что на графике, изображающем реализацию Рис. 36. X (t), проведена прямая, параллельная оси t, отстоящая от этой оси на расстоянии х (рис. 36). Очевидно, в качестве оценки F(x) функции распределения естественно принять отношение общего времени пребывания реализации случайной функции ниже уровня х к Г, т. е = 1-1 У'* D3.1) где через tj обозначено время /-го выброса за уровень х, а суммирование производится по всем выбросам, имевшим место в течение времени Г. Для того чтобы проверить несмещенность и состоятельность оценки A), заметим, что формулу A) можно переписать в виде + sign [*(*)-*]} D3.2) так как подынтегральное выражение равняется единице при X ^ равняется нулю при X{t)<^xy и следовательно, интегрирование дает сумму времени пребывания случайной функции выше заданного уровня. Используя интегральное представление A0.32) для нелинейности вида sign*, вместо B) можно написать 1 1 oiu \X (t) - х\ ^Г U D3.3)
414 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII Находя математическое ожидание обеих частей последнего равенства, получим T' <43-4> где характеристическая функция ординаты случайного процесса Е(и) вследствие его стационарности не зависит от t и, следовательно, интегрирование по t может быть выполнено. Легко убедиться, что выражение, стоящее справа в D), есть F(x). Действительно, дифференцируя обе части D), получим ± ^ М [F(x)\ =± J e-'«*E(u)du=f(x) = ??3&. D3.5) — 00 С другой стороны, из A) непосредственно следует, что lim F(x) = Q, так как при дг—¦— со все время Т будет соответ- Х-+— СО ствовать выбросу. Следовательно, lim M [F(x)] = Q, и, учитывая E), Х-+—СО получим D3.6) Таким образом, выражение A) дает несмещенную оценку для функции распределения F(x\ Для доказательства состоятельности оценки F{x) определим дисперсию C). Вычитая для этой цели D) из C) и находя математическое ожидание квадрата этой разности, после несложных преобразований получим 7 оо D [F{x)) = 4? у» $ $ $ О" —0 е-"*+* * X О —оо Х[Е (Щ) Е (вО - Е (а»,«О] ^^ dx, D3.7) где Е(ирЩ) — характеристическая функция системы случайных величии X (t) и X(t-{-i), зависящая вследствие стационарности процесса только от интервала времени т, а Е(и^ и ?(w2) — характеристические функции X(t) и A'(^-f-T) соответственно.
* 43] ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯ 415 Воспользовавшись соотношениями C) и D) и учитывая, что = 1 С 4it2 J , D3.8) «0 ^s} = - /(x, *3), D3.9) формулу G) после небольших преобразований можно переписать в виде 7 }d^ D3.10) где F(x, x) — функция распределения системы случайных величии X(t), Х(?-|-т), оба аргумента которой приняты равными х. Стоящая в A0) разность [F(xy х) — F*(x)]9 как правило, весьма быстро убывает с ростом т, так как ординаты X (t) и с ростом х становятся независимыми, следовательно, Поэтому в большинстве практически интересных случаев lim D[F (*)]== 0 D3.11) Т-+оэ и, следовательно, оценка F(x) является состоятельной. Для вычисления оценки F(x) по формуле A) могут быть использованы корреляторы, снабженные дополнительными несложными устройствами. Например, если в корреляторе, схема которого изображена на рис. 33, правый индекс установить на постоянный отсчет, на дифференциале 4 не производить вычитания, на дифференциал 2 вместо х подавать различные значения х, а после дифференциала 2 поставить реле, которое при положительной величине на входе дает единицу, а при отрицательной — нуль, то на счетчике будет получена величина, пропорциональная 2*/' Также может быть приспособлен и корре- / лятор, схема которого изображена на рис. 34. После нахождения оценки F(x) обычно возникает задача сравнения согласия полученного выражения с некоторой «теоретической»
416 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII функцией распределения F(x), вид которой может быть выбран или исходя из общих соображений, связанных с природой возникновения исследуемого процесса, или путем подбора соответствующего аналитического выражения, аппроксимирующего функцию F(x). Для решения подобной задачи при обработке реализаций дискретных случайных величин имеются хорошо разработанные методы, базирующиеся на применении так называемых критериев согласия, с помощью которых можно оценить вероятность того, что полученная выборка согласуется с предположением о том, что исследуемая случайная величина имеет функцию распределения F(x) (см., например, [23]). Непосредственное применение этих методов к обработке реализаций случайных функций наталкивается на трудность, связанную с тем, что во все критерии согласия входит объем выборки п, т. е. число независимых реализаций случайной величины. При обработке реализации случайной функции подобной величины не существует, так как мы имеем непрерывные значения ординат реализации x(t), между которыми существует вероятностная зависимость, постепенно ослабевающая с увеличением интервала между выбранными ординатами. Поэтому для применения обычных критериев согласия необходимо определить величину, эквивалентную объему выборки для дискретной случайной величины. Рассмотрим этот вопрос подробнее на примере широко применяемого в статистике случайных величин критерия согласия К. Пирсона. Предположим сначала, что дано п независимых реализаций дискретной случайной величины X: хг, лг2, ..., хпУ D3.12) на основании которых определена оценка функции распределения F(x). Пусть требуется определить, насколько оценка Р(х) согласуется с «теоретической функцией распределения» F (х)У вид которой выбран или из общих соображений, или на основании анализа функции F {х). Для получения необходимой оценки, в соответствии с обычной процедурой, применяемой в статистике (см., например, [23]), разобьем интервал изменения случайной величины X на т интервалов и обозначим число элементов выборки A2), попавших в у-й интервал, через rij (/= 1, 2, ...,/#), Очевидно, в соответствии с определением оценки функции распределения ny = /z[F(^)-F(^-i)], D3.13) где через %j обозначено наибольшее значение случайной величины X, относящееся к у-му интервалу (?0 = лгш1п, \т = хтгх). Математическое ожидание flj числа элементов выборки, попадающих в у-й интервал, определяется формулой «, = я IF (Sy)-F ($,_!)], D3.14)
* 43, ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯ -i . 7 отличающейся от A3) только тем, что вместо оценки F(x) функции распределения нужно взять функцию F(x). Отличие чисел nj от tij может служить мерой расхождения функций распределения F(x) и F(x). Для количественной оценки меры этого расхождения необходимо найти величину yj, определяемую формулой №<& F to-i)№ D3 15) Величина у? содержит экспериментально определяемые величины rij и, следовательно, является случайной. При достаточно большом значении я, независимо от закона распределения случайной величины X, распределение случайной величины Z=x3 стремится к «закону распределения хи квадрат», плотность вероятности для которого определяется формулой г k 2 г(т) где k — так называемое число степеней свободы, связанное с числом групп т и числом г соотношений, использованных для определения параметров закона распределения, формулой k=tn — r — 1. D3.17) Располагая законом распределения %*, согласие оценки F(x) с функцией распределения F (х) можно оценить следующим образом: выберем два числа yl и а, связанных соотношением р(Ха^Х«) = а- D3.18) Если в результате опыта получено значение y?^>yl> то это значит, что при наличии функции распределения F(x) произошло событие, имеющее вероятность, меньшую а. При малом а выполнение неравенства х^^Х* означает, что произошло событие маловероятное, т. е. предположение о наличии функции распределения F(x) плохо согласуется с опытным материалом. Если X2^ZJ, то опытный материал не противоречит сделанному предположению о виде закона распределения случайной величины X. Значение вероятности а («уровень значимости») выбирается в соответствии с физическим смыслом рассматриваемой задачи (см. любое руководство по математической статистике), значение же уа, определяемое формулой A8), без труда может быть найдено, так как значения интегралов ^ Р (х2 ^ х«) = I /О) dz> D3-] 9) 14 А. А. Свешников
418 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII соответствующих плотности вероятности A6), табулированы (см., например, [38], [16]). Вернемся к рассмотрению случайных процессов. Очевидно, непосредственное применение указанной выше схемы в данном случае является невозможным, так как в формулу A5), определяющую значение у^> входит число п — объем выборки, — не имеющее непосредственного эквивалента в случае обработки непрерывной реализации стационарного случайного процесса. Однако с небольшими изменениями критерий Пирсона может быть применен и в данном случае. Действительно, рассмотрим выражение ^ F (ц _ F F>Ll) > которое отличается от выражения A5) отсутствием множителя п в правой части равенства. При достаточной длине реализации Т число пересечений реализацией случайной функции уровней лг = $/ и лг=5у_! будет достаточно большим и сумма отрезков времени, в течение которых выполняются неравенства ?/_i^x^?/, будет (вообще говоря) приближаться к нормальной случайной величине. С другой стороны, разности [F(Sy)— ?(S/_i)l пропорциональны этим отрезкам времени, и следовательно, сумма B0) будет приближаться к сумме квадратов нормальных (центрированных) случайных величин. Такая сумма, как это доказывается в теории вероятностей (см., например, [23]), будет пропорциональна случайной величине Z=x2» т. е. можно положить Z=a& D3.21) где Z подчиняется закону распределения у? с соответствующим образом подобранным числом степеней свободы k. Для определения чисел а и k воспользуемся тем, что первые два момента для закона распределения yj определяются формулами M[Z] = ft, D[Z] = 2k. D3.22) Подставляя сюда Z=a-?\> получим два уравнения с двумя неизвестными «M[tfl = *. aJD|rf] = 2*, D3.23) откуда следует Таким образом, для применения критерия согласия Пирсона к оценке согласия статистического и теоретического законов распределения необходимо определить значение случайной величины Z по формулам B0), B1) и число степеней свободы k по формуле B4), а затем
431 ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯ 419 пользоваться той же схемой применения критерия согласия, что и при обработке реализаций случайной величины. В формулу B4) входят М [Х\] и D [х\]- Следовательно, для осуществления указанной схемы расчета необходимо вычислить М [^П и D [х?]- Для этого вычисления введем обозначение t) D3.25) и будем считать величину y\j нормальной. Так как F(x) есть несмещенная оценка функции распределения F(x), то Ъ = М Ш = F <5У) - F (?у.,) D3.26) и формулу B0) можно переписать в более компактном виде т Х? = У (^Т^8 , D3.27) Применяя операцию нахождения математического ожидания к последнему равенству, получим т т М [ХП= У -1 D Ы= У [- М GO) - J- D3-28) Для нахождения D[iiy], рассуждая так же, как при выводе C), представим случайную величину тцу в виде 7 1U = 4r \ \sign[X(t) —^)-sign \X(t)-^\}dt = 7 оо _1.. JL ^ ^ е (еЧ> _ е "Hi 0 ~ Л- D3.29) О —оо Возводя последнее равенство в квадрат, находя математическое ожидание и повторяя те же выкладки, что и при выводе A0), получим М h?| = fs \ G--т) \F(l,_l9 I,) + F Ey, Ey.0—F Ey_i, 6/-i)—Д5/. 5/)| Л. D3.30) где FEy_i, Ey), f(Sy, 5y_0 и т. д. — значения функции распределения системы случайных величин X(t) и X(t-\-*z)f взятой при соответствующих значениях ее аргументов. Как ясно из выражения C0), для нахождения М [^i] необходимо располагать двумерным законом распределения F(xv x.>) Если 14*
420 ЭКСПЕРИМЕНТАЛЬНОЕ ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК [ГЛ. VII предполагается, что процесс X (t) нормальный, то формула для F(xb x%) без труда может быть написана, а интегралы C0) могут быть вычислены численно. Аналогичным образом может быть вычислена и дисперсия D [х?]> однако для ее нахождения потребуются уже законы распределения ординат случайной функции более высокого порядка, чем второго. Действительно, на основании B7) и учитывая сделанное допущение о нормальности случайных величин у\р имеем т = у = 1 +"/J'V-- !М1Х?]}'. D3.31) где D3.32) Если предполагаемый (теоретический) закон распределения ординат случайного процесса X(f) нормальный, то F(^, \j) может быть представлена в виде однократного интеграла, и следовательно, для нахождения kj t необходимо выполнить двойное интегрирование, что может быть сделано численно. Рассмотрим пример. Пример 43.1. Для нахождения оценки плотности вероятности f(x) определено суммарное время 0 пребывания реализации случайной функции длительности Т в интервале (?, ? + д^)- В качестве оценки плотности вероятности принято Проверить несмещенность и состоятельность оценки при Д? -> 0. Рассматриваемая оценка отличается от величины т\р определенной B5) и B9), только добавочным множителем 1/Д5 и тем, что в данном случае ?у—1 = S, ?у == ? —J— Д?. Поэтому, применяя формулу B9) и полагая <ГШ' получим Т оо 1 1 С С -с 271 г -J
§ 43] ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯ 421 Находя математическое ожидание последнего равенства, получим Т оо оо М V* («)] = ЕГ • f S \ j 6 —00 —00 т. е. оценка несмещенная. Возводя /* (с) в квадрат и находя математическое ожидание результата, получим Т Т оо где ?(«!, ?г3) — характеристическая функция системы случа^ч^х величин X(t{), X(ti)9 а /^(?, ?) — плотность вероятности системы величины X(f)f X(t-^z) при аргументах этой плотности, равных t При достаточно большом т /^E, ?)->/!(?). Следовательно, T—QQ т. е. Иш D |/F)]- М [Й(?)] - {М |/;(?)J}* = /i(;) -/5E) —0. 7*-» со Следовательно, оценка /*(?) состоятельная.
ГЛАВА VIII НЕКОТОРЫЕ ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ § 44. Случайные последовательности Наряду со случайными функциями непрерывно изменяющегося аргумента, которые рассматривались в предыдущих параграфах (случайные процессы), практический интерес представляют также случайные функции, аргумент которых может принимать только определенные числовые значения. Подобные функции, называемые в отличие от случайных процессов случайными последовательностями, возникают, например, при фиксировании значений случайных функций в определенные моменты времени; при численной характеристике свойств системы, состоящей из дискретного числа элементов, могущих находиться в определенных состояниях, и в ряде других случаев. При фиксированном значении аргумента элемент случайной последовательности является случайной величиной непрерывного или дискретного типа. Будем считать для определенности, что ординаты случайной последовательности являются величинами непрерывного типа. Рассмотрим особенности, которые возникают при исследовании случайных последовательностей. Прежде всего отметим, что случайную последовательность можно рассматривать как функцию целочисленного аргумента, так как всегда можно пронумеровать в определенном порядке возможные значения аргумента и принять номер возможного значения за аргумент функции. Поэтому, в отличие от случайных процессов, будем обозначать случайные последовательности большими буквами латинского алфавита, снабжая их целочисленными индексами, например Xj, Yp Z/,..., где индекс j может изменяться в бесконечной (от 0 до со или от — оо до +оо) или конечной области. Перейдем к рассмотрению вероятностных характеристик случайных последовательностей. Очевидно, все, что было сказано применительно к случайным процессам о математическом ожидании, корреляционной
§ 44) СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 423 функции и законах распределения ординат случайных функций, остается в силе и применительно к случайным последовательностям, за тем, однако, исключением, что аргументы у математического ожидания и корреляционной функции в данном случае могут принимать только целочисленные значения. Иными словами, обозначая случайную последовательность Хр для математического ожидания и корреляционной функции будем иметь D4.1) /С (/, I) = М [(XJ - *5) (Xt - xt)} D4.2) (/, /=... — 3, — 2, — 1, 0, 1, 2,...). Общие свойства корреляционной функции, установленные для случайных процессов, остаются в силе и для случайных последовательностей. Так же как и для случайных процессов, случайные последовательности могут быть стационарными (в широком или узком смысле) или нестационарными, нормальными или ненормальными, марковскими или немарковскими. Предположим, что случайная последовательность обладает стационарностью в широком смысле. В этом случае корреляционная функция должна быть функцией только одного аргумента, т. е. должно выполняться соотношение К(/, l) = K(l—j) (/, /=... —2, —1, 0, 1, 2,...). D4.3) Для стационарной последовательности справедливо спектральное разложение, формально не отличающееся от спектрального разложения стационарных случайных процессов, рассмотренного в § 10, т. е. для любой стационарной последовательности 00 Xj — Xj= \ г'°>Ш(и>) (/ = ... —2, —1, О, 1, 2,...), D4.4) —00 где случайные приращения йФ(о>) удовлетворяют условиям М [йФ (со)] = 0, ^ D4.5) М [сГФ* К) AФ (со)] = Ь (со — «о,) 5 (<д>) rfo) Aщ. D4.6) Однако, в отличие от случайных процессов, в данном случае можно считать, что спектральная плотность 5(со) имеет отличные от нуля ординаты только в интервале (—тс, тс). Действительно, учитывая, что при целом j функция ег<% стоящая множителем под знаком интеграла в D), имеет период 2тс, этот интеграл всегда можно представить в виде интеграла, взятого от —тс до тс, т. е. написать —Xj— \ е^AФх{ш) (/ = ... — 3, —2, —1, 0, 1,2,...), D4.7)
424 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII где Ф*(о>) — новая случайная функция, имеющая смысл только в интервале (— п, тс), приращения которой связаны линейным образом с приращениями ^Ф(ш) для значений ш, отличающихся между собой на целое число 2тг. Вследствие линейной зависимости между AФХ (ш) и с/Ф(ш) приращения d<&x(&) удовлетворяют соотношениям E) и F), но теперь спектральная плотность ?*(<*>) будет задана только в интервале (— тс, те): о>)] = О, М [d®% (a)i) d<bx (о))] = 8 (а) — о)!) Sx (ш) йш^ш ( — тс < со ^ те). D4.8) Итак, будем исходить из соотношений G) и (8). Подставляя G) в формулу B) для корреляционной функции, меняя местами операцию интегрирования и нахождения математического ожидания, получим Кх (/) = \ \ e-W+*»i <Я-0М [<*Ф* (ш) аФ @H], D4.9) —1С —1С что после учета (8) и выполнения о'дного интегрирования дает спектральное разложение корреляционной функции, которое отличается от соответствующего разложения для корреляционной функции случайного процесса только конечной областью интегрирования Kx(l)= $ eia"Sx(^)dio (/=... — 2, —1, 0, 1, 2,...)- D4.10) —1С Формула A0) показывает, что КхA) отличается от коэффициента разложения функции 5Л(«>) в ряд Фурье только отсутствием множителя 1/2те, т. е. спектральная плотность может быть представлена в виде в~ы**ю- <44Л1> /=—оо Формула A1) заменяет для случайных последовательностей интегральное соотношение между корреляционной функцией и спектральной плотностью, существующее у стационарных случайных процессов. Рассмотрим две случайные последовательности Xj и Yv Определим корреляционную функцию связи Rxy(j, l) для этих последовательностей как математическое ожидание произведения отклонений элементов этих последовательности о г их математических ожиданий, т. е. положим R*vU> t)=M[(X--X*j)(Yl-yl)\ С/, / = ...-2,-1, 0, 1,2,...). D4.12)
$ 44) СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 425 В случае стационарно связанных последовательностей Rxy (/, /) зависит только от разности индексов j — /, т. е. RxyU> l) = Rxy(l-J)> D4.13) Подставляя в A2) спектральные разложения случайных последовательностей Xj и Т/, которые на основании G) имеют вид Xj — xj=\ ешйФх (со), D4.14) Yi-h= \ешAФу{т), D4.15) —те и учитывая, что для стационарно связанных последовательностей приращения с1Фх((й) и с1Фу(и>) должны удовлетворять равенству М [а'Ф5 (со,) <1Фу (со)] = Sxy (со) В(со — соО tf со do>v D4.16) после простых преобразований получим Rxy V-fl = ] е*u-*Sxy(со)dco. D4.17) — 1Z Соотношение A7) отличается от соответствующего соотношения для случайных процессов только тем, что интегрирование в данном случае производится в интервале (— тс, тс), а не в бесконечных пределах, как это имело место в случае непрерывного аргумента случайной функции. Обозначая l—j = m D4.18) и замечая, что правая часть A7) дает коэффициент разложения в ряд Фурье функции 2тс5Д:3;(со), взаимную спектральную плотность Sxy (со) можно представить в виде бесконечного ряда который в случае дискретного времени заменяет соответствующее интегральное представление для взаимной спектральной плотности стационарных случайных процессов. Итак, формулы спектральной теории стационарных случайных процессов при переходе к стационарным последовательностям претерпевают изменение в двух направлениях: во-первых, во всех формулах, дающих спектральное разложение случайных функций, корреляционных функций и корреляционных функций связи, соответствующие
426 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ'СЛУЧАЙНЫХ ФУНКЦИЙ |ГЛ. VIII интегралы вычисляются в конечной области (— тс, т:), а не в бесконечных пределах, как это имело место для случайных процессов; -во-вторых, спектральные плотности и взаимная спектральная плотность выражаются через корреляционные функции и корреляционную функ- .цию связи соответственнно не в виде интегралов, а в виде бесконечных сумм. Эти отличия приводят к тому, что общие методы спект- .ральной теории стационарных случайных функций, рассмотренные в предыдущих параграфах на примере случайных процессов, остаются применимыми и к случайным последовательностям, хотя окончательные формулы приобретают несколько иной вид. Для уяснения существа вопроса рассмотрим несколько конкретных задач» возникающих при исследовании случайных последовательностей. 1. Задача о выбросах. Под задачей о выбросах для случайных последовательностей понимается определение вероятности выхода ординаты случайной последовательности за данный уровень и нахождение вероятностных характеристик времени пребывания •ординат случайных последовательностей выше данного уровня. Рассмотрим определение вероятности выброса для данного значения аргумента случайной последовательности и определение среднего времени пребывания случайной последовательности выше заданного уровня (решение задачи о выбросах в ее полном объеме и для случайных последовательностей связано с большими трудностями). Пусть задано некоторое число а, определяющее уровень, выбросы за который нас интересуют. Обозначим значение элемента случайной последовательности в произвольный момент j через Ху Тогда искомая вероятность выброса Pj(a) в момент времени у определится равенством Pj(a) = P{Xj^a; a<Xy+1}. D4.20) Для определения этой вероятности введем в рассмотрение двумер- 'ную плотность распределения f(xj, хг) ординат случайной последовательности, после чего вероятность B0) можно представить в виде «интеграла а оо Pj{a)= \ $/(*,, xi + 1)dxuidxj. D4.21) В случае стационарной последовательности двумерная плотность распределения не зависит от индекса j и, следовательно, вероятность Pj(a) будет иметь неизменное значение р(а) для любого значения времени j. Рассмотрим подробнее стационарную нормальную последовательность. В этом случае интеграл B1) легко вычисляется, так как, считая для простоты Xj — Xj+i = Q и обозначая klo\ D4.22)
$ 44i СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ 427 для двумерного закона распределения будем иметь Подставляя B3) в B1) и обозначая переменные интегрирования х и у, для вероятности р(а) получим 2^i-V2 S Ы~^^|гК^ D4-24) -оо о что после интегрирования по х дает <44'25) где Ф (х) — интегральная функция Лапласа. Вероятность р(а) однозначно определяет среднее число выбросов па> приходящееся на заданный интервал времени (О, Г), и среднюю продолжительность выброса ъ так как простые рассуждения дают D4.26) 2. Задача о линейном экстраполировании при известных значениях конечного числа элементов последовательности. Пусть X/ — случайная последовательность, обладающая нулевым математическим ожиданием, элементы которой известны для п моментов времени, предшествующих текущему моменту времени /. Требуется определить линейную комбинацию этих известных элементов Е, D4.27) таким образом, чтобы дисперсия отклонения полученного результата от значения случайной последовательности в момент времени (J-\~ tri)(m^>0) имела минимальное значение, т. е. требуется так определить коэффициенты ат, чтобы удовлетворялось условие M{\Xf+m-?lalXJ.lli\ = m\n, m>0. D4.28) Формулировка этой задачи отличается от соответствующей задачи для случайных процессов только тем, что вместо интеграла в B8) стоит сумма конечного числа слагаемых, и следовательно, требуется определить не весовую функцию, как для случайных процессов, з конечное
428 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ 1ГЛ. VIII число постоянных at. Поэтому, повторяя рассуждения § 19, вместо интегрального уравнения получим систему линейных алгебраических уравнений, имеющую вид п yialKx(J-s,j~-l) = Kx(j-s,j + m) (s=l, 2, ... , п), D4.29) которая в случае стационарной последовательности приобретает еще более простой вид п ? atKx (s-l) = KAs + m) (s=l,2,...,/i). D4.30) Решение системы уравнений B9) или C0) не связано с какими- либо принципиальными трудностями, но при большом п становится утомительным. 3. Задача о линейном экстраполировании стационарной случайной последовательности по всему прошлому последовательности. В качестве последнего примера рассмотрим экстраполирование стационарной случайной последовательности в том случае, когда для экстраполяции могут быть использованы значения элементов последовательности во все предыдущие моменты времени. В этом случае аппроксимирующее выражение примет вид бесконечного ряда Yj=fialXJ_l, D4.31) для нахождения коэффициентов которого, полагая формально в C0) л = оо, получим систему уравнений оо ^alKAs-l) = KAsJrm) (s=l, 2, 3, ... ). D4.32) i = \ Система C2) уже не может быть решена обычными алгебраическими методами, так как она состоит из бесконечного числа уравнений, определяющих бесконечное число неизвестных. Однако ее решение во многих практически интересных случаях может быть найдено, если перейти от корреляционной функции к спектральной плотности. Воспользовавшись для этого выражением A0), систему C2) можно преобразовать к виду = 0 (r=h 2, 3, ... ), D4.33)
$ 45] СЛУЧАЙНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 429 где введено обозначение оо F (о)) =*2 аье-1Ы, D4.34) i=\ причем дисперсия ошибки экстраполирования может быть вычислена по формуле } I /=1 -тс Задача, таким образом, сводится к определению функции F(w), удовлетворяющей C3) при любом положительном г и разлагающейся в ряд Фурье C4), коэффициентами которого и являются искомые постоянные av Решение этой задачи, в общем виде представляющее значительные математические трудности, впервые было получено А. Н. Колмогоровым в 1941 г. ([19]). Решение задачи в том случае, когда спектральная плотность Sx(u>) является дробно-рациональной функцией со, может быть получено сравнительно простым способом. Необходимые расчетные формулы можно найти, например, в [44]. § 45. Случайные функции нескольких переменных (случайные поля) Наряду со случайными функциями одной переменной в ряде задач возникают случайные функции нескольких переменных, или случайные поля. Примером таких функций являются ординаты поверхности моря как функции координат горизонтальной проекции выбранной точки волновой поверхности и времени, составляющая скорости ветра как функция координат выбранной точки земной атмосферы и т. п. Пусть X (?!, ?2> • • • у ?л) является случайной функцией своих (неслучайных) аргументов $v fi2, ..., ?„, которые можно рассматривать как координаты некоторой точки А в пространстве п измерений. Будем обозначать для краткости случайную функцию X (lv ?а, ..., in) через Х(|), понимая под | многомерный вектор с составляющими м> ?2> * • • * *п* Очевидно, так же как и для случайной функции одного аргумента, Х(§) может быть нормальной случайной функцией или не обладать свойством нормальности. Кроме того, подобно понятию стационарной функции в широком смысле, в многомерном случае можно ввести понятие однородного случайного поля, понимая под этим такую случайную функцию нескольких
430. ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ 'ГЛ. VTI1 переменных, для которой математическое ожидание является постоянным, а корреляционная функция зависит только от разности векторов N|* и §', т. е. КЛЪ', Г) = КЛг\)> D5.2) где Л = Г-Г- D5.3) Для однородного случайного поля имеет место спектральное разложение, являющееся прямым обобщением разложения стационарных случайных функций одной переменной, т. е. при наличии однородности оо оо Х(Ъ) — Х= I ...(л)... $ *'«*5«1Я>Ф(©). D5.4) — 00 — ОО Здесь о) — вектор с составляющими со^ <% ..., <ол, (о), I) = «о^ + «А +... + «>А, D5.5) а приращения я-го порядка случайной функции Ф(ш) удовлетворяют условиям )] = 0, D5.6) = Sx (со) S (<о — о') dwj... d<bn d&\... d<a'n> D5.7) где через В (о> — ш') обозначено произведение дельта-функций 8 (со _ ©') — 8 (ш, — со,) 8 (ш.2 — оJ)... 8 (шя — шя). D5.8) Следствием D) и G) является спектральное разложение корреляционной функции случайной функции нескольких переменных, которое имеет вид Кх (т|) = J ... (л)... J г'^ч)^ (о) Ао,... d(on. D5.9) —00 —ОО Применяя к формуле (9) п раз обратное преобразование Фурье, получим 00 ОО $*(«») =j2Sj* S •••<">••• J *-"in|1Kjr(i|)«fiji..-rf4«- D5.10) —оо —оо Таким образом, и для однородного случайного поля (для функции многих переменных) задание корреляционной функции эквивалентно заданию спектральной плотности и, наоборот, спектральная плотность
§ 45J СЛУЧАЙНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 4ZV случайного поля однозначно характеризует его корреляционную» функцию. Еще более частным случаем функции многих переменных, чем* однородное случайное поле, является однородное изотропное случайное поле, для которого корреляционная функция зависит только от расстояния т) между двумя точками поля и не зависит от направления вектора ц. В этом случае (п—1) интегрирование в A0) может быть выполнено, а оставшийся однократный интеграл будет зависеть только от величины вектора о>. Действительно, вводя в A0) вместо прямоугольных координат tjj, 7]2,..., т]л многомерные сферические координаты, выбрав в качестве полярной оси направление вектора со, т. е. полагая 7Ц = 7] COS <pj, 7]2i=7] sin cpi cos cpa, 7j3 = 7j sin ®i sin <p3 cos cp8, D5.1; •qn 1 = ri sin cpi sin cp2... sin срЛ_2 cos сря_1, 7}Л = т] sincpj sin cp2... sin сря_2 sin срл_!, и учитывая, что за счет якобиана преобразования при переходе от прямоугольных координат к сферическим возникает множитель -1 sin n~* <p, sin "-3 <р9... sin срл_2, D5.12) для изотропного однородного поля формулу A0) можно переписать в виде Sx (ш) = ^ -t sin-* cp, d>fl d4, D5.13) о о где ^л — интеграл от остальных множителей якобиана по <ра, <р3,. ¦ ¦ •••» ?«-!• После выполнения интегрирования в A3) по переменной ои. учитывая интегральное представление для функции Бесселя J^(z) [45]: = (°'5;f)V Г v + е± sin получим 5Л (о)) = Г A) Г ^ . D5.14).
432 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII Аналогично, если ввести сферические координаты при интегрировании в (9), то для изотропного однородного поля получим . D5.15) Для определения множителя kn, входящего в формулы A4) и A5), п рассмотрим функцию е 1~* , интеграл от которой по всему л-мерному пространству одинаково легко вычислить как в я-мерных сферических координатах, так и в прямоугольных координатах. Так как результат интегрирования не зависит от выбранной системы координат, то должно быть ( \ . D5.16) / Выполняя интегрирование, получим явное выражение для коэффи- циента kn: что после подстановки в A4) и A5) дает 00 Sx («О = Bк)п ,1о)(я-,)/г 5 К» AЙ Лп-ы*(щ) Ч»лdYj, D5.18) О оо К, G)) = B*)»/« -^ [ J(n-,u^fi)Sx (»)«»»/«А». D5.19) О Таким образом, для изотропных однородных полей корреляционная функция и спектральная плотность являются функциями одной переменной, причем, подобно тому как это имело место для случайных функций одной переменной, каждая из функций Кх(у\) и Sx(y\) выражается через другую с помощью однократного интеграла, вид которого, однако, отличается от интеграла, имевшего место для одномерного стационарного процесса. Вернемся к рассмотрению однородного неизотропного поля. Заметим, во-первых, что, закрепляя одну из переменных Ър из /г»мерного поля мы получим поле п — 1 измерения, корреляционная
§ 45) СЛУЧАЙНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 433 функция и спектральная плотность которого вследствие однородности- процесса не зависят от выбранного значения ?у и однозначно определяются функциями Кх(%) и Sx((d). Действительно, обозначив получающееся таким образом случайное поле буквой К(|'), где штрихом будем отмечать вектор п — 1 измерений, на основании A) замечаем, что корреляционная функция Ky(v[) может быть получена из корреляционной функции КХ(У\) путем простой замены /-й компоненты вектора rj нулем, т. е. D5-20> Для получения связи между Sx(to) и Sy(o/) проинтегрируем A0> по о)у, после чего получим 0 = Щп* J •••(«)••• I e-^'n')KAr\){i J e-O/Vdm^dn. D5.21) Интеграл, стоящий в фигурных скобках, в соответствии с A0.21) равен 8(tjy). Следовательно, интегрирование по t\j в B1) может быть выполнено, и мы получим '- D5.22) Выражение, стоящее в B2) справа, — искомая спектральная плотность Sy{(d'); следовательно, получим окончательно оо D5.23) Таким образом, можно сформулировать окончательное правило: для получения корреляционной функции и спектральной плотности однородного случайного поля (я — /) измерений, получаемого из однородного случайного поля п измерений путем закрепления / аргументов этого поля, необходимо в корреляционной функции последнего соответствующие аргументы заменить нулями, а спектральную плотность проинтегрировать по составляющим вектора о>, соответствующим закрепленным переменным исходного поля. Так как направление осей координатной системы 5Ь ..., ?я может быть выбрано произвольно, то полученные выше формулы позволяют 15 А. А. Свешников
434 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII определить корреляционную функцию и спектральную плотность кривой, получающейся в сечении поверхности случайного поля Х(|) плоскостью, проходящей через ось X и составляющей заданный угол <с осью Hi. Для этого нужно повернуть оси координат Е1? Е2, ..., 5Я таким образом, чтобы одна из них (например, ось %[) совпала с заданной плоскостью и в соответствии с формулой B0) для получения корреляционной функции положить равными нулю все переменные tj}, кроме неременной у\'и соответствующей Sj, и в соответствии с фор* мулой B3)! для получения спектральной плотности произвести интегрирование что всем переменным ш), кроме a>j. Случайные поля, подобно случайным функциям одной переменной, могут быть дифференцируемыми или недифференцируемыми, причем в последнем случае производная может не существовать для всех аргументов поля или только для некоторых из них. Повторяя рассуждения, которые были приведены в § 6 для случайной функции одной переменной, можно убедиться, что условием дифферента руе- мости случайного поля по одному из его аргументов (например, по ?у) является существование второй частной производной от корреляционной функции -5Т—-^— K(lv 50 при ?lf/=(i2fdr h,j Ч/ Если производная существует, то для нахождения корреляционной функции производной -^-АГ(|) необходимо найти вторую смешанную частную производную от корреляционной функции Кх Ei> |2), т. е. Кдх (Si, 50 = - * Кх Fь 60- D5.24) Остается также справедливым для случайного поля и общее правило нахождения корреляционной функции результата применения линейного ©ператора к случайной функции многих переменных, полученное в § 7, т. е. для этого достаточно дважды применить этот линейный оператор к корреляционной функции исходного поля, рассматривая ее сначала как функцию аргумента 5i» а затем — как функцию аргумента |2- Если случайное поле однородно, то производные от него будут также обладать однородностью, и для нахождения их спектральных плотностей достаточно умножить спектральную плотность исходного поля на соответствующие степени /о>у. Например, если производная ^g D5.25) существует, то S, И = 1 *»;!¦$,(»> D5-26)
, 451 СЛУЧАЙНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 435 Аналогичные формулы справедливы и для производных более высокого порядка. Для получения этих формул достаточно воспользоваться спектральным разложением D) и повторить все выкладки, выполненные для стационарной случайной функции одного переменного. При исследовании случайных полей возникают задачи, подобные тем, которые были рассмотрены для случайных функций одной переменной. Решение большинства этих задач может быть получено методами, аналогичными одномерному случаю, причем, так же как й для функции одного переменного, часть из этих задач может быгь решена в рамках корреляционной теории, другие же задачи требуют знания законов распределения ординат случайных функций или моментов более высокого порядка. Для нормальных процессов математическое ожидание и корреляционная функция случайного поля полностью определяют все законы распределения и, следовательно, полностью характеризуют случайную функцию многих переменных. Рассмотрим несколько конкретных задач, возникающих при исследовании случайных полей, причем для простоты ограничимся только двумерными полями. Задача 1. Определение среднего числа максимумов, приходящегося на единицу площади двумерного однородного поля Пусть С (хУ у) — однородное случайное поле, характеризующее, например, ординаты волнового профиля в произвольной точке пола с координатами х, у. Предположим, что ^(лг, у) является однородным нормальным полем, спектральная плотность которого St(a>j> щ) известна. Требуется определить среднее число максимумов, принимаемое функцией (ь(х, у) на единицу площади плоскости хОу — среднее число вершин волн, если С(*> у) — ординаты волнового профиля. Функция ?(х, у) в точке с координатами х, у будет иметь максимум, если в этой точке производные х Ъх Чу ду одновременно меняют знак с + на — и одновременно выполняется неравенство ttj — Wyy^0» D5.27) где обозначено . дК (лг, у) г [гхх~ дха 9 ^уу' Таким образом, задача сводится к определению вероятности PQdxdy одновременного выброса случайных функций С* и Су за 15*
436 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ 1ГЛ. VIII нулевой уровень при выполнении неравенства B7). Следовательно, при положительных приращениях dx и dy, наряду с неравенством B7), должны выполняться неравенства D5.29) Замечая, что вследствие малости dx и dy можно положить x + dx, у) = С* (х, У) + <? =С* С*. -V) + 0« (х. J0 <**. D5-30) = Сл (х, у) + С,, (х, у) dy, D5.31) искомую вероятность можно представить в виде /,я,Ь D5.32) Если обозначить плотность вероятности системы случайных величин C*(*> У)> Су(Аг, j/), ^(jp, j;), tjpC*» у), Сдсу (-хг, у) через / (чА'» ^У» Cjpjc» Cyy> 4jpy)> ТО О 0 V47y~y -*-чул> -с«*« />0^а!>'=5 S 5 S $ /к*, с* <и„ с,», с*) х —оо —со _ i/"? г О О V хх уу XdbdZydbydbx&yy D5.33) Два первых интегрирования в C3) могут быть выполнены сразу, так как интегрирования производятся в бесконечно малых интервалах. Поэтому после сокращения в обеих частях равенства на dxdy получим О 0 V^xx^yy jО, О, С^, С^, ^(KxytKxxd^y D5.34) Формула C4) справедлива для любых случайных полей, однако * вычисление полученного двойного интеграла может быть упрощено только для нормального случайного поля. В этом случае все величины Zi = C*> Z2 = Cr Z3 = C^, Z4 = Cyr tZz = ^xy являются нормальными, математические ожидания которых
3 451 СЛУЧАЙНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 437 равны нулю, а корреляционная матрица определяется формулами оо д2 I С С — GO OO = \ \ Sr(<i),, »)l = ^t> = l' J J " OO _0 = \ J Sz^v OO = [[ Sr @)i, 0>, П1 = Т12 = 0 J J C — OO OO = \ \ S. @)!, 0J) @| — 00 00 — 00 OO = \ \ O- ((Oj, D5.35) которые легко получаются тем же методом, который был использован для получения корреляционной функции случайной функции одного переменного. Полученные значения элементов корреляционной матрицы показывают, что система пяти случайных величин Zv Z2, Z3, Z4, Z8 распадается на две системы взаимно некоррелированных (а вследствие нормальности, значит, и независимых) случайных величин: Zj, Z2 и Zjp ZA, ZB. Следовательно, плотность вероятности zb). D5.36)
438 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ |ГЛ. VIII Подставляя это выражение в C4) и выражая плотности вероятности нормальных случайных величин через элементы корреляционной матрицы, получим Рп== ?-5/2 О О j J J 71 1/тГ 1/А ~2Д 2j V/^ где ^33 ^34 ^35 ^43 ^44 ?43 ^83 ^84 ^55 D5.37) D5.38) а Лу/ — алгебраическое дополнение определителя А, соответствующее элементу kiv Интегрирование по zb в интеграле C7) может. быть выполнено, и мы получим о 1 L <А»г* z,z, dz% dz,. D5.39) Задача 2. Определение среднего числа выбросов v случайной однородной функции ^(хУ у) за уровень а, приходящегося на единицу площади плоскости хОу. Данная задача аналогична задаче о среднем числе выбросов случайной функции одной переменной за данный уровень, однако в данном случае «выброс» происходит по непрерывным кривым, являющимся линиями пересечения поверхности Z=^(x, у) с плоскостью z = a. Для решения этой задачи рассмотрим проекцию / одного из таких контуров на плоскость хОу. Проведем две касательные к кон- туру /, параллельные оси Оу (пря- F мые / и // на рис. 37). Тогда точками касания этих прямых контур / окажется разделенным на две части. Будем рассматривать только часть контура, ближайшую к оси Ох (нижнюю на рисунке). Очевидно, общее число выбросов, имевших место на части плоскости Оху площади S, равно 0 Рис. 37.
§ 451 СЛУЧАЙНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 439 разности общего числа минимумов, имеющих место на указанной части контуров /, и общего числа максимумов, расположенных на этих же частях контуров *) (если не учитывать те контуры, которые пересекаются с границей области S, что можно делать, так как S можно считать сколь угодно большой, когда влияние этого «граничного» эффекта станет сколь угодно малым). Следовательно, искомое число выбросов v(a), приходящееся на единицу площади, равно среднему числу минимумов vj (а), имеющихся на указанных выше частях контуров /, приходящемуся на единицу площади, за вычетом среднего числа максимумов v2(a) на этих кривых, приходящегося на единицу площади, т. е. v(a) = v1(e) — v,(a> D5.40) Определим плотность vt (а). Для этого выберем элемент площади dxdy и определим вероятность того, что в этом элементе окажется один из указанных выше минимумов. Так как элемент площади предполагается произвольно малым, а функцию {,(х, у) мы считаем непрерывной, то попадание в этот элемент нескольких минимумов можно считать невозможным и, следовательно, вероятность попадания одного минимума в рассматриваемый элемент будет равна vj dx dy. Для выражения этой вероятности через закон распределения ординат функции ? [ху у) заметим, что если минимум действительно попал в элемент dxdy, то внутри этого элемента найдется точка с координатами x-\-dXi, y-\-dylf в которой удовлетворяются условия D5.41) из которых первое является следствием того, что контур / является пересечением поверхности Z—Цлг, у) плоскостью z = a, .второе условие является следствием наличия минимума в рассматриваемой точке, а третье условие показывает, что мы рассматриваем только выбросы снизу вверх. Разлагая функции C(x-\-dxv y-\-dyx) и С*С*-Ь^-*1» y-\-dyi) в ряды около точки х, у> сохраняя при этом только члены первого порядка малости и учитывая, что 0 ^dxt *^dx, d получим следующие пределы изменения С(^» у) и *> у)' , J0< — 0**<**> Су С*. У)>0> D5.42) *) Контур / считаем непрерывным с непрерывной касательной.
440 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII обеспечивающие нахождение минимума одного из контуров в выбранном элементе площади dxdy. Следовательно, для искомой вероятности получим П , D5.43) — оо О О a— t.ydy где /(С, С*> С_у> С**)— плотность вероятности системы случайных величин С, С*! Су» Catjc- В формуле D3) интегрирования по С и ^х могут быть выполнены, так как они выполняются в бесконечно узких интервалах. Сокращая после этого на dxdy у получим О оо *i(e) = — 1\ Па, О, С,, Ъх)^ххсКу<Кхх. D5.44) — ооО Для того чтобы в элемент площади dxdy попал максимум нижней части контура /, необходимо, чтобы выполнялись условия а — Су(д - Ъх С*. J') Ar < С* {х, у) ^ 0. D5.45) Следовательно, для плотности va(a) получим va (a) d*d[y = Р {* — Су dy <С < а, — С^^<С^<0, С^>!0, С^^О}= /(а, О, С,, С,*) С/,** dCr dC*r D5.46) 00 00 о о Таким образом, окончательно для среднего числа выбросов на единицу площади v(a) получим оо О О —• оо оо оо со о-оо ' 'D5^7) Для дальнейшего вычисления v(a) необходимо знать плотность вероятности /(С, С*» Су» С**)- Если ординату случайной функции CC*i у) можно считать нормальной, то нормальной будет и система случайных величин С> С*» Су) ^хх, а для плотности вероятности / можно будет написать (см. B.29)) -2? 2 Ал^« D5>48)
§ 451 СЛУЧАЙНЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ где для краткости обозначено Х\ = С, АГ2 = С* > ^у> 441 D5.49) Д — определитель, составленный из элементов корреляционной матрицы kjly a Aji — алгебраическое дополнение этого определителя, соответствующее элементу kjt. Если двумерная корреляционная функция однородного поля K(f\h tq2) задана, то элементы корреляционной матрицы определяются формулами, аналогичными формулам, полученным при решении задачи 1: *и = К@, 0), 0) =0* ^2=0' 41 Подставляя E0) в D8) и выполняя интегрирования в D7), полу- D5.50) чим D5.51) Задача 3. Определение средней площади пересечения s двумерной случайной функщти Z=(t(x, у) с плоскостью z = a и средней длины /контура пересечения поверхности Z=(,(x, у) с плоскостью Рассуждая так же, как в теории выбросов стационарной случайной функции одной переменной, заключаем, что при увеличении площади 5 выбранной части плоскости Оху отношение суммарной площади, вырезаемой поверхностью Z=C(^> у) из плоскости z = a, к площади 5 должно стремиться к вероятности того, что ордината случайной функции Цдг, у) будет больше а, т. е. к [1—Fc(a)]> где FC(Q — функция распределения ординаты случайного поля. С другой стороны, на площадь 5 в среднем приходится v? выбросов, которым соответствует суммарная площадь vsS, вырезанная из плоскости z = a. Поэтому, разделив последнее выражение на S> получим sv(a)=l— Fc(a), D5.52) или в другой форме где v(a) определяется D7).
442 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ (ГЛ. VIII Для определения средней длины контура / заметим, что общая длина всех контуров С (дг, у) = а, оказавшихся на площади S, может быть вычислена двумя независимыми способами. Во-первых, эта длина равна среднему числу выбросов vS, приходящихся на площадь S, умноженному на среднюю длину контура /, т. е. равна v (a) SL С другой стороны, эта же длина может быть найдена как средняя длина контура [х (а), приходящаяся на единицу площади, умноженная на площадь S, т. е. fi(a)& Приравнивая эти выражения друг другу и сокращая на S, получим Поскольку v(a) определена D7), задача сводится к нахождению ) Выберем для этой цели произвольную точку контура / и проведем в этой точке нормаль п к контуру. Построим около выбранной точки элемент площади. Элемент нормали dn связан с соответствующим приращением функции СС*г, у) соотношением = d^ D5.55) где Уй + Су — градиент функции ^{ху у), вычисленный для данной точки. Вероятность попадания элемента контура dl в выбранный элемент площади можно вычислить, или умножая dldn на плотность |х(а), или интегрируя плотность распределения /(С, С** Су) в пределах a^l^a-\-V^%-\-Vydriy —оо^Сдг^оо, — оо^Су^оо, и умножая полученный результат на dl. Следовательно, имеем /(С, С* ydCdkdC,. D5.56) — оо — оо Выполняя в правой части равенства интегрирование по d? и сокращая обе части равенства на dldnt получим &x Лг D5.57) 0 Если случайный процесс нормальный, то, сохраняя обозначения E0), получим /(С, С*, у = D5.58)
§ 461 СИСТЕМЫ С НЕПРЕРЫВНО РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ 443 Подставляя E8) в E7) и переходя к полярным координатам С* = г cos <р, Су = sin ср, D5.59) замечаем, что интегрирование по г выполняется 1 *1__ч/2 + у (^зз — h<d cos 2cp — ?23 sin 2<р d<p. D5.60) Полученный интеграл может быть приведен к стандартной форме полного эллиптического интеграла первого рода = \ Y\ — A* sin2 9 d<f. D5.61) о Выполнив необходимые преобразования, получим Vkn Таким образом, для нормального случайного поля С (^, у) для величин v (а), (х (а), 5 и / могут быть получены простые расчетные формулы. Рассмотрение вероятностных характеристик двумерного и трехмерного нормального поля можно найти, например, в [27]. § 46. Вычисление вероятностных характеристик динамических систем с непрерывно распределенными параметрами Динамические системы, рассматривавшиеся в предыдущих частях данной книги, характеризовались системами обыкновенных дифференциальных уравнений. Подобный подход к исследованию динамических систем возможен в том случае, когда система характеризуется конечным числом параметров, являющихся обобщенными координатами системы, соответствующих конечному числу степеней свободы системы. Однако существуют задачи, для которых нет возможности ввести конечное число обобщенных координат, а приходится рассматривать функции непрерывных аргументов, характеризующих состояние системы. Примерами таких систем могут служить: различные системы, состоящие из упругих тел в том случае, когда недостаточно знать общую
444 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII деформацию упругого тела, а необходимо исследовать, например, распределение напряжений в различных точках тела; различные гидродинамические и аэродинамические задачи, например исследование поля скоростей взволнованного моря; явления, связанные с распространением электромагнитного излучения; распространение звука в различных средах и т. п. Подобные системы мы будем называть динамическими системами с непрерывно распределенными параметрами. Специфика исследования таких систем заключается в том, что их поведение, в отличие от систем с сосредоточенными параметрами, рассматривавшимися ранее, характеризуется уже не обыкновенными дифференциальными уравнениями, а дифференциальными уравнениями в частных производных. Динамические системы с непрерывно распределенными параметрами также могут находиться под воздействием различных случайных возмущений, характеризуемых случайными величинами или функциями. Некоторые из этих возмущений возникают вследствие случайности начальных или граничных условий, другие являются следствием наличия случайных внешних сил и, наконец, в ряде задач случайными являются функции, характеризующие свойства самой системы (например, плотность среды, в которой распространяются упругие колебания, и т. п.) Так же как и для динамических систем, характеризуемых обыкновенными дифференциальными уравнениями, исследование динамических систем с непрерывно распределенными параметрами осуществляется сравнительно просто только в том случае, когда система линейна, т. е. и функция, определяющая состояние системы, и функции, Являющиеся внешними возмущениями, входят в уравнение движения системы линейным образом. Однако и в этом случае в ряде задач возникают добавочные трудности, связанные с решением дифференциальных уравнений в частных производных. Поэтому даже для решения стационарных задач в рамках корреляционной теории далеко не всегда удается получить общее решение, аналогичное, например, результатам, получаемым в спектральной теории стационарных случайных процессов, и приходится рассматривать методы решения, специфические для данной задачи. Тем не менее некоторые общие замечания об исследовании линейных динамических систем с распределенными параметрами, находящихся под воздействием случайных возмущений, все-таки можно сделать. Решение этих задач в общем виде удается получить в двух случаях: когда случайная функция U(xv xiy..., хп), являющаяся характеристикой состояния системы, может быть явно выражена через случайные функции, поступающие на вход системы, или когда случайные
§ 461 СИСТЕМЫ С НЕПРЕРЫВНО РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ 445 функции, поступающие на вход системы, могут быть представлены в виде такой суммы (интеграла) неслучайных функций со случайными коэффициентами, чтобы для каждого слагаемого дифференциальное уравнение системы могло быть решено в конечном виде. Рассмотрим оба эти случая подробнее. Пусть U{xb ...,хп)является функцией, характеризующей состояние системы (например, поле скоростей или напряжений в различных точках системы), a C(^i> ...» хп) — случайная функция, действующая на систему. Предположим, что решение U уравнения системы удается получить в виде \\ ...dlw D6.1) (D) где функция Q(xit ..., хп; Zly ..., Ъп) (функция Грина уравнения системы) и область D определяются видом рассматриваемого уравнения. Тогда, применяя операцию нахождения математического ожидания к A), получим \ D6.2) (D) Аналогичным образом, перемножая равенства A) для различных значений аргументов xv ..., хП) находя математические ожидания произведений и рассматривая произведение интегралов как многократный интеграл, получим связь между любыми моментами ординат случайной функции U и соответствующими моментами ординат случайной функции С Таким образом, определение вероятностных свойств линейной динамической системы с непрерывными параметрами можно считать в принципе законченным, если решение уравнения системы удается получить в виде A). Способ получения такого решения существенно зависит от типа дифференциального уравнения в частных производных, области изменения независимых переменных уравнения, для которой ищется решение, и, наконец, от характера граничных и начальных условий. Предположим теперь, что функция t(xh ..., хп) является однородным случайным полем и, следовательно, может быть представлена в виде (см. D5.4)) ..о *„) = ? + $... (п) ...$ *У dW<b(av ..., о)л), D6.3) -оо где с?(л)Ф удовлетворяет условиям D5.6) и D5.7).
446 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII Предположим далее, что п(хь ..., хп) является решением уравнения системы, удовлетворяющим всем начальным и граничным условиям, соответствующим поступлению на вход системы неслучайной величины С, а ср (хь ..., *я; <*>v ..., юп) — решение того же уравнения (с соблюдением нулевых начальных и заданных граничных условий) Д при поступлении на вход системы неслучайной функции е Тогда вследствие линейности рассматриваемой системы для функций U(xh ..., хп) можно написать «= \... (ri) . • Лср (xh ..., xn\ co1?..., со ) ^(Л)Ф ((о„ ..., соД D6.4) -oo J Находя математическое ожидание обеих частей последнего равенства и учитывая D5.6), получим M[U(xu .,., ха)] = п(х19 ..., дгя). D6.5) Перемножая равенства D), написанные для значений xv ,.0 хп и ^Ч)!» ••¦> ¦^я + 'г1л> и находя математические ожидания обеих частей полученного таким образом равенства, с учетом D5.7) будем иметь K(xlf ..., хп; со $ $ l» —i «я) X rfcort. D6.6) Таким образом, для корреляционной функции случайного процесса U(xv ..., хп) в этом случае удается получить общую формулу. Если входная случайная функция С не является однородной, но может быть представлена в виде ..., хп) = •••' «»Х D6.7) где g—заданная функция, а Ф(и>ь ..., «>„) — случайная функция, удовлетворяющая D5.6) и D5.7), и удается получить решение ср дифференциального уравнения системы, соответствующее поступлению на вход системы функции g, то формулы E) и F) остаются по- прежнему справедливыми.
§ 46] СИСТЕМЫ С НЕПРЕРЫВНО РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ 447 Как ясно из вышеизложенного, даже в рассмотренных двух случаях, когда удается^написать общее выражение для моментов ординат функции О(хь ..., хп), характеризующей состояние системы, непосредственное получение расчетных формул все-таки упирается в решение конкретного дифференциального уравнения в частных производных, которое не може^ быть получено в общем виде, а должно отыскиваться каждый раз заново с учетом специфики решаемой задачи. Для иллюстрации применяемых при таком решении методов рассмотрим несколько типичных уравнений в частных производных, которые могут представлять и непосредственный интерес в различных случаях. 1. Уравнение теплопроводности. Рассмотрим систему, состояние которой определяется непрерывной функцией двух переменных U(t> х)У являющейся решением уравнения ^-а*^=0; 0^</, t^O D6.8) при начальных и граничных условиях. tf(O,6) = *8E); U(t,O) = X1(t), U{ty 0 = ^@, t^O; D6.9) где а — постоянная, a Xx(t), X$(t), ХгA)— некоррелированные между собой стационарные функции своих аргументов, имеющие заданные математические ожидания хь 'Хь хг и спектральные плотности S% (<*>)> 5*0°) и S3(ty соответственно. Примером такой задачи может служить определение распределения температуры U вдоль стержня длины / в момент времени t, если боковая поверхность стержня лишена теплового контакта с окружающей средой, концы стержня поддерживаются при температурах соответственно Xt(t) и X*(t), а начальное распределение температуры (при ?=0) задано функцией ХгA). Уравнение (8) при добавочных условиях (9) имеет решение (см. [18], стр. 81) D6.10) Таким образом, случайная функция U(t, S) явно выражена через случайные функции Хх (t), X*2 (t) и Хд (I). Так как это выражение линейно, то вычисление моментов функции U(t, l) не представляет труда.
448 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII Так, применяя операцию нахождения математического ожидания к обеим частям равенства A0), получим -2 ТС ±т /—1 оо — 1L sin ^6- D6.1: Находя математическое ожидание квадрата A0) и вычитая из полученного результата й(?, S), после ряда очевидных преобразований будем иметь D [?/(*, 6)] = ( ^фГ(/_6)'со^ 1 [^лп W + К*2 W] ^т}, D6.12) /-1 1^' Переход от одномерного уравнения теплопроводности к двумерному или трехмерному не приводит к принципиальным усложнениям, если только область, в которой ищется решение уравнения теплопроводности, имеет простую форму. 2. Уравнение Лапласа. Рассмотрим движение жидкости, занимающей нижнее полупространство (рис. 38), возникающее вследствие Рис. 38. того, что в начальный момент времени поверхность жидкости отличалась от равновесной (горизонтальной), а поверхностные частицы жидкости имели начальные значения вертикальной составляющей скорости. Обозначим V(x, у, z, t) вектор скорости частицы жидкости, имеющей координаты х, у, z в момент времени L Примем допущение,
§ 461 СИСТЕМЫ С НЕПРЕРЫВНО РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ 449 как это обычно делается в теории волновых движений идеальной жидкости, что амплитуда волнения достаточно мала, а движение жидкости потенциально. В этом случае вместо векторной функции V(x, у, z> t) можно ввести скалярную, функцию U(x, у, z, t) — потенциал скоростей, связанную с V соотношением у, zy t) = gvad(J(x, у у Zy t). D6.13) Функция U удовлетворяет уравнению Лапласа 5-? + з-т- + хт =0 D6.14) (ijc fiv uz и граничным условиям : = — оо, U=0y ) D6.15) причем, как это доказывается в гидромеханике, последнее соотношение сохраняется для любого 2<:0. Кроме граничных условий, справедливых для любого t^0} функция U должна удовлетворять начальным условиям, которые в данной задаче могут быть записаны в виде U(x9 у, 0, О) = /чС*, У), ди(х**ЬЪ |t=Q =Ft(x,y), D6.16) где Fi(x, у) и F$(x, у) — случайные функции, которые мы будем считать однородными. Учитывая однородность этих функций, имеем Fj (х, у) = § *«**w> d* Фу (р, q) (/ = 1,2), D6.17) —00 где случайные функции Фу(р, ^) удовлетворяют соотношениям = S/ (p, q) 8y, 8 (р — Л) »(? — УО Ф dpx dq dqh D6.18) (P4) — Двумерная спектральная плотность, a 811 = S22=1, 8u = o. Так как рассматриваемая задача является линейной, а функции Р\(х>У) и F*(x>y) линейно выражены через неслучайные функции exp{i(px-\-qy)}, то, найдя решение уравнения Лапласа A4), которое удовлетворяет всем граничным условиям, а также начальным условиям, в которых вместо случайных функций F\{x9y) и F*(x>у) взята неслучайная функция ехр \i (px-\-qy)}9 в соответствии с G) искомое решение U(x, y} z, t) можно будет получить путем умножения полученных
450 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII решений на d*$i(p, q), ^2Ф2(р> q) и интегрирования. Непосредственной проверкой можно убедиться, что такими решениям будут ) и = где v = )//?* 4-?*• Поэтому для искомой функции U(x> у, z, t) получим U(x, у, г, 0 = ^ е1 »*+9У-У* '>+« [«РФ, (f/, д) + у= «РФ, (р, D6.19) или, обозначив квадратную скобку в последнем равенстве через сРФ(р, д), получим окончательно Щх, у, z, 0= §eHpx+'y-Vi*)+VZd4>(p, д), D6.20) —00 где дифференциалы и*Ф(р, q) удовлетворяют соотношению МК2Ф*(/?, q)d*O(ph q{)} = = S(p, q)b{p—px)b{q — ql)dpdpxdqdqh D6.21) а спектральная плотность S(p, q) линейно связана со спектральными плотностями S\(p, q) и S2(/?, q)*). Решение уравнения Лапласа в данном случае можно было получить сравнительно просто, так как область, в которой нужно было найти решение, имела простую форму (полупространство). В общем случае произвольной области и любых граничных условий решение уравнения Лапласа может быть связано с большими вычислительными трудностями. Однако во многих прикладных задачах аналитическое решение может быть получено. 3. Волновое уравнение. В качестве последнего уравнения рассмотрим волновое уравнение для неограниченной струны, т. е. уравнение [40] ai ° *^° оо<*<о°. D6-22) где скорость а распространения колебаний вдоль струны зависит от упругих свойств струны и удельной плотности материала струны (плотности на единицу длины струны). Уравнение B2) однозначно определяет колебания струны, если известна начальная форма струны и скорость движения ее точек , *) Более подробное решение этой задачи см. Свешников А. А., Определение вероятностных характеристик трехмерного волнения моря. Изв. АН СССР, ОТН, Механика 3, 1959.
§46] ЧСИСТЕМЫ С НЕПРЕРЫВНО РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ 451 в начальный момент времени, т. е. если дано tfft 0) = Хх E), Ut ft 0) = X* (?), D6.23) где Xi(V) и Х%(%) могут быть или случайными или числовыми (не случайными) функциями своих аргументов. Решение уравнения B2) может быть записано в общем виде *) at U& 0 = у [*, (I + at) + *, (S — at)] + -^ ^ ^3<?-hTj) ah). D6.24) —at В полученное выражение ординаты функций Xt(l) и Х2(?) входят линейно. Поэтому, если эти функции являются случайными, а их математические ожидания и корреляционные функции известны, то нахождение математического ожидания и двумерной корреляционной функции случайного поля ?/(Е, t) не связано с принципиальными трудностями и может быть выполнено обычными для таких задач методами (т. е. путем нахождения математических ожиданий ?/(?, i) и произведения ?/(Е,, tt) ?/(E2, Щ. В некоторых задачах случайными являются не только начальные условия, но и параметры системы, входящие в уравнение ее движения в качестве коэффициентов. Предположим, например, что в рассматриваемой задаче плотность струны не постоянна вдоль струны, а является случайной функцией расстояния t В этом случае параметр а в уравнении B2) становится функцией ?, что существенно усложняет решение этого уравнения. Однако часто отклонение случайного параметра системы от его математического ожидания можно считать малым, что позволяет существенно упростить решение задачи. Пусть, например, в рассматриваемой задаче отклонение плотности струны от ее среднего значения вызвано случайными дефектами ее изготовления. В этом случае в B2) можно положить а* = ашо + Хг(Ь), D6.25) где а0 — постоянная, а Хг (?) — случайная функции с нулевым математическим ожиданием, большие значения ординат которой имеют весьма малую вероятность и, следовательно, Х3(%) можно считать малой сравнительно с al. В этом случае вероятностные свойства функции U(l,t) могут быть определены следующим образом. Положим U (Ь 0 = Ub ft 0 + Ux E,0> D6.26) где функция U0(l,t) удовлетворяет уравнению *Ф=0, D6.27) ¦) Считаем о = const.
452 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ, (ГЛ. VIII а функция U\ (E, t) — уравнению дЮ d*U d*U fi 9ЯЧ D6.28) которое получается, если B6) подставить в B2), и считая Ux малым, пренебречь слагаемыми второго порядка малости. Определим U0(b,t) из B7) так, чтобы ?/0 удовлетворяло начальным условиям B3). Тогда в соответствии с B4) получим D6-29> 25; Г ** Так как функция Uo E, ^) удовлетворяет начальным условиям, то функция U\ ($, t) должна удовлетворять нулевым начальным условиям Ui ft 0) = 0, ^ ^ (?, 0 |/вв = 0. D6.30) В этом случае уравнение B8) имеет решение [40] , l + оУт) , 0 С Таким образом, случайная функция U\ (|, t) и в этом случае может быть явно представлена в виде линейного выражения, содержащего случайную функцию Х3(|), моменты ординат которой предполагаются известными, и случайную функцию -gp ?/0(?, 0» связь которой со случайными функциями Хх (?) и Х% (?) определяется формулой B9). Если случайные функции XiQ) и A(?) H^ зависят от случайной функции X3(?)> то определение моментов ординат функции f/i(|, 0 в принципе не отличается от решения аналогичных задач, рассмотренных выше. Если между этими функциями имеется корреляция, то ход решения остается прежним, однако окончательные расчетные формулы несколько усложняются, так как теперь необходимо будет учесть корреляционные функции связи между Xi(Qy Х*A) и ХъA). Переход от одномерных задач к двумерным или трехмерным, хотя и усложняет расчеты, однако если область, в которой ищется решение уравнения, достаточно проста, то решение удается получить в виде, пригодном для инженерных расчетов. Методы получения таких решений (для неслучайных функций) можно найти в различных книгах по математической физике (см. например, [22], [40]). Рассмотренные вуше примеры определения вероятностных характеристик динамических систем с распределенными параметрами
§ 471 КАНОНИЧЕСКИЕ РАЗЛОЖЕНИЯ СЛУЧАЙНЫХ ФУНКЦИЙ 453 не исчерпывают, естественно, все возможные типы уравнений в частных производных, которые могут встретиться в приложениях, а только иллюстрируют общую схему решения подобных задач. По изложенной выше схеме могут быть решены различные задачи, имеющие практический интерес: исследование распространению звука в неоднородной среде, исследование распространения радиоволн/ в неоднородной атмосфере, определение влияния неоднородности оптических стекол на качество изображения, различные задачи теории, упругости и т. д. § 47. Канонические разложения случайных функций Вернемся к случайным функциям одной переменной. До сих пор* мы рассматривали в основном стационарные случайные функции или такие нестационарные функции, которые получаются в результате применения нестационарных операторов к стационарным функциям или приближенно могут быть сведены к стационарным функциям. В большинстве технически интересных задач подобное рассмотрение вопроса оказывается не только вполне приемлемым, но и наиболее рациональным, так как, несколько ограничивая общность разбираемого вопроса, мы тем самым получаем возможность использовать более простой математический аппарат, который в большинстве случаев прямо ведет к цели. Однако с точки зрения завершенности теории случайных функций желательно иметь общий математический метод исследования случайных процессов, одинаково пригодный как, для стационарных, так и для нестационарных процессов. Подобным методом является теория канонических разложений случайных функций, получившая развитие в течение последних 15—20 лет в работах [32], [33], [49] и особенно успешно развиваемая в Советском Союзе В. С Пугачевым. Сущность этой теории состоит в том, что случайная функция X (t) заменяется линейной комбинацией некоторых (неслучайных) функций ср/(?), коэффициентами которых служат случайные величины Vjy взаимно не коррелированные между собой и обладающие нулевым математическим ожиданием. Основанием для такой замены является теорема, согласно которой для любой случайной функции X(t), непрерывной в интервале (а, Ь\ справедливо разложение 2yb <47Л> где Vj — взаимно некоррелированные случайные величины, обладающие нулевыми математическими ожиданиями и единичными,
454 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII дисперсиями, а Ху и <py(tf) — собственные числа и собственные функции •интегрального уравнения ь а т. е. такие значения числа X, при которых могут быть найдены функции cp(f), удовлетворяющие уравнению B) (и соответствующим граничным условиям). Если в ряде A) приближенно ограничиться конечным числом слагаемых, то задача изучения случайной функции X (t) сводится к изучению системы случайных величин V/, что в некоторых отношениях может оказаться более удобным. Очевидно, что представление A) при конечном числе слагаемых может давать только приближенное •выражение случайной функции, однако если мы ограничим область изменения t, то, увеличивая число слагаемых в сумме, можно получить представление случайной функции с достаточной точностью. Преимущество канонического разложения заключается в том, что если такое разложение получено, то ряд вероятностных характеристик заданной случайной функции, а также и случайных функций, получаемых из нее путем применения различных операторов, вычисляется сравнительно просто. Действительно, предположим, что случайная функция задана своим разложением A), где случайные величины Vj, согласно определению .канонического разложения, должны удовлетворять соотношениям М(V» = 0, M(Vj Vt) = Ьп (/, /= 1, 2, ...), D7.3) оде bjU как обычно, определяется условием если / = /, ' D7.4) если / Ф L Определим корреляционную функцию X(f). Подставляя для этой дели сумму A) в общую формулу для корреляционной функции, получим п п Кх ft, tj = М \УУ Vftf (fO Vlb (*0 -4^1 D7.5) [2 ущ] Меняя порядок суммирования и нахождения математического ожидания и учитывая соотношение C), будем иметь оо Кх (** h) = 2 г, $ Уд Ь Уд- D7-6) /1
§ 47] КАНОНИЧЕСКИЕ РАЗЛОЖЕНИЯ СЛУЧАЙНЫХ ФУНКЦИЙ 455 Столь же просто определяется и корреляционная функция производной А > так как, дифференцируя A) и повторяя те же выкладки, что и выше, получим Аналогично для любого линейного оператора, применение которого к X(t) дает новую функцию Z(t): Z(t) = LX(f), D7.8) получим Кг (МО = fjx^tf ft) L<< *>(^ D7'9) Естественным обобщением канонического разложения A) является представление случайной функции в виде интеграла от произведения неслучайной функции на приращения другой случайной функции, которые являются независимыми случайными величинами, т. е. представление вида X(t) = x @ + J х (t, ш) dfb (о>), D7.1 о> —00 где x(t,<u) не является случайной, а приращения ^Ф(ш) удовлетворяют таким же условиям, как и соответствующие приращения в теории стационарных случайных функций, т. е. (<*>)] = О, М [<*Ф*(ю) йФ (coj)] = Sx((o) Ь (со — coj) du do),. D7.11 > Однако в отличие от стационарных случайных процессов, для которых x(f,<o) = *le*, D7.12) общей теоремы о представлении любой случайной функции в виде интеграла A0) не существует, — наоборот, доказано, что в общем случае имеет место более сложное разложение. Тем не менее разложение A0) во многих прикладных задачах может быть принято за основу при исследовании случайных процессов, так как случайные функции, возникающие в различных прикладных задачах, или обладают специальными свойствами, при наличии которых разложение A0) имеет место, или это разложение в ограниченном интервале изменения аргумента случайной функции t дает достаточно точное представление случайной функции. Первый случай,,
455 ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ СЛУЧАЙНЫХ ФУНКЦИЙ [ГЛ. VIII например, имеет место, когда случайная функция X(t) получается на выходе линейной нестационарной динамической системы, на вход которой поступает стационарная случайная функция (см. § 15). Если случайная функция задана интегральным каноническим разложением A0), а случайная функция Z(t) связана с X(t) линейным соотношением (8), то простые вычисления дают Кх ft, h) = $ х* (tb ш) х (*„ ш) Sx (ш) dm, D7.13) —ОО ОО KAtp k)= $ Ц x*(tb *)U,x(tb »)Sx(»)d*> D7.14) —CO 00 Rxz (*„ t,) = I x* (tb a)) L,t x (tb a) Sx (ш) da. D7.15) —oo В том случае, когда оператор L не является линейным, непосредственное применение (9), A4) и A5) невозможно, однако во многих технических задачах случайные функции появляются в качестве различных возмущений, искажающих основное движение динамической системы, которые можно считать малыми. В этом случае в формуле A) случайные величины можно рассматривать как малые параметры и искомую функцию Z(t) = LX(t) разлагать по степеням этих параметров, вероятностные характеристики которых могут быть определены, если известны свойства случайных величин Vj. Таким образом, применение канонического разложения случайных функций в принципе позволяет решать не только линейные, но и нелинейные задачи. Однако применение этого метода показывает, что в том случае, когда линейное приближение дает слишком большую ошибку, использование канонических разложений для получения нелинейных поправок дает слишком сложный результат, проверка точности которого сама по себе представляет трудную задачу. Тем не менее, если каноническое разложение интересующей нас функции задано, то вероятностные характеристики случайной функции (по крайней мере в рамках корреляционной теории) находятся сравнительно просто. Поэтому весьма важной задачей является построение канонического разложения, если известно математическое ожидание процесса и его корреляционная функция, определяемые из опыта или из каких-либо теоретических соображений. Для нахождения канонического разложения A) не обязательно решать интегральное уравнение B), а можно воспользоваться различными приближенными способами. Покажем, что разложение типа A) может быть получено сравнительно .просто, причем не единственным способом. Выберем для этой цели ^систему неслучайных функций yj(t), вид которых в значительной
§ 471 КАНОНИЧЕСКИЕ РАЗЛОЖЕНИЯ СЛУЧАЙНЫХ ФУНКЦИЙ 457 мере является произвольным, и заменим случайную функцию X(i) линейной комбинацией вида п XW^^AjvW + Xit), D7.16) /=] где случайные коэффициенты Aj должны быть подобраны так, чтобы сумма A6) давала представление случайной функции в определенном смысле слова наилучшим образом. Можно, например, потребовать, чтобы аппроксимация A6) была наилучшей в смысле среднего квад- ратического или чтобы она давала правильные значения ординат случайной функции в определенных узлах интерполирования. Выражение A6) еще не является каноническим разложением, так как при выбранном способе аппроксимации случайные коэффициенты Aj не являются некоррелированными случайными величинами, а имеют корреляционную матрицу, определяемую видом корреляционной функции Kxtfuh) и выбранным способом аппроксимации. Однако, перейдя от величин Aj путем линейного преобразования Aj = 2 *Л Vi U = 1. 2,... л) D7.17), к новым случайным величинам V[f можно так распорядиться коэффициентами &jV чтобы случайные величины Уг были взаимно некоррелированными. Сложнее обстоит дело с интегральным каноническим разложением, так как общих приемов для нахождения функций х (t, w) и Sx («>) по Kx(th U) не имеется, хотя ряд соображений по этому вопросу можно найти, например, в [33], где также рассмотрено применение канонических разложений к решению ряда задач, имеющих практический интерес. Очевидно, что спектральное разложение стационарной случайной функции можно рассматривать как частный случай интегрального канонического разложения. Однако, в отличие от стационарных случайных функций, где спектральное разложение однозначно и просто определяется видом корреляционной функции, в общем случае любой нестационарной функции такой простой зависимости получить невозможно. Поэтому при решении практических задач более целесообразно во всех тех случаях, где это возможно, исходить из спектральной теории стационарных случайных функций, даже если это и требует известной схематизации решаемой задачи.
ЛИТЕРАТУРА 1. Бартлетт М, С, Введение в теорию случайных процессов, ИЛ, 1958. 2. Бендат Дж., Основы теории случайных шумов и ее применения, «Наука», 1965. 3. Б у н и м о в и ч В. И., Флюктуационные процессы в радиоприемных устройствах, Советское радио, 1951. 4. Вентцель Е. С, Теория вероятностей, Физматгиз, 1962. 5. Володин Б. Г. и др., Задачник по теории вероятностей, под редакцией Свешникова А. А., «Наука», 1965. 6. Г е л ь ф а н д И. М. и Ш и л о в Г. Е., Обобщенные функции и действия над ними, Физматгиз, 1959. 7. Гнеденко Б. В., Курс теории вероятностей, Физматгиз, 1961. 8. Гренандер У., Случайные процессы и статистические выводы, ИЛ, 1961. 9. Градштейн И. С. и Рыжик И. М., Таблицы интегралов,сумм, рядов и произведений, Физматгиз, 1962. 10. Г ю н т е р Н. М., Интегрирование уравнений первого порядка в частных производных, ГТТИ, 1934. П. Д ав енпорт В. Б. и Р у т В. Л., Введение в теорию случайных сигналов и шумов, ИЛ, 1960. 12. Дёч Р., Нелинейные преобразования случайных процессов, Советское радио, 1965. 13. Д ж е й м с X., Н и к о л ь с Н., Ф и л л и п с Р., Теория следящих систем, ИЛ, 1951. 14. Д и т к и н В. А. и Кузнецов П. И., Справочник по операционному исчислению, Гостехиздат, 1951. 15. Д м и т р и е в СП., Долгинцева Г. Я., И г н а т о в А. А., Решение некоторых нестационарных задач оптимальной фильтрации, ИАН СССР. Тех. киб. 1 A965). 16. Д у н и н-Б а р к о в с к и й И. В. и С м и р н о в В. Н., Теория вероятностей и математическая статистика в технике, Гостехиздат, 1955. 17. К а з а к о в И. Е. и Д о с т у п о в Б. Г., Статистическая динамика нелинейных автоматических систем, Физматгиз, 1962. 18. К а р с л о у X. С, Теория теплопроводности, Гостехиздат, J947. 19. Колмогоров А. Н., Интерполирование и экстраполирование стационарных случайных последовательностей, Изв. АН СССР, сер. матем. 5, № 1 A941). 20. К о л м о г о р о в А. Н., А р а т о М., С и н а й Я. Г., Об оценке параметров комплексного стационарного гауссовского марковского процесса, ДАН СССР 146, № 4 A962). 21. К о л м о г о р о в А. Н., Об аналитических методах в теории вероятностей, УМН 5 A938) (впервые опубликовано на немецком языке в 1931 г.).
ЛИТЕРАТУРА 459* 22. К о ш л я к о в Н. С, Г л и н е р Э. Б., С м и р н о в М. М., Основные дифференциальные уравнения математической физики, Физматгиз, 1962. 23. Крамер Г., Математические методы статистики, ИЛ, 1948. 24. Кузнецов П. И., Стратонович Р. Л., Тихонов В. М., О длительности выбросов случайной функции, ЖЭТФ 24: 1 A954). 25. Левин Б. Р., Теория случайных процессов и ее применение в радиотехнике, Советское радио, I960. 26. Л и н н и к Ю. В., Метод наименьших квадратов и основы теории обработки результатов наблюдений, Физматгиз, 1962. 27. Лонг е-Х и г г и н с М. С, Статистический анализ сл\ чайной движущейся поверхности. «Ветровые волны», Сборник статей, ИЛ, 1962. 28. Л з и н и н г Дж. л. и Беттин Р. Г., Случайные процессы в задачах автоматического управления, ИЛ, 1958. 29. М и д л т о н Д., Введение в статистическую теорию связи, т. I и т. И,. Советское радио, 1961, 1962. 30. П е р в о з н а н с к и й А. А., Случайные процессы в нелинейных автоматических системах, Физматгиз, 1962, 31. Питерсон И. Л., Статистический анализ и оптимизация систем автоматического управления, Советское радио, 1964. 32. П у г а ч е в В. С, Основы общей теории случайных функций. Труды Акад. арт. наук, 1952. 33. П у г а ч е в В. С, Теория случайных функций и ее применение к задачам автоматического управления, Физматгиз, 1960. 34. Романовский В. И., Дискретные цепи Маркова, Гостехиздат, 1949. 35. С а р ы м с а к о в Т. А., Основы теории процессов Маркова, Гостехиздат, 1954. 36. С о л о д о в н и к о в В. В., Статистическая динамика линейных систем автоматического регулирования, Физматгиз, 1960. 37. С т р а т о н о в и ч Р. Л., Избранные вопросы теории флюктуации в радиотехнике, Советское радио, 1961. 38. Большее Л. Н. и Смирнов Н. В., Таблицы математической статистики, «Наука», 1965. 39. Ф а д д е е в а В. Н. и Т е р е н т ь е в Н. М., Таблицы значений интеграла вероятностей от комплексного аргумента, под ред. Фока В. А., Гостехиздат, 1954. 40. Т и х о н о в А. Н. и С а м а р с к и й А. А., Уравнения математической физики, Гостехиздат, 1951. 41. Труды И конгресса IFAC. Оптимальные системы. Статистические методы,. «Наука», 1965. 42. X е н н а н Э., Анализ временных рядов, «Наука», 1964. 43. У и т т е к е р Е. Т. и В а т с о н Г. Н., Курс современного анализа, ч. 2, Гостехиздат, 1934. 44. Я г л о м А. М., Введение в теорию стационарных случайных функций, УМН 7:5E1), A952). 45. Янке Е. и Эмде Ф., Таблицы функций, Гостехиздат, 1948. 46. D a v i s R. С, On the Theory of Prediction of Nonstationary Stochastic Precesses. J. of Appl. Phys. 23, № 9 A952). 47. В 1 а с k m a n n R. B. and Tukey J. W., The measurement of Power Spectra. Bell System Technical Journal 37 A958). 48. J. A. Me. Fad den, The Axis — Crossing Intervals of Random Functions, IRE Transactions of Information Theory, 4, № 1 A958). 49. К a r h u n e n K., 0ber lineare Methoden in der Wahrscheinlichkeitsrechnung, Ann. Acad. Sci. Fennical, A, 1, № 37, Helsinki, 1947. 50. Shinbrot M., On the Integral Equation occuring in Optimisation Theory with nonstationary Inputs, J. of Mathem. and Physics, XXXVI, № 1 A957).
460 ЛИТЕРАТУРА 51. W i e n e г N., Extropolation, interpolation and Smoothing of Stationary time Series, John Wiley, № 4 A949). 52. Z a d e h L., К a g g a z z i n i J. R., An Extension of Wiener's Theory of Prediction. Journ. of Appl. Physics 21 A950). 53. M i 11 e г J. C. P., Tables of Weber Parabolic Cylinder Functions, London, 1955. 54. R i с е S. O., Mathematical Analysis of Random Noise, Bell. Syst. Thech. J. 23, 24, A944, 1945). 55. Grenander U. and Rosenblatt M., Statistical Analysis of Stationary Time Series, John Wiley and Sons A957). .56. Applied Statistics, J. of the Roy. Statist. Soo, Ser С 14, 1 A965). (Серия статей по оценке спектральной плотности.) 57. Т ц к е у J. W., Discussion, emphassing the Connection between Analysis of variance and spectral Analysis. Technometrics 3 A961). 58. R. С. В о о ton, 1) The Analysis of nonlinear control systems with randon inputs, Proc. Symp. Nonlinear Curcuit Analysis, 2 A953). 2) Nonlinear Control Systems with randon inputs, Trans IRE CT-1 A954).
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ *) Асимметрия 315 Белый шум 96 Белый шум в узком смысле 257 Броуновское движение 10 Выбросы случайной функции одной переменной; ~, временная плотность вероятности выбросов 67; ~, дисперсия общего времени выброса 75; ~, дисперсия общего числа выбросов 76; ~, применение марковских процессов 267; ~, среднее время выброса 69; ~, среднее число выбросов 69; ~, средняя площадь под кривой во время выброса 72; ~, характеристики выбросов для нормального процесса 70 Выбросы случайной функции нескольких переменных; ~, средняя длина контура пересечения с плоскостью 442; ~, средняя площадь пересечения с плоскостью 441; ~, среднее число выбросов на единицу площади 438; ~, среднее число максимумов на единицу площади 435 Дельта-функция; ~, интегральное представление 87; ~, определение 86; ~, основные свойства 86 Динамические системы; ~, весовая (импульсная переходная) функция линейной системы 51; ~, линейные системы 48; ~, нелинейные системы 306; ~, нелинейные системы с обратной связью 307; ~, передаточная функция линейной системы 106, 198; ~, приводимые нелинейные системы 322 Динамические системы с распределенными параметрами; ~, вероятностные характеристики решения уравнения в частных производных 445; ~, вероятностные характеристики решения волнового уравнения 450; ~, вероятностные характеристики решения уравнения Лапласа 448; ~, вероятностные характеристики решения уравнения теплопроводности 447 Дисперсия; ~ случайной величины 13; /^случайной функции 22 Дифференциальные уравнения, содержащие случайные величины в коэффициентах 345, 451 Дифференцирование случайной функции; ~ у корреляционная функция производной 39; ^, математическое ожидание производной 43; ~, производная случайной функции 34; ~, производная стационарной случайной функции 39; ~, условие дифференцируемости функции 36 Законы распределения случайных величин; ~ у нормальный одной случайной величины 17; ~, нормальный системы случайных величин 17; ~ Пуассона 18; ~ Рзлея 149 Замена реальных процессов марковскими 300 , Интеграл Стилтьеса 85 Интегральная функция Лапласа 17 Интегрирование случайной функции; ~, интеграл от случайной функции 40; ~, корреляционная функция интеграла 41; ~, корреляцион- *) Знак -w заменяет группу слов, выделенных курсивом.
462 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ ная функция интеграла от стационарной случайной функции 42; ~, математическое ожидание интеграла 42; ~, условие интегрируемости случайной функции 41 Каноническое разложение случайной функции; ~, дискретное каноническое разложение 453; ~, интегральное каноническое разложение 455; ^, определение корреляционной функции по каноническому разложению 454, 456 Композиция законов распределения 16 Корреляторы; ~, коррелятор общего типа 393; ~, коррелятор для нормальных процессов 398; ~, применение для определения корреляционной функции связи 395 Корреляционная матрица 14 Корреляционная функция; ~, корреляционная функция интеграла 41; ~, корреляционная функция полином а от нормальных случайных функций 118; ~, корреляционная функция производной 102; ~, корреляционная функция решения линейного дифференциального уравнения 56; ~, определение корреляционной функции 22; ~, основные свойства корреляционной функции 29; ~, связь со спектральной плотностью 92 Корреляционная функция связи; ^ , корреляционная функция связи случайной функции и ее второй производной 64; ~, корреляционная функция связи случайной функции и ее первой производной 63; ~, определение корреляционной функции связи 59; ~, связь корреляционной функции связи стационарного процесса с взаимной спектральной плотностью 92 Линейные дифференциальные уравнения со случайной правой частью; ~, закон распределения решения линейного уравнения 310; ~, корреляционная функция решения уравнения с переменными коэффициентами 129; ~, спектральная плотность стационарного решения уравнения с постоянными коэффициентами 105 Линейный оператор; ^, корреляционная функция результата применения линейного оператора к случайной функции 53; ~, математическое ожидание результата применения линейного оператора к случайной функции 53; ~, основные свойства линейного оператора 47 Марковские процессы; ~, вероятность пребывания в заданной области 267; ~, задача о выбросах для марковских процессов 273; ^, многомерные марковские процессы 286; ~, обобщенное уравнение Маркова 250, .286; ~, определение марковского процесса 247; ~, примеры составления уравнений Колмогорова 257; ~, простейшие случаи интегрируемости уравнения Колмогорова 260; ~, уравнения Колмогорова 250; ~, уравнение Фоккера—Планка—Колмогорова 251 Математическое ожидание; ~^ случайной величины 13; ~ случайной функции 22 Метод огибающих; ~, закон распределения огибающей 151;~, закон распределения производной от огибающей 160; ^, закон распределения производной от фазы 157; ^, закон распределения фазы 150; ~w, многомерные законы распределения огибающей и фазы 154; ^, огибающая стационарной нормальной случайной функции 149; ~, приближенная формула для плотности вероятности времени выброса 167; ^, применение метода огибающих для узкополосного спектра 164; ^, условные законы распределения огибающей и фазы 155 Многомерные законы распределения ординат случайной функции 21 Моменты случайных величин; ~, начальные моменты 13; ~ , момент связи (корреляционный момент) двух случайных величин 14; -~, соотношения между начальными и центральными моментами 13; ^, центральные моменты 13 Оптимальные линейные динамические системы; ~ , дисперсия ошибки оптимальной системы 197, 227}
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 463 ~1 критерии оптимальности 181; *v/, нестационарные задачи 233; ~, оптимальные системы с «бесконечной памятью» 194; ~, оптимальные системы с заданной структурой 191; ~, оптимальные системы с несколькими каналами 242; ~, оптимальные системы с «конечной памятью» 215 Обработка реализаций случайных функций] ~, доверительный интервал 370; ~ , несмещенные оценки 369; "~, общие требования к оценкам 369; ^, оптимальный интервал дискретности 379; ~, оценка корреляционной функции 382; ~~, оценка математического ожидания 373; ~, оценка спектральной плотности 401; ~, оценка функции распределения 413; ~, применение критериев согласия в статистике случайных процессов 418; ^, состоятельность оценки 369; ^ , эффективность оценки 369 Передаточная функция линейной системы; ~, общая формула 106; ~, связь с импульсной переходной функцией 229; ~, связь с независимыми интегралами уравнения системы 51, 198 Расчетные формулы для определения передаточной функции оптимальной линейной системы; ~, интерполирование при дробно-рациональных спектральных плотностях сигнала и помехи 211; ~, экстраполирование при дробно-рациональных спектральных плотностях сигнала и помехи 205 Реализация случайной функции 19 Свертка весошх функций 221 Случайная функция нескольких переменных (случайное поле); ~, задача о выбросах для случайного поля 438; ~, изотропное случайное поле 432; ~, корреляционная функция случайного поля 430; ~, однородное случайное поле 432; ~, спектральная плотность случайного поля 430 Случайная функция одной переменной; ~ непрерывная 18; ~ нормальная 24; ~ марковская 25; ~, сингулярная 189; ~~ стационарная 23; ~ стационарная в широком смысле 24; ~ эргодическая 375 Случайные величины; ~ независимые 12; ~ непрерывные 11; ~, плотность вероятности системы случайных величин 12; ~, плотность вероятности случайной величины 11; ~, условная плотность вероятности 12; ^ , функция распределения 11; ~, характеристическая функция 14 Спектральная теория стационарных случайных функций; ~, взаимная спектральная плотность 95; ~, примеры нахождения спектральной плотности 96; ~, связь спектральной плотности с корреляционной функцией 92; ^, спектральная плотность 90; ^, спектральная плотность линейной комбинации стационарной функции и ее производных 105; ~ , спектральная плотность стационарного решения линейного дифференциального уравнения 106; ~, спектральная плотность степени нормальной случайной функции 118; ~ , спектральная плотность производной 102; ^, спектральная функция 91; ^, спектральное разложение стационарной функции 85; ~, теорема Хинчина 91 Случайные последовательности; ^, задача о выбросах для случайной последовательности 426; ^, случайная последовательность 422; <^, оптимальное экстраполирование по всему прошлому последовательности 428; ~ , оптимальное экстраполирование по конечному числу элементов последовательности 427 Существенно нелинейные элементы системы 308 Эксцесс 315
Арам Арутюнович Свешников Прикладные методы теории случайных функций М., 1968 г., 464 стр. с илл. Редактор М /7. Ганин Техн. ред. И. Ш. Аксельрод Корректоры А. Ф. Серкина, О А. Сигал Сдано в набор 2/1 1968 г. Подписано к печати 22/V 1968 г. Бумага бОХЭО'Дв. Физ. печ. л. 29. Условн. печ. л. 29. Уч.-изд. л. 27.11. Тираж 23 000 экз. Т-08327. Цена книги 1 р. 73 к. Заказ № 2993. Издательство «Наука» Главная редакция физико-математической литературы. Москва В-71, Ленинский проспект, 15. Отпечатано с матриц в типографии издательства «Коммунист», г. Саратов.